Revisión conceptual
Para elegir el mejor modelo para la solución se describió diferentes conceptos y analizó una
valorización de los criterios con la comparativa que realizo Kalluri [1] entre DNN, CNN y RNN con
TF-IDF y Word2vec.
- Análisis de sentimiento: El análisis de sentimiento es la técnica que consiste en obtener
información sobre una entidad y determinar sus subjetividades de forma automática. El
propósito es identificar si el material generado por el usuario expresa sentimientos
favorables, negativos o neutrales. La clasificación del sentimiento puede realizarse en tres
niveles de extracción: nivel de aspecto o rasgo, nivel de frase y nivel de documento.
- Word Embedding (Incrustación de palabras): La mayoría de los algoritmos de aprendizaje
automático no pueden interpretar cadenas o texto plano en su forma básica. Por el
contrario, necesitan entradas numéricas para funcionar. Al convertir las palabras en
vectores, la incrustación de palabras permite procesar grandes cantidades de datos de
texto y adaptarlos a los algoritmos de aprendizaje automático. En este apartado se usa
Word2vec [14] y TF-IDF [15,25] como técnicas de incrustación de palabras [8]. Se examina
todo el texto y el procedimiento de construcción del vector se lleva a cabo identificando las
palabras con las que la palabra objetivo aparece con más frecuencia. De este modo,
también se muestra la proximidad semántica de las palabras, a diferencia de otras técnicas
se lleva a cabo un procedimiento de aprendizaje no supervisado mediante redes neuronales
artificiales, se utilizan datos no etiquetados para entrenar el modelo Word2Vec que crea
vectores de palabras.
- Red neuronal profunda (DNN): Esta red neuronal tiene la característica distintiva de
permitir captar automáticamente las funciones necesarias. El modelo de aprendizaje
profundo es una función matemática f: X, Y. El aprendizaje profundo es el desarrollo de
una red neuronal artificial (ANN) que emplea más de una capa oculta para modelar un
conjunto de datos [7].
- Red neuronal Convolucional (CNN): consisten en múltiples capas de convoluciones con
funciones de activación no lineales, como ReLU o tanh, aplicadas a los resultados. En una
red neuronal feedforward convencional, cada neurona de entrada está conectada a cada
neurona de salida de la capa siguiente. Esto también se conoce como una capa totalmente
conectada [6]. Finalmente, los datos se preprocesan para la matriz de incrustación, pasan
por capas y filtros para obtener un resultado de análisis de sentimiento entre positivo o
negativo [23,24].
- Red neuronal recurrente (RNN): La red neuronal recurrente es una extensión de la red
neuronal directa con una memoria interna ya que realiza la misma función para cada
entrada de datos, mientras que el resultado de la entrada actual depende del cálculo
anterior [11]. Una vez generada la salida, se duplica y se vuelve a introducir en la red
recurrente. Para la toma de decisiones, evalúa tanto la entrada actual como el resultado