REVISTA INNOVACIÓN Y SOFTWARE Vol. 5 Nº. 1 Marzo Agosto 2024 ISSN Nº 2708-0935
RECIBIDO 26/08/2023● ACEPTADO 25/10/2023 PUBLICADO 30/03/2024
RESUMEN
El flujo de información surge día a día mediante internet de manera continua gracias a las
constantes interacciones presentes entre los usuarios, estas interacciones se presentan en
comentarios que pueden ser positivos o negativos. Esto puede ayudar mucho al servicio que
ofrece Amazon en sus productos para poder comprender si esta´ en buen estado o no, para que
sus usuarios de la plataforma se puedan convencer al momento de comprar un producto, y es
que, si estos son un gran número, un análisis hecho por una sola persona no es suficiente. Para
ello es necesario el uso de herramientas que operan con grandes cantidades de datos como
(nombre del procesamiento de datos), que es un modelo que ayuda al análisis de clasificación de
comentarios basados en lo que expresan los usuarios. En este trabajo se usará´ este modelo
para la clasificación de comentarios de productos de Amazon, valorando estos comentarios según
su descripción. Se harán además uso de métricas y de sugerencias futuras para la propuesta
mencionada en este trabajo. El análisis de los comentarios ayudara´ a entender cómo es que las
personas clasifican estas diferentes situaciones de su vida cotidiana. Los datos de las redes
sociales se utilizan durante todo el proceso de análisis y clasificación, que consiste en datos de
texto. Utilizando las redes sociales, se puede monitorizar o analizar los comentarios. En este
trabajo de investigación clasificaremos los datos de los comentarios que se realizan en Amazon
relativos a su calificación en cada comentario.
Palabras claves:
Sentimiento del consumidor, análisis de comentarios, minería de opiniones,
clasificación de datos, Amazon, Inteligencia artificial.
Frank Jhoseph Duarte Oruro
Universidad La Salle. Arequipa, Perú.
fduarteo@ulasalle.edu.pe
lmamania@ulasalle.edu.pe
ARK: ark:/42411/s15/a119
DOI: 10.48168/innosoft.s15.a119
PURL: 42411/s15/a119
REVISTA INNOVACIÓN Y SOFTWARE Vol. 5 Nº. 1 Marzo Agosto 2024 ISSN Nº 2708-0935
21
ABSTRACT
The flow of information arises every day through the internet continuously thanks to the constant
interactions between users, these interactions are presented in comments that can be positive or
negative. This can help a lot to the service offered by Amazon on their products to understand if
this' in good condition or not, so that its users of the platform can be convinced when buying a
product, and is that, if these are a large number, an analysis made by one person is not enough.
This requires the use of tools that operate with large amounts of data such as (name of data
processing), which is a model that helps the analysis of classification of comments based on what
users express. In this paper we will use' this model for the classification of Amazon product
reviews, rating these reviews based on their description. It will also make use of metrics and
future suggestions for the proposal mentioned in this paper. The analysis of comments will help
to understand how people classify these different situations in their daily lives. Social network
data is used throughout the analysis and classification process, which consists of text data. Using
social networks, comments can be monitored or analyzed. In this research work, we will classify
the data of comments made on Amazon relating to their rating on each comment.
Keywords:
Consumer sentiment, comment analysis, opinion mining, data classification, Amazon,
IA.
INTRODUCCIÓN
La capacidad de adaptación de la tecnología a diferentes contextos ha transformado diversos
aspectos de la vida cotidiana, incluyendo la educación y la interacción en línea. La enseñanza y
el aprendizaje se han vuelto más accesibles gracias a la tecnología. Sin embargo, esta
adaptabilidad tecnológica se ha expandido a diversas áreas de interacción en línea, siendo las
redes sociales uno de los ejemplos más prominentes.
Las redes sociales representan un amplio y complejo en- torno de interacción en línea, donde
usuarios de todo el mundo comparten información, intereses y opiniones sobre diversos temas
de manera remota. Esta interacción se lleva a cabo principalmente a través de los comentarios
en los productos, publicaciones, vídeos, tendencias, etc., de otros usuarios, lo que a menudo
proporciona una visión general de las opiniones sobre un tema específico. Sin embargo, esta
visión puede no ser siempre precisa debido a la diversidad de información presente en los
comentarios.
Entre las plataformas más destacadas para este intercambio de opiniones se encuentran
Facebook, Twitter y YouTube, pero el objetivo de este proyecto de aplicación NLP es detectar los
diferentes tipos de comentarios expresados en los productos de Amazon. Sabemos que en la
actualidad las redes sociales se han convertido en una parte integral de la vida diaria de muchas
REVISTA INNOVACIÓN Y SOFTWARE Vol. 5 Nº. 1 Marzo Agosto 2024 ISSN Nº 2708-0935
22
personas y pueden tener un impacto significativo. Muchas personas utilizan las redes sociales
para conectarse con otros, pero también pueden exponerse a una gran cantidad de información
negativa, información positiva. Amazon es una de las plataformas de redes sociales más
populares y la gente la utiliza a menudo, la plataforma ofrece una amplia gama de opciones para
compras en línea y es conocida por su conveniencia y entrega rápida. El proyecto desarrolla un
modelo de aprendizaje automático que pueda analizar los comentarios para identificar patrones
lingüísticos asociados a los tipos de comentarios, nos enfocaremos en obtener opiniones de
comentarios que reaccionan a los productos de Amazon. El objetivo es determinar su utilidad y
clasificar los comentarios en categorías como ”positivos”, ”negativos”, ”neutros”, ”muy buenos”
y ”muy malos”. Para lograr esto, primero realizaremos un preprocesamiento de la información,
seleccionando los comentarios que expresen sentimientos de manera explícita, y luego
utilizaremos algoritmos de procesamiento de lenguaje natural para determinar la polaridad
predominante, a su vez puede mejorar la calidad de los productos en venta en Amazon.
Motivación
Los comentarios y opiniones de otros compradores pueden influir significativamente en las
decisiones de compra. Al clasificar y analizar estos comentarios de manera eficaz, se puede
ayudar a los consumidores a tomar decisiones informadas y, al mismo tiempo, mejorar su
experiencia de compra.
A.
¿En qué dominio del conocimiento está trabajando?
Consumidores de Amazon que desean obtener información sobre productos antes de realizar una
compra.
B.
¿Quiénes son los usuarios objetivo?
Vendedores, compradores, anunciantes de Amazon interesa- dos en comprender las opiniones y
reacciones de los clientes hacia sus productos.
C.
¿Por qué es interesante el tema que proponen?
Investigadores y profesionales en el campo de la inteligencia artificial, el procesamiento de
lenguaje natural y el análisis de sentimientos.
REVISTA INNOVACIÓN Y SOFTWARE Vol. 5 Nº. 1 Marzo Agosto 2024 ISSN Nº 2708-0935
23
D.
¿Cuáles son las preguntas que su proyecto de NLP intenta responder?
Personas interesadas en cómo las opiniones en línea influyen en las decisiones de compra y la
calidad de los productos en una plataforma como Amazon.
Problema
El problema central que aborda este proyecto es la creciente complejidad de gestionar y analizar
grandes conjuntos de datos generados por compras masivas en línea.
A medida que el comercio electrónico se expande, surge la necesidad de comprender
profundamente los patrones de compra, las preferencias del consumidor y los comportamientos
de compra en escenarios de compras masivas, lo que presenta un desafío significativo tanto para
las empresas como para los investigadores. Además, la gestión de datos masivos requiere
soluciones eficaces de procesamiento de datos y técnicas de aprendizaje automático para extraer
información valiosa y tomar decisiones estratégicas basadas en datos precisos y confiables.
Objetivo
El objetivo principal de este estudio es investigar y desarrollar soluciones efectivas para la gestión
y análisis de grandes volúmenes de datos de compras en línea en Amazon. Se pretende abordar
la creciente demanda de herramientas que permitan comprender los patrones de comportamiento
del consumidor en el entorno de compras en línea a gran escala.
Datos
A.
¿Qué datos necesitará?
Datos de transacciones de compras en línea, que incluyen detalles como productos comprados,
fechas y montos. Datos de navegación en línea, que pueden incluir información sobre páginas
visitadas, tiempo de navegación y acciones realizadas en el sitio web. Datos de usuarios, que
pueden incluir información demográfica, preferencias, historial de compras previas y otros datos
relevantes.
REVISTA INNOVACIÓN Y SOFTWARE Vol. 5 Nº. 1 Marzo Agosto 2024 ISSN Nº 2708-0935
24
B.
¿Cómo recolectarán los datos?
Los datos de transacciones se pueden recopilar a través de los sistemas de registro de compras
en línea de empresas asociadas o a través de acuerdos de colaboración. Los datos de navegación
en línea pueden ser obtenidos mediante el seguimiento de la actividad del usuario en el sitio web
de la empresa o mediante la implementación de cookies y seguimiento web. Los datos de usuarios
pueden recopilarse a través de formularios de registro, cuentas de usuario en línea o incluso
mediante encuestas voluntarias.
C.
¿Dónde planea obtenerlos?
Los datos de transacciones pueden obtenerse directamente de las empresas de comercio
electrónico o de terceros que recopilen y proporcionen datos de transacciones en nea. Como:
Kaggle, Hugging Face, Google.
D.
¿Cómo planea almacenarlos?
Los datos se almacenarán en un excel con extensión .xls para ser analizados más fácilmente.
E.
¿Cómo accederá a ellos para utilizarlos en su proyecto?
Ya que trabajaremos con Python en Google Colab usaremos la librería Pandas Numpy que nos
permitirá la lectura de la data y su obtención en una estructura de datos como diccionarios y
matrices, para su posterior procesamiento.
Se podrían utilizar lenguajes de programación como Python o herramientas de análisis de datos
como SQL para realizar consultas y análisis de los datos almacenados.
Revisión Literaria
Con el propósito de abordar los desafíos inherentes al análisis de comentarios de productos en
Amazon, llevamos a cabo una revisión exhaustiva de artículos disponibles en la plataforma de
Google Scholar. En este proceso, presentamos de manera sucinta una descripción detallada de
cada enfoque aplicado en diversas investigaciones relacionadas con este tema.
REVISTA INNOVACIÓN Y SOFTWARE Vol. 5 Nº. 1 Marzo Agosto 2024 ISSN Nº 2708-0935
25
El primer paper se enfoca en el análisis de sentimientos en reseñas de productos de Amazon.
Utiliza técnicas de aprendizaje profundo y aprendizaje automático para clasificar la polaridad de
las palabras, frases y documentos en positiva, negativa o neutral. Se comparan nueve algoritmos
diferentes, y Bert se destaca con un rendimiento excepcional, logrando una precisión del 0.94.
Además, se aplica el modelo Bert a un gran conjunto de reseñas adicionales para evaluar su
eficacia. El estudio demuestra que Bert es muy efectivo para la clasificación de sentimientos en
reseñas de productos. [?]
El enfoque del segundo paper se centra en la presentación de un recurso valioso para la
investigación en procesamiento de lenguaje natural: el ”Multilingual Amazon Reviews Corpus
(MARC)”. El texto describe la creación de este corpus que contiene reseñas de productos de
Amazon en varios idiomas y resalta su importancia para abordar tareas de clasificación de texto
multilingüe. También se proporcionan resultados basales para la clasificación supervisada y la
transferencia cero, subrayando la relevancia del corpus en la comunidad de investigación. En
resumen, el enfoque principal es informar sobre la disponibilidad y utilidad del corpus MARC para
avanzar en investigaciones relacionadas con el procesamiento de lenguaje natural en un contexto
multilingüe. [?]
El enfoque del tercer paper es evaluar la eficiencia de tres enfoques de aprendizaje automático
(Support Vector Machines, Naive Bayes y Maximum Entropy) para clasificar reseñas de productos
en Amazon. Se centra en el uso de técnicas de análisis de sentimientos para analizar el contenido
de las reseñas y comprender las opiniones de los usuarios sobre los productos. El texto también
explora cómo los aspectos y la polaridad de las opiniones pueden influir en la clasificación de las
reseñas. Además, se utiliza una variedad de características, como unigrams y weighted unigrams,
para entrenar a los clasificadores y se presentan los resultados de precisión para cada método.
En resumen, el enfoque se concentra en la clasificación de reseñas en Amazon y la comparación
de diferentes enfoques de aprendizaje automático para lograrlo. [1]
El cuarto paper presenta un enfoque de detección de sarcasmo en reseñas de productos de
Amazon utilizando técnicas de procesamiento de lenguaje natural (NLP) y clasificación de
REVISTA INNOVACIÓN Y SOFTWARE Vol. 5 Nº. 1 Marzo Agosto 2024 ISSN Nº 2708-0935
26
sentimientos. Comienza destacando la creciente importancia de analizar las opiniones en nea
debido al gran número de reseñas en Amazon y la necesidad de comprender y analizar estos
datos para realizar mejoras en productos. Luego, se centra en el desafío específico de detectar el
sarcasmo en estas reseñas y analiza una serie de características y enfoques utilizados en la
literatura previa, incluyendo el uso de algoritmos basados en reglas y clasificadores de machine
learning. El trabajo también menciona la importancia de etiquetar la polaridad de las palabras
antes del proceso de clasificación y evalúa el rendimiento de varios clasificadores, como SVM,
Random Forest y K Vecinos más Cercanos (K Nearest Neighbors), proporcionando las tasas de
precisión respectivas de cada uno de ellos. [2]
Diseño
A.
Propuesta
Para este trabajo se utilizó un dataset ”Amazon multilingual Corpus” que están previamente
categorizadas en cinco niveles. Que son correspondidas al número de estrellas que se les da en
la reseña. Como ventaja de este dataset es que se encuentra en varios idiomas que son Español,
Inglés, Francés, Japones, Alemán y Chino que son los idiomas más populares a nivel mundial.
Además de que el dataset cuenta con 1.2 millones de datos en total. Es importante señalar que,
específicamente para la sección de comentarios en inglés, se utilizó un subconjunto de 50,000
datos para llevar a cabo el proceso de entrenamiento. Este enfoque permite centrarse en un
conjunto específico de comentarios en un idioma particular, facilitando así la tarea de modelado
y análisis de sentimientos en el ámbito del inglés.
Figura 1. Pipeline del proceso de clasificación.
REVISTA INNOVACIÓN Y SOFTWARE Vol. 5 Nº. 1 Marzo Agosto 2024 ISSN Nº 2708-0935
27
B.
Preprocesamiento de los datos
El preprocesamiento consiste en preparar el conjunto de datos para que tenga una alta calidad.
Se trata de tareas importantes que deben antes de utilizar un conjunto de datos para el
entrenamiento de modelos. Utilizamos la biblioteca NLTK para realizar tareas de limpieza,
incluyendo la eliminación de caracteres especiales, stop words y otros elementos no relevantes.
Además, aplicamos lematización para reducir las palabras a su forma base, simplificando así la
representación léxica de los comentarios.
Eliminación de etiquetas HTML.
Eliminación de datos NULL y repetidos del conjunto de datos.
Filtrado de todos los emojis.
Eliminación de palabras vacías
Corrección ortográfica.
C.
Tokenización
La tokenización desempeña un papel vital en la preparación de datos para modelos basados en
BERT. Implementamos un tokenizador específico de BERT para dividir los comentarios en
unidades semánticas, preservando así la información contextual. Se aplica padding para ajustar
todas las secuencias a la misma longitud, permitiendo un procesamiento eficiente durante el
entrenamiento del modelo.
D.
Entrenamiento del Modelo
Para el entrenamiento del modelo, se emplea una arquitectura basada en BERT, aprovechando
las capacidades preentrenadas del modelo en tareas generales del lenguaje. Añadimos capas
específicas para la tarea de análisis de sentimientos. Se experimenta con diferentes
hiperparámetros para optimizar el rendimiento del modelo en el conjunto de entrenamiento y se
valida en el conjunto de validación.
E.
Evaluación del Modelo
La evaluación del modelo se realiza en un conjunto de prueba independiente, utilizando métricas
como precisión, recall y F1-score. Se analiza la capacidad del modelo para generalizar a datos no
vistos y para manejar la variabilidad lingüística presente en el corpus multilingüe de comentarios
de Amazon.
REVISTA INNOVACIÓN Y SOFTWARE Vol. 5 Nº. 1 Marzo Agosto 2024 ISSN Nº 2708-0935
28
F.
Uso del Modelo con Streamlit
La implementación práctica del modelo se logra mediante la integración con Streamlit, una
biblioteca de Python para la creación pida de aplicaciones web interactivas. Describimos la
interfaz de usuario diseñada para la aplicación, que permite a los usuarios finales ingresar
comentarios y obtener la clasificación en tiempo real a través de la web.
Principios básicos de diseño que nos guió para crearlo
Fortalezas
Nuestro diseño ofrece varias ventajas significativas para el procesamiento de lenguaje natural
(NLP) en el re- conocimiento de mensajes de odio. Aquí se mencionan algunas:
Adaptabilidad a diferentes idiomas La capacidad de adaptarse a diversos idiomas es
una característica clave de nuestro diseño. Aunque se entrena y aplica inicialmente
en español, la presencia de conjuntos de datos que abarcan varios idiomas permite
que se adapte para reconocer y clasificar textos en diferentes lenguajes. Esta
versatilidad es particular- mente valiosa en el reconocimiento y clasificación de
mensajes y comentarios, dado que la información esclarecedora puede presentarse
en variados idiomas y contextos culturales. Estas ventajas posicionan nuestra
propuesta como una elección flexible para el procesamiento de lenguaje natural en
la identificación y clasificación de comentarios. No obstante, es esencial tener en
cuenta que ningún modelo es infalible, y se deben considerar siempre las
limitaciones y posibles sesgos inherentes en los datos y el proceso de entrenamiento.
Contextualización bidireccional: Nuestra estructura de diseño logra una captura
bidireccional del con- texto y la relación entre las palabras en una oración. En otras
palabras, tiene la capacidad de comprender tanto las palabras que preceden como
las que siguen en un texto, lo que eleva la comprensión del significado y la intención
subyacentes en la clasificación de comentarios. Esta mejora en la contextualización
facilita la identificación más precisa de clasificación de comentarios.
Debilidades
Manejo de texto no estructurado: La clasificación de comentarios, comúnmente
expresados en forma de texto no estructurado como publicaciones en redes sociales
o foros, representa un desafío para nuestro enfoque. Aunque logra captar el contexto
y el significado gramatical más informal, su eficacia se ve afectada en términos de
prueba y entrenamiento, ya que se basa en un conjunto de datos estructurado y
previamente clasificado.
REVISTA INNOVACIÓN Y SOFTWARE Vol. 5 Nº. 1 Marzo Agosto 2024 ISSN Nº 2708-0935
29
Requisitos computacionales y de recursos: Nuestra propuesta emplea un modelo de
lenguaje profundo y complejo, como BERT, que demanda una cantidad significativa
de recursos computacionales y memoria tanto durante el entrenamiento como la
aplicación. Esta característica dificulta su implementación en entornos con recursos
limitados, lo que restringe su accesibilidad y uso en ciertos casos.
Tamaño del modelo: La eficacia del modelo de reconocimiento y clasificación de
comentarios puede verse desafiada por el tamaño del modelo y el conjunto de datos
utilizado, especialmente en casos donde la relación es de aproximadamente 10,000
palabras.
Dependencia de datos etiquetados: Aunque BERT puede adaptarse a tareas
específicas con datos etiquetados limitados, sigue siendo necesario contar con una
cantidad significativa de datos anotados para obtener un rendimiento óptimo. La
recopilación y etiquetado de grandes conjuntos de datos pueden resultar costosos y
consumir tiempo, especialmente en el ámbito de la clasificación de comentarios, que
a menudo requiere una revisión manual exhaustiva.
Resultados
La siguiente tabla muestra la cantidad de datos, el número de categorías y las métricas de
precisión, ofreciendo una comparación del rendimiento entre los modelos previos. También se
incluyó una comparación con un modelo de Bert llamado ’Bert antiguo,’ que emplea la misma
Base de Datos. Durante el proceso de entrenamiento, se aplicó la ley de Paretto.
Tabla 1. Resultados detallados del modelo
Clase
Precision
Recall
F1-Score
Soporte
0
0.71
0.64
0.67
2043
1
0.49
0.44
0.47
1993
2
0.44
0.57
0.50
2016
3
0.57
0.47
0.51
1998
4
0.68
0.74
0.71
1950
Accuracy
0.57
Macro Avg
0.58
0.57
0.57
10000
Weighted Avg
0.58
0.57
0.57
10000
Trabajos Relacionados
El estudio “Amazon Fine Food Reviews se enmarca en la creciente importancia de las reseñas en
línea para consumidores y empresas, especialmente en la industria del comercio electrónico. Las
reseñas, generalmente compuestas por una puntuación general y una descripción de texto, son
REVISTA INNOVACIÓN Y SOFTWARE Vol. 5 Nº. 1 Marzo Agosto 2024 ISSN Nº 2708-0935
30
cruciales para que los consumidores comprendan intuitivamente los productos y servicios antes
de realizar una compra. Este trabajo se centra en desarrollar un modelo basado en BERT, una
técnica de Procesamiento del Lenguaje Natural (NLP), para predecir la puntuación general de
reseñas basándose en las descripciones de texto [7].
La investigación aborda la influencia masiva de las opiniones implícitas en las revisiones de
clientes en las decisiones de compra. Se exploran diversas técnicas de representación vectorial,
como Bag-Of-Words, Tf-Idf y Glove, para transformar las revisiones en datos procesables. Luego,
se emplean varios algoritmos de aprendizaje automático, como Regresión Logística, Bosques
Aleatorios, Na¨ıve Bayes, Memoria a Corto y Largo Plazo Bidireccional (Bi-LSTM) y BERT, para
clasificar el sentimiento [8].
El artículo titulado ”Amazon products reviews classification based on machine learning, deep
learning methods and BERT” aborda la creciente tendencia de las compras en línea y la
importancia de las reseñas de clientes en las plataformas de comercio electrónico. Los autores
proponen un sistema automatizado para el análisis de sentimientos de las reseñas de productos
de Amazon utilizando diversas técnicas de aprendizaje automático (ML) y aprendizaje profundo
(DL), incluido BERT [9].
Conclusiones
En resumen, la calidad y la adecuada preparación de los conjuntos de datos utilizados para
entrenar modelos, como BERT, son factores críticos que influyen en los resultados de la evaluación
y las métricas obtenidas. La importancia de contar con un conjunto de datos equilibrado y someter
los datos a una exhaustiva limpieza, centrándose en los campos pertinentes para el
entrenamiento, se revela como un aspecto crucial para lograr resultados óptimos. Un conjunto
de datos equilibrado asegura que el modelo se entrene con una representación justa de las
diversas clases o categorías presentes en los datos, evitando sesgos y mejorando su capacidad
para clasificar correctamente las muestras de prueba.
La limpieza de datos también desempeña un papel funda- mental. Al eliminar ruido, datos
irrelevantes o redundantes, y garantizar la integridad de los campos necesarios para el
entrenamiento, se eleva la calidad y la coherencia del conjunto de datos. Este proceso se traduce
en un aprendizaje más preciso por parte del modelo, lo que se refleja en una evaluación más
confiable y en métricas más sólidas.
REVISTA INNOVACIÓN Y SOFTWARE Vol. 5 Nº. 1 Marzo Agosto 2024 ISSN Nº 2708-0935
31
Trabajos futuros
En el contexto de futuras investigaciones, se identifican diversas áreas clave para el
perfeccionamiento del pipeline propuesto en la clasificación de comentarios de productos de
Amazon. Se sugiere la exploración de técnicas de pre- procesamiento más avanzadas y
personalizadas para abordar desafíos específicos en el ámbito de las reseñas de productos, como
la adaptación de la limpieza de datos para considerar peculiaridades lingüísticas y contextuales.
Además, se sugiere la exploración de la sensibilidad del modelo a la variación en el número de
épocas de entrenamiento, considerando la posibilidad de incrementar este parámetro para
evaluar su impacto en el rendimiento y la convergencia del modelo. La experimentación con otras
arquitecturas de modelos, aparte de BERT.
Contribución de Autoría
Luisfelipe Rodrigo Mamani Arosquipa: Conceptualización, Análisis formal, Investigación,
Software, Validación, Redacción - borrador original, Curación de datos, Escritura, revisión y
edición, Visualización, Metodología, Software, Frank Jhoseph Duarte Oruro:
Conceptualización, Investigación, Visualización, Metodología, Software, Validación, Redacción -
borrador original, Curación de datos.
Referencias
[1]
P. Keung, Y. Lu, G. Szarvas y N. A. Smith, "The Multilingual Amazon Reviews Corpus",
en Proc. 2020 Conf. Empirical Methods Natural Lang. Process. (EMNLP), Online.
Stroudsburg, PA, USA: Assoc. Comput. Linguistics, 2020. Accedido el 21 de octubre
de 2023. [En línea]. Disponible: https://doi.org/10.18653/v1/2020.emnlp-main.369
[2]
M. V. Rao and S. C., "Detection of Sarcasm on Amazon Product Reviews using
Machine Learning Algorithms under Sentiment Analy- sis," 2021 Sixth International
Conference on Wireless Communications, Signal Processing and Networking
(WiSPNET), Chennai, India, 2021, pp. 196-199, doi:
10.1109/WiSPNET51692.2021.9419432.
[3]
Jain, K. (2021). Amazon reviews [Data set].
[4]
asin. Geophysical research letters, 25(2), 155-158.
REVISTA INNOVACIÓN Y SOFTWARE Vol. 5 Nº. 1 Marzo Agosto 2024 ISSN Nº 2708-0935
32
[5]
Rorato, A. C., Dal'Asta, A. P., Lana, R. M., Dos Santos, R. B., Escada, M. I. S., Vogt,
C. M.,Codec¸o, C. T. (2023). Trajetorias: a dataset of environmental,
epidemiological, and economic indicators for the Brazilian Amazon. Scientific Data,
10(1), 65.
[6]
C. Danescu-Niculescu-Mizil, G. Kossinets, J. Kleinberg, and L. Lee, "How opinions
are received by online communities: A case study on Amazon.com helpfulness
votes," arXiv (Cornell University), Jun. 2009, [Online]. Available:
https://arxiv.org/pdf/0906.3741.pdf
[7]
X. Zhao y Y. Sun, "Amazon Fine Food Reviews with BERT Model", Procedia Comput.
Sci., vol. 208, pp. 401-406, 2022. Accedido el 26 de noviembre de 2023. [En línea].
Disponible: https://doi.org/10.1016/j.procs.2022.10.056
[8]
A. Verma, C. Rawat y M. S. Gupta, "Sentiment Analysis for Amazon Product
Reviews", Int. J. Recent Technol. Eng. (IJRTE), vol. 11, n.º 2, pp. 109-112, julio de
2022. Accedido el 26 de noviembre de 2023. [En línea]. Disponible:
https://doi.org/10.35940/ijrte.b7099.0711222
[9]
S. Iftikhar, B. Alluhaybi, M. Suliman, A. Saeed y K. Fatima, "Ama- zon products
reviews classification based on machine learning, deep learning methods and BERT",
TELKOMNIKA (Telecommunication Comput. Electron. Control), vol. 21, n.º 5, p.
1084, octubre de 2023. Accedido el 26 de noviembre de 2023. [En línea]. Disponible:
https://doi.org/10.12928/telkomnika.v21i5.24046