Clasificación de comentarios de Android usando BERT

Susana Rosa Elizabeth  Mansilla Ancco; Marcelo Antony Pérez Treviños

doi:10.48168/innosoft.s15.a120

Susana Rosa Elizabeth Mansilla Ancco Universidad La Salle
Marcelo Antony Pérez Treviños Universidad La Salle

DOI: 10.48168/innosoft.s15.a120

PURL: 42411/s15/a120

ARK: ark:/42411/s15/a120

Palabras clave: BERT, clasificación de tópicos, clasificación de texto, procesamiento de lenguaje natural

Resumen

Este proyecto se centra en desarrollar una herramienta de análisis de texto basada en NLP para evaluar comentarios de usuarios de aplicaciones Android, específicamente recopilados de F-Droid. La falta de una solución automatizada para analizar y entender estas opiniones, clasificándolas en tópicos específicos, motiva la investigación. El objetivo es proporcionar a desarrolladores, usuarios y analistas de datos una visión detallada de las preferencias y percepciones de los usuarios. Utilizando conjuntos de datos en inglés entre 2014 y 2017, la propuesta se implementa en Python con la librería Pandas. Se emplea el modelo BERT para la clasificación, con un enfoque específico en la comparación de diferentes modelos. La interfaz gráfica se construye en Visual Studio, permitiendo a los usuarios ingresar comentarios y obtener clasificaciones de tópicos, junto con visualizaciones de nubes de palabras.

Descargas

La descarga de datos todavía no está disponible.

Citas

. S. Moon, S. Chi, and S.-B. Im, “Automated detection of contractual risk clauses from construction specifications using bidirectional encoder representations from Transformers (Bert),” Automation in Construction, October, 2022. [Online]. Available:https://www.sciencedirect.com/science/article/pii/S0926580522003387. DOI: https://doi.org/10.1016/j.autcon.2022.104465

. Alammar, J. "Ecco: An open source library for the explainability of transformer language models", Proceedings of the 59th annual meeting of the association for computational linguistics and the 11th international joint conference on natural language processing: System demonstrations, pp.249-257,2021. DOI: https://doi.org/10.18653/v1/2021.acl-demo.30

. Rahat, A. Mohaimin, A. Kahir, and A. Mohammad. "Comparison of Naive Bayes and SVM Algorithm based on sentiment analysis using review dataset", 8th International Conference System Modeling and Advancement in Research Trends (SMART). IEEE, 2019. DOI: https://doi.org/10.1109/SMART46866.2019.9117512

. Li, Q., et al., “A survey on text classification: From traditional to deep learning”, ACM Transactions on Intelligent Systems and Technology (TIST), vol. 13, no.2, pp. 1-41,2022. DOI: https://doi.org/10.1145/3495162

. G.Mendez, S., et al. “Identifying banking transaction descriptions via support vector machine short-text classification based on a specialized labelled corpus”, IEEE Access, vol. 8, pp. 61642-61655,2020. DOI: https://doi.org/10.1109/ACCESS.2020.2983584

. Nikhil, “Bert: Handling class imbalance in text classification,” Medium, December, 2023. [Online]. Available: https://medium.com/@nikviz/bert-handling-class-imbalance-in-language-models-7fe9ccc62cb6.