Clasificación de comentarios de Android usando BERT
Resumen
Este proyecto se centra en desarrollar una herramienta de análisis de texto basada en NLP para evaluar comentarios de usuarios de aplicaciones Android, específicamente recopilados de F-Droid. La falta de una solución automatizada para analizar y entender estas opiniones, clasificándolas en tópicos específicos, motiva la investigación. El objetivo es proporcionar a desarrolladores, usuarios y analistas de datos una visión detallada de las preferencias y percepciones de los usuarios. Utilizando conjuntos de datos en inglés entre 2014 y 2017, la propuesta se implementa en Python con la librería Pandas. Se emplea el modelo BERT para la clasificación, con un enfoque específico en la comparación de diferentes modelos. La interfaz gráfica se construye en Visual Studio, permitiendo a los usuarios ingresar comentarios y obtener clasificaciones de tópicos, junto con visualizaciones de nubes de palabras.
Descargas
Citas
. S. Moon, S. Chi, and S.-B. Im, “Automated detection of contractual risk clauses from construction specifications using bidirectional encoder representations from Transformers (Bert),” Automation in Construction, October, 2022. [Online]. Available:https://www.sciencedirect.com/science/article/pii/S0926580522003387.
. Alammar, J. "Ecco: An open source library for the explainability of transformer language models", Proceedings of the 59th annual meeting of the association for computational linguistics and the 11th international joint conference on natural language processing: System demonstrations, pp.249-257,2021.
. Rahat, A. Mohaimin, A. Kahir, and A. Mohammad. "Comparison of Naive Bayes and SVM Algorithm based on sentiment analysis using review dataset", 8th International Conference System Modeling and Advancement in Research Trends (SMART). IEEE, 2019.
. Li, Q., et al., “A survey on text classification: From traditional to deep learning”, ACM Transactions on Intelligent Systems and Technology (TIST), vol. 13, no.2, pp. 1-41,2022.
. G.Mendez, S., et al. “Identifying banking transaction descriptions via support vector machine short-text classification based on a specialized labelled corpus”, IEEE Access, vol. 8, pp. 61642-61655,2020.
. Nikhil, “Bert: Handling class imbalance in text classification,” Medium, December, 2023. [Online]. Available: https://medium.com/@nikviz/bert-handling-class-imbalance-in-language-models-7fe9ccc62cb6.
Derechos de autor 2024 Innovación y Software
Esta obra está bajo licencia internacional Creative Commons Reconocimiento 4.0.
Los autores ceden en exclusiva el derecho de publicación de su artículo a la Revista Innovación y Software, que podrá editar o modificar formalmente el texto aprobado para cumplir con las normas editoriales propias y con los estándares gramaticales universales, antes de su publicación; asimismo, nuestra revista podrá traducir los manuscritos aprobados a cuantos idiomas considere necesario y difundirlos en varios países, dándole siempre el reconocimiento público al autor o autores de la investigación.