Clasificación de categorías de noticias usando BERT

Palabras clave: clasificacion de noticias, procesamiento de lenguaje natural, BERT, machine learning, inteligencia artificial

Resumen

El presente proyecto consiste en desarrollar un modelo de Procesamiento del Lenguaje Natural para clasificar noticias utilizando un conjunto de datos o DataSets ya evaluados. El objetivo principal es crear un sistema que pueda identificar y asignar automáticamente las noticias a una de las categorías predefinidas: negocios, entretenimiento, política, deportes o tecnología. Esto implica el preprocesamiento de datos, extracción de características, entrenamiento de un modelo de machine learning y posteriormente su evaluación de rendimiento utilizando métricas como” precisión”,” recall 2” F1 − score”. Esto permitir ‘a determinar que tan bien el modelo puede predecir la categoría correcta para una noticia nueva o no etiquetada. Si el rendimiento del modelo es satisfactorio, se puede utilizar para clasificar noticias no etiquetadas en tiempo real. En resumen, se busca proporcionar una solución eficiente y precisa para organizar y etiquetar el contenido informativo de una noticia con ayuda de la Inteligencia Artificial.

Descargas

La descarga de datos todavía no está disponible.

Citas

Abu Nowshed Chy, Md Hanif Seddiqui, and Sowmitra Das. Bangla news classification using naive bayes classifier. In 16th Int’l Conf. Computer and Information Technology, pages 366–371. IEEE, 2014.

Philip J Hayes, Laura E Knecht, and Monica J Cellio. A news story categorization system. In Second Conference on Applied Natural Language Processing, pages 9–17, 2000.

Md Mahbubur Rahman, Rifat Sadik, and Al Amin Biswas. Bangla document classification using character level deep Lear Ning. In 2020 4th International Symposium on Multidisciplinary Studies and Innovative Technologies (ISMSIT), pages 1–6. IEEE, 2020.

Meng-Jin Wu, Tzu-Yuan Fu, Yao-Chung Chang, and Chia-Wei Lee. A study on natural language processing classified news. In 2020 Indo–Taiwan 2nd International Conference on Computing, Analytics and Networks (Indo-Taiwan ICAN), pages 244–247. IEEE, 2020.

Zhen Wang, Xu Shan, Xiangxie Zhang, and Jie Yang. N24news: A new dataset for multimodal news classification, 2022.

Recibido: 2023-03-18
Aceptado: 2023-06-28
Publicado: 2023-09-30
Cómo citar
[1]
B. L. Machado Medina, C. A. Santillana Quirita, y S. V. Bautista Luque, «Clasificación de categorías de noticias usando BERT», Innov. softw., vol. 4, n.º 2, pp. 36-51, sep. 2023.
Sección
Artículos originales