REVISTA INNOVACIÓN Y SOFTWARE Vol. 5 Nº. 1 Marzo Agosto 2024 ISSN Nº 2708-0935
RECIBIDO 05/10/2023 ● ACEPTADO 22/12/2023 PUBLICADO 30/03/2024
RESUMEN
El proyecto se enfoca en el desarrollo de un algoritmo de Procesamiento de Lenguaje Natural
(NLP, por sus siglas en inglés) diseñado para detectar comentarios suicidas en la plataforma
Reddit y posteriormente realizar un análisis de sentimientos negativos con el propósito de brindar
apoyo a los usuarios que puedan encontrarse en riesgo de suicidio. Para lograr este objetivo, el
proyecto combina conceptos y técnicas de inteligencia artificial, procesamiento de lenguaje
natural y psicología/psiquiatría.
Para evaluar la eficiencia del proyecto aplicamos la métrica F1 obteniendo un resultado
bastante aceptable respecto a una clasificación textual.
Palabras claves:
BERT, clasificación, NLP, depresión, suicidio.
ABSTRACT
The project focuses on the development of a Natural Language Processing (NLP) algorithm
designed to detect suicidal comments on the Reddit platform and subsequently perform a
negative sentiment analysis for the purpose of providing support to users who may be at risk of
suicide. To achieve this goal, the project combines concepts and techniques from artificial
intelligence, natural language processing and psychology/psychiatry.
Isabel Karina Ttito Campos
Universidad La Salle. Arequipa, Perú.
ittitoc@ulasalle.edu.pe
https://orcid.org/0009-0008-9159-7581
Aron Josue Hurtado Cruz
Universidad La Salle. Arequipa, Perú.
ahurtadoc@ulasalle.edu.pe
https://orcid.org/0009-0002-0423-1730
ARK: ark:/42411/s15/a123
DOI: 10.48168/innosoft.s15.a123
PURL: 42411/s15/a123
REVISTA INNOVACIÓN Y SOFTWARE Vol. 5 Nº. 1 Marzo Agosto 2024 ISSN Nº 2708-0935
60
To evaluate the efficiency of the project we applied the F1 metric obtaining a fairly acceptable
result with respect to a textual classification
Keywords:
BERT, classification, depression, NLP, suicide.
INTRODUCCIÓN
El Procesamiento de Lenguaje Natural es esencial para analizar el contenido de los comentarios,
identificando signos de advertencia relacionados con la ideación suicida. Además, los aportes de
la psicología y la experiencia clínica contribuyen significativamente a una comprensión matizada
de estas señales de advertencia, asegurando una identificación más precisa de los usuarios en
riesgo.
En este contexto, es relevante señalar que investigaciones anteriores han contribuido
significativamente al desarrollo de algoritmos que abordan la detección de la ideación suicida.
Yeskuatov et al. (2022) aprovecharon Reddit para la detección de la ideación suicida,
proporcionando una revisión exhaustiva de las técnicas de aprendizaje automático y
procesamiento de lenguaje natural [1]. Además, estudios realizados por Aldhyani et al. (2022)
[2], Tadesse et al. (2019) [3], Awatramani et al. (2021) [4], Pal et al. (2018) [5] y Rahat et al.
(2019) [6] han explorado diversas metodologías, desde el aprendizaje profundo hasta el análisis
de sentimientos, enriqueciendo el panorama de herramientas disponibles para tareas críticas
como esta. Estas referencias constituyen una base sólida para el desarrollo y la evaluación de
nuestro algoritmo.
Trabajos relacionados
En esta sección, revisaremos algunos enfoques y estudios relacionados que se han centrado en
problemas similares al propuesto en este proyecto.
Leveraging Reddit for Suicidal Ideation Detection: A Review of Machine Learning and Natural
Language Processing Techniques.
Este artículo proporciona una revisión de la literatura de los artículos recientes que detallan los
métodos de aprendizaje automático y procesamiento del lenguaje natural (NLP) utilizados para
detectar la ideación suicida en Reddit. Los autores identifican tres enfoques principales:
Enfoques basados en reglas: Estos enfoques utilizan un conjunto de reglas predefinidas,
basadas en palabras y frases clave asociadas a la ideación suicida, para identificar
publicaciones y comentarios que pueden indicar un riesgo de suicidio.