si el dato se consideraba relacionado al suicidio o no. En caso de ambigüedad se optó por colocarlo
como suicida. Para la categoría de suicidio se considera que este explicito el intento de suicidio
del usuario. Para la categoría de no suicidio se considera sarcasmo, reportes, o textos
relacionados a la sensibilización del tema.
Para el preprocesamiento se quitaron las urls, la mención de usuarios, hashtags y los signos como
el guion y el apostrofe (-,’), se consideraron las palabras que repitieran las letras. Luego esta
información paso por tres arquitecturas. Recurrent Neural Network (RNN) modelo que se destaca
por ser eficiente al clasificar información secuencial de longitud arbitraria. Long Short Term
Memory (LSTM), método adecuado para clasificar, procesar y predecir series temporales y captar
dependencias a largo plazo en las frases. Finalmente, C-LSTM, este modelo combina la eficiencia
de codificación espacial y la extracción automática de características de la red neuronal
convolucional (Convolutional neural network, CNN), combinada con la eficaz clasificación de
textos mediante LSTM.
El procesamiento de clasificación se basó en tres etapas. Integración de palabras, integración de
frases y clasificación. Para la primera etapa se usaron las N palabras más frecuentes en un tweet
para formar una capa, se utilizó word2vec. La segunda etapa se usó en el modelo C-LSTM, donde
se añade un CNN unidimensional y luego una capa de integración. La integración de sentencias
alimenta la capa de LSTM. Finalmente, la clasificación donde el modelo alimenta las sentencias
aprendidas. En comparación a los tres modelos el que dio mejores resultados fue el modelo
híbrido C-LSTM.
D. Detection of Suicidal Ideation on Twitter using Machine Learning and Ensemble Approaches
El suicidio es uno de los principales problemas de salud pública que consume muchas vidas. Según
las estadísticas de la Organización Mundial de la Salud (OMS), alrededor de un millón de personas
mueren por suicidio cada a no.
La OMS menciono que el suicidio es la principal causa de muerte entre los adolescentes y la sexta
entre los adultos. Los factores incluyen problemas personales como desesperanza, abuso de
sustancias, ansiedad, esquizofrenia; factores sociales como el aislamiento de la sociedad, la
perdida de seres queridos, el desempleo, etc. A pesar del creciente número de casos de suicidio,
se puede prevenir hasta cierto punto mediante la comprensión de los factores de riesgo
relacionados con el comportamiento suicida en las primeras etapas del proceso suicida. El proceso
de suicidio comienza con pensamientos o ideas suicidas. Luego madura hasta el intento de suicidio
y finalmente hasta el suicidio consumado [1].
Hay una creciente inclinación de las personas a formar comunidades en línea e interactuar entre
sí. Las investigaciones han revelado que las personas se sienten cómodas para hablar sobre
tendencias suicidas en línea en lugar de hablar de ello cara a cara; la razón es una sensación de
autocontrol y la característica anónima de las redes sociales. Existen varios casos en los que las
víctimas de suicidio también revelaron sus sentimientos finales antes de su muerte en las redes
sociales.