Resultados
Para todos estos resultados se usaron data sets equilibrados de 30K de datos, entre los que más
resaltan es el entrenamiento con BERT y Naive Bayes (TF-IDF), aunque el método de NB es más
rápido al sacar resultados BERT puede superar estos resultados con el entrenamiento exacto sin
sobre entrenarlo.
En cuanto a este trabajo que se realizó en BERT, se usó el modelo de "bert-base-uncase" ya que
nuestros recursos para trabajar este proyecto fueron muy limitados, al no contar con una tarjeta
de video usamos google colab (T4 GPU) el cual nos prestaba su GPU por unas 6 horas promedio,
limitándonos a usar data sets de 30K de datos por 10 epocas, cuando quisimos trabajar con otros
modelos como "bert-large-uncase" o "bert-large-uncase-enmascared" que son más eficientes no
pudimos ya que el T4 GPU de colab nos limitaba a solo usar "bert-base-uncased" y así no pudimos
obtener los resultados deseados.
Conclusiones
• Potencial Impacto en la Salud Mental: El proyecto presenta una aplicación práctica de la
tecnología para mejorar la salud mental al prevenir posibles tragedias. La detección temprana
de usuarios en riesgo, incluso si no expresan abiertamente sus pensamientos suicidas, abre
la puerta para la intervención oportuna de profesionales de la salud mental.
• Desafíos Computacionales: Aunque BERT ha demostrado ser una herramienta poderosa, su
implementación puede ser computacionalmente costosa y requerir recursos significativos de
hardware. Este desafío se debe tener en cuenta al considerar la escalabilidad y la
implementación práctica del modelo.
• Resultados Aceptables: Los resultados obtenidos, especialmente en términos de precisión,
recall y F1 score, indican que el modelo propuesto tiene un rendimiento aceptable. La
aplicación de métricas como F1 score es crucial en tareas de clasificación de texto para
evaluar el equilibrio entre precisión y recall.
Contribución de Autoría
Aron Josue Hurtado Cruz: Conceptualización, Análisis formal, Investigación, Visualización,
Metodología, Software, Validación, Redacción - borrador original, Curación de datos, Escritura,
revisión y edición. Isabel Karina Ttito Campos: Conceptualización, Investigación, Visualización,
Metodología, Software, Validación, Redacción - borrador original, Curación de datos.