Impacto de las Instrucciones de Comportamiento en Modelos de Lenguaje

Palabras clave: Intrucciones de comportamiento, Lenguajes y sus modelos, Procesado de lenguaje humano, Rendimeinto del Modelo, Comprension de los lenguajes, Aplicaciones de texto, Configuración del Modelo, Entrenamiento del Modelo, Traducción automática, Generación de texto, Clasificación de documentos

Resumen

El impacto de las instrucciones de comportamiento en modelos de lenguaje es un área de investigación fundamental en el ámbito del procesado para el lenguaje que sea humano. Este estudio se enfoca en analizar cómo las directrices específicas proporcionadas a los modelos lingüísticos afectan su rendimiento y eficacia en diversas tareas. Se examina detalladamente la importancia de las instrucciones en el entendimiento para que los lenguajes sean humano y su influencia en aplicaciones de actividades como la traducción automática, creación de contenido textual y categorización de documentos. Se discute cómo las instrucciones de comportamiento impactan en la configuración y entrenamiento de los modelos, así como en su capacidad predictiva y generativa. Se presentan ejemplos concretos de cómo las instrucciones pueden mejorar o limitar el desempeño de los modelos lingüísticos en diferentes contextos. Los resultados obtenidos resaltan la necesidad de considerar cuidadosamente las instrucciones de comportamiento al desarrollar y evaluar los lenguajes y sus modelos, con tener el deseo de optimizar su precisión y tener buen rendimiento en diversas tareas lingüísticas.

Descargas

La descarga de datos todavía no está disponible.

Citas

N. Chomsky, Syntactic Structures. Mouton, 1957.

J. R. Firth, Papers in Linguistics, 1934-1951. Oxford University Press, 1957.

G. Lakoff, Women, Fire, and Dangerous Things: What Categories Reveal About the Mind. University of Chicago Press, 1987.

T. Mikolov et al., “Distributed representations of words and phrases and their compositionality,” in Advances in Neural Information Processing Systems, 2013.

J. Pennington et al., “Glove: Global vectors for word representation,” in Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing, 2014.

T. B. Brown et al., “Language models are few-shot learners,” in Advances in Neural Information Processing Systems, 2020.

A. Vaswani et al., “Attention is all you need,” in Advances in Neural Information Processing Systems, 2017.

A. Radford et al., “Language models are few-shot learners,” arXiv preprint, vol. arXiv:1910.01108, 2019.

J. Smith, “Contextual coherence in natural language understanding,” Journal of Linguistic Research, 2015.

A. Jones, “Domain adaptability in language models,” in International Conference on Natural Language Processing, 2021.

I. Goodfellow, Y. Bengio, and A. Courville, Deep Learning. MIT Press, 2016.

D. Jurafsky and J. H. Martin, Speech and Language Processing. Pearson, 2008.

A. Ng, “Natural language processing with deep learning,” Coursera, 2019.

“Speech and language processing,” Coursera, Stanford University.

“The gradient,” Google AI. [Online]. Available: https://thegradient.pub/

A. Ng, “Ai today.” [Online]. Available: https://www.aitoday.io/

“Neural information processing systems (nips).” [Online]. Available: https://nips.cc/

“Conference on empirical methods in natural language processing (emnlp).” [Online]. Available: https://www.emnlp.org/

D. Amodei, C. Olah, J. Steinhardt, P. Christiano, J. Schulman, and D. Mané, “Concrete problems in ai safety,” 2016. [Online]. Available: https://arxiv.org/abs/1606.06565

M. Brundage, S. Avin, J. Clark, H. Toner, P. Eckersley, B. Garfinkel, A. Dafoe, P. Scharre, T. Zeitzoff, B. Filar, H. Anderson, H. Roff, G. C. Allen, J. Steinhardt, C. Flynn, S. hÉigeartaigh, S. Beard, H. Belfield, S. Farquhar, C. Lyle, R. Crootof, O. Evans, M. Page, J. Bryson, R. Yampolskiy, and D. Amodei, “The malicious use of artificial intelligence: Forecasting, prevention, and mitigation,” 2018. [Online]. Available: https://arxiv.org/abs/1802.07228

L. Floridi, The Ethics of Artificial Intelligence. Oxford University Press, 2019.

“Prompt engineering,” Hostinger, 2024. [Online]. Available: https://www.hostinger.es/tutoriales/ prompt-engineering

“Allen institute for artificial intelligence.” [Online]. Available: https://allenai.org/ [24] “Openai.” [Online]. Available: https://openai.com/

“Google ai.” [Online]. Available: https://ai.google/

M. Rouse. (2024) Chatgpt. Techopedia. 2024, 26 de enero. [Online]. Available: https://www.techopedia.com/es/definicion/chatgpt

Recibido: 2024-05-02
Aceptado: 2024-07-08
Publicado: 2024-09-30
Cómo citar
[1]
F. G. Huamanchumo Trujillo, A. R. Campos Gamarra, y M. Torres Villanueva, «Impacto de las Instrucciones de Comportamiento en Modelos de Lenguaje», Innov. softw., vol. 5, n.º 2, pp. 18-29, sep. 2024.
Sección
Artículos originales

Artículos más leídos del mismo autor/a