Aplicación de técnicas de Inteligencia Artificial para la diferenciación del nivel socioeconómico

Palabras clave: Inteligencia Artificial, árboles de decisión, regresión logística, dataset, nivel socioeconómico

Resumen

En este proyecto se hace una diferenciación entre personas a travez de diferentes parametros como edad,sexo,nivel educativo entre otros,para tratar de calcular a cuanto podria asender su salario. Este problema es importante a resolver por que así una persona podría predecir su futuros ingresos a través de las decisiones que tomaría en el presente, como por ejemplo hasta qué grado de educación debe recibir y cuando ya comenzar a trabajar para obtener experiencia. Nuestro procedimiento para resolver este problema han sido dos análisis estadísticos ,el primero regresión lineal y un árbol de decisión para poder hacer una comparativa entre estos, las hemos probado usando herramientas como Colab (Python) y un dataset. Nuestra población de nuestro trabajo fue de 32000 registros (filas).Los resultados fueron que a través del árbol de decisión hubo una precisión de 0.879 y un accuracy de 0.817 .Y con respecto a la regresión logística obtuvimos una precisión de 0.80 cuando para el sueldo <=50K y 0.72 cuando el sueldo es >50K, el accuracy obtenido es de 0.7912. Dando por conclusión que entre estas dos herramientas nos quedamos con el Árbol de decisión.

Descargas

La descarga de datos todavía no está disponible.
Citas

“Ingresos promedio a nivel mundial.” https://www.datosmundial.com/ingreso-promedio.php .

J. Vega, “Departamento de economía,” Pontif. Univ. Católica del Perú, p. 25, 2020, [Online]. Available: https://repositorio.pucp.edu.pe/index/handle/123456789/176236

J. Gamero and J. Pérez, “Perú: Impacto de la COVID - 19 en el empleo y los ingresos laborales,” Organ. Int. de Trab. Panor. Labor. en tiempos la COVID- 19, vol. I, no. I, p. 64, 2020, [Online]. Available: https://www.ilo.org/wcmsp5/groups/public/---americas/---ro-lima/documents/publication/wcms_756474.pdf

“Decreto Supremo N° 051-2020-PCM” https://cdn.www.gob.pe/uploads/document/file/572157/DECRETO_SUPREMO_N%C2%BA_051-2020-PCM.pdf (accessed Jun. 27, 2022).

“Decreto Supremo N° 116-2020-PCM” https://cdn.www.gob.pe/uploads/document/file/898487/DS_116-2020-PCM.pdf

Patrick Henry Winston, Artificial Intelligence, 3rd ed., vol. 110, no. 5. Addison-Wesley Publishing Company, 1993.

S. Fletcher and M. Z. Islam, “Decision tree classification with differential privacy: A survey,” ACM Comput. Surv., vol. 52, no. 4, 2019, doi: 10.1145/3337064.

S. Domínguez-Almendros, N. Benítez-Parejo, and A. R. Gonzalez-Ramirez, “Logistic regression models,” Allergol. Immunopathol. (Madr)., vol. 39, no. 5, pp. 295–305, 2011, doi: 10.1016/j.aller.2011.05.002.

D. B. Lomet, “Bulletin of the Technical Committee on Data Engineering,” Bull. Tech. Comm. Data Eng., vol. 24, no. 4, pp. 1–56, 2001, [Online]. Available: papers2://publication/uuid/30073F7F-1B7C-4496-ADA4-94FF4E6EE8F7

“Transformación de datos y por qué es importante para las empresas | Astera.” https://www.astera.com/es/type/blog/data-transformation-tools/

“ETL: Extracción, transformación y carga de datos - Evaluando Software.” https://www.evaluandosoftware.com/etl-extraccion-transformacion-carga-datos/

M. M. Breunig, H. P. Kriegel, R. T. Ng, and J. Sander, “OPTICS-OF: Identifying local outliers,” Lect. Notes Comput. Sci. (including Subser. Lect. Notes Artif. Intell. Lect. Notes Bioinformatics), vol. 1704, pp. 262–270, 1999, doi: 10.1007/978-3-540-48247-5_28.

“Te damos la bienvenida a Colaboratory - Colaboratory.” https://colab.research.google.com/?hl=es#scrollTo=5fCEDCU_qrC0.

Recibido: 2023-12-19
Aceptado: 2024-03-01
Publicado: 2024-03-30
Cómo citar
[1]
C. Z. Pacori Paucar, M. E. Mayta Condori, L. F. Quispe Sanomamani, y D. G. Montana Neyra, «Aplicación de técnicas de Inteligencia Artificial para la diferenciación del nivel socioeconómico», Innov. softw., vol. 5, n.º 1, pp. 141-155, mar. 2024.
Sección
Artículos originales