Predictive model of water potability through a decision tree in Artificial Intelligence
Abstract
The objective of this work was to use the decision tree technique to define a model capable of predicting water potability. To evaluate the performance of the decision tree classification, a dataset extracted from Kaggle was used, which has 3276 water samples divided by the potability variable. Applying the Pandas and Scikit Learn libraries, a model based on a decision tree evaluated with the metrics of precision, accuracy, completeness, and F1 score was defined, achieving 0.77, 0.80, 0.85, and 0.81, respectively.
Downloads
References
C. C. Sánchez, “Enfermedades infecciosas relacionadas con el agua en el Perú,” Revista peruana de medicina experimental y salud publica, 35, 309-316.2018
B. Serrano Pérez, R. Tendero Caballero, & M. D. Río Merino, “Parámetros indicadores del agua potable doméstica urbana, umbrales y consecuencias para la salud,” 2018.
F. L. Meoño, C. G. Taranco, & Y. M. Olivares, “Las aguas residuales y sus consecuencias en el Perú. Saber y hacer,” 2(2), 8-25. 2015
M. F. Amado Camargo, “Determinación bacteriológica de la calidad del agua de consumo humano, regadío y bebida de animales del Distrito de Majes, Provincia de Caylloma, Departamento de Arequipa, Abril-Mayo 2017”, DSpace. Tesis. Arequipa, 2018. Disponible: http://repositorio.unsa.edu.pe/handle/UNSA/5890
A. J. Espinosa Ramírez, “El agua, un reto para la salud pública: la calidad del agua y las oportunidades para la vigilancia en salud ambiental.” UNAL. Tesis. Bogotá, 2018. Disponible: https://repositorio.unal.edu.co/handle/unal/63149
C. Idrovo. “Optimización de la planta de tratamiento de Uchupucún,” B.S. Tesis. Cuenca, 2010. Disponible: http://dspace.ucuenca.edu.ec/handle/123456789/2426
I. D. López, A. Figueroa y J. C. Corrales, "Un mapeo sistemático sobre predicción de calidad del agua mediante técnicas de inteligencia computacional", Revista Ingenierías Universidad de Medellín, vol. 15, n.º 28, pp. 35–52, 2016. Accedido el 10 de agosto de 2022. Disponible: https://doi.org/10.22395/rium.v15n28a2
L. Quiñones Huatangari, L. Ochoa Toledo, N. Kemper Valverde, O. Gamarra Torres, J. Bazán Correa y J. Delgado Soto, "Red neuronal artificial para estimar un índice de calidad de agua", Enfoque UTE, vol. 11, n.º 2, pp. 109–120, abril de 2020. Accedido el 11 de agosto de 2022. Disponible: https://doi.org/10.29019/enfoque.v11n2.633
A. F. Siles, “Desarrollo de software y diseño de un sistema automatizado para monitoreo y predicción de eventos de contaminación en sistemas de distribución de agua, utilizando inteligencia artificial”. Repositorio DspaceDesarrollo de software y diseño de un sistema automatizado para monitoreo y predicción de eventos de contaminación, 1 octubre, 2019. Accedido el 16 de agosto de 2022. Disponible: http://literatura.ciidiroaxaca.ipn.mx:8080/xmlui/handle/LITER_CIIDIROAX/230
A. C. Aguilar Aguilar y F. F. Obando - Díaz, "APRENDIZAJE AUTOMÁTICO PARA LA PREDICCIÓN DE CALIDAD DE AGUA POTABLE", Ingeniare, n.º 28, junio de 2020.Disponible: https://doi.org/10.18041/1909-2458/ingeniare.28.6215
Iberdrola. "¿Qué es la Inteligencia Artificial? - Iberdrola". Iberdrola. https://www.iberdrola.com/innovacion/que-es-inteligencia-artificial.
INSTITUTO DE INGENIERÍA DEL CONOCIMIENTO. "Machine Learning y Deep Learning - Expertos en IIC". 2022. Instituto de Ingeniería del Conocimiento. https://www.iic.uam.es/inteligencia-artificial/machine-learning-deep-learning/.
K. Kelley. "What is Data Analysis? Types, Methods and Techniques 2022, Simplilearn". Simplilearn.com. https://www.simplilearn.com/data-analysis-methods-process-types-article#what_is_data_analysis.
Lucid Software Inc.. "Qué es un diagrama de árbol de decisión". Lucidchart. https://www.lucidchart.com/pages/es/que-es-un-diagrama-de-arbol-de-decision.
I. Moreno Hojas y StatPlans. "Construyendo árboles de decisión - StatDeveloper". StatDeveloper. https://www.statdeveloper.com/construyendo-arboles-de-decision/.
F. Charte. "Cómo es el proceso de extraer conocimiento a partir de bases de datos - campusMVP.es". campusMVP.es. https://www.campusmvp.es/recursos/post/el-proceso-de-extraccion-de-conocimiento-a-partir-de-bases-de-datos.aspx.
"Water Quality". Kaggle: Your Machine Learning and Data Science Community. 2021, [En línea] https://www.kaggle.com/datasets/adityakadiwal/water-potability.
Copyright (c) 2022 Innovación y Software
This work is licensed under a Creative Commons Attribution 4.0 International License.
The authors exclusively grant the right to publish their article to the Innovation and Software Journal, which may formally edit or modify the approved text to comply with their own editorial standards and with universal grammatical standards, prior to publication; Likewise, our journal may translate the approved manuscripts into as many languages as it deems necessary and disseminates them in several countries, always giving public recognition to the author or authors of the research.