Predictive model of water potability through a decision tree in Artificial Intelligence

Keywords: Drinking water, artificial intelligence, decision tree

Abstract

The objective of this work was to use the decision tree technique to define a model capable of predicting water potability. To evaluate the performance of the decision tree classification, a dataset extracted from Kaggle was used, which has 3276 water samples divided by the potability variable. Applying the Pandas and Scikit Learn libraries, a model based on a decision tree evaluated with the metrics of precision, accuracy, completeness, and F1 score was defined, achieving 0.77, 0.80, 0.85, and 0.81, respectively.

Downloads

Download data is not yet available.

References

C. C. Sánchez, “Enfermedades infecciosas relacionadas con el agua en el Perú,” Revista peruana de medicina experimental y salud publica, 35, 309-316.2018

B. Serrano Pérez, R. Tendero Caballero, & M. D. Río Merino, “Parámetros indicadores del agua potable doméstica urbana, umbrales y consecuencias para la salud,” 2018.

F. L. Meoño, C. G. Taranco, & Y. M. Olivares, “Las aguas residuales y sus consecuencias en el Perú. Saber y hacer,” 2(2), 8-25. 2015

M. F. Amado Camargo, “Determinación bacteriológica de la calidad del agua de consumo humano, regadío y bebida de animales del Distrito de Majes, Provincia de Caylloma, Departamento de Arequipa, Abril-Mayo 2017”, DSpace. Tesis. Arequipa, 2018. Disponible: http://repositorio.unsa.edu.pe/handle/UNSA/5890

A. J. Espinosa Ramírez, “El agua, un reto para la salud pública: la calidad del agua y las oportunidades para la vigilancia en salud ambiental.” UNAL. Tesis. Bogotá, 2018. Disponible: https://repositorio.unal.edu.co/handle/unal/63149

C. Idrovo. “Optimización de la planta de tratamiento de Uchupucún,” B.S. Tesis. Cuenca, 2010. Disponible: http://dspace.ucuenca.edu.ec/handle/123456789/2426

I. D. López, A. Figueroa y J. C. Corrales, "Un mapeo sistemático sobre predicción de calidad del agua mediante técnicas de inteligencia computacional", Revista Ingenierías Universidad de Medellín, vol. 15, n.º 28, pp. 35–52, 2016. Accedido el 10 de agosto de 2022. Disponible: https://doi.org/10.22395/rium.v15n28a2

L. Quiñones Huatangari, L. Ochoa Toledo, N. Kemper Valverde, O. Gamarra Torres, J. Bazán Correa y J. Delgado Soto, "Red neuronal artificial para estimar un índice de calidad de agua", Enfoque UTE, vol. 11, n.º 2, pp. 109–120, abril de 2020. Accedido el 11 de agosto de 2022. Disponible: https://doi.org/10.29019/enfoque.v11n2.633

A. F. Siles, “Desarrollo de software y diseño de un sistema automatizado para monitoreo y predicción de eventos de contaminación en sistemas de distribución de agua, utilizando inteligencia artificial”. Repositorio DspaceDesarrollo de software y diseño de un sistema automatizado para monitoreo y predicción de eventos de contaminación, 1 octubre, 2019. Accedido el 16 de agosto de 2022. Disponible: http://literatura.ciidiroaxaca.ipn.mx:8080/xmlui/handle/LITER_CIIDIROAX/230

A. C. Aguilar Aguilar y F. F. Obando - Díaz, "APRENDIZAJE AUTOMÁTICO PARA LA PREDICCIÓN DE CALIDAD DE AGUA POTABLE", Ingeniare, n.º 28, junio de 2020.Disponible: https://doi.org/10.18041/1909-2458/ingeniare.28.6215

Iberdrola. "¿Qué es la Inteligencia Artificial? - Iberdrola". Iberdrola. https://www.iberdrola.com/innovacion/que-es-inteligencia-artificial.

INSTITUTO DE INGENIERÍA DEL CONOCIMIENTO. "Machine Learning y Deep Learning - Expertos en IIC". 2022. Instituto de Ingeniería del Conocimiento. https://www.iic.uam.es/inteligencia-artificial/machine-learning-deep-learning/.

K. Kelley. "What is Data Analysis? Types, Methods and Techniques 2022, Simplilearn". Simplilearn.com. https://www.simplilearn.com/data-analysis-methods-process-types-article#what_is_data_analysis.

Lucid Software Inc.. "Qué es un diagrama de árbol de decisión". Lucidchart. https://www.lucidchart.com/pages/es/que-es-un-diagrama-de-arbol-de-decision.

I. Moreno Hojas y StatPlans. "Construyendo árboles de decisión - StatDeveloper". StatDeveloper. https://www.statdeveloper.com/construyendo-arboles-de-decision/.

F. Charte. "Cómo es el proceso de extraer conocimiento a partir de bases de datos - campusMVP.es". campusMVP.es. https://www.campusmvp.es/recursos/post/el-proceso-de-extraccion-de-conocimiento-a-partir-de-bases-de-datos.aspx.

"Water Quality". Kaggle: Your Machine Learning and Data Science Community. 2021, [En línea] https://www.kaggle.com/datasets/adityakadiwal/water-potability.

Received: 2022-06-28
Accepted: 2022-08-02
Published: 2022-09-30
How to Cite
[1]
A. A. Zevallos Apaza, S. S. Onque Gárate, A. E. J. Canaza Cuadros, and P. M. Choqueneira Ccasa, “Predictive model of water potability through a decision tree in Artificial Intelligence”, Innov. softw., vol. 3, no. 2, pp. 121-131, Sep. 2022.
Section
Journal papers