Angel Alexis Zevallos Apaza  
Universidad Nacional de San Agustín.  
Arequipa, Perú.  
Sofía Sair Onque Gárate  
Universidad Nacional de San Agustín.  
Arequipa, Perú.  
azevallosa@unsa.edu.pe  
sonque@unsa.edu.pe  
Arian Eduardo Javier Canaza  
Cuadros  
Universidad Nacional de San Agustín.  
Arequipa, Perú.  
Paulina Miriam Choqueneira Ccasa  
Universidad Nacional de San Agustín.  
Arequipa, Perú.  
pchoqueneira@unsa.edu.pe  
acanazacua@unsa.edu.pe  
RECIBIDO 28/06/2022 ● ACEPTADO 02/08/2022 PUBLICADO 30/09/2022  
RESUMEN  
En este trabajo se planteó como objetivo utilizar la técnica de árbol de decisión para definir un  
modelo capaz de predecir la potabilidad del agua. Para evaluar el rendimiento de la clasificación  
del árbol de decisión se utilizó un dataset extraído de Kaggle que cuenta con 3276 muestras de  
agua divididas por la variable de potabilidad. Aplicando las librerías Pandas y Scikit Learn se logró  
definir un modelo basado en un árbol de decisión evaluado con las métricas de precisión,  
exactitud, exhaustividad y puntuación F1 logrando 0.77, 0.80, 0.85 y 0.81 respectivamente.  
Palabras claves: Agua potable, inteligencia artificial, árbol de decisión.  
ABSTRACT  
The objective of this work was to use the decision tree technique to define a model capable of  
predicting water potability. To evaluate the performance of the decision tree classification, a  
dataset extracted from Kaggle was used, which has 3276 water samples divided by the potability  
variable. Applying the Pandas and Scikit Learn libraries, a model based on a decision tree  
REVISTA INNOVACIÓN Y SOFTWARE  
VOL 3 Nº 2 Septiembre - Febrero 2022 ISSN Nº 2708-0935  
evaluated with the metrics of precision, accuracy, completeness and F1 score was defined,  
achieving 0.77, 0.80, 0.85 and 0.81 respectively.  
Keywords: Drinking water, artificial intelligence, decision tree.  
INTRODUCCIÓN  
La vida del hombre y su existencia se la debe al agua, existe una alta necesidad de esta y cada  
vez más por el incremento de la población, por consecuencia ocurre una mayor demanda de agua.  
Existen desigualdades entre las zonas urbanas y rurales, puesto que el 96% de la población  
mundial urbana utiliza fuentes de agua potable frente al 84% de la población rural, tal como lo  
dicen en [1], por lo que el poseer agua potable es una necesidad primaria, como lo menciona la  
Asamblea General de las Naciones Unidas [2].  
"Todas las personas tienen derecho a disponer de forma continuada de agua suficiente, salubre,  
físicamente accesible, asequible y de una potabilidad del agua aceptable, para uso personal y  
doméstico". Entonces podemos reafirmar que el consumo de agua se debe garantizar, el agua no  
debe estar contaminada o con sustancias que puedan producir enfermedades ya que este sería  
un problema muy grave.  
Entrando en un contexto cercano, en el Perú más de un 70% de las aguas residuales no tienen  
tratamiento, la contaminación en el agua puede ser una gran preocupación para nosotros, porque  
pone en peligro la salud pública. Los principales lugares que superan los límites recomendados  
por la OMS para el consumo humano de agua son Lima, La Oroya y Juliaca de la cual puede ver  
más información en [3].  
Incluso aquí en Arequipa mediante estudios se determinó que se superaron los parámetros  
establecidos en bacterias coliformes, que se evalúan en [4]. Por lo que para evitar que esta  
situación empeore se necesita un buen control del agua verificando que esta sea apta para  
consumo humano.  
La forma como se mide la contaminación química, los límites que se toleran y las decisiones que  
se toman al respecto de las afluentes de agua, depende de procesos de monitoreo y vigilancia.”  
5]. Con esta perspectiva, este trabajo plantea la implementación de inteligencia artificial para  
[
determinar las condiciones de la potabilidad del agua a partir de datos que han sido obtenidos de  
un trabajo de análisis.  
Con el modelo se espera determinar con un error mínimo la potabilidad del agua, para beneficiar  
a la población que obtiene el líquido de afluentes, además de aportar a los procesos que  
determinan su potabilidad. Ello se plantea hallar en función a los distintos parámetros que influyen  
REVISTA INNOVACIÓN Y SOFTWARE  
VOL 3 Nº 2 Septiembre - Febrero 2022 ISSN Nº 2708-0935