Renato Eduardo Delgado Huacallo  
Universidad Nacional de San Agustín.  
Arequipa, Perú.  
Christian Ilachoque Hanccoccallo  
Universidad Nacional de San Agustín.  
Arequipa, Perú.  
Felman Luque Sanabria  
Universidad Nacional de San Agustín.  
Arequipa, Perú.  
Jose Maykol Paniura Huamani  
Universidad Nacional de San Agustín.  
Arequipa, Perú.  
RECIBIDO 20/06/2022 ACEPTADO 31/07/2022 PUBLICADO 30/09/2022  
RESUMEN  
La obesidad es un problema para la salud pública que afecta a la población mundial es por eso  
que el presente trabajo está orientado a presentar una solución informática para la estimación y  
predicción de niveles de obesidad haciendo posible que una persona pueda conocer su estado  
físico actual, para esto se usó un dataset de personas con obesidad de distintos países como Perú,  
México y Colombia basándose en sus hábitos alimenticios y su condición física, creando con todos  
estos datos un árbol de decisión.  
Palabras claves: Obesidad, árbol de decisión, nivel de obesidad.  
ABSTRACT  
Obesity is a public health problem that affects the world population, that is why the present work  
is oriented to present a computer solution for the estimation and prediction of obesity levels,  
making it possible for a person to know their current physical condition for this we used a dataset  
REVISTA INNOVACIÓN Y SOFTWARE  
VOL 3 Nº 2 Septiembre - Febrero 2022 ISSN Nº 2708-0935  
of people with obesity from different countries like Peru, Mexico and Colombia based on their  
eating habits and their physical condition, creating a decision tree with all these data.  
Keywords: Obesity, decision tree, level of obesity.  
INTRODUCCIÓN  
Es un hecho en el mundo que el problema de obesidad va en aumento, muchos años atrás está  
tan solo era un número pequeño dentro de la población mundial, pero este problema en la  
actualidad va en crecimiento, lo cual puede presentar un gran problema para la salud pública de  
infantes y adultos, cuyas consecuencias propias de un actuar negligente, representa pérdidas  
sustanciales, en razón a que la obesidad implica un estado vulnerable hacia otras enfermedades  
como puede ser el cáncer o problemas cardiovasculares que afectan al corazón [1,2].  
Según la Organización Mundial de la Salud (OMS) [3] desde 1975 los problemas de obesidad  
presentaron un incremento cercano al triple de su media habitual de aquel entonces,  
trasladándonos al año 2016 que servirá como punto de referencia y del cual destacan los  
siguientes datos: El 39% de adultos, considera aquellos de 18 años a más tenían sobrepeso y el  
1
3% eran obesos; más de 340 millones de niños y adolescentes, considera aquellos de 5 a 18  
años contaban con sobrepeso u obesidad y alrededor de 41 millones de niños menores a los 5  
años de edad contaban con sobrepeso u obesidad. Manifestando entonces, la poca o nula  
preocupación frente al problema, que en determinados casos deviene en consecuencias  
irreversibles y más aún teniendo en cuenta que el tratamiento para restablecer la salud y estado  
físico no es de periodicidad inmediata a lo cual este lapso de tiempo será de vital importancia  
para los individuos pertinentes al caso.  
Con el fin de adecuar cuidadosamente la información sobre este tema se ha tomando en cuenta  
algunos trabajos relacionados, de los que se pueden destacar los siguientes: El primero, hace un  
estudio en la población española de adultos, donde se evalúa la prevalencia de obesidad  
considerando mediciones antropométricas individuales, factores sociodemográficos, consumo  
alimentario, actividad física, estilos de vida y problemas de salud. Con el que se llegó a la  
conclusión de que existía una prevalencia de obesidad alta en varones con mayor edad, y este  
factor presenta relación inversa con el nivel socioeconómico. Además de que la probabilidad  
mínima de obesidad estaba relacionada a las personas con estilos de vida que incluían la actividad  
física y un sedentarismo moderado.[4]  
Como segundo trabajo, también realizado en España, en esta ocasión el estudio fue realizado a  
una población infantil. En este caso se evalúa la estimación de la prevalencia de sobrepeso en  
niños de entre 2 y 14 años, tomando en cuenta el Índice de Masa Corporal (IMC) y propiamente  
REVISTA INNOVACIÓN Y SOFTWARE  
VOL 3 Nº 2 Septiembre - Febrero 2022 ISSN Nº 2708-0935  
dicho la edad y sexo de la población de niños y niñas. De este trabajo se obtuvo que la prevalencia  
de sobrepeso y obesidad alta era mayor en los varones [5].  
Un tercer trabajo, nos describe un proyecto de software realizado en Arequipa en el cual se  
analiza, diseña e implementa un modelo de minería de datos con datos recolectados de diferentes  
colegios del Perú para estimar en nivel de obesidad de una persona mediante el IMC, en el cual  
se hace uso del algoritmo de árboles de decisión para poder predecir un resultado de acuerdo a  
datos ingresados por el usuario en este caso el estudiante. Se usan varios algoritmos para esta  
tarea, tales como el J48, Multilayer Perceptrion, ForestPA, NaiveBayes, BayestNet asi obteniendo  
como resultado el mejor algoritmo que es J48 con una precisión del 94.38% [6].  
Como último trabajo relacionado tenemos una investigación en la cual se identifican las variables  
más influyentes en determinar el grado de obesidad por medio de técnicas de minería de datos,  
en esta se tiene 16 variables independientes y una variable dependiente la cual se identifica como  
grado de obesidad, se hace uso del algoritmo J48 y otras técnicas de inteligencia artificial para  
poder cumplir el objetivo, los resultados de la investigación muestran que las variables  
independientes más influyentes son el género, estatura, peso y el IMC, así también se obtiene  
que por el algoritmo J48 se obtiene un éxito superior al 97% mediante validación cruzada [7].  
En este trabajo se pretende utilizar un dataset recuperado del repositorio de Machine Learning  
UCI [8], el cual presenta datos para la estimación de distintos niveles de obesidad en personas  
de los países de México, Perú y Colombia, basados en sus hábitos alimenticios y condición física.  
Por todo lo descrito anteriormente, el presente trabajo tiene como objetivo principal presentar  
una solución informática para la estimación y/o predicción de niveles de obesidad de las personas  
que deseen conocer su estado físico; haciendo uso de la data set mencionado anteriormente y  
utilizando como técnica de análisis predictivo un árbol de decisión, el cual está implementado en  
el lenguaje de programación de Python.  
Trabajos relacionados  
En el trabajo de Moral et.al. [9], desarrollan una estrategia para evaluar variables que puedan  
influir en la aparición o evolución de la Diabetes tipo 2. La información almacenada de los  
pacientes incluye historias clínicas y datos de laboratorio; dicha información se encuentra  
almacenada en distintas bases de datos. La técnica utilizada es del Random Forest, el cual crea  
árboles de decisión para la clasificación; concluyendo que su mejor modelo obtenido es un  
Random Forest con 40 árboles y una profundidad de 5 para cada uno, listando además las  
variables más importantes para la predicción.  
REVISTA INNOVACIÓN Y SOFTWARE  
VOL 3 Nº 2 Septiembre - Febrero 2022 ISSN Nº 2708-0935