9
4
5
6
•
. Reducción de la dimensión de los datos: Identificar qué datos son los importantes
para hacer modelos de un fenómeno.
. Identificación-interrelación: identificar que variables y relaciones son importantes
para ciertos grupos identificados a partir de analizar los datos.
. Recodificación: discretizar variables o establecer criterios cualitativos perdiendo la
menor cantidad posible de información relevante [5].
KNN: K-Nearest-Neighbor es un algoritmo basado en instancia de tipo supervisado de
Machine Learning. Puede usarse para clasificar nuevas muestras (valores discretos) o
para predecir (regresión, valores continuos). Al ser un método sencillo, es ideal para
introducirse en el mundo del Aprendizaje Automático. Sirve esencialmente para
clasificar valores buscando los puntos de datos “más similares” (por cercanía)
aprendidos en la etapa de entrenamiento y haciendo conjeturas de nuevos puntos
basado en esa clasificación [6].
•
Red Neuronal: Las redes neuronales Artificiales (RNAs) son modelos computacionales
como un intento de conseguir formalizaciones matemáticas acerca de la estructura del
cerebro. Las RNAs imitan la estructura hadware del sistema nervioso, centrándose Enel
funcionamiento el cerebro humano, basado en el aprendizaje a través de la experiencia,
con la consiguiente extracción de conocimiento a partir de la misma [7].
Para aplicar los modelos mencionados se utilizó un dataset, extraído a través de consultas SQL
de la base de datos del sistema académico de la Universidad Nacional Intercultural de la
Amazonía, dicho dataset este compuesto con datos registrados desde el 2005, en total se
generaron 17 variables junto con el target “desercion”. La tabla de datos contiene 18 columnas
y 5803 filas, con un peso de 680.2 kb.
Tabla 1: Contenido de la data académica procesada
N°
1
Variable
codigo
Descripción
Código que identifica al estudiante.
2
3
sexo
mestizo
Sexo del estudiante, 1 es masculino y 0 femenino.
Si el estudiante es mestizo 1 y si no lo es 0.
4
indigena
Si el estudiante es indigena 1 y si no lo es 0.
5
pobre
Si el estudiante es pobre 1 y si no lo es 0.
6
7
pobre_extremo
no_pobre
educacion
ingenieria
matriculas
Si el estudiante es pobre extremo 1 y si no lo es 0.
Si el estudiante es No pobre 1 y si no lo es 0.
Si el estudiante es de la facultad de educación 1 y si no lo es 0.
Si el estudiante es de la facultad de ingeniería 1 y si no lo es 1.
Número de matriculas que tiene el estudiante durante su estadía en la universidad.
11
12
13
14
15
16
17
18
19
matriculas_aprobadas Número de matriculas aprobadas que tiene el estudiante durante su estadía en la universidad.
matriculas_desaprobadas Número de matriculas desaprobadas que tiene el estudiante durante su estadía en la universidad.
egresado
ponderado
semestres
desercion
Si el estudiante es egresado 1 y si aun no lo es 0.
Promedio ponderado acumulado del estudiante
Numero de semestres que se ha ,atriculado el estudiante.
1 si el estudiante deserto 0 si el estudiante no deserto.
Fuente: Elaboración propia.
REVISTA INNOVACIÓN Y SOFTWARE
VOL 2 Nº 2 Septiembre - Febrero 2021 ISSN Nº 2708-0935