Aplicación de Técnicas de Data warehouse y Data mining para el estudio del Rendimiento Académico de Alumnos


Resumen

Se han aplicado técnicas de Almacenes de Datos (DataWarehouses: DW) y de Minería de Datos (Data Mining: DM) basadas en clustering, entre otras, para la búsqueda de perfiles de los alumnos de la Asignatura Sistemas Operativos (SO) de la FACENA de la UNNE según su rendimiento académico, situación demográfica y socio económica, con el propósito de determinar a priori situaciones potenciales de éxito o de fracaso académico, lo cual permitiría encarar las medidas tendientes a minimizar los fracasos. Se brinda acá una breve descripción de aspectos relacionados con el almacén de datos construido y algunos procesos de minería de datos desarrollados sobre el mismo, mostrándose muy brevemente algunos  resultados preliminares.

 


Objetivos

El objetivo es determinar las variables que inciden en el rendimiento académico, considerando la situación del alumno según la Res. N° 185/03 CD (régimen de evaluación y promoción): promocionado, regular o libre.

 


Materiales y métodos

Se construyó un Almacén de Datos (DW) y se utilizaron técnicas de Minería de Datos (DM), para buscar perfiles de los alumnos y determinar situaciones potenciales de éxito o de fracaso académico, utilizándose el IBM DWE v.9.5. Se obtuvieron clasificaciones mediante (preferentemente) técnicas de clustering, según diferentes criterios, por ej.:

a) minería de clasificación según carrera;
b) minería de clasificación según situación final del alumno;
c) minería de clasificación según importancia dada al estudio;
d) minería de clustering demográfico según situación final del alumno;
e) minería de clustering de Kohonen según situación final del alumno.

Se analizaron estadísticas de partición, detalle de particiones, detalles de clústeres, detalle de campos y frecuencia de campos, calidad global de cada proceso y calidad detallada (precisión, clasificación, fiabilidad), matrices de confusión, diagramas de ganancia / elevación, de árboles, de distribución de nodos, de importancia de campos, tablas de correlación de campos y estadísticas de clúster.

 

Estructura del Datamart utilizado, parte del Data Warehouse

 

Visualización de la estructura del DM utilizado, parte del DW.


Resultados preliminares

Se obtuvieron perfiles preliminares de estudiantes, destacándose los siguientes aspectos:

a) los libres son en su mayoría solteros, en menor proporción divorciados, la mayoría no trabaja, dice darle más importancia al estudio que a la diversión y a la familia, mayormente consideran que las TICs facilitan el estudio y que es importante su dominio, la mayoría señala que estudia para aprender integralmente;
b) los regulares son mayormente solteros y en unión consensual, le dan más importancia al estudio que a la diversión y que al trabajo, mayormente consideran que las TICs facilitan el aprendizaje, que será imprescindible su dominio y que son una realidad, la mayoría estudia para aprender integralmente y para aprender a aprender, la mayoría no trabaja;
c) los promocionados son mayoritariamente solteros y en menor medida casados o en unión consensual, la mayoría confiere más importancia al estudio que a la diversión y al trabajo, mayormente consideran que las TICs facilitan el aprendizaje y que será imprescindible su dominio y en menor medida, que están de moda, mayoritariamente dicen estudiar para aprender integralmente, para aprender a aprender y en menor medida sólo para aprobar, la mayoría no trabaja.

Los que
a): estudian para aprobar: confieren más importancia al estudio que a la diversión y al trabajo, son solteros, consideran que las TICs facilitan el aprendizaje y que será imprescindible su dominio, la mayoría quedó libre;
b) estudian para aprender integralmente: confieren más importancia al estudio que a la diversión y al trabajo, la mayoría son solteros y en menor % casados y divorciados, mayoritariamente consideran que las TICs facilitan el aprendizaje, que será imprescindible su dominio y que son una realidad, la mayoría quedó libre, pero casi la mitad quedó regular o promocionó;
c) estudian para aprender a aprender: confieren más importancia al estudio que al trabajo, la diversión y la familia, son mayoritariamente solteros, pero aumenta el % de casados y en unión consensual, mayoritariamente consideran que será imprescindible el dominio de las TICs, la mayoría quedó libre, pero es importante el % de promocionó o regular.

Importancia dada al estudio

Situación final del alumno, Regular, Libre y Promocionado

Situación final del alumno, Regular, Libre y Promocionado

(III) Situación final del alumno, Regular, Libre y Promocionado

 Visualización de los siguientes resultados: Situación final del alumno, Regular, Libre y Promocionado.