BI sobre Análisis de la evaluación docente y Puntajes PSU - Analizando el origen de datos.

En este primer capítulo explicaré de donde obtener nuestros dataset, los cuales utilizaremos y explotaremos para analizar desde las visiones que deseemos mediante el análisis de ciertas medidas relacionadas con el rendimiento de los profesores y alumnos de Chile en Colegio públicos, particular subvencionado y privados.

Para esto decidí utilizar un dataset abierto construido por el Ministerio de Educación de Chile el cual se encuentra ubicado en la siguiente dirección. (menú tablas)

Ministerio de educación de Chile

http://data.mineduc.cl/

 

En el sitio encontrarán diversos dataset, todos relacionados con la misma temática, los cuales contienen la historia de todos los años en que se ha ido recopilando la información. En este proyecto utilizaremos dos dataset, los cuales los pueden descargar del siguiente link. (De todas maneras los archivos se encuentran adjuntos en el caso que hayan sido removidos del sitio).

http://datastorage.mineduc.cl/tablas/Establecimiento_PSU.xlsx

http://datastorage.mineduc.cl/tablas/Establecimiento_EvaluacionDocente.xlsx

 

El primero considera los puntajes PSU promedio por cada colegio del País y para cada año (2006 hasta 2012). En el segundo dataset encontraremos datos relacionados con la evaluación docente en Chile, un tema bastante cuestionado actualmente. Este nos permitirá  conocer cantidad de profesores por cada colegio del país que obtuvieron niveles deficientes en los test hasta la cantidad de docentes evaluados con máxima distinción. Este dataset considera solo los años 2009 y 2010 (Ignoro porque no siguieron actualizando la data hasta hoy).

 

Como se pueden dar cuenta al abrir ambos archivos, existen datos muy potentes para realizar un análisis básico de ambos temas. Por ejemplo podemos obtener el Colegio con mejor puntaje promedio por año para matemáticas y lenguaje o también realizar un ranking de los mejores 5 para una región determinada. Existen un sinnúmero de visiones y análisis que podemos obtener con los datos, pero para eso necesitamos las herramientas necesarias que nos permitirán realizar este análisis.

 

Naturalmente esto mismo lo podemos realizar con las últimas versiones de Microsoft Excel, la herramienta preferida por la mayoría, pero que pasaría si la historia que tenemos almacenada se encuentra en una base de datos con millones de registros y ya no solo algunos años, sino que 30 años de historia? Obviamente para responder a los análisis que queremos realizar ya no nos bastaría con una planilla Excel, sino que necesitaríamos una herramienta capaz de responder en menos tiempo y capaz de almacenar miles o millones de registros.

Es por eso que intento explicar de manera simple los pasos a seguir para utilizar ciertas herramientas y explotar los datos que tenemos almacenados en nuestra Base de datos.

Teniendo descargados ambos dataset ya tenemos lista la primera parte de nuestro tutorial.

 

En el próximo capítulo hablaremos de las herramientas que utilizaremos para comenzar a “meter mano” a nuestro mini proyecto de creación, construcción y explotación de un modelo multidimensional utilizando herramientas libres y dataset públicos.

 

Finalmente quedo atento a cualquier comentario, sugerencia o felicitación que deseen expresar.

 

Saludos,