5.3 Instalación del Ambiente Datamart

5.3 Instalación del Ambiente Datamart alfonsocutro 20 Enero, 2010 - 12:48

En esta fase se definirán todas las tablas correspondientes a las dimensiones y a la tabla de hecho de nuestro análisis del Data Warehouse .

Para mayor comprensión, se recomienda consultar Capitulo Nº1 “Introducción a la Minería de Datos”, precisamente la sección Características del  Data Warehouse.

5.3.1 Selección y Exploración de la Destino de Depósito

5.3.1 Selección y Exploración de la Destino de Depósito alfonsocutro 21 Enero, 2010 - 16:07

Luego de un arduo estudio sobre la problemática hacia donde se enfoca la EPH (Encuesta Permanente de Hogares), como así también la comprensión
del alcance de las variables a considerar, se ha logrado determinar las siguientes dimensiones :

Nivel Educativo (ver fig. 5.9).

Población de Asalariados (ver fig. 5.10).

Población de Independientes (ver fig. 5.11).

Población Desocupada (ver fig. 5.15).

Población Desocupada c/Empleo anterior (ver fig. 5.13).

Población c/Plan Jefes y Jefas de Hogar (ver fig. 5.12).

Población Ocupados (ver fig. 5.14).

Ocupación Principal (ver fig. 5.16).

Siendo la tabla de Hecho :

Individuos(ver fig. 5.17).

Formando así el esquema en estrella correspondiente (ver fig. 5.18).

Una vez definida todas la dimensiones se deberá exportar estas estructuras a el DB2 UDB Universal Database. Para llevar a cabo esto se debe trabajar de la misma forma que en el apartado anterior “Trabajando con DB2 UDB Universal Database”.

Los pasos son:

• Creación de la base de datos denominada PDESTINO.

 

 

    

 

Figura 5.9: Visualización de la dimensión Nivel Educativo.

 

  

 

Figura 5.10: Visualización de la dimensión Población de Asalariados

 

    

 

Figura 5.11: Visualización de la dimensión Independientes.

 

     

Figura 5.12: Visualización de la dimensión Población Desocupada con Empleo Anterior.

 

     

Figura 5.13: Visualización de la dimensión Población c/Plan Jefes y Jefas de Hogar.

 

     

 

 

Figura 5.14: Visualización de la dimensión Población Ocupados.

 

   

 

Figura 5.15: Visualización de la dimensión Población Desocupada.

 

     

 

Figura 5.16: Visualización de la dimensión Ocupación Principal.

 

   

 

Figura 5.17: Visualización de la dimensión Individuos (HECHO).

 

     

 

Figura 5.18: Visualización de la estructura del esquema en estrella.

  

• Creación de una tabla por cada dimensión.

• Creación de una tabla que corresponda a la tabla de hecho.

El primer paso utilizando el DB2 UDB Universal Database es creación de la base de datos. En este caso se llamará PDESTINO, hacia donde se exportarán todas las tablas de dimensiones junto con la de hecho (ver fig. 5.19).

 

   

 

Figura 5.19: Creación de la base de datos denominada PDESTINO.