Crear un DataWarehouse

 Buenas,

 

Voy a crear mi primer DataWarehouse.

 

1.- Debo pasar el modelo lógico relacional que tengo a modelo físico

2.- Después realizar una migración de datos de ficheros DBF (DBASE V) a mi modelo físico.

3.- Posteriormente crear el DataWarehouse.

 

La tarea 1, está en curso, la tarea 2 también. Paralelamente, tengo que empezar la creación del DataWarehouse.

 

Tengo mucha documentación y todas dicen prácticamente lo mismo. Me gustaría recibir, consejos útiles, best-practice, o expongáis casos que os han pasado para tomar nota.

 

Muchas Gracias,

Javier.

Si es tu primer Data Warehouse yo te aconsejo prestar especial atención al diseño del modelo, y comenzar por algo simple para luego ir mejorándolo a medida que aprendas.

El Data Mart de ventas es el candidato ideal para comenzar. Tienes muchos ejemplos, y todas las empresas han de tener los datos de facturación bien registrados, cosa que te garantiza un origen de datos bastante 'limpio' y consistente, y te puede ahorrar muchos esfuerzos en la fase de ETL, la más importante bajo mi punto de vista.

Supongo que ya lo habrás consultado, pero te recomiendo la lectura del artículo de Factores críticos de éxito de un proyecto de BI, especialmente el capítulo específico de FCE

Para la parte más práctica, puedes seguir la Metodología Hefesto para la construcción de un Data Warehouse, de Dario Bernabeu

 

Gracias Carlos

 

En primer lugar comentarte que no hy datamart de ventas. Solo hay ficheros DBF que es donde está la informacion origen. Que usa un aplicativo contruido en visual foxpro.

 

Se esta construyendo un nuevo aplicativo,  que guardará la nueva información en un modelo fisico. De momento, se está en el modelo relacional (todavia por completar). Una vez completado se pasará a modelo fisico.

 

Con este modelo relacional incompleto tengo que empezar a contruir el data. Como ves está todo sujeto con pinzas...!!

 

Bueno ya iré postenado mis progresos.

En respuesta a por JavierGomez

Con lo del Datamart de ventas me refiero a que es un buen candidato para comenzar a construirlo. Lo de las pinzas es algo bastante habitual, si al menos puedes plantear un buen modelo relacional ya tendrás mucho ganado.

Bueno, pues espero que vaya bien el proyecto, que seguro que va a ser muy interesante, y estaremos atentos a lo que nos vayas explicando!

Saludos,

 

tengo una duda, soy muy nuevo en este ámbito pese a las muhcas horas de lectura que he tenido, estoy siguiendo la metodologia hefesto y ya tengo desarrollado todo hasta el modelo logico en estrella, y mi pregunta es como paso al modelo fisico es decir que herramientas son la que utilizo para crear el modelo fisico, espero mi pregunta sea la correcta, gracias.

En respuesta a por b3nito

Herramientas hay muchas, pero pasar al modelo físico significa básicamente crear en una base de datos las tablas que van a conformar tu Data Warehouse. Para hacerlo no necesitas más que un editor de texto (bueno, mejor un editor de SQL), y utilizar sentencias CREATE TABLE para crear todas las tablas que necesites. Después puedes ejecutar el script con la herramienta que te proporcione el motor de base de datos que vayas a utilizar.

También puedes utilizar el entorno gráfico del gestor de base de datos para ir creando las tablas y sus relaciones. Hoy en dia casi todos proporcionan un entorno en el que crear una tabla es tan fácil cómo utilizar la opción CREATE TABLE que te aparece al pulsar el botón derecho sobre el explorador de objetos de la BD.

Luego otra cuestión será preparar los procesos de carga de datos en las tablas, para lo que sí te recomiendo que utilices un software de ETL, sobretodo si no tienes mucha experiencia utilizando SQL.

 Agradezco tu respuesta e interes, bueno estoy pensando utilizar toda la suite de microsoft con SQL Server 2008 r2 (quisiera me des una recomendación sobre con que herramienta podria iniarme en funcion a documentación, facilidad) Sobre donde crear el modelo me referia a utilizar Power Designer como lo hago con bases relaciones, genero un script con el modelo fisico y lo paso a SQL 

 

En respuesta a por b3nito

Ah, pues perfecto. Power Designer te irá genial para crear la estructura inicial. Supongo que tu duda iba encaminada a si el modelo físico de un DWH es muy diferente de uno relacional. Piensa que la diferencia está en el diseño de las estructuras de datos, que no siguen las reglas de los modelos normalizados, pero por lo demás al final se acaban utilizando igualmente tablas 'de toda la vida'. Incluso puede ser recomendable definir relaciones entre las principales tablas del modelo en estrella.

No te líes tampoco con los cubos MOLAP, que sí utilizan un sistema de almacenamiento físico especial. Aunque fueras a utilizar cubos, que podrías crear directamente a partir de los orígenes de datos, mi recomendación es que igualmente implementes antes un modelo de Data Warehouse sobre tablas que serviría de origen para cargar esos cubos.

Sobre SQLServer 2008, es una buena opción para comenzar, la mayor parte de las herramientas que integra son muy intuitivas, te facilitará mucho la gestión de la base de datos, y sobretodo, tienes Integration Services (SSIS) para utilizar como ETL para preparar los procesos de carga de las tablas, que ya te avanzo que puede representar hasta un 80% del tiempo que dediques al proyecto completo.