Filosofando sobre el DWH

La definición de Data Warehouse no es solamente lo que significaría traducir la palabra al castellano (almacén de datos) sino que la definición sería almacén de datos ORGANIZADO, de tal manera que sus cuatro principales características son: es integrado, temático, histórico y no volátil. Lo más importante para que un DWH funcione en cualquier empresa, es que este esté organizado de tal manera que se facilite el acceso a los datos para las consultas estratégicas que la compañía pueda plantearse.

Desde que las empresas se han empezado a preguntar cuales son los clientes que les aportan realmente valor y que tipologías cumplen para poder hacer marketing sobre estos de forma eficiente, tiene sentido hablar de Data Warehouse. Tanto las compañías grandes como las pequeñas que se van haciendo cada vez más grandes, necesitan en algún momento de su vida organizar la información que han ido almacenando desde que su volumen de clientes ya no podía organizarse en unas fichas de papel, para poder ser competitivos ante un mercado creciente.

Además yendo más allá de tener un almacén de datos organizado y herramientas para atacarlo de forma eficiente, se puede ir un paso más adelante y utilizar herramientas de datamining para adelantarse a los eventos clave para la compañía, es decir basándonos en un histórico que hemos ido recogiendo, limpiado y ya organizado, aplicarle algoritmos matemáticos para predecir comportamientos de clientes o posibles campañas de marketing con una probabilidad bastante alta de que funcionen. Con toda esta introducción, espero haber animado un poco a los que lean esta interesante web que nuestro compañero Carlos se está trabajado para seguir indagando en este mundillo.

Primero queríamos saber quienes éramos y de donde veníamos, luego quisimos saber que estaba pasando en el resto del mundo al mismo tiempo, pero ahora estamos ya deseando adivinar que pasará en el futuro…todavía queda mucho por responder.

Saludos, Lourdes Rodríguez

Carlos tiene el reto de formar, entre otras cosas, un buen DWH en la cía actual donde trabaja. Esperemos que eso sirva de ejemplo.

Supongo que a medida que se realice su desarrollo nos irás comentando lo que se va encontrando, técnicas utilizadas, herramientas aplicadas...

En respuesta a por drakon

Por supuesto que todo lo que me parezca interesante o enriquecedor iré publicándolo, y cuento también con el apoyo y las aportaciones de otros profesionales que ya han pasado o están viviendo una experiencia parecida, o simplemente interesados en estos temas, y que estén abiertos a compartir sus conocimientos para hacer de esta web un punto de encuentro donde todos podamos hallar respuesta a nuestras inquietudes.

Diseño de un datawarehouse

Hola!!Estoy realizando un proyecto para el diseño de un datawarehouse, utilizando como gestor de base de datos Sql Server 2005. Los pasos para el diseño del mismo por lo que he averiguado serían:

-recogida y análisis de requisitos
-diseño conceptual: entidad-relación
-diseño lógico: modelado multidimensional y esquemas en estrella
-diseño físico: definición del esquema rolap o molap, diseño ETL
-implementación: carga del almacén y la preparación de las vistas de usuario mediante herramientas OLAP

Sql Server 2005 cubriría la carga del datawarehouse (ETL) mediante sql integration services, y la explotación del mismo (OLAP Y mineria de datos) mediante sql analysis services.

Mi principal duda es construir, diseñar el datawarehouse, sobre todo tengo dudas a la hora del diseño lógico y físico del mismo. He leido tutoriales, manuales y ninguno de ellos me resuelve el problema.
Si pudieran adjuntarme algún ejemplo práctico, sugerencia o experencia personal sobre el tema lo agradecería.

A medida que avance el proyecto y vaya resolviendo dudas las publicaré.

Mi correo es juapepa@ei.upv.es

Un saludo y gracias.

Hola!
en mi empresa vamos a implementar un DWH y tengo que realizar una propuesta sobre las políticas y estándares a seguir para el manejo de los datos (seguridad, accesos, backups, etc), he estado buscando en internet alguna guía de mejores prácticas pero no encuentro nada...
Alguien me podría ayudar?

En respuesta a por giselle (no verificado)

Hola Giselle

En http://www.dataprix.com/seguridad-acceso-dwh, del manual online sobre DWH que publicamos en esta misma web puedes encontrar una pequeña referencia.
A ver si entre todos podemos encontrar algo más. Es cierto que es un tema sobre el que no es fácil encontrar información, al menos aplicada directamente sobre sistemas de Data Warehouse, y realmente, sobretodo en el tema de los backups puede haber bastantes diferencias sobre los criterios habituales para otros sistemas de almacenamiento de información.

Carlos Fernández

Analista de sistemas

Saludos,

Desade hace 3 años iniciamos el proceso de implementacion de un Datawarehouse para una empresa publica municapl de agua potable y telecomunicaciones..

Al momento hemos implementado varios modulos que abarcan las principales areas del negocio de la empresa...

El problema surge al existir un continuo cambio en las relglas del negocio, debido a politicas que se aplican, deteccion de errores e inconsistencias...en fin

Al momento trato de implementar una politica que me ayude a manejar estos cambios en las reglas del negocio de tal forma que la informacion que muestra el data siempre este de acuerdo a la realiadad de la Empresa

Espero que puedan ayudarme ...

Ademas, debido a que nos encontramos ya en una fase de calidad total, pienso adicionar nuevos componenetes al proyecto datawarehouse en lo relativo a mejores practicas.

Atte.

Ing. Cristina Carpio P.
Administrador DataWareHouse
ETAPA

Puede que la aplicación de algunos conceptos que manejan las nuevas metodologías ágiles te ayude a gestionar mejor el mantenimiento y los cambios en los requerimientos de negocio.

Te recomiendo la lectura de algunos posts del blog Sistemas Decisionales, comenzando por Que son las metodologias agiles, donde explica qué es el Manifiesto Agil, y comenta, por ejemplo, uno de los 4 principales valores que recoge:

4) Responder a los cambios más que seguir una planificación.

Una organización cambia constantemente, se adapta a las necesidades del mercado y reorganiza sus flujos de trabaja para ser mas eficiente. Es difícil pues, que en el desarrollo de un proyecto, este no sufra ningún cambio, pues es seguro que las necesidades de información de la empresa habrán cambiado y mas cuando se trata de sistemas decisionales, no siempre tomamos las decisones de la misma manera. . Son muchos los factores que alterarán nuestra planificación inicial del proyecto, si la adaptamos a estos cambios corremos el riesgo de que cuando acabemos, nuestra aplicación no sirva para nada y el cliente se haya gastado el dinero en vano. La habilidad de responder a los cambios de requisitos, tecnología, presupuestarios o estrategia, marca sin duda el camino del éxito del proyecto.

Después hay que buscar una metodología agil que se adapte a la problemática específica de los proyectos de Business Intelligence.

En el mismo blog Jorge Fernández, entre otras cosas interesantes, publica dos artículos sobre dos metodologías que podrían adaptarse al BI (DSDM y Pair Thinking):

Dynamic Systems Development Method para Data Warehouse

Pair Thinking para Data Warehouse

Espero que esto te sirva de ayuda. Como seguro que la aplicación de una buena metodología para poder gestionar correctamente nuestros proyectos de BI nos preocupa mucho a todos, he creado en el foro el tema Metodologías ágiles y BI, donde podemos ir discutiendo nuestros descubrimientos y opiniones sobre las diferentes alternativas.

Carlos Fernández

Analista de sistemas