ODS y Staging Area

Buenos días:
Soy nueva en esto de la BI y estoy buscando información relevante para realizar mi proyecto final de carrera.
Me gustaría, por favor, que me ayudarais para saber donde puedo encontrar más información sobre el Staging Area y el ODS. ¿Durante el Staging Area se realiza limpieza a los datos o se elimina algún tipo de datos (como datos erróneos o duplicados)? ¿Cómo mantiene el ODS  la información referente a los cambios?

 

También he estado intentando encontrar información sobre diferentes tipos de datamarts. La clasificación más extendendida que  he encontrado ha sido la de datamarts dependientas e independientes. Leí algo, no encontré mucho, sobre datamarts olap y oltp. ¿Cuando es preferible usar cada tipo de datamart?

 

Un saludo y gracias!

Te hago algunas recomendaciones de lo que puedes encontrar en Dataprix sobre los temas que comentas:

Sobre lo que preguntas, en la Staging Area se suelen cargar los datos que se necesitan tal como vienen del sistema origen. La limpieza de datos, deduplicación y transformaciones se suelen realizar en la etapa siguiente, en el paso de la Stage al ODS y/o al Almacén Corporativo.

Datamarts OLTP? Seguro? Los Datamarts están orientados al análisis, y suelen apoyarse en estructuras OLAP (OnLine Analytical Processing).

OLTP (OnLine Transaction Processing) son las estructuras transaccionales de base de datos, las que se utilizan para crear los informes operacionales de toda la vida.

En respuesta a por Dataprix

Muchas gracias por tu respuesta! Estoy leyendo tus enlaces aunque algunos ya los había leído con anterioridad.

En cuanto a lo que comentaba de los datamarts olap y oltp:

 

"Datamart OLTP
Pueden basarse en un simple extracto del datawarehouse, no obstante, lo común es introducir mejoras en su rendimiento (las agregaciones y los filtrados suelen ser las operaciones más usuales) aprovechando las características particulares de cada área de la empresa. Las estructuras más comunes en este sentido son las tablas report, que vienen a ser fact-tables reducidas (que agregan las dimensiones oportunas), y las vistas materializadas, que se construyen con la misma estructura que las anteriores, pero con el objetivo de explotar la reescritura de queries (aunque sólo es posibles en algunos SGBD avanzados, como Oracle).

Los datamarts que están dotados con estas estructuras óptimas de análisis presentan las siguientes ventajas:

*  Poco volumen de datos

*  Mayor rapidez de consulta

*  Consultas SQL y/o MDX sencillas

*  Validación directa de la información

*  Facilidad para la historización de los datos"

(Fuente: http://www.sinnexus.com/business_intelligence/datamart.aspx)

 

¿Sería esto un datamart dependiente?

 

En respuesta a por SugarFree (no verificado)

Sinceramente, es la primera vez que tengo noticias de esta definición, pero yo sigo sin verle la transaccionalidad a este tipo de Datamart para llamarle OLTP. A lo mejor la 'T' en este caso significa otra cosa, habría que preguntar a Sinnexus.

Estoy de acuerdo contigo en que parecen referirse más bien a un Datamart dependiente, pero no sé porqué le llaman OLTP.

Si alguien sabe algo más que nos lo cuente..