Data Governance: ¿qué?, ¿cómo?, ¿por qué?

La gestión de los datos y la informaciónLa toma de decisiones está basada en la información que obtenemos de los datos empresariales. Toda toma de decisiones implica aceptar un riesgo, pero lo cierto es que no siempre es fácil disponer de datos rigurosos...

Ante esta situación, ¿cómo podemos alcanzar el auténtico valor de los datos y ofrecer una visión consistente del rendimiento empresarial?, ¿cómo conseguir un adecuado análisis de la información teniendo en cuenta los cambios constantes que ocurren en nuestras organizaciones?

¿Le estamos dando la importancia que se merecen a los Procesos de Calidad de Datos?

Limpieza de datos: detección de duplicados en BBDD diferentesDentro de las actividades de Gestión de los Datos que realiza una organización resultan cada vez más críticos los procesos que supervisan y garantizan la calidad de los datos.

El volumen de información crece constantemente en las organizaciones y disponer de almacenes de datos fiables resulta imprescindible para realizar un correcto análisis y explotación de los mismos evitando inconsistencias, conclusiones erróneas y facilitando el desarrollo de futuros sistemas basados en maestros de datos consistentes, depurados, enriquecidos y fiables..

Data profiles de SQL Server IS almacenados en tablas

 

La tarea de Data Profile de SQL Server Information Services almacena los resultados del perfilado en un documento XML que se puede examinar con el Data Profile Viewer. En el artículo Dataprofiling con SQL Server 2008 explico cómo se utiliza esta nueva Task de SSIS.

Aunque este método sea muy sencillo, a veces puede no resultar suficiente. Si se aborda un proyecto de calidad de datos puede interesar, por ejemplo, almacenar un histórico de los perfilados para poder evaluar cómo ha ido mejorando la calidad de los datos tratados...

 

 

Data profiling con SQL Server 2008

Data Profile viewer de SSISUna de las múltiples mejoras que aporta SQL Server 2008 en la parte de ETL con Integration Services es su capacidad para realizar perfilado de datos con su nueva Data Profile Task.

El data profiling es una de las primeras tareas que se suelen abordar en procesos Calidad de Datos, y consiste en realizar un primer análisis sobre los datos de origen, normalmente sobre tablas, con el objetivo de empezar a conocer su estructura, formato y nivel de calidad. Se hacen consultas a nivel de tabla, columna, relaciones entre columnas, e incluso relaciones entre tablas.

 

La Data Profile Task de SSIS funciona seleccionando una tabla de una base de datos SQLServer 2000 o superior (no sirven otras bases de datos), las opciones de perfilado que se quiera realizar sobre los datos de la tabla, y un fichero XML donde se almacenarán los resultados cuando se ejecute la misma...