Calidad de datos

¿Por qué la Gestión de Datos Maestros (MDM) será clave en 2014?

Carlos Dufour, de Stibo systems (MDM)

Hoy en día, los consumidores esperan que su experiencia digital sea 100% coherente con el entorno físico del comercio. En el próximo año, los retailers no verán esta expectativa como una demanda por parte del consumidor, sino más bien como un reconocimiento de que la tecnología digital es ahora una parte de la vida real, y los dos deben ofrecer la misma experiencia.

Como las tiendas siguen centrándose en mejorar la fidelidad del cliente, muchos están adoptando la tecnología de gestión de datos maestros (MDM) con el fin de crear una experiencia de compra más rica y satisfactoria en todos los canales.. 

Data Governance: ¿qué?, ¿cómo?, ¿por qué?

La gestión de los datos y la informaciónLa toma de decisiones está basada en la información que obtenemos de los datos empresariales. Toda toma de decisiones implica aceptar un riesgo, pero lo cierto es que no siempre es fácil disponer de datos rigurosos...

Ante esta situación, ¿cómo podemos alcanzar el auténtico valor de los datos y ofrecer una visión consistente del rendimiento empresarial?, ¿cómo conseguir un adecuado análisis de la información teniendo en cuenta los cambios constantes que ocurren en nuestras organizaciones?

¿Le estamos dando la importancia que se merecen a los Procesos de Calidad de Datos?

Limpieza de datos: detección de duplicados en BBDD diferentesDentro de las actividades de Gestión de los Datos que realiza una organización resultan cada vez más críticos los procesos que supervisan y garantizan la calidad de los datos.

El volumen de información crece constantemente en las organizaciones y disponer de almacenes de datos fiables resulta imprescindible para realizar un correcto análisis y explotación de los mismos evitando inconsistencias, conclusiones erróneas y facilitando el desarrollo de futuros sistemas basados en maestros de datos consistentes, depurados, enriquecidos y fiables..

Introducción a Open Data, Linked Data, catálogos de datos y recursos

Open DataOpen Data es un movimiento que se ha creado para hacer fácilmente accesibles a ciudadanos y empresas los datos públicos que recogen las Administraciones Públicas.

Open Data está apoyado por el W3C y otros organismos a nivel internacional, y poco a poco va sumando iniciativas en diferentes países. El primer paso es la iniciativa de un organismo público, que pone a disposición pública determinados datos en uno o más formatos estándar fácilmente 'tratables'. A partir de ahí pueden surgir otros organismos o empresas que agreguen valor a esos datos cruzándolos o enriqueciéndolos con otras fuentes de datos, o desarrollando aplicaciones que permitan al usuario consultar esos datos en un entorno amigable..

Data profiles de SQL Server IS almacenados en tablas

 

La tarea de Data Profile de SQL Server Information Services almacena los resultados del perfilado en un documento XML que se puede examinar con el Data Profile Viewer. En el artículo Dataprofiling con SQL Server 2008 explico cómo se utiliza esta nueva Task de SSIS.

Aunque este método sea muy sencillo, a veces puede no resultar suficiente. Si se aborda un proyecto de calidad de datos puede interesar, por ejemplo, almacenar un histórico de los perfilados para poder evaluar cómo ha ido mejorando la calidad de los datos tratados...

 

 

Data profiling con SQL Server 2008

Data Profile viewer de SSISUna de las múltiples mejoras que aporta SQL Server 2008 en la parte de ETL con Integration Services es su capacidad para realizar perfilado de datos con su nueva Data Profile Task.

El data profiling es una de las primeras tareas que se suelen abordar en procesos Calidad de Datos, y consiste en realizar un primer análisis sobre los datos de origen, normalmente sobre tablas, con el objetivo de empezar a conocer su estructura, formato y nivel de calidad. Se hacen consultas a nivel de tabla, columna, relaciones entre columnas, e incluso relaciones entre tablas.

 

La Data Profile Task de SSIS funciona seleccionando una tabla de una base de datos SQLServer 2000 o superior (no sirven otras bases de datos), las opciones de perfilado que se quiera realizar sobre los datos de la tabla, y un fichero XML donde se almacenarán los resultados cuando se ejecute la misma...

Informe sobre Pervasive Business Intelligence

Pervasive Business Intelligence se podría traducir como Business Intelligence Omnipresente, al menos a nivel de empresa. Se trata de hacer que el sistema de BI llegue a todos los niveles de la organización, en el momento oportuno, y con la información necesaria para cada uno. Puede abarcar incluso la integración con otros sistemas, normalmente operacionales, y también contemplar capacidades de interacción, no sólo de acceso a la información...

 

Informatica World 2008 en Las Vegas

Chris Boorman en la sesión general del Informatica World

Finalmente he podido asistir al Informatica World 2008 y qué menos que explicar un poco lo que me encontré por allí. La conferencia se celebró del 3 al 5 de junio bajo el lema 'Gain the Edge', una expresión con mucha fuerza en inglés pero difícil de traducir al castellano, a ver si alguien se anima y nos da una traducción válida.

El día 3 comenzó, después del desayuno, con una sesión general que llevaba por título Vision. Strategy. Technology Announcements. Industry leadership. En la misma, tanto Sohaib Abbasi, CEO y Presidente de Informática, como Chris Boorman, Ivan Chong y Girish Pancha, Vicepresidentes en las àreas de Márqueting, Calidad de Datos e Integración de Datos, respectivamente, nos mostraron su visión actual del mercado, cómo están evolucionando la tecnología y los negocios, y qué papel juegan en este marco los datos y las aplicaciones que los gestionan...

Integracion y calidad de datos en el PowerDay 2008

En marzo-abril se celebró la séptima edición de Powerday, un evento anual que organiza PowerData, y que este año tenía por objetivo proporcionar a los asistentes una visión global de la estrategia adecuada para sacar el máximo partido a los datos. Yo tuve la oportunidad de asistir al de Barcelona, y disfrutar con las interesantes ponencias que se realizaron en el mismo. 

Fueron presentaciones de una media hora, en las que se habló sobre la importancia de la calidad de datos y los procesos de integración, sobre la situación tecnológica y de mercado actual y, por supuesto, sobre cómo facilitar las cosas con la utilización de herramientas de Informática como PowerCenter.

Estos son los títulos de las presentaciones: