Limpieza de datos
¿Le estamos dando la importancia que se merecen a los Procesos de Calidad de Datos?
Submitted by Juan Vidal on 13 September, 2011 - 12:26
Dentro de las actividades de Gestión de los Datos que realiza una organización resultan cada vez más críticos los procesos que supervisan y garantizan la calidad de los datos.
El volumen de información crece constantemente en las organizaciones y disponer de almacenes de datos fiables resulta imprescindible para realizar un correcto análisis y explotación de los mismos evitando inconsistencias, conclusiones erróneas y facilitando el desarrollo de futuros sistemas basados en maestros de datos consistentes, depurados, enriquecidos y fiables..
Una aproximación a Solvencia II y Business Intelligence
Submitted by Juan Vidal on 26 July, 2011 - 22:37El entorno financiero actual, la inestabilidad económica y un mercado global poco robusto han dado lugar a cambios importantes en el manejo del Riesgo. Han surgido en estos años diferentes marcos de regulación como Basilea II en el entorno bancario.
En este artículo nos vamos a centrar en el acuerdo de capitales alcanzado para entidades aseguradoras: Solvencia II.
Informatica 9, una completa plataforma de Integración de Datos
Submitted by carlos on 5 May, 2010 - 15:09- Integracion de datos
- Integración de datos
- Limpieza de datos
- MDM (Gestión de datos maestros)
- Perfilado de datos
- Deduplicación
- ETL
- Calidad de datos
- Normalización de datos
- Powercenter
- Informatica
- B2B Data Exchange
- B2B Data Transformation
- Data Archive
- Data Explorer
- Data Privacy
- data quality
- Data Subset
- identity
- Identity Resolution
- Informatica 9
- powercenter
- powerexchange
En el mercado de la Integración de Datos uno de los fabricantes líderes es Informatica. Su herramienta más conocida, y el corazón de su plataforma, es Informatica PowerCenter, toda una referencia en el mundo de la Integración.
Pero aparte de PowerCenter, Informatica también dispone de otras herramientas que se orientan a propósitos más específicos, a la vez que se integran dentro de la plataforma, y siempre en el marco de la Integración de Datos...
Data profiles de SQL Server IS almacenados en tablas
Submitted by carlos on 19 August, 2009 - 13:24La tarea de Data Profile de SQL Server Information Services almacena los resultados del perfilado en un documento XML que se puede examinar con el Data Profile Viewer. En el artículo Dataprofiling con SQL Server 2008 explico cómo se utiliza esta nueva Task de SSIS.
Aunque este método sea muy sencillo, a veces puede no resultar suficiente. Si se aborda un proyecto de calidad de datos puede interesar, por ejemplo, almacenar un histórico de los perfilados para poder evaluar cómo ha ido mejorando la calidad de los datos tratados...
Data profiling con SQL Server 2008
Submitted by carlos on 17 August, 2009 - 18:47
Una de las múltiples mejoras que aporta SQL Server 2008 en la parte de ETL con Integration Services es su capacidad para realizar perfilado de datos con su nueva Data Profile Task.
El data profiling es una de las primeras tareas que se suelen abordar en procesos Calidad de Datos, y consiste en realizar un primer análisis sobre los datos de origen, normalmente sobre tablas, con el objetivo de empezar a conocer su estructura, formato y nivel de calidad. Se hacen consultas a nivel de tabla, columna, relaciones entre columnas, e incluso relaciones entre tablas.
La Data Profile Task de SSIS funciona seleccionando una tabla de una base de datos SQLServer 2000 o superior (no sirven otras bases de datos), las opciones de perfilado que se quiera realizar sobre los datos de la tabla, y un fichero XML donde se almacenarán los resultados cuando se ejecute la misma...
Datacleansing con Power*MatchMaker/ DQGuru
Submitted by carlos on 19 March, 2009 - 09:50
DQGuru (antes Power MatchMaker) es una herramienta de Data Cleansing que SQLPower liberó convirtiendo la licencia en Open Source, junto con la de Power Architect (herramienta para modelización de datos).
Como no es que haya demasiadas herramientas Open Source en el campo de la limpieza de datos, me ha podido la curiosidad y la he instalado para ver que tal funciona.
La instalación ha sido muy sencilla, el software se descarga desde Descarga de DQGuru, en diferentes versiones según el SO. Yo he probado la de windows, que se instala a golpe de botón en 2 minutos. Importante no olvidarse del requerimiento del Java Runtime 5...
Dataclean.es: un proyecto de servicios de limpieza de datos
Submitted by carlos on 12 December, 2008 - 12:23Hace ya bastante tiempo me planteé la posibilidad de arrancar un proyecto para ofrecer servicios de limpieza de datos online. Si hablamos en términos de lo que ara se oye más, podríamos interpretarlo como un nuevo significado de las siglas DAAS: Datacleansing As A Service.
En aquel momento escogí el nombre de Dataclean.es, entre otras cosas porque el dominio estaba libre. Lo registré a mi nombre e hice una aproximación a un plan de empresa. Hasta comencé a preparar una web donde quería crear una primera versión sencilla de la idea. Este prototipo se quedó en prácticamente una simple estructura, pero pienso que puede servir para ilustrar la intención que tenía.
Como al final no me decidí a dar el gran paso y desarrollar el proyecto, y es una pena que el esfuerzo que dediqué a hacer el planteamiento se quede en un documento de mi portátil, he decidido compartir el plan de empresa, adjunto en este post. També he puesto online el prototipo web que comencé. Aviso que está tal como lo dejé, no funciona casi nada.

Integracion y calidad de datos en el PowerDay 2008
Submitted by carlos on 26 May, 2008 - 01:16En marzo-abril se celebró la séptima edición de Powerday, un evento anual que organiza PowerData, y que este año tenía por objetivo proporcionar a los asistentes una visión global de la estrategia adecuada para sacar el máximo partido a los datos. Yo tuve la oportunidad de asistir al de Barcelona, y disfrutar con las interesantes ponencias que se realizaron en el mismo.
Fueron presentaciones de una media hora, en las que se habló sobre la importancia de la calidad de datos y los procesos de integración, sobre la situación tecnológica y de mercado actual y, por supuesto, sobre cómo facilitar las cosas con la utilización de herramientas de Informática como PowerCenter.
Estos son los títulos de las presentaciones:
Caso de estudio: Business Intelligence aplicado a la banca
Submitted by carlos on 6 December, 2007 - 21:33En estas diapositivas se presenta el caso de estudio de un banco que se plantea la necesidad de un mayor conocimiento de sus clientes para poder definir adecuadamente sus estrategias de negocio.
Gracias a la utilización de herramientas de Business Intelligence, en concreto de Data Warehouse y Data Mining, y a la definición de unos claros objetivos de negocio, este banco pudo analizar el comportamiento de sus clientes, segmentarlos, tomar decisiones estratégicas en función de este comportamiento, realizar predicciones y analizar los resultados de la aplicación de estas decisiones, valorando así el retorno de la inversión...
- Inicie sesión o regístrese para enviar comentarios
- Leer más
-

Oracle Warehouse Builder 10g disponible sin cargo
Submitted by carlos on 9 May, 2007 - 21:20Si trabajas con bases de datos Oracle y te estás planteando la posibilidad de utilizar una herramienta ETL (Extract, Transform & Load) para la alimentación de un Data warehouse, o simplemente para facilitar integraciones o migraciones de datos, te puede ir muy bien saber que Oracle permite la utilización de la versión básica de su herramienta de ETL Oracle Warehouse Builder 10g Release 2, sin coste adicional de licencias.
Eso sí, has de disponer de al menos una licencia de Oracle Database Standard Edition One, Oracle Database Standard Edition o Oracle Database Enterprise Edition.
Para más detalles, consultar el artículo de Oracle Press Oracle Anuncia la Disponibilidad General de Oracle Warehouse Builder 10g Release 2
