Integración de datos y ETL: las noticias clave de la semana para empresas y equipos de datos


Hace ya algún tiempo tuve la oportunidad de probar el software de Business Intelligence Crono, pero ha llovido bastante, y Crono ha evolucionado mucho desde entonces, así que aprovecho este post para ponerme al día sobre las nuevas características de este software de BI, y ahora también de ETL..
dVelox Data Quality: la base del éxito para tomar decisiones efectivas
Respuestas a 50 importantes cuestiones sobre Oracle GoldenGate, la ETL de Oracle para integración de datos de bases de datos heterogéneas en tiempo real.
Clasifico estas preguntas en 5 grupos: cuestiones básicas, GoldenGate 12c, Rendimiento, Resolución de problemas y Otras cuestiones..
Los procesos ETL (Extracción, Transformación y Carga) son un elemento clave para la construcción y mantenimiento de sistemas de Data Warehouse en entornos de Business Intelligence.
Las herramientas ETL automatizan, organizan y optimizan esos procesos, facilitando especialmente la gestión, el mantenimiento y la escalabilidad de todo el entorno de 'alimentación' del Data Warehouse, y también de otros entornos.
Se trata de leer un archivo XML y convertirlo en un archivo plano separado por comas utilizando Pentaho Data Integration. PDI siempre tratará de convertir las fuentes de entrada en filas y columnas, con este principio hay que partir siempre que uno intente hacer algo con este software. El XML en un tipo de datos jerárquico, por ello habrá que transformarlo a dato tabular. Para manipular XML se utiliza XQuery y XPath.
Talend, es una ETL de código libre. Una ETL, es una herramienta para Extraer, Transformar y Carga los datos (Extract-Transform-Load). Mediante herramientas de este tipo, podemos hacer transformaciones en los datos, fusionar campos, aplicar cálculos de funciones sobre los campos, etc.

Luca Zurlo es Director para el Sur de Europa de Jaspersoft, la compañia que ofrece la extendida suite de Business Intelligence open source.
Con motivo de la presentación en el evento Big data 2012 de novedades en la suite para trabajar con Big Data, y del acuerdo firmado por la compañia con el grupo tecnológico GMV, que convierte a esta compañia en el primer partner de Jaspersoft en España, Luca Zurlo nos concedió esta entrevista.
Ya está disponible Oracle GoldenGate 11g R2, que proporciona integración de datos en tiempo real para aplicaciones críticas de negocio, que permiten una mejor comprensión del negocio, maximizando el rendimiento y permitoendo migración de datos sin tiempo de inactividad, recuperación de desastres y sincronización activa de bases de datos para su continua disponibilidad.