Integracion de datos

Herramientas de Integración, ETLs y Pipelines de datos

Reseña del libro Pentaho Data Integration Cookbook (Second Edition)

Pentaho Data Integration Cookbook

Sobre Pentaho Data Integration Cookbook (segunda edición del libro Pentaho Data Integration 4 Cookbook), nos encontramos ante un libro en formato "recetas" escrito por María Carina Roldán, Alex Meadows y Adrian Sergio Pulvirenti, todos ellos con más de 10 años como profesionales en el mundo del Business Intelligence. El libro esta organizado de tal manera que para cada una de las soluciones propuestas..

Guía sobre procesos y elección de herramientas de ETL

Guia sobre Procesos ETLLos procesos ETL (Extracción, Transformación y Carga) son un elemento clave para la construcción y mantenimiento de sistemas de Data Warehouse en entornos de Business Intelligence.

Las herramientas ETL automatizan, organizan y optimizan esos procesos, facilitando especialmente la gestión, el mantenimiento y la escalabilidad de todo el entorno de 'alimentación' del Data Warehouse, y también de otros entornos.

La búsqueda de la perfección en los sistemas de información

El sistema de información perfectoEl uso de aplicaciones departamentales conlleva una serie de ventajas y desventajas, que los responsables de Organización y Procesos suelen ver más de las segundas que de las primeras. Por ejemplo, aduciendo que este tipo de aplicaciones generan porciones de información aisladas, a modo de islas. Tienen razón, es así, pero eso se debe a que el sistema de información no es perfecto, así que la cuestión es ¿debe ser perfecto el sistema de información?

 

Leer datos de XML y escribirlos en un archivo tabulado CSV con Kettle

Se trata de leer un archivo XML y convertirlo en un archivo plano separado por comas utilizando Pentaho Data Integration. PDI siempre tratará de convertir las fuentes de entrada en filas y columnas, con este principio hay que partir siempre que uno intente hacer algo con este software. El XML en un tipo de datos jerárquico, por ello habrá que transformarlo a dato tabular. Para manipular XML se utiliza XQuery y XPath.

Construyendo un Sistema de Business Intelligence con datos estructurados y no estructurados

Hadoop y KettleUno de los puntos que han cambiado la forma en que se hace y hará Business Intelligence es la eclosión de una gran cantidad de datos que anteriormente no se analizaban. Ahora es posible combinar y analizar de forma conjunta, tanto datos estructurados (relacionales, legacy, dbcolumn, etc...) con no estructurados (Hadoop, MapReduce, NoSQL), permitiendo alcanzar cantidades enormes de datos.