Pentaho 3.2 Data Integration: Reseñas

Buenas.

Hace unos días terminé de leer (y hacer los ejercicios!) el libro Pentaho 3.2 Data Integration - Beginner's Guide, escrito por María Carina Roldan.

Tal como lo vengo haciendo, realizaré una serie de reseñas desde diferentes perspectivas:

 

1) Reseña general: es un libro muy ameno y fácil de leer. Cada tema es abordado con muchísima dedicación apuntando a que la comprensión de lo que se quiere transmitir sea lo más alta posible.

Cabe destacar la cantidad y la calidad de los ejemplos presentes en el libro, como así también el énfasis en detallar qué se hizo y para qué.

Algo principal a remarcar para que quede bien claro, es que María Carina en su libro habla de la Integración de Datos y no solo de "procesos ETL para cargar un DW", lo cual hace que su lectura nos pueda ayudar en muchísimos ámbitos.

 

2) Reseña detallada: Pentaho 3.2 Data Integration es un paseo por la integración de datos a través de los ejemplos, prácticas, consejos y recomendaciones que nos plantea María Carina, utilizando por supuesto PDI.

A lo largo del libro se tratan temas complejos tales como: expresiones regulares, pasaje de parámetros, ejecución de transformación y trabajos por línea de comandos, xml, manejo de variables, etc, etc.

Se utilizan pasos no convencionales: Fórmula, Búsqueda en flujo de datos, Append streams, Des-Normalización de Fila, If field value is null, Normalización de Fila, Number range, Regex Evaluation, Búsqueda en Base de Datos, Mapeo, etc, etc.

Hay todo un capítulo dedicado a la utilización de código javascript y del paso "Valor Java Script Modificado".

Oto dedicado al manejo de errores y a los pasos "Write to log", "Abort" y "Data Validator".

Y uno más dedicado al armado de un Data Mart: dimensiones degeneradas, dimensiones junk, claves subrogadas, dimensiones lentamente cambiantes, dimensión tiempo.

Finalmente, se introduce y ejemplifica cómo instalar diferentes plugins en PDI, se habla de cómo aumentar la performance en trabajos y transformaciones y de cómo integrar PDI con Pentaho BI Server.

Pentaho 3.2 Data Integration es un material totalmente recomendable tanto para quienes nos dedicamos al BI, como para quienes tengan que implementar técnicas de Integración de Datos.

 

3) Reseña final: existen muchas tareas en el mundo del IT y del BI que se hacen manualmente casi sin darle la menor importancia y otras tantas que no son siquiera tenidas en cuenta. A través de este libro María Carina nos muestra una serie de ejemplos que nos hace pensar en todos estos casos y cómo sería la transformación o trabajo que deberíamos utilizar.

Sin lugar a duda, este es otro libro de indispensable lectura.

 

 

Salud!