kettle

Reseña del libro Pentaho Data Integration Cookbook (Second Edition)

Pentaho Data Integration Cookbook

Sobre Pentaho Data Integration Cookbook (segunda edición del libro Pentaho Data Integration 4 Cookbook), nos encontramos ante un libro en formato "recetas" escrito por María Carina Roldán, Alex Meadows y Adrian Sergio Pulvirenti, todos ellos con más de 10 años como profesionales en el mundo del Business Intelligence. El libro esta organizado de tal manera que para cada una de las soluciones propuestas..

BI sobre Análisis de la evaluación docente y Puntajes PSU - Herramientas a utilizar en el Proyecto

Continuando con el mini proyecto sobre el análisis de medidas relacionadas a la educación docente y puntajes PSU procederemos a puntualizar las herramientas a utilizar para poder llevar a cabo esta tarea.

Tal como lo expliqué en el capitulo anterior nuestros orígenes de datos corresponden a dos dataset públicos pertenecientes al Ministerio de educación los cuales contienen información histórica de las dos áreas antes mencionadas.

Leer datos de XML y escribirlos en un archivo tabulado CSV con Kettle

Se trata de leer un archivo XML y convertirlo en un archivo plano separado por comas utilizando Pentaho Data Integration. PDI siempre tratará de convertir las fuentes de entrada en filas y columnas, con este principio hay que partir siempre que uno intente hacer algo con este software. El XML en un tipo de datos jerárquico, por ello habrá que transformarlo a dato tabular. Para manipular XML se utiliza XQuery y XPath.

Construyendo un Sistema de Business Intelligence con datos estructurados y no estructurados

Hadoop y KettleUno de los puntos que han cambiado la forma en que se hace y hará Business Intelligence es la eclosión de una gran cantidad de datos que anteriormente no se analizaban. Ahora es posible combinar y analizar de forma conjunta, tanto datos estructurados (relacionales, legacy, dbcolumn, etc...) con no estructurados (Hadoop, MapReduce, NoSQL), permitiendo alcanzar cantidades enormes de datos.

Pentaho Data Integration 4 Cookbook

 

 

He recibido con mucho agrado una copia de "Pentaho Data Integration 4 Cookbook", un libro muy esperado.



Imagen eliminada.

Particularmente pienso que el formato Cookbook es el más cómodo una vez que manejamos un software, Poseo varios libros de este tipo y me han sido de mucha utilidad. Por otro lado, me adelanto a decir, que si este libro tiene la misma calidad que el anterior, está todo dicho.



Gracias a Richard Dias (Packt Publishing) y a Maria Carina Roldan (co-autora)



Saludos



Mariano

Pentaho 3.2 Data Integration: Beginner's Guide (fin de lectura)

Estimados,

luego de un tiempo considerable he finalizado la lectura de  "Pentaho 3.2 Data Integration: Beginner's Guide" escrito por María Carina Roldán.

En pocas palabras, un muy buen libro!

La cantidad de ejemplos, sobre todo de procesos no triviales y poco utilizados, hacen de este libro una opción inteligente a la hora de aprender sobre PDI e integración de datos.

Uno de los capítulos que más ha llamado la atención es el dedicado a Javascript embebido.

También podrán leer sobre como armar datamarts mediante la utilización de los pasos necesarios y su configuración.

No intento hacer un resumen del libro ni mucho menos, pero considero que su lectura es fundamental para aquellos que se inician con PDI e integración de datos y muy recomendable para aquellos que ya lo conocen y quieren profundizar.

Saludos

Mariano García Mattío