Artículos IT, información y publicaciones sobre kettle

Últimas publicaciones destacadas en Dataprix sobre esta temática TIC

Reseña del libro Pentaho Data Integration Cookbook (Second Edition)

 

Pentaho Data Integration Cookbook

Sobre Pentaho Data Integration Cookbook (segunda edición del libro Pentaho Data Integration 4 Cookbook), nos encontramos ante un libro en formato "recetas" escrito por María Carina Roldán, Alex Meadows y Adrian Sergio Pulvirenti, todos ellos con más de 10 años como profesionales en el mundo del Business Intelligence. El libro esta organizado de tal manera que para cada una de las soluciones propuestas..

BI sobre Análisis de la evaluación docente y Puntajes PSU - Herramientas a utilizar en el Proyecto

 

Continuando con el mini proyecto sobre el análisis de medidas relacionadas a la educación docente y puntajes PSU procederemos a puntualizar las herramientas a utilizar para poder llevar a cabo esta tarea.

Tal como lo expliqué en el capitulo anterior nuestros orígenes de datos corresponden a dos dataset públicos pertenecientes al Ministerio de educación los cuales contienen información histórica de las dos áreas antes mencionadas.

Leer datos de XML y escribirlos en un archivo tabulado CSV con Kettle

 

Se trata de leer un archivo XML y convertirlo en un archivo plano separado por comas utilizando Pentaho Data Integration. PDI siempre tratará de convertir las fuentes de entrada en filas y columnas, con este principio hay que partir siempre que uno intente hacer algo con este software. El XML en un tipo de datos jerárquico, por ello habrá que transformarlo a dato tabular. Para manipular XML se utiliza XQuery y XPath.

Federación de datos con PDI 5

 

Federacion de datos con PDIPor estos días han presentado las nuevas características de Pentaho Data Integration 5 (PDI o Kettle), son realmente muchas y por demás interesantes. Dentro de las nuevas características se encuentra una muy esperada, al menos por mí, se trata de la posibilidad de federar datos utilizando PDI.

Construyendo un Sistema de Business Intelligence con datos estructurados y no estructurados

 

Hadoop y KettleUno de los puntos que han cambiado la forma en que se hace y hará Business Intelligence es la eclosión de una gran cantidad de datos que anteriormente no se analizaban. Ahora es posible combinar y analizar de forma conjunta, tanto datos estructurados (relacionales, legacy, dbcolumn, etc...) con no estructurados (Hadoop, MapReduce, NoSQL), permitiendo alcanzar cantidades enormes de datos.

Pentaho Data Integration 4 Cookbook

 

 

 

He recibido con mucho agrado una copia de "Pentaho Data Integration 4 Cookbook", un libro muy esperado.

Particularmente pienso que el formato Cookbook es el más cómodo una vez que manejamos un software, Poseo varios libros de este tipo y me han sido de mucha utilidad. Por otro lado, me adelanto a decir, que si este libro tiene la misma calidad que el anterior, está todo dicho.

Gracias a Richard Dias (Packt Publishing) y a Maria Carina Roldan (co-autora)

Saludos

Mariano

Pentaho Kettle Solutions: Reseñas

 

Acabo de concluir la lectura de Pentaho Kettle Solutions. Este libro tan extenso como interesante, me ha llevado más tiempo de lectura de lo que había pensado, pero también me ha sorprendido con la calidad de su contenido y la diversidad de temas que abarca.

A continuación las reseñas:

Manual de Usuari@ de Spoon en español

 

Buenas.

Acabo de finalizar la actualización del Manual de Usuari@ de Spoon en español. (ver manual..)

El manual ha sido confeccionado en su totalidad, tomando como base la traducción que me ha sido provista por Leonardo M. Tito y Felipe Mullicundo:

Herramientas de ETL

Promedio: 3.3 (14 votos)

 

Esquema típico de funcionamiento de herramienta ETLListado de las principales herramientas de ETL para la empresa que ofrecen los fabricantes de software ETL.

Las herramientas de ETL sirven para facilitar los procesos de Extracción, Transformación y Carga de cualquier sistema, y son especialmente útiles para el Data Warehousing, cuando se construyen sistemas de Data Warehouse en proyectos de Business Intelligence.

Distribuir contenido

 



 

  BI   |    CRM     |    CMS    |    Tendencias en software empresarial    |    Cloud computing  |    Software libre    |   Internet    |    Movilidad y apps