ETL

Leer datos de XML y escribirlos en un archivo tabulado CSV con Kettle

10

Se trata de leer un archivo XML y convertirlo en un archivo plano separado por comas utilizando Pentaho Data Integration. PDI siempre tratará de convertir las fuentes de entrada en filas y columnas, con este principio hay que partir siempre que uno intente hacer algo con este software. El XML en un tipo de datos jerárquico, por ello habrá que transformarlo a dato tabular. Para manipular XML se utiliza XQuery y XPath.

ssis etl script

tengo un problema, cree un etl pero ahora quiero hacer un script o algo similar para que el que lo quiera ejecutar no tenga que entrar a la herramienta y poner el botón play, si me pudiesen dar los pasos de como hacer eso lo agradecería.

Primeros pasos con Talend

7

1. Introducción

Talend, es una ETL de código libre. Una ETL, es una herramienta para Extraer, Transformar y Carga los datos (Extract-Transform-Load). Mediante herramientas de este tipo, podemos hacer transformaciones en los datos, fusionar campos, aplicar cálculos de funciones sobre los campos, etc. 

Entrevista con Luca Zurlo, director de Jaspersoft para el sur de Europa

8

Luca Zurlo, Director de Jaspersoft para el Sur de Europa

Luca Zurlo es Director para el Sur de Europa de Jaspersoft, la compañia que ofrece la extendida suite de Business Intelligence open source.

Con motivo de la presentación en el evento Big data 2012 de novedades en la suite para trabajar con Big Data, y del acuerdo firmado por la compañia con el grupo tecnológico GMV, que convierte a esta compañia en el primer partner de Jaspersoft en España, Luca Zurlo nos concedió esta entrevista.

Oracle GoldenGate 11g R2 ya se encuentra disponible

Ya está disponible Oracle GoldenGate 11g R2, que proporciona integración de datos en tiempo real para aplicaciones críticas de negocio, que permiten una mejor comprensión del negocio, maximizando el rendimiento y permitoendo migración de datos sin tiempo de inactividad, recuperación de desastres y sincronización activa de bases de datos para su continua disponibilidad.

 

Construyendo un Sistema de Business Intelligence con datos estructurados y no estructurados

6

Hadoop y KettleUno de los puntos que han cambiado la forma en que se hace y hará Business Intelligence es la eclosión de una gran cantidad de datos que anteriormente no se analizaban. Ahora es posible combinar y analizar de forma conjunta, tanto datos estructurados (relacionales, legacy, dbcolumn, etc...) con no estructurados (Hadoop, MapReduce, NoSQL), permitiendo alcanzar cantidades enormes de datos.

Tiempo de Actualización

 Hola, estoy haciendo un DW para un area de Diagnostico por imagenes donde en la Base de datos se registra el turno del paciente, cuando fue llamado por el medico, cuando demoro el medico, donde se atendio, etc......la duda que se me presenta es que me pidieron que la actualización de la información en el dw se realice cada 6 horas, como para conocer la info de la mañana a la tarde .....

 

Se puede hacer asi? o es demasiado poco tiempo?.....cuales son los tiempos recomendados de carga?

 

 

Muchas Gracias!!! :)

 

saludos,

Julio

BT Retail se estandariza sobre Informatica Cloud

Empresa o cliente: 
BT Retail
Software: 
Informatica Cloud

Las soluciones de Informatica Cloud están siendo utilizadas para ampliar la Plataforma Informatica con el fin de optimizar y acelerar las decisiones ejecutivas, unificando el reporting desde las múltiples ubicaciones de Salesforce (que en total abarca unos 5.000 usuarios) desplegadas por todo BT Retail, incluyendo BT Business y BT Conferences...

Estrategia de Implementación y Administración Inteligente de DataWarehouse

5
Comparto con ustedes una estrategia que he venido desarrollado desde hace varios años, orientada a minimizar las tareas de administración de los datawarehouse empresariales en entornos de alta complejidad.
 
A diferencia de otras metodologías que están centradas en las fases de los proyectos, esta estrategia se enfoca en resolver temas de lógica de negocio, forma de organizar las distintas tareas de ETL o ELT, como resolver conflictos de información, optimización de los tiempos de respuesta de los procesos y sus componentes, etc.
 
En resumen, describe una estrategia genérica, aplicable a cualquier plataforma para la implementación y administración de DataWarehouse, cuyo principal objetivo es lograr el éxito, sustentabilidad y adaptabilidad del proyecto tanto a corto como largo plazo.
 
El documento puede ser descargado en este mismo blog, a través del link: http://www.easybi.cl/joomla16/index.php/metodologias-y-estrategias/10-cat-metodologias-y-estrategias/2-eiad-10
 
 

Introducción

Es complejo intentar desvelar, a través de unas líneas todo lo que puede incluir un modelo de Data Warehouse e incluso llegar a un acuerdo en su significado y tipo de estructuración física.

En cualquier caso, a estas alturas de la madurez de Business Intelligence (BI) en España, todos coincidimos en que el único pilar básico para el desarrollo de soluciones de negocio es sin lugar a dudas el DW. Almacenamiento pensado, diseñado y construido por y para unas necesidades agresivas de análisis, análisis completamente impredecibles.

 

Distribuir contenido

 

 

 

Gestion del Conocimiento    |    Business Intelligence y Analítica    |     Bases de Datos    |      ERP     |      CRM      |     Tendencias tecnológicas