Consideraciones procesos ETL en entornos Big Data: Caso Hadoop

Procesos de ETLEn el presente post pretendemos mostrar la problemática que con frecuencia encontramos en los procesos de extracción, validación y carga de datos en los entornos Big Data. Un proceso ETL tradicional, extrae datos desde múltiples fuentes origen, después los valida, normaliza, realiza determinadas transformaciones y vuelca los mismos en un entorno datawarehouse para su posterior análisis. Cuando en los datos fuentes, tenemos volúmenes altos, una frecuencia de actualización alta en origen o bien son datos no estructurados, estos procesos ETL suelen tener problemas.. 

¿Cómo se pueden beneficiar los directores financieros de los sistemas ERP?

Elección de ERP

Los directores financieros (CFOs) están cada vez más solicitados para involucrarse en más proyectos diversos dentro de sus organizaciones y para contribuir al crecimiento estratégico con sus habilidades y experiencia. Sin embargo, esto supone un reto importante para los responsables de finanzas, que necesitan utilizar todas las herramientas a su disposición para tomar decisiones sólidas basadas en evidencias cuantitativas.

Reseña del libro Pentaho Data Integration Cookbook (Second Edition)

Pentaho Data Integration Cookbook

Sobre Pentaho Data Integration Cookbook (segunda edición del libro Pentaho Data Integration 4 Cookbook), nos encontramos ante un libro en formato "recetas" escrito por María Carina Roldán, Alex Meadows y Adrian Sergio Pulvirenti, todos ellos con más de 10 años como profesionales en el mundo del Business Intelligence. El libro esta organizado de tal manera que para cada una de las soluciones propuestas..

Oracle Data Integrator 11g

Interface de Oracle Data IntegratorOracle Data Integrator es la herramienta de integración de datos de Oracle. Es la apuesta de Oracle en cuestiones de integración de datos y sustituye a OWB (Oracle Warehouse Builder). Forma parte de la solución OFM (Oracle Fusion Middleware) y está totalmente integrada con otras soluciones Oracle relacionadas con la gestión de datos..

Real Time Data Integration - CDC

Existe cada vez una necesidad mayor en los entornos de Business Intelligence de disponer de la información en el menor tiempo posible, ciclos de generación de datos cada vez más cortos y actualización del dato casi en tiempo real. Se habla de ‘Operational Business Intelligence (OBI)’ y de ‘Real Time Decision Support’.

Es crítico para ello hacer llegar a los entornos analíticos los datos operacionales en el  menor tiempo posible. Surge la necesidad de un ‘Real Time Data Integration’.

En la optimización de estos procesos de integración de datos, tenemos que considerar tanto las fuentes origen de datos habituales (ERP’s, CRM’s, sistemas operacionales, Bases de Datos, ficheros planos, formatos Excel, XML ,etc..), como otras de naturaleza más inmediata como pueden ser colas de mensajería e información on-line accedida vía servicios webs o RSS.

Inauguramos Data Planet, el Planet de Dataprix sobre Tecnologías de la Información

 

Data Planet de Dataprix, el Planet sobre Tecnologías de la InformaciónAcabamos de inaugurar una nueva sección en Dataprix. Se trata de un Planet dedicado a recoger de la blogosfera las publicaciones y opiniones de blogs de referencia sobre los temas que tratamos en el portal, básicamente sobre tecnologías de la información.

En el planet mostramos un resumen de cada publicación, y un enlace al blog o fuente externa para poder acceder a la fuente original y leer el contenido completo..