ELT on-premise: el patrón del que nadie habla (y que quizá ya estás usando)
El ELT —cargar primero el dato en crudo y transformarlo después, dentro del propio motor de destino— se ha vendido como una característica del cloud, pero es un patrón arquitectónico, no una función de Snowflake o BigQuery. Se puede hacer —y se hace— on-premise, sobre SQL Server, Oracle o PostgreSQL, y para muchas empresas con datos sensibles o restricciones de coste es una opción perfectamente válida.
Aquí explico qué es, por qué lo confundimos con la nube, cómo se implementa on-premise y cuándo conviene..

¿Cómo encaja el Big Data con el BI? Hablando de BI yo siempre he visto el visto el Big Data como un origen de datos más para el Data Warehouse, pero con todo el bombo que se le está dando a esta tecnología a veces he llegado a entender que el Big Data iba a sustituir al Business Intelligence.
En el presente post pretendemos mostrar la problemática que con frecuencia encontramos en los procesos de extracción, validación y carga de datos en los entornos Big Data. Un proceso ETL tradicional, extrae datos desde múltiples fuentes origen, después los valida, normaliza, realiza determinadas transformaciones y vuelca los mismos en un entorno datawarehouse para su posterior análisis. Cuando en los datos fuentes, tenemos volúmenes altos, una frecuencia de actualización alta en origen o bien son datos no estructurados, estos procesos ETL suelen tener problemas.. 

