ELT on-premise: el patrón del que nadie habla (y que quizá ya estás usando)

Flujo de ELT on-premise por capas: orígenes, carga en crudo en una zona de staging del motor, y transformación con SQL en capas Silver y Gold dentro del propio SQL Server u Oracle
El ELT —cargar primero el dato en crudo y transformarlo después, dentro del propio motor de destino— se ha vendido como una característica del cloud, pero es un patrón arquitectónico, no una función de Snowflake o BigQuery. Se puede hacer —y se hace— on-premise, sobre SQL Server, Oracle o PostgreSQL, y para muchas empresas con datos sensibles o restricciones de coste es una opción perfectamente válida.
Aquí explico qué es, por qué lo confundimos con la nube, cómo se implementa on-premise y cuándo conviene..

Airflow, Prefect, dbt, NiFi y Kafka: comparativa práctica de las herramientas que mueven los datos de tu empresa

Airflow, Prefect, dbt, NiFi y Kafka: comparativa práctica de las herramientas que mueven los datos de tu empresa
Airflow, Prefect, dbt, NiFi y Kafka son un ejemplo de stack de integración —el del modern data stack open-source, código primero— que este capítulo usa como hilo conductor para entender los cuatro planos de un pipeline: quién orquesta (Airflow, Prefect), quién transforma (dbt), quién mueve los datos (NiFi) y sobre qué viajan los eventos en tiempo real (Kafka).
No son "las mejores" herramientas ni la única vía válida. El mercado ofrece desde plataformas comerciales integradas —Informatica, Azure Data Factory, AWS Glue, Talend y el resto del TOP 10 de Dataprix— hasta decenas de alternativas open-source por cada capa.
La pregunta correcta no es "¿qué cinco herramientas elijo?", sino entender los planos, elegir un arquetipo coherente con tu equipo y tu caso, y no usar una herramienta excelente para el trabajo equivocado..

Patrones ETL vs ELT: cuándo transformar en origen o en destino

ETL vs ELT: dos patrones de integración de datos enfrentados, transformar antes o después de cargar en el destino

ETL transforma los datos antes de cargarlos en el destino; ELT los carga primero en crudo y los transforma después dentro del propio almacén analítico. La elección no es una cuestión de modernidad sino de tres variables: coste (dónde y cuántas veces se paga el cómputo de transformación), latencia (cuánto tarda el dato en estar disponible y en qué estado) y gobernanza (qué datos sensibles pueden o no aterrizar en crudo en la plataforma analítica).
La mayoría de las organizaciones maduras acaban operando un patrón híbrido EtLT: una transformación ligera en vuelo —enmascarado de PII, deduplicación, normalización de formatos— seguida de la transformación pesada en el destino, gobernada como código..

dbt (Data Build Tool): Qué es y cómo funciona. Guía práctica en español

ELT moderno con dbt

dbt se ha convertido en la herramienta de referencia para la transformación de datos en los stacks de datos modernos. Si trabajas con SQL y necesitas transformar datos en un data warehouse, dbt te permite hacerlo de forma modular, versionada, documentada y testeable — aplicando las mejores prácticas de ingeniería de software al mundo de los datos.
En esta guía práctica en español te explicamos qué es dbt, cómo funciona, cuándo usarlo, y cómo empezar con tu primer proyecto..