dbt | Dataprix

Read more about ELT on-premise: el patrón del que nadie habla (y que quizá ya estás usando)
Log in to post comments

Flujo de ELT on-premise por capas: orígenes, carga en crudo en una zona de staging del motor, y transformación con SQL en capas Silver y Gold dentro del propio SQL Server u Oracle
El ELT —cargar primero el dato en crudo y transformarlo después, dentro del propio motor de destino— se ha vendido como una característica del cloud, pero es un patrón arquitectónico, no una función de Snowflake o BigQuery. Se puede hacer —y se hace— on-premise, sobre SQL Server, Oracle o PostgreSQL, y para muchas empresas con datos sensibles o restricciones de coste es una opción perfectamente válida.
Aquí explico qué es, por qué lo confundimos con la nube, cómo se implementa on-premise y cuándo conviene..

Airflow, Prefect, dbt, NiFi y Kafka son un ejemplo de stack de integración —el del modern data stack open-source, código primero— que este capítulo usa como hilo conductor para entender los cuatro planos de un pipeline: quién orquesta (Airflow, Prefect), quién transforma (dbt), quién mueve los datos (NiFi) y sobre qué viajan los eventos en tiempo real (Kafka).
No son "las mejores" herramientas ni la única vía válida. El mercado ofrece desde plataformas comerciales integradas —Informatica, Azure Data Factory, AWS Glue, Talend y el resto del TOP 10 de Dataprix— hasta decenas de alternativas open-source por cada capa.
La pregunta correcta no es "¿qué cinco herramientas elijo?", sino entender los planos, elegir un arquetipo coherente con tu equipo y tu caso, y no usar una herramienta excelente para el trabajo equivocado..

Read more about Patrones ETL vs ELT: cuándo transformar en origen o en destino
Log in to post comments

ETL vs ELT: dos patrones de integración de datos enfrentados, transformar antes o después de cargar en el destino

ETL transforma los datos antes de cargarlos en el destino; ELT los carga primero en crudo y los transforma después dentro del propio almacén analítico. La elección no es una cuestión de modernidad sino de tres variables: coste (dónde y cuántas veces se paga el cómputo de transformación), latencia (cuánto tarda el dato en estar disponible y en qué estado) y gobernanza (qué datos sensibles pueden o no aterrizar en crudo en la plataforma analítica).
La mayoría de las organizaciones maduras acaban operando un patrón híbrido EtLT: una transformación ligera en vuelo —enmascarado de PII, deduplicación, normalización de formatos— seguida de la transformación pesada en el destino, gobernada como código..

Read more about dbt (Data Build Tool): Qué es y cómo funciona. Guía práctica en español
Log in to post comments

ELT moderno con dbt

dbt se ha convertido en la herramienta de referencia para la transformación de datos en los stacks de datos modernos. Si trabajas con SQL y necesitas transformar datos en un data warehouse, dbt te permite hacerlo de forma modular, versionada, documentada y testeable — aplicando las mejores prácticas de ingeniería de software al mundo de los datos.
En esta guía práctica en español te explicamos qué es dbt, cómo funciona, cuándo usarlo, y cómo empezar con tu primer proyecto..

Subscribe to dbt

Suscríbete a nuestro boletín

Featured software

Semrush

Semrush reúne en una sola plataforma SaaS todo lo que un equipo de marketing digital necesita para dominar el posicionamiento orgánico, la publicidad de pago y la inteligencia competitiva: más de 55 herramientas integradas, una base de datos de 26.000 millones de palabras clave, 43 billones de backlinks indexados y estimaciones de tráfico para cualquier dominio..
…

🟢 DataCamp — Aprende datos e IA en español

600+ cursos interactivos de SQL, Python, Power BI y más. Empieza gratis, certifícate como profesional de datos.

Probar Gratis →

Enlace de afiliado · Dataprix puede recibir una comisión