Dataprix es un portal de referencia sobre software y servicios IT para la empresa. Nuestra comunidad está integrada por profesionales y empresas IT interesados en compartir y difundir conocimiento y recursos sobre software y servicios de Tecnologías de la Información para las empresas.

Member for

19 years 6 months

Publicaciones

  • Semrush

    Semrush reúne en una sola plataforma SaaS todo lo que un equipo de marketing digital necesita para dominar el posicionamiento orgánico, la publicidad de pago y la inteligencia competitiva: más de 55 herramientas integradas, una base de datos de 26.000 millones de palabras clave, 43 billones de backlinks indexados y estimaciones de tráfico para cualquier dominio..

  • Mejores herramientas de análisis de datos y Business Intelligence: guía comparativa

    Elegir una herramienta de análisis de datos es una decisión que condiciona durante años cómo trabaja un equipo. No hay una «mejor» en abstracto: hay la más adecuada para tu volumen de datos, tu nivel técnico, tu presupuesto y tu ecosistema tecnológico. Esta guía no explica desde cero qué es el análisis de datos, sino que va al grano de lo difícil: comparar las opciones reales del mercado y ayudarte a decidir cuál encaja en tu caso.

    Guía comparativa de herramientas de análisis de datos y Business Intelligence

  • Airflow, Prefect, dbt, NiFi y Kafka: comparativa práctica de las herramientas que mueven los datos de tu empresa

    Airflow, Prefect, dbt, NiFi y Kafka: comparativa práctica de las herramientas que mueven los datos de tu empresa
    Airflow, Prefect, dbt, NiFi y Kafka son un ejemplo de stack de integración —el del modern data stack open-source, código primero— que este capítulo usa como hilo conductor para entender los cuatro planos de un pipeline: quién orquesta (Airflow, Prefect), quién transforma (dbt), quién mueve los datos (NiFi) y sobre qué viajan los eventos en tiempo real (Kafka).
    No son "las mejores" herramientas ni la única vía válida. El mercado ofrece desde plataformas comerciales integradas —Informatica, Azure Data Factory, AWS Glue, Talend y el resto del TOP 10 de Dataprix— hasta decenas de alternativas open-source por cada capa.
    La pregunta correcta no es "¿qué cinco herramientas elijo?", sino entender los planos, elegir un arquetipo coherente con tu equipo y tu caso, y no usar una herramienta excelente para el trabajo equivocado..

  • Patrones ETL vs ELT: cuándo transformar en origen o en destino

    ETL vs ELT: dos patrones de integración de datos enfrentados, transformar antes o después de cargar en el destino

    ETL transforma los datos antes de cargarlos en el destino; ELT los carga primero en crudo y los transforma después dentro del propio almacén analítico. La elección no es una cuestión de modernidad sino de tres variables: coste (dónde y cuántas veces se paga el cómputo de transformación), latencia (cuánto tarda el dato en estar disponible y en qué estado) y gobernanza (qué datos sensibles pueden o no aterrizar en crudo en la plataforma analítica).
    La mayoría de las organizaciones maduras acaban operando un patrón híbrido EtLT: una transformación ligera en vuelo —enmascarado de PII, deduplicación, normalización de formatos— seguida de la transformación pesada en el destino, gobernada como código..

  • Eventos vs batch: los fundamentos de la integración de datos que deciden el futuro de tu arquitectura

    La integración de datos es la fontanería invisible sobre la que se sostiene toda la arquitectura: sin ella, el data lake del capítulo 8, los pipelines de los próximos capítulos y los dashboards de la Parte IV son cajas vacías. La decisión más importante no es qué herramienta comprar, sino cuándo mover los datos: en tiempo real, evento a evento, o agrupados en lotes a intervalos fijos.

    Diagrama del panorama de la integración de datos mostrando el flujo desde sistemas origen hacia destinos analíticos a través de las capas de eventos, mensajería, colas y CDC

    El territorio de la integración de datos: de los sistemas origen al consumo, pasando por las grandes familias de patrones.

    Este capítulo desgrana las cuatro piezas fundamentales —eventos, mensajería, colas y Change Data Capture (CDC)— y ofrece criterios de consultoría para no caer en el error más caro de todos: aplicar streaming a problemas que el batch resolvía a una décima parte del coste, o forzar el batch donde el negocio exige inmediatez.

  • Diseñar la plataforma de datos de una fintech: anatomía de un stack que no puede fallar

    Arquitectura de plataforma de datos de una fintech: capa transaccional, streaming, lakehouse analítico y consumo

    Vista general de las cuatro capas de la plataforma: transaccional, ingesta en streaming, lakehouse analítico y consumo.

    Una fintech es, en esencia, una empresa de datos que casualmente mueve dinero. Su plataforma tiene que conciliar lo que en otros sectores va por separado: latencia de milisegundos para autorizar pagos, consistencia transaccional estricta para que ningún saldo cuadre mal, analítica masiva para el antifraude y el scoring, y trazabilidad regulatoria perpetua para el supervisor.
    En este caso práctico —que cierra la Parte II de la Guía— se diseña ese stack de principio a fin a través de una fintech europea, recorriendo las decisiones, los trade-offs y los errores evitados: del ledger inmutable a la idempotencia, del tiering de almacenamiento a la resiliencia por niveles de criticidad. Incluye un incidente real que demuestra por qué las decisiones que parecían sobreingeniería cara fueron justo las que salvaron la operación.