Parte II - Bases y Plataformas de Datos

Parte II de VI · La capa de almacenamiento

Bases y plataformas de datos

Aquí es donde la estrategia se vuelve infraestructura. Esta parte recorre el corazón técnico de cualquier arquitectura: los motores que almacenan el dato, las plataformas que lo sirven y las decisiones de diseño que determinan si el sistema escala, resiste y cumple.

Si la Parte I respondía al por qué y al para qué, esta segunda parte aborda el dónde y el cómo se guarda el dato. Es la sección más técnica y densa de toda la guía, y también la que más decisiones irreversibles concentra: elegir mal un motor de base de datos, un modelo de almacenamiento o una estrategia de particionado puede condicionar la arquitectura durante años.

El recorrido va de lo general a lo concreto. Comienza con un panorama de motores de datos —relacionales, NewSQL, NoSQL, series temporales, grafos— y de las grandes arquitecturas de almacenamiento (data lakes, warehouses y lakehouses). De ahí desciende al diseño de esquemas, los patrones OLTP frente a OLAP, las bases de datos distribuidas y el eterno dilema entre nube y on-premise. Cierra con la capa operativa que mantiene todo en pie: cachés y aceleradores, almacenamiento en la nube, observabilidad, migraciones sin caídas y resiliencia ante desastres.

¿Para quién es esta parte?

Es la sección de referencia para arquitectos de datos, ingenieros de plataforma y data engineers senior que toman decisiones de stack. El CIO y los perfiles de gestión encontrarán aquí las preguntas correctas que hacer y las señales de alarma que detectar en cualquier propuesta técnica.

Analistas y científicos de datos pueden ser selectivos: entender la plataforma que tienen debajo mejora directamente cómo estructuran sus datasets y consultas, especialmente en los capítulos de almacenamiento, modelado y observabilidad.

Bases de datos y Plataformas de datos

Capítulos de esta parte

7

El hilo conductor de esta parte

Esta parte está pensada para leerse en tres movimientos. El primero elige las piezas: qué motor (cap. 7), qué arquitectura de almacenamiento (cap. 8) y cómo la IA está redefiniendo ese terreno (capítulo especial AI-Native). El segundo diseña con criterio: modelado de esquemas (cap. 9), separación de cargas OLTP/OLAP (cap. 10), distribución y consistencia (cap. 11) y la decisión cloud vs on-premise (cap. 12).

El tercer movimiento es el que distingue una plataforma de juguete de una plataforma de producción: la capa operativa. Cachés y aceleradores (cap. 13), almacenamiento en la nube optimizado (cap. 14), observabilidad (cap. 15), resiliencia y DR (cap. 16) y migraciones sin caídas (cap. 17) son las disciplinas que mantienen el sistema rápido, fiable y vivo. El caso de la fintech (cap. 18) cerrará la parte mostrando todas estas decisiones tomadas a la vez, bajo presión real.

Una idea que atraviesa toda la sección: no existen balas de plata, solo trade-offs documentados. Cada motor, cada modelo de consistencia y cada decisión de almacenamiento gana algo a costa de otra cosa. El trabajo del arquitecto no es encontrar la opción perfecta, sino elegir conscientemente qué está dispuesto a sacrificar.

Selección de software: rankings de Dataprix

Las decisiones de esta parte se materializan en herramientas concretas. Para acompañar la elección de plataforma, Dataprix mantiene un ranking actualizado del mejor software de la categoría, con criterios de evaluación independientes:

Ranking Dataprix →