Si la Parte I respondía al por qué y al para qué, esta segunda parte aborda el dónde y el cómo se guarda el dato. Es la sección más técnica y densa de toda la guía, y también la que más decisiones irreversibles concentra: elegir mal un motor de base de datos, un modelo de almacenamiento o una estrategia de particionado puede condicionar la arquitectura durante años.
El recorrido va de lo general a lo concreto. Comienza con un panorama de motores de datos —relacionales, NewSQL, NoSQL, series temporales, grafos— y de las grandes arquitecturas de almacenamiento (data lakes, warehouses y lakehouses). De ahí desciende al diseño de esquemas, los patrones OLTP frente a OLAP, las bases de datos distribuidas y el eterno dilema entre nube y on-premise. Cierra con la capa operativa que mantiene todo en pie: cachés y aceleradores, almacenamiento en la nube, observabilidad, migraciones sin caídas y resiliencia ante desastres.
¿Para quién es esta parte?
Es la sección de referencia para arquitectos de datos, ingenieros de plataforma y data engineers senior que toman decisiones de stack. El CIO y los perfiles de gestión encontrarán aquí las preguntas correctas que hacer y las señales de alarma que detectar en cualquier propuesta técnica.
Analistas y científicos de datos pueden ser selectivos: entender la plataforma que tienen debajo mejora directamente cómo estructuran sus datasets y consultas, especialmente en los capítulos de almacenamiento, modelado y observabilidad.
Capítulos de esta parte
El hilo conductor de esta parte
Esta parte está pensada para leerse en tres movimientos. El primero elige las piezas: qué motor (cap. 7), qué arquitectura de almacenamiento (cap. 8) y cómo la IA está redefiniendo ese terreno (capítulo especial AI-Native). El segundo diseña con criterio: modelado de esquemas (cap. 9), separación de cargas OLTP/OLAP (cap. 10), distribución y consistencia (cap. 11) y la decisión cloud vs on-premise (cap. 12).
El tercer movimiento es el que distingue una plataforma de juguete de una plataforma de producción: la capa operativa. Cachés y aceleradores (cap. 13), almacenamiento en la nube optimizado (cap. 14), observabilidad (cap. 15), resiliencia y DR (cap. 16) y migraciones sin caídas (cap. 17) son las disciplinas que mantienen el sistema rápido, fiable y vivo. El caso de la fintech (cap. 18) cerrará la parte mostrando todas estas decisiones tomadas a la vez, bajo presión real.
Una idea que atraviesa toda la sección: no existen balas de plata, solo trade-offs documentados. Cada motor, cada modelo de consistencia y cada decisión de almacenamiento gana algo a costa de otra cosa. El trabajo del arquitecto no es encontrar la opción perfecta, sino elegir conscientemente qué está dispuesto a sacrificar.
Selección de software: rankings de Dataprix
Las decisiones de esta parte se materializan en herramientas concretas. Para acompañar la elección de plataforma, Dataprix mantiene un ranking actualizado del mejor software de la categoría, con criterios de evaluación independientes:
🎓 Formación recomendada para esta parte
Profundiza en bases de datos, SQL y arquitectura de plataformas con estos cursos en español:
Enlaces de afiliado · Dataprix puede recibir una comisión por tus compras.
Continúa tu recorrido por la guía
Guía práctica de arquitectura de datos · Una serie de Dataprix.com · Knowledge is the goal
