Diseño de esquemas y modelos de datos escalables — normalización, desnormalización y modelos por acceso

Buen diseño y mal diseño de esquemas

El diseño de esquemas de datos es la decisión arquitectónica más duradera y costosa de modificar en cualquier plataforma. Este capítulo desmitifica el dilema normalización vs desnormalización, proporcionando criterios cuantitativos basados en patrones de acceso reales, no en dogmas académicos.
Aprenderás cuándo y cómo aplicar particionado, sharding e índices estratégicos para escalar sin re-arquitecturas dolorosas. Incluye un caso real donde el rediseño basado en patrones de acceso redujo la latencia de 2.3s a 180ms (92% de mejora) y los costes de infraestructura en 48%, junto con checklists operativos, antipatrones documentados y frameworks de decisión para CIOs, arquitectos e ingenieros que necesitan que sus sistemas escalen sin colapsar..

Herramientas ETL. ¿Que son, para que valen?. Productos mas conocidos. ETL´s Open Source.

Herramientas ETL. ¿Que son, para que valen?. Productos mas conocidos. ETL´s Open Source.

Las Herramientas ETL, deberían proporcionar las siguientes funcionalidades:

  • Control de la extracción de los datos y su automatización, disminuyendo el tiempo empleado en el descubrimiento de procesos no documentados, minimizando el margen de error y permitiendo mayor flexibilidad.
  • Acceso a diferentes tecnologías, haciendo un uso efectivo del hardware, software, datos y recursos humanos existentes.
  • Proporcionar la gestión integrada de Data Warehousing y los Data Marts existentes, integrando la extracción, transformación y carga para la construcción del Data Warehouse corporativo y de los Data Marts.
  • Uso de la arquitectura de metadatos, facilitando la definición de los objetos de negocio y las reglas de consolidación.
  • Acceso a una gran variedad de fuentes de datos diferentes.
  • Manejo de excepciones.
  • Planificación, logs, interfaces a schedulers de terceros, que nos permitiran llevan una gestión de la planificación de todos los procesos necesarios para la carga del DW.
  • Interfaz independiente de hardware.
  • Soporte en la explotación del Data Warehouse...