Eventos vs batch: los fundamentos de la integración de datos que deciden el futuro de tu arquitectura
La integración de datos es la fontanería invisible sobre la que se sostiene toda la arquitectura: sin ella, el data lake del capítulo 8, los pipelines de los próximos capítulos y los dashboards de la Parte IV son cajas vacías. La decisión más importante no es qué herramienta comprar, sino cuándo mover los datos: en tiempo real, evento a evento, o agrupados en lotes a intervalos fijos.
Este capítulo desgrana las cuatro piezas fundamentales —eventos, mensajería, colas y Change Data Capture (CDC)— y ofrece criterios de consultoría para no caer en el error más caro de todos: aplicar streaming a problemas que el batch resolvía a una décima parte del coste, o forzar el batch donde el negocio exige inmediatez.






The process of taking data from different systems and putting it into a data warehouse for business analysis can be a complicated affair. In this article, we look at what is involved and how the cloud has made matters potentially trickier.