¿Por que un almacén de datos es diferente a una base de datos operacionales?

Uno de los errores típicos cuando nos enfrentamos a la construcción de un almacén de datos es intentar replicar el modelo operacional.

Un almacén de datos es diferente a una base de datos operacionales porque su finalidad y objetivos son  distintos. Haciendo una analogía con el transporte, si quiero entregar una carta en una oficina en el centro de la ciudad contrato a un mensajero que vaya en moto y lo haga de forma ágil y rápida. Si quiero entregar 2 toneladas de papel contrato a un camión. Ambos son transportes, pero con características distintas que responden a necesidades distintas.

He aquí una tabla comparativa:

Datos Primitivos / OperacionalesDatos Derivados / Data WarehouseOrientados a la aplicaciónOrientados al sujetoDetalladosSumarizados, al menos refinadosExacta, al momento del accesoRepresenta valores a través del tiempoSirve a los oficinistas/trabajadoresSirve a los directivosPuede ser actualizadaNo se actualizaSe ejecuta repetitivamenteSe ejecuta heurísticamenteLos requerimientos para procesar se entiende a prioriLos requerimientos para procesar se entienden a posterioriCompatible con entornos de desarrollo tradicionalesIncompatible con entornos de desarrollo tradicionalesAccesible atómicamenteAccesible por conjuntos de datosOrientado a la transacciónOrientado al análisisNo redundanteRedundanteEstructura estáticaEstructura dinámicaPequeños volúmenes de datosGrandes volúmenes de datosAlto usoBajo uso

El motivo principal de por que deben ser bases de datos distintas con modelos distintos  es por que se les va a dar usos distinto y lo que es bueno para uno es malo para el otro. Interactuamos con la información de forma distinta por lo que debe estar estructurada de forma distinta.