dwh

HEFESTO v2.0

10

Buenas, me complace mucho anunciarles que ya está listo HEFESTO versión 2.0: "DATA WAREHOUSING: Investigación y Sistematización de Conceptos - HEFESTO: Metodología para la construcción de un Data Warehouse".

 

Propuesta de DW para XML

Hola buenas,

 

tengo que buscar una solución para poder almacenar la información de los documentos XML que se corresponden con un esquema determinado sobre la temática de las ventas.

 

El gráfico del XML Schema es éste:

 

http://img404.imageshack.us/i/xmlschema.jpg/

 

Como explicación, mencionar que en el esquema hay 3 elementos que parten del raíz (Starpackage), que son FACTS, DIMENSIONS y BASES.

 

- Dentro de FACTS únicamente está Ventas (con atributo ID de tipo ID) y que contiene, además de un subelemento Unidades_Vendidas, 4 referencias de tipo IDREF a cada una de las dimensiones.

 

- Dentro de BASES, existen 4 subelementos que representan las tablas base de cada dimensión, cada una con un atributo ID de tipo ID. Cada uno de estos elementos contendrán en su interior un subelemento de tipo IDREF como referencia a la dimensión correspondiente.

 

- Dentro de DIMENSIONS, estarán las 4 dimensiones (Dependiente, Producto, Fecha y Lugar), cada una de su tipo complejo correspondiente que fue creado previamente. Además cada una de ellas tendrá un atributo ID de tipo ID.

 

6.6 Impactos

Al implementar un DWH, es fundamental que l@s usuari@s del mismo participen activamente durante todo su desarrollo, debido a que son ell@s l@s que conocen en profundidad su negocio y saben cuáles son los resultados que se desean obtener. Además, es precisamente en base a la utilización que se le de, que el depósito de datos madurará y se adaptará a las situaciones cambiantes por las que atraviese la empresa. L@s usuari@s, al trabajar junto a l@s desarrollador@s y analistas podrán comprender más en profundidad sus propios sistemas operacionales, con todo lo que esto implica.

Con la implementación del DWH, los procesos de toma de decisiones serán optimizados, al obtener información correcta al instante en que se necesita, evitando perdidas de tiempo y anomalías en los datos. Al contar con esta información, l@s usuari@s tendrán más confianza en las decisiones que tomarán y en adición a ello, poseerán una base sustentable para justificarlas.

2.7 Redundancia

Debido a que el DW recibe información histórica de diferentes fuentes, sencillamente se podría suponer que existe una repetición de datos masiva entre el ambiente DW y el operacional. Por supuesto, este razonamiento es superficial y erróneo, de hecho, hay una mínima redundancia de datos entre ambos ambientes.

Para entender claramente lo antes expuesto, se debe considerar lo siguiente:

  • Los datos del ambiente operacional se filtran antes de pertenecer al DW. Existen muchos datos que nunca ingresarán, ya que no conforman información necesaria o suficientemente relevante para la toma de decisiones.
  • El horizonte de tiempo es muy diferente entre los dos ambientes.
  • El almacén de datos contiene un resumen de la información que no se encuentra en el ambiente operacional.
  • Los datos experimentan una considerable transformación, antes de ser cargados al DW. La mayor parte de los datos se alteran significativamente al ser seleccionados, consolidados y movidos al depósito.

En vista de estos factores, se puede afirmar que, la redundancia encontrada al cotejar los datos de ambos ambientes es mínima, ya que generalmente resulta en un porcentaje menor del 1%.

2.6 Desventajas

A continuación se enumerarán algunas de las desventajas más comunes que se pueden presentar en la implementación de un Data Warehousing:

Distribuir contenido

Últimos estados

Investigando

   - negrito_cl hace 1 día -

Busco Consultor ARTUS para proyecto en Panamá, será contratado en Mx, al concluir regresará en México.Enviar CV bhernandez@intellego.com.mx

   - Intellego hace 3 días -

Intellego es líder en consultoría y servicios para la gestión de información.

   - Intellego hace 3 días -

Infográfico sobre el nuevo escenario de la información http://bit.ly/dflh8B

   - carlos hace 1 semana -

Anunciando el laboratorio de Dataprix: www.labs.dataprix.com

   - carlos hace 1 semana -