Duda sobre estrategia para carga de dimension DW

3 replies [Último envío]
Imagen de cgmuros
Offline
Joined: 22/06/2012
Puntos: 21

Estimados, mi duda es simple y se que muchos podrán responderla. El tema es el siguiente. Tengo una dimensión en el cual se cargarán datos desde el origen OLTP. El tema es que desde el OLTP vienen dos columnas: el id y la descripción. He aquí el problema ya que la estructura es la siguiente:

id descripcion
1 descrip1
2 descrip1
3 descrip1
4 descrip2
5 descrip2
6 descrip3
7 descrip4

Mi duda es de que manera manejo los datos en la dimensión, si las descripciones se repiten 'N' veces, algunas son idénticas a las otras con distinto id, o también se diferencian por mayúsculas o acentos.

Quedo atengo a sus aportes.

Gracias.

BertBrijs (no verificado)

Una sola pregunta: las descripciones tienen un data de validez en la base de datos de origen? Si hay datos, la diferencia podría ser explicado por uno o otro razón. Si no, tienen que transformar y normalizar los duplicados azntes de introducirles en la dimensión. No me parece muy difícil con los herramientas “ETL”

Imagen de cgmuros
Offline
Joined: 22/06/2012
Puntos: 21

BertBrijs agradezco tu respuesta. Efectivamente existe un dato de validez ubicado en la BD origen. Este corresponde a un flag de estado. Deberé obtener ese dato por cada registro con el fin de separar dos descripciones iguales.

Saludos,

Offline
Joined: 26/05/2010
Puntos: 14

Hola, puedes hablar con los propietarios (de IT y de negocio) de la información para unifiquen la información en origen que siempre es más limpio que hacerlo en el DW.

Si no es posible, siempre puedes generar un nivel superior en la dimensión con una descripción unificada que sea única para todos los registros.

Esto te permite asociar cada hecho a su valor válido de la dimensión en cada momento manteniendo la misma información que la fuente y, explotando la información por este nuevo campo, hace que los usuarios sólo vean una descripción. No modificas la información de origen por lo que en cualquier momento puedes trazarla y justificarla.

Enviar un comentario nuevo

El contenido de este campo se mantiene como privado y no se muestra públicamente.

Si no estás registrado recuerda que tu comentario entrará en una cola de aprobación.

Más información sobre opciones de formato

Enviando este formulario, acepta la política de privacidad de Mollom.

  BI   |    CRM     |    CMS    |    Tendencias en software empresarial    |    Cloud computing  |    Software libre    |   Internet    |    Movilidad y apps