Estimados, mi duda es simple y se que muchos podrán responderla. El tema es el siguiente. Tengo una dimensión en el cual se cargarán datos desde el origen OLTP. El tema es que desde el OLTP vienen dos columnas: el id y la descripción. He aquí el problema ya que la estructura es la siguiente:
id descripcion
1 descrip1
2 descrip1
3 descrip1
4 descrip2
5 descrip2
6 descrip3
7 descrip4
Mi duda es de que manera manejo los datos en la dimensión, si las descripciones se repiten 'N' veces, algunas son idénticas a las otras con distinto id, o también se diferencian por mayúsculas o acentos.
Quedo atengo a sus aportes.
Gracias.
- Log in to post comments

Una sola pregunta: las
Submitted by BertBrijs (not verified) on 20 August, 2013 - 18:20
BertBrijs agradezco tu
Submitted by cgmuros on 21 August, 2013 - 18:30
Hola, puedes hablar con los
Submitted by cmateos on 30 August, 2013 - 08:46
In reply to BertBrijs agradezco tu by cgmuros
Hola, puedes hablar con los propietarios (de IT y de negocio) de la información para unifiquen la información en origen que siempre es más limpio que hacerlo en el DW.
Si no es posible, siempre puedes generar un nivel superior en la dimensión con una descripción unificada que sea única para todos los registros.
Esto te permite asociar cada hecho a su valor válido de la dimensión en cada momento manteniendo la misma información que la fuente y, explotando la información por este nuevo campo, hace que los usuarios sólo vean una descripción. No modificas la información de origen por lo que en cualquier momento puedes trazarla y justificarla.