Duda sobre estrategia para carga de dimension DW

Estimados, mi duda es simple y se que muchos podrán responderla. El tema es el siguiente. Tengo una dimensión en el cual se cargarán datos desde el origen OLTP. El tema es que desde el OLTP vienen dos columnas: el id y la descripción. He aquí el problema ya que la estructura es la siguiente: id descripcion 1 descrip1 2 descrip1 3 descrip1 4 descrip2 5 descrip2 6 descrip3 7 descrip4 Mi duda es de que manera manejo los datos en la dimensión, si las descripciones se repiten 'N' veces, algunas son idénticas a las otras con distinto id, o también se diferencian por mayúsculas o acentos. Quedo atengo a sus aportes. Gracias.

Una sola pregunta: las descripciones tienen un data de validez en la base de datos de origen? Si hay datos, la diferencia podría ser explicado por uno o otro razón. Si no, tienen que transformar y normalizar los duplicados azntes de introducirles en la dimensión. No me parece muy difícil con los herramientas “ETL”

BertBrijs agradezco tu respuesta. Efectivamente existe un dato de validez ubicado en la BD origen. Este corresponde a un flag de estado. Deberé obtener ese dato por cada registro con el fin de separar dos descripciones iguales. Saludos,

En respuesta a por cgmuros

Hola, puedes hablar con los propietarios (de IT y de negocio) de la información para unifiquen la información en origen que siempre es más limpio que hacerlo en el DW.

Si no es posible, siempre puedes generar un nivel superior en la dimensión con una descripción unificada que sea única para todos los registros.

Esto te permite asociar cada hecho a su valor válido de la dimensión en cada momento manteniendo la misma información que la fuente y, explotando la información por este nuevo campo, hace que los usuarios sólo vean una descripción. No modificas la información de origen por lo que en cualquier momento puedes trazarla y justificarla.