dudas de principiante de Bi

Por favor, alguien me podría responder algunas de las preguntas que recorren mi cabeza despues de haber leido bastante de BI.

 

1.Cuando se habla de datawarehouse y datamarts depatamentales. que quieren decir a nivel de base de datos, y me explico:

que tengo una base de datos para el datawarehouse y otras tantas como datamarts tenga?. O es que la base de datos del datawarehouse es divide logicamente en varios datamars departamentales ( pero solo es una base de datos)

 

2.Si en el datawarehouse guardo la clave primeria de mi base de datos relacional, ¿es recomendable guardarla como varchar aunque sea número ? y solo dejar como númericos las medidas y las claves del propio datawarehouse

 

3.si tengo una tabla de hecho de ventas : con idVendedor,idGestor. Había pensado crear una dimensión empleados pero esto provocaría tener dos relaciones con esa tabla de hechos. ¿ sería más conveniente crear dos dimensiones: vendedores, y gestores?

Lo digo por ejemplo porque en el modelado de datos de powerpivot me pide una relacion activa y por lo tanto las otras es como si no las tuviese.

 

Muchas gracias

Hola, te voy contestando según mi experiencia, a ver si puedo ayudarte a resolver alguna duda.

1. DWH - Data marts: Más bien es la segunda opción, el Data Warehouse es todo el conjunto, que se compone de Datamarts, sería la misma base de datos.

2. Los tipos de datos de los campos te van a afectar más al rendimiento o a el espacio ocupado en la base de datos que a otra cosa, sin en el modelo relacional la clave primaria es un entero, yo no veo ninguna razón para convertirla en un varchar, aunque en las tablas del DWH deje de ser clave primaria.

3. Sí, lo mejor es que tengas esas dos dimensiones, aunque sean prácticamente iguales. Si tuvieras sólo una para los dos roles tendrías problemas cuando en un informe quisieras mostrar a la vez vendedores y gestores, ya que te haría una join para cada uno con la misma tabla, y sólo te sacaría los que tuvieran el mismo id.

Según el software que utilices, si Vendedor y Gestor tienen los mismos campos puedes incluso tener una sola tabla física de dimensión y que la segunda sea sólo una tabla virtual con otro nombre.