Aspectos técnicos en el proceso de creación y explotación de un Data Warehouse

 

3.- ASPECTOS TÉCNICOS EN EL PROCESO DE CREACIÓN Y EXPLOTACIÓN DEL DW

En este capítulo se pretende dar la orientación suficiente al comprador para la preparación del conjunto de especificaciones que definirán los requisitos que han de cumplir la Creación y Explotación de un Data Warehouse.

Se realiza en primer lugar un análisis de las necesidades del comprador, a continuación se recogen los factores relevantes a tener en cuenta en el proceso de adquisición y, finalmente, se describe cómo deben ser planteadas las especificaciones técnico - funcionales para la elaboración del Pliego de Prescripciones Técnicas, qué normas, estándares y cláusulas tipo pueden ser de aplicación, y cuál es el cuestionario técnico diseñado para normalizar las ofertas y facilitar su evaluación.

3.1.- Análisis de las necesidades del comprador

3.2.- Factores relevantes en el proceso de adquisición

3.3.- Diseño del pliego de prescripciones técnicas particulares

 

Análisis de las necesidades del comprador de un Data Warehouse

 

3.1.- ANÁLISIS DE LAS NECESIDADES DEL COMPRADOR

Incluimos aquí unos pasos que, tal y como se comentaban en la Fases de implantación de un Data Warehouse , son previos al inicio de un proyecto de este tipo.

En efecto, como punto de arranque de todo, es preciso "vender la idea" a los usuarios finales de un Data Warehouse. Esto es así, por ser una idea bastante novedosa y sobre la que pueden surgir recelos de su efectividad. Estos recelos se pueden eliminar comenzando por un pequeño módulo, del cual se valoren los beneficios posteriores, para iniciar progresivamente el desarrollo de nuevos módulos, cada uno con un coste unitario cada vez más reducido, pero sin embargo con unos beneficios distribuidos cada vez mayores por poder cada vez incluir más información. (Ver Data Warehouse vs. Data Mart) para comprobar un caso de este tipo.

El simple hecho de realizar un informe de necesidades previas en el que se enumeren la situación de los datos entre los diversos sistemas operacionales, puede ser un hecho decisivo para emprender un proyecto de este tipo. Muchas veces la información existente se encuentra tan poco normalizada, existen tantas discrepancias entre estos sistemas, que el abordar un Data Warehouse en el que se limpien estos datos y se normalicen pueden aportar un valor intangible: "la calidad y fiabilidad de la información".

La venta de esta idea no sólo se ha de realizar frente a la Dirección sino que es preciso realizarla a todos los niveles: a la Dirección, Gerencia e incluso al área de Desarrollo.

Tras esta venta de la idea, comienzan dos fases similares al análisis de requisitos del sistema (ARS según abreviaturas de la metodología METRICA): la definición de objetivos y requerimientos de información, en el que se analicen las necesidades del comprador.

Definición de los objetivos

En esta fase se definirá el equipo de proyecto que debe estar compuesto por representantes del departamento informático y de los departamentos usuarios del Data Warehouse además de la figura de jefe de proyecto.

Se definirá el alcance del sistema y cuales son las funciones que el Data Warehouse realizará como suministrador de información de negocio estratégica para la empresa. Se definirán así mismo, los parámetros que permitan evaluar el éxito del proyecto.

 

Definición de los requerimientos de información

Durante esta fase se mantendrán sucesivas entrevistas con los representantes del departamento usuario final y los representantes del departamento de informática. Se realizará el estudio de los sistemas de información existentes, que ayudaran a comprender las carencias actuales y futuras que deben ser resueltas en el diseño del Data Warehouse

Asimismo, en esta fase el equipo de proyecto debe ser capaz de validar el proceso de entrevistas y reforzar la orientación de negocio del proyecto. Al finalizar esta fase se obtendrá el documento de definición de requerimientos en el que se reflejarán no solo las necesidades de información de los usuarios, sino cual será la estrategia y arquitectura de implantación del Data Warehouse.

Factores relevantes en el proceso de adquisición de un sistema de Data Warehouse

DATA WAREHOUSE

3.2.- FACTORES RELEVANTES EN EL PROCESO DE ADQUISICIÓN

En la definición del objeto del contrato y los requisitos inherentes al mismo, así como en la valoración y comparación de ofertas de los licitadores pueden intervenir muchos factores y de muy diversa índole.

Es de suma importancia que todos los factores relevantes que intervienen en el proceso de contratación queden debidamente recogidos en el pliego de prescripciones técnicas que regule el contrato. Así mismo, es conveniente que las soluciones ofertadas por los licitadores sean recogidas en los cuestionarios disponibles a tal efecto:

  • De empresa
  • Económicos
  • Técnicos particulares

Se van a relacionar a continuación algunos de los factores que suelen tener mayor peso al seleccionar una herramienta de Data Warehouse. Sin embargo, debe tenerse en cuenta que la importancia de cada factor variará en función de cada caso particular, por lo que siempre será necesario identificar la importancia relativa de cada punto. Los puntos a contemplar son bastante similares a los contemplados en el apartado homónimo de los SGBD, que adaptaremos a la casuística particular de un Data Warehouse.

Pruebas en condiciones reales

Tal y como sucedía en los SGBD, el rendimiento real de un Data Warehouse es muy difícil de predecir mediante procedimientos teóricos. Por ello, de igual forma que en el SGBD, si se va a instalar un Data Warehouse que contendrá un gran volumen de datos o, si por cualquier otra razón, existen dudas sobre la capacidad del Data Warehouse de dar unas prestaciones adecuadas en las máquinas disponibles se debe exigir al suministrador una prueba anterior a la adquisición del Data Warehouse. Esta prueba debe realizarse en la propia instalación de destino.

La prueba se debería realizar en las condiciones más parecidas a las reales que se puedan conseguir. Para ello se deberá cargar el Data Warehouse con un volumen de datos adecuado y se deberán crear procesos de prueba similares a los más costosos de los que se vayan a desarrollar.

A diferencia de con los SGBD, no es preciso realizar la prueba en momentos de gran carga, por la diferente filosofía de un almacén de datos orientado al conocimiento, pero sí que será preciso la comprobación de la compatibilidad de la herramienta para los procesos de extracción y carga desde los diferentes sistemas operacionales (sistemas operativos, bases de datos, etc.) implicados .

Volumen y organización de los datos

Debe estar garantizado que el Data Warehouse es capaz de tratar el volumen de datos que se vaya a necesitar en la instalación. Para ello debe verificarse no sólo que el Data Warehouse puede manejar el volumen total de datos, sino que no existe ninguna limitación que impide organizarlo de la forma más conveniente.

No obstante, en este sentido y como factor común de un SGBD con un Data Warehouse, cabe reseñar que muchos problemas de rendimiento se deben más veces a un mal diseño del modelo de datos del Data Warehouse que a un problema de rendimiento de la herramienta en sí.

Dimensionamiento de la plataforma de instalación

De lo comentado en los dos puntos anteriores puede deducirse que existe la posibilidad de que sea necesario redimensionar la máquina en la que se instale el Data Warehouse, o mejor aun, disponer de una dedicada al Data Warehouse.

Es necesario que el suministrador detalle cual de las dos versiones está ofreciendo para cada una de las licencias que se compren y si alguna de ellas fuese una versión limitada, que especifique claramente cuales de las funcionalidades ofertadas no se encuentran presentes en la versión restringida.

Condiciones económicas y del soporte

Existen actualmente varios sistemas de cobro por el uso de Data Warehouse según el fabricante. Los más utilizados son facturar por:

  • Cada máquina y/o tipo de máquina en la que se instale.
  • Cada usuario que acceda al SGBD.
  • Por tiempo de utilización (usualmente renovación anual).
  • Por combinación de las anteriores.

Es imprescindible que el suministrador indique con toda claridad el método utilizado.

También debe explicitarse que, salvo indicación en contrario, todas las licencias son de versiones completas sin ninguna restricción respecto a las funcionalidades ofertadas.

También es conveniente pedir los precios de los productos adicionales que no se desee instalar en el momento pero que puedan ser interesantes en el futuro.

Otro factor importante es la duración de la garantía, período de tiempo durante el que el suministrador proporcionará soporte gratuito a sus productos y, también el precio del soporte en años sucesivos. Este último precio debe fijarse sobre variables presentes en el contrato no sobre futuros precios de lista del fabricante.

Otro factor que debe evaluarse es la calidad del soporte ofrecido. Este puede dividirse en un gran número de puntos cuya importancia variará en función de las necesidades del comprador. Entre ellos, se pueden citar:

  • La inclusión o no de la instalación en el precio del producto.
  • El tiempo máximo de entrega.
  • La inclusión o no de prestaciones adicionales gratuitas como puede ser un cierto número de horas de formación.
  • Capacitación y experiencia del personal que presta soporte técnico y consultoría.
  • Calidad de la documentación, idioma en que está escrita, número de copias suministradas gratuitamente y precio de las copias adicionales.
  • Capacidad técnica de la empresa y de la asistencia técnica que presta para lo que es recomendable pedir referencias a otros usuarios de la Administración de este tipo de productos.

 

 

Pliego de descripciones técnicas particulares de un Data Warehouse

DATA WAREHOUSE

3.3.- DISEÑO DEL PLIEGO DE PRESCRIPCIONES TÉCNICAS PARTICULARES

Debido a la no existencia de ninguna norma o estándar aplicable a un Data Warehouse, mas que estándares de facto, describimos a continuación cuestionarios técnicos de normalización y valoración de ofertas de SGBD.

Estos cuestionarios han de partir de unas especificaciones previas de:

Entorno Hardware:

      Host: (Tipo Máquina, Sistema Operativo y Base de Datos Operacional)

      Servidor de la aplicación de DW (Tipo Máquina, Nº procesadores, Memoria total y por procesador, Sistema Operativo, Capacidad de Disco)

      Clientes (Tipo de Máquina, Memoria, Sistema Operativo, Capacidad de Disco)

      Red local (Topología, Protocolos, Sofware de Cliente y Número de Usuarios soportados)

Entorno Software:

      Gestor de Base de Datos para el Data Warehouse

      Volumen estimado de la Base de Datos

A continuación y dependiendo del ámbito de aplicación del Data Warehouse describimos un cuestionario aplicado a la creación del Data Warehouse por un lado, por otro del Análisis de la Calidad del dato y la depuración, y por último de su Explotación.

3.3.1.- Cuestionario para la Extracción, Movimiento y Carga

3.3.2.- Cuestionario de Análisis de Calidad

3.3.3.- Cuestionario de Herramientas de Usuario Final: OLAP, EIS y Reporting.

 

 

Cuestionario para la ETL

3.3.1.- CUESTIONARIO PARA LA EXTRACCIÓN, MOVIMIENTO Y CARGA

Con carácter general y a fin de utilizar la información recopilada de cara a la contratación, es importante destacar que los datos recogidos en este cuestionario están dirigidos a obtener un resumen estructurado de la oferta y a demostrar la solvencia técnica o profesional de la empresa en aquellos casos en que no sea requerida la clasificación de la misma. Dicha información sólo servirá de base a la valoración cuando esté relacionada con lo expresado en la cláusula "Criterios de adjudicación del contrato", siendo, en el resto de los casos, de carácter meramente informativo.

Nota: (*) significa que hay que indicar "1" en caso afirmativo.

(**) significa que hay que repetir para cada sistema operativo ofertado.

Cuestión Respuesta Referencia a



oferta (Página)
------------------------------------------
ENTORNO OPERATIVO
- REQUERIMIENTOS LÓGICOS
. Especificar para cada uno de las paquetes software ofertados la o las posibles
plataformas (servidor central, servidor intermedio y cliente) donde podrían instalarse, detallando los requerimientos
físicos y lógicos asociados a cada alternativa, junto con los procesos que se ejecutarían
en cada una de las posibles plataformas
[ ] [ ]
. Compatibilidad con Sistemas operativos (Enumerar) [ ] [ ]
. Compatibilidad con software de red [ ] [ ]
. Necesidad de software adicional [ ] [ ]
- REQUERIMIENTOS FÍSICOS
 . Especificar detalladamente los requerimientos físicos mínimos
y recomendados, tales como memoria RAM, espacio libre en disco, procesadores, etc...
[ ] [ ]
CARACTERÍSTICAS GENERALES
- FUENTES DE DATOS (ORIGEN) SOPORTADAS
. Permite extraer datos desde varias plataformas origen simultáneamente [ ] [ ]
. Indicar las distintas fuentes de datos operacionales a las que es posible acceder,
especificando en los casos que sea necesario las últimas versiones certificadas.
[ ] [ ]

Ficheros planos

[ ] [ ]

Acceso a bases de datos

[ ] [ ]

Otras fuentes operacionales

[ ] [ ]

Consideraciones a tener en cuenta

[ ] [ ]
- BASES DE DATOS DESTINO SOPORTADAS
. Permite cargar datos en varias plataformas destino simultáneamente [ ] [ ]
.Gestores de bases de datos destino soportados, especificando las



últimas versiones certificadas
- FUNCIONALIDADES

. Enumerar las funcionalidades de la o las herramientas propuestas:

Permite manejar (leer/escribir) cadenas de caracteres de longitud variable

No limita el número de dígitos de los formatos numéricos

Es posible aplicar reglas de transformación a los números con
formato en coma flotante

Otras funcionalidades (especificar)

[ ] [ ]
- TRATAMIENTO INTERMEDIO DE LOS DATOS RECUPERADOS

.Realiza un almacenamiento intermedio de los datos recuperados a partir de
los sistemas operacionales

. Especificar

Almacenamiento intermetdio físico de los datos

Fichero plano

Memoria

BBDD propia

BBDD externa

Otros

Localización

Puesto cliente

Servidor intermedio

Servidor central

Otros

Técnicas aplicadas sobre los datos intermedios

Compresión

Encriptación

Otros

Explicar el consumo de recursos asociado a este almacenamiento intermedio de los datos

[ ] [ ]
- BASE DE DATOS COMO FUENTE DE DATOS OPERACIONALES

. Conocimiento de la estructura de la base de datos

Requiere algún software adicional que permita el acceso a las BBDD
para tal funcionalidad

[ ] [ ]

. Detección a captura de modificaciones en la estructura de las bases
de datos

Requiere algún software adicional que permita el acceso a las BBDD
para tal funcionalidad

Explicar con detalle los mecanismos utilizados para la detección de
cambios en la estructura de las bases de datos

Es posible automatizar la detección de dichos cambios

Es posible automatizar la captura de los cambios realizados en la estructura
de las bases de datos

Indicar si la herramienta es capaz de detectar automáticamente las
transformaciones a las que afectan las modificaciones realizadas

Es necesario parar las bases de datos para realizar el proceso de captura
de cambios

Observaciones

[ ] [ ]

. Acceso a las bases de datos

Requiere algún software adicional que permita el acceso a las BBDD
para tal funcionalidad

Acceden directamente a la base de datos los programas generados por la herramienta

Indicar cómo se obtienen los ficheros de descarga de los datos

Mediante una utilidad de la propia herramienta

A través de una utilidad de la BBDD

Mediante un desarrollo a medida

Otros (especificar))

[ ] [ ]

. Detección y captura de las modificaciones en los datos

Requiere algún software adicional que permita el acceso a las BBDD
para tal funcionalidad

Es posible automatizar la detección de estas modificaciones

Explicar detalladamente los mecanismos utilizados para la captura de dichas
modificaciones

Es posible automatizar la captura de dichas modificaciones

Indicar si la herramienta es capaz de detectar automáticamente las
transformaciones a las que afectan las modificaciones realizadas.

Es necesario parar las bases de datos para realizar el proceso de captura de las modificaciones realizadas sobre
los datos (Observaciones)

[ ] [ ]
- RECOMENDACIONES PRÁCTICAS
. Enumerar las principales recomendaciones prácticas para asegurar una
plena explotación de la potencialidad de los paquetes software ofertados



. Enumerar y justificar brevemente los puntos fuertes tanto de la arquitectura funcional propuesta como de
las herramientas ofertadas
[ ] [ ]
FUNCIONALIDAD
- FACILIDAD DE USO

. Especificar los idiomas soportados en cada una de las siguientes áreas:

Aplicación

Ayuda on-line

Manuales de ayuda

Soporte

. Soporta alfabetización internacional

. Dispone de ayuda on-line

. Es posible la presentación preliminar de la documentación
generada antes de imprimirla

. Posee un interfaz gráfico que permita tener una visión global
de las tablas incluidas en los sistemas operacionales y en el Data Warehouse

. Especificar detalladamente los diferentes perfiles de usuario contemplados
para cada una de las herramientas ofertadas, así como la curva de aprendizaje (en horas) para cada uno de
ellos.

. Posee un Editor de Diagramas que facilite las tareas de diseño de
los flujos de datos y de las transformaciones a aplicar

[ ] [ ]
- PROCESOS DE EXTRACCIÓN Y TRANSFORMACIÓN

. Indicar el paquete software ofertado que incluye esta funcionalidad
y la plataforma o plataformas donde ha de instalarse

. Requiere algún software adicional que complemente esta funcionalidad

. Es posible automatizar completamente los procesos de extracción y
transformación

. Se puede integrar con el planificador externo de tareas

. Explicar detalladamente el mecanismo de acceso a las estructuras de
las bases de datos, tanto operacionales como del Data Warehouse

. Explicar el mecanismo de extracción de los datos desde los sistemas
operacionales detallando concretamente de dónde los extraen y si se utilizan ficheros secuenciales intermedios

. Detallar los procedimientos de depuración incorporados

. Indicar las funciones de transformación más importantes incluidas
en el producto:

Importación desde ficheros planos de reglas de transformación
previamente definidas Validación y sustitución de los campos de una tabla en base a los campos de
otras tablas

Cálculos aritméticos propios de sumarización de la información

Conversión de formatos de fecha

Definición de reglas de negocio

Llamadas a subrutinas externas

Otras

. Es posible definir reglas de transformación generales que se puedan
parametrizar mediante variables para casos concretos

. En caso de exclusión de datos en base a reglas de transformación,
indicar si se pueden almacenar

. Indicar:

Almacenamiento físico de los datos excluidos

Fichero plano

Base de Datos propia

Base de Datos externa

Otros

Localización física de los datos excluidos

Puesto cliente

Servidor intermedio

Servidor central

Otros

[ ] [ ]
- CARACTERÍSTICAS DE LOS PROGRAMAS GENERADOS
. Especificar el lenguaje utilizado en la generación de código
para las distintas fuentes soportadas



. Indicar si genera también los JCL o scripts de compilación y ejecución



. Es posible modificar los esqueletos de los programas a generar



. Enumerar los tipos de programas generados, con una breve descripción de los mismos, y las plataformas
(destino u origen) donde deben ser ejecutados
[ ] [ ]
- GENERACIÓN DE DOCUMENTACIÓN

. Posee un Generador de Informes que automatice la generación de la
documentación sobre los procesos de extracción y transformación

. Indicar el paquete software ofertado que incluye esta funcionalidad
y la plataforma o plataformas donde ha de instalarse

. Requiere algún software adicional que complemente esta funcionalidad

. Describir la información incluida en dicha documentación

Origen de los datos

Correspondencias

Transformaciones

Reglas de negocio aplicadas

Otras (especificar))

. Soporta el versionado de la documentación generada

. Se proporciona algún software que facilite el mantenimiento
y versionado de la documentación

[ ] [ ]
- CARACTERÍSTICAS DEL ENTORNO FUNCIONAL
. Especificar el software mínimo que es necesario tener instalado
en las diferentes plataformas



. La transferencia de los programas generados desde el puesto cliente hasta los sistemas operacionales y el Data
Warehouse es automática



. Son necesarios otros requisitos software adicionales, como por ejemplo compiladores (Observaciones)
[ ] [ ]
- DETECCIÓN Y CAPTURA DE MODIFICACIONES
. Indicar el paquete software ofertado que incluye esta funcionalidad
y la plataforma o plataformas donde ha de instalarse



. Requiere algún software adicional que complemente esta funcionalidad



. Explicar con detalle los mecanismos utilizados para la detección de cambios en la estructura de las
bases de datos del Data Warehouse



. Es posible automatizar la detección de dichos cambios



. Explicar detalladamente los mecanismos utilizados para la captura de dichos cambios



. Es posible automatizar la captura de los cambios realizados en la estructura de las bases de datos del Data Warehouse



. Indicar si la herramienta es capaz de detectar automáticamente las transformaciones a las que afectan
los cambios realizados



. Es necesario parar las bases de datos del Data Warehouse para realizar el proceso de captura de cambios (Observaciones)

[ ] [ ]
- DETECCIÓN Y CAPTURA DE MODIFICACIONES EN LA ESTRUCTURA DE LAS BASES
DE DATOS DE DATA WAREHOUSE
. Indicar el paquete software ofertado que incluye esta funcionalidad y
la plataforma o plataformas donde ha de instalarse



. Requiere algún software adicional que complemente esta funcionalidad



. Explicar con detalle los mecanismos utilizados para la detección de modificaciones en los datos de
los sistemas operacionales fuente, enumerando las principales consideraciones a tener en cuenta



. Es posible automatizar la detección de estas modificaciones



. Explicar detalladamente los mecanismos utilizados para la captura de dichas modificaciones



. Es posible automatizar la captura de dichas modificaciones



. Indicar si la herramienta es capaz de detectar automáticamente las transformaciones a las que afectan
las modificaciones realizadas



. Es necesario parar las bases de datos operacionales para realizar el proceso de captura de las modificaciones
realizadas sobre los datos (Observaciones)
[ ] [ ]

. Detección y captura de modificaciones en los datos de los
sistemas operacionales.



Indicar el paquete software ofertado que incluye esta funcionalidad y la plataforma
o plataformas donde ha de instalarse.



Requiere algún software adicional que complemente esta funcionalidad

[ ] [ ]

Explicar con detalle los mecanismos utilizados para la detección de modificaciones
en los datos de los sistemas operacionales fuente, enumerando las principales consideraciones a tener en cuenta.



Posibilidad de automatizar la detección de estas modificaciones

[ ] [ ]

Explicar detalladamente los mecanismos utilizados para la captura de dichas modificaciones.



Posibilidad de automatizar la captura de dichas modificaciones

[ ] [ ]

Herramienta es capaz de detectar automáticamente las transformaciones
a las que afectan las modificaciones realizadas

[ ] [ ]

Es necesario parar las bases de datos operacionales para realizar el proceso
de captura de las modificaciones realizadas sobre los datos

[ ] [ ]

- MOVIMIENTO Y CARGA




. Indicar el paquete software ofertado que incluye esta funcionalidad
y la
plataforma o plataformas donde ha de instalarse




. Requiere algún software adicional que complemente esta funcionalidad

[ ] [ ]

. Explicar detalladamente los mecanismos de movimiento y carga de
los datos
en las bases de datos destino del Data
Warehouse, enumerando las principales
consideraciones
a tener en cuenta. En este sentido indicar si la transferencia se
realiza
directamente o a través de un servidor intermedio, en este último caso
detallar requerimientos físicos y lógicos de dicho servidor intermedio




. Transferencia de datos desde los Sistemas
Operacionales al Data Warehouse
automática

[ ] [ ]
. Control de las filas que sean rechazadas en el proceso de carga [ ] [ ]

Indicar qué ocurre con el proceso de carga




. Para el caso de los datos rechazados indicar



Si se especifica el motivo del rechazo

[ ] [ ]

Almacenamiento físico de los datos rechazados

Fichero plano

[ ] [ ]

Base de Datos propia

[ ] [ ]

Base de Datos externa (especificar los gestores soportados en observaciones)

[ ] [ ]


Otros (especificar)

[ ] [ ]

Localización física de los datos rechazados



Puesto cliente

[ ] [ ]

Servidor intermedio

[ ] [ ]

Servidor central

[ ] [ ]


Otros (especificar)

[ ] [ ]

Explicar el mecanismo de tratamiento de los datos rechazados




. Indicar las alternativas para realizar la carga final del Data Warehouse



A través de la propia herramienta

[ ] [ ]

A través de programas externos

[ ] [ ]

Utilidades propias del gestor

[ ] [ ]


Otras (especificar)

[ ] [ ]

. Incorpora la herramienta algún proceso de comunicación automática de la disponibilidad
de los datos en el Data Warehouse a los usuarios finales

[ ] [ ]

. En caso afirmativo indicar



El paquete software ofertado que incluye esta funcionalidad.




Requiere algún software adicional que complemente esta funcionalidad

[ ] [ ]

El medio de comunicación automático utilizado



Correo electrónico

[ ] [ ]

Otros (especificar)

[ ] [ ]

En caso de poder utilizar correo electrónico, indicar los paquetes del
mercado perfectamente integrables con la herramienta propuesta




- CARGA INCREMENTAL




. Explicar detalladamente el mecanismo de carga incremental de los
datos en las bases de datos destino del Data Warehouse, especificando si se realiza en base a un chequeo de los
ficheros log de los sistemas operacionales, o en base al cruce de los fichero de carga, etc.




. Enumerar las principales diferencias respecto al proceso de carga
masiva y las
consideraciones a tener en cuenta




- FUNCIONALIDADES ADICIONALES




. Análisis y control de la calidad



Incorpora funcionalidades para realizar un análisis y control de la calidad
de los datos

[ ] [ ]

Especificar el paquete software ofertado que incluye esta funcionalidad y la
plataforma o plataformas donde ha de instalarse.




Requiere algún software adicional que complemente esta funcionalidad

[ ] [ ]

. Limpieza



Incorpora funcionalidades para llevar a cabo una limpieza de los datos

[ ] [ ]

Especificar el paquete software ofertado que incluye esta funcionalidad y la
plataforma o plataformas donde ha de instalarse



Requiere algún software adicional que complemente esta funcionalidad

[ ] [ ]

Explicar detalladamente los mecanismos de limpieza proporcionados, indicando
la plataforma donde se ejecutan estos




- GESTIÓN DEL METADATA




. Procedimientos de creación, mantenimiento y consulta



Indicar cómo se almacenan físicamente los metadatos generados



Fichero plano

[ ] [ ]

Base de Datos propia

[ ] [ ]

Base de Datos externa (especificar los gestores soportados en observaciones)

[ ] [ ]


Otros (especificar)

[ ] [ ]

Dónde se almacenan dichos metadatos



Puesto cliente

[ ] [ ]

Servidor intermedio

[ ] [ ]

Servidor central del Data Warehouse

[ ] [ ]


Servidor central operacional

[ ] [ ]

La creación y actualización de los metadatos es completamente automática

[ ] [ ]

Es posible definir plantillas para los metadatos que se desean generar

[ ] [ ]

Todos los datos y reglas de transformación que intervienen en la creación
y mantenimiento del Data Warehouse se almacenan como metadatos

[ ] [ ]

Dispone de alguna herramienta específica para el mantenimiento y consulta
de los metadatos asociados al Data Warehouse, permitiendo la navegación dentro del directorio de metadatos

[ ] [ ]

En caso afirmativo indicar

* El nombre del paquete software ofertado que incluye tal funcionalidad

* La plataformas o plataformas donde ha de instalarse

* Si requiere algún software adicional para completar tal funcionalidad

* Describir el mecanismo de integración con las otras herramientas
ofertadas



Es posible crear vistas adaptadas de los metadatos para diferentes proyectos

[ ] [ ]

Utiliza un formato propio de metadatos

[ ] [ ]

Indicar la información contenida en los metadatos



Descripción de los esquemas de datos origen y destino

[ ] [ ]

Reglas de transformación y validación de datos

[ ] [ ]

Variables de conversión

[ ] [ ]

Mappings origen-destino

[ ] [ ]

Opciones de recuperación de datos

[ ] [ ]

Opciones de manejo de excepciones

[ ] [ ]

Secuencia de acciones a realizar en las conversiones (queries, sorts y merges)

[ ] [ ]

Especificaciones detalladas de las conversiones

[ ] [ ]


Otras (especificar)

[ ] [ ]

Indicar el grado de seguridad en el acceso a los metadatos.



No incorpora funciones de seguridad (utiliza la dada por el gestor)

[ ] [ ]

Sí incorpora funciones de seguridad

[ ] [ ]


Explicar en detalle



Dispone de alguna herramienta específica que permita el acceso vía
Web a los metadatos asociados al Data Warehouse

[ ] [ ]

En caso afirmativo especificar qué navegadores son compatibles



Microsoft Internet Explorer

[ ] [ ]


Netscape

[ ] [ ]

En caso afirmativo indicar



El nombre del paquete software ofertado que incluye tal funcionalidad y dónde
ha de instalarse, detallando los requerimientos lógicos y físicos asociados



Requiere algún software adicional para completar tal funcionalidad, además
del propio navegador

[ ] [ ]

En base a la pregunta anterior indicar las funcionalidades disponibles vía
Web y las principales diferencias respecto a un acceso cliente/servidor directo




. Integración de los metadatos



Es posible que los metadatos generados por dicha herramienta de extracción
puedan ser interpretados e integrados con los metadatos generados por las herramientas de acceso al Data Warehouse

[ ] [ ]

En base a la pregunta anterior explicar detalladamente los mecanismos de integración
utilizados, enumerando las consideraciones a tener en cuenta



Dicha integración de los metadatos completamente automática

[ ] [ ]

Posibilidad de la integración entre metadatos de negocio y técnicos
provenientes de múltiples fuentes

[ ] [ ]

En caso afirmativo explicar detalladamente los mecanismos de integración
utilizados, así como el grado de automatización de dicha integración




. Control de versiones y documentación del metadato



Mantiene un histórico sobre los cambios realizados que permita realizar
un control de versiones

[ ] [ ]

Está automatizada la generación de documentación asociada
con los metadatos

[ ] [ ]

En caso afirmativo indicar si es posible imprimir dicha documentación.



No

[ ] [ ]

Sí, pero sin presentación preliminar

[ ] [ ]


Sí, con presentación preliminar

[ ] [ ]

. Importación y exportación de metadatos



Permite capturar los metadatos desde fuentes externas

[ ] [ ]

En caso afirmativo indicar las fuentes soportadas



Procesadores de texto

[ ] [ ]

Amipro

[ ] [ ]

Word

[ ] [ ]

WordPerfect

[ ] [ ]

Otros (especificar)

[ ] [ ]

Bases de datos (especificar)

[ ] [ ]

Hojas de cálculo

[ ] [ ]

Lotus 123

[ ] [ ]

Excel

[ ] [ ]


Otros (especificar)

[ ] [ ]

Ficheros planos

[ ] [ ]


Otras (especificar)

[ ] [ ]

Posibilidad de exportar los metadatos

[ ] [ ]

En caso afirmativo indicar los formatos soportados.



CDIF (formato estándar de intercambio de datos)

[ ] [ ]


Otros (especificar)

[ ] [ ]

ADMINISTRACIÓN




- GESTIÓN DE RECURSOS




. Administración centralizada



Posee una herramienta de administración y control centralizada



No

[ ] [ ]

Sí, pero sin interfaz gráfica

[ ] [ ]


Sí, con interfaz gráfica

[ ] [ ]

Indicar el paquete software ofertado que incluye esta funcionalidad



Indicar las plataformas donde es necesario instalar el software de esta herramienta
de administración



Puesto cliente

[ ] [ ]

Servidor intermedio

[ ] [ ]


Servidor central

[ ] [ ]

Requiere algún software adicional que complemente dicha funcionalidad

[ ] [ ]

Indicar las funcionalidades que incorpora esta herramienta



Gestión de la seguridad

[ ] [ ]

Monitorización de tareas en curso

[ ] [ ]

Realización de pruebas de funcionalidad a volumen pequeño

[ ] [ ]


Otras (especificar)

[ ] [ ]

Puede ser utilizada esta herramienta de administración desde varios puestos



No

[ ] [ ]

Sí, pero no simultáneamente

[ ] [ ]


Sí, simultáneamente

[ ] [ ]

. Estadísticas y logs de los procesos de extracción,
transformación, movimiento y
carga



Elabora automáticamente estadísticas y logs de dichos procesos

[ ] [ ]

En caso afirmativo, especificar la información incluida en dichos logs
y estadísticas



Total de registros leídos

[ ] [ ]

Total de registros cargados

[ ] [ ]

Tiempos de ejecución

[ ] [ ]

Número de registros a los que se aplica una determinada regla de transformación

[ ] [ ]

Número de registros que cumplen cada una de las condiciones de una regla
de transformación

[ ] [ ]


Otras (especificar)

[ ] [ ]

Indicar el almacenamiento físico de dicha información



Fichero plano

[ ] [ ]

Base de Datos propia

[ ] [ ]

Base de Datos externa (especificar los gestores soportados en observaciones)

[ ] [ ]


Otros (especificar)

[ ] [ ]

Almacen de dicha información



Puesto cliente

[ ] [ ]

Servidor intermedio

[ ] [ ]


Servidor central

[ ] [ ]

Indicar los tiempos estimados de extracción y transformación, en
base a volúmenes de información



Indicar los tiempos estimados de carga, en base a volúmenes de información




- SEGURIDAD




. Indicar los niveles de seguridad soportados



Por usuario

[ ] [ ]

Por grupo de usuario

[ ] [ ]


Otros (especificar)

[ ] [ ]

. En qué plataforma se gestiona la seguridad



Puesto cliente

[ ] [ ]

Servidor intermedio

[ ] [ ]


Servidor central

[ ] [ ]
. Se realiza una identificación del usuario a la hora de acceder al sistema [ ] [ ]

. Almacenamiento físico de la password



Fichero plano

[ ] [ ]

Base de datos propia

[ ] [ ]

Base de datos externa (especificar los gestores soportados en observaciones)

[ ] [ ]


Otros (especificar)

[ ] [ ]

. Localización física de la password



Puesto cliente

[ ] [ ]

Servidor intermedio

[ ] [ ]

Servidor central

[ ] [ ]


Otros (especificar)

[ ] [ ]

. Explicar en detalle los mecanismos de seguridad que incorporan la
o las
herramientas ofertadas




- PROCEDIMIENTO DE PLANIFICACIÓN Y MANTENIMIENTO



. Posible construir procedimientos que automaticen las tareas de planificación
y mantenimiento

No

[ ] [ ]

Sí, pero no dispone de un interfaz gráfico que facilite la programación
dedichas tareas.

[ ] [ ]


Sí, con un interfaz gráfico que facilite la programación
de dichas tareas

[ ] [ ]
. En caso afirmativo, indicar las posibles bases de dicha planificación


Eventos

[ ] [ ]

Ventanas de tiempo

[ ] [ ]


Otras (especificar)

[ ] [ ]
. Indicar el paquete software ofertado que incluye esta funcionalidad y la plataforma
o plataformas donde ha de instalarse


. Requiere algún software adicional que complemente dicha funcionalidad [ ] [ ]

ACLARACIONES GENERALES




REFERENCIAS





Cuestionario de análisis de la calidad en un Data Warehouse

3.3.2.- CUESTIONARIO DE ANÁLISIS DE CALIDAD

Con carácter general y a fin de utilizar la información recopilada de cara a la contratación, es importante destacar que los datos recogidos en este cuestionario están dirigidos a obtener un resumen estructurado de la oferta y a demostrar la solvencia técnica o profesional de la empresa en aquellos casos en que no sea requerida la clasificación de la misma. Dicha información sólo servirá de base a la valoración cuando esté relacionada con lo expresado en la cláusula "Criterios de adjudicación del contrato", siendo, en el resto de los casos, de carácter meramente informativo.

Nota: (*) significa que hay que indicar "1" en caso afirmativo.

(**) significa que hay que repetir para cada sistema operativo ofertado.

Cuestión Respuesta