En este capítulo se pretende dar la orientación suficiente al comprador para la preparación del conjunto de especificaciones que definirán los requisitos que han de cumplir la Creación y Explotación de un Data Warehouse.
Se realiza en primer lugar un análisis de las necesidades del comprador, a continuación se recogen los factores relevantes a tener en cuenta en el proceso de adquisición y, finalmente, se describe cómo deben ser planteadas las especificaciones técnico - funcionales para la elaboración del Pliego de Prescripciones Técnicas, qué normas, estándares y cláusulas tipo pueden ser de aplicación, y cuál es el cuestionario técnico diseñado para normalizar las ofertas y facilitar su evaluación.
3.1.- Análisis de las necesidades del comprador
3.2.- Factores relevantes en el proceso de adquisición
3.3.- Diseño del pliego de prescripciones técnicas particulares
Incluimos aquí unos pasos que, tal y como se comentaban en la Fases de implantación de un Data Warehouse , son previos al inicio de un proyecto de este tipo.
En efecto, como punto de arranque de todo, es preciso "vender la idea" a los usuarios finales de un Data Warehouse. Esto es así, por ser una idea bastante novedosa y sobre la que pueden surgir recelos de su efectividad. Estos recelos se pueden eliminar comenzando por un pequeño módulo, del cual se valoren los beneficios posteriores, para iniciar progresivamente el desarrollo de nuevos módulos, cada uno con un coste unitario cada vez más reducido, pero sin embargo con unos beneficios distribuidos cada vez mayores por poder cada vez incluir más información. (Ver Data Warehouse vs. Data Mart) para comprobar un caso de este tipo.
El simple hecho de realizar un informe de necesidades previas en el que se enumeren la situación de los datos entre los diversos sistemas operacionales, puede ser un hecho decisivo para emprender un proyecto de este tipo. Muchas veces la información existente se encuentra tan poco normalizada, existen tantas discrepancias entre estos sistemas, que el abordar un Data Warehouse en el que se limpien estos datos y se normalicen pueden aportar un valor intangible: "la calidad y fiabilidad de la información".
La venta de esta idea no sólo se ha de realizar frente a la Dirección sino que es preciso realizarla a todos los niveles: a la Dirección, Gerencia e incluso al área de Desarrollo.
Tras esta venta de la idea, comienzan dos fases similares al análisis de requisitos del sistema (ARS según abreviaturas de la metodología METRICA): la definición de objetivos y requerimientos de información, en el que se analicen las necesidades del comprador.
En esta fase se definirá el equipo de proyecto que debe estar compuesto por representantes del departamento informático y de los departamentos usuarios del Data Warehouse además de la figura de jefe de proyecto.
Se definirá el alcance del sistema y cuales son las funciones que el Data Warehouse realizará como suministrador de información de negocio estratégica para la empresa. Se definirán así mismo, los parámetros que permitan evaluar el éxito del proyecto.
Definición de los requerimientos de información
Durante esta fase se mantendrán sucesivas entrevistas con los representantes del departamento usuario final y los representantes del departamento de informática. Se realizará el estudio de los sistemas de información existentes, que ayudaran a comprender las carencias actuales y futuras que deben ser resueltas en el diseño del Data Warehouse
Asimismo, en esta fase el equipo de proyecto debe ser capaz de validar el proceso de entrevistas y reforzar la orientación de negocio del proyecto. Al finalizar esta fase se obtendrá el documento de definición de requerimientos en el que se reflejarán no solo las necesidades de información de los usuarios, sino cual será la estrategia y arquitectura de implantación del Data Warehouse.
En la definición del objeto del contrato y los requisitos inherentes al mismo, así como en la valoración y comparación de ofertas de los licitadores pueden intervenir muchos factores y de muy diversa índole.
Es de suma importancia que todos los factores relevantes que intervienen en el proceso de contratación queden debidamente recogidos en el pliego de prescripciones técnicas que regule el contrato. Así mismo, es conveniente que las soluciones ofertadas por los licitadores sean recogidas en los cuestionarios disponibles a tal efecto:
- De empresa
- Económicos
- Técnicos particulares
Se van a relacionar a continuación algunos de los factores que suelen tener mayor peso al seleccionar una herramienta de Data Warehouse. Sin embargo, debe tenerse en cuenta que la importancia de cada factor variará en función de cada caso particular, por lo que siempre será necesario identificar la importancia relativa de cada punto. Los puntos a contemplar son bastante similares a los contemplados en el apartado homónimo de los SGBD, que adaptaremos a la casuística particular de un Data Warehouse.
Tal y como sucedía en los SGBD, el rendimiento real de un Data Warehouse es muy difícil de predecir mediante procedimientos teóricos. Por ello, de igual forma que en el SGBD, si se va a instalar un Data Warehouse que contendrá un gran volumen de datos o, si por cualquier otra razón, existen dudas sobre la capacidad del Data Warehouse de dar unas prestaciones adecuadas en las máquinas disponibles se debe exigir al suministrador una prueba anterior a la adquisición del Data Warehouse. Esta prueba debe realizarse en la propia instalación de destino.
La prueba se debería realizar en las condiciones más parecidas a las reales que se puedan conseguir. Para ello se deberá cargar el Data Warehouse con un volumen de datos adecuado y se deberán crear procesos de prueba similares a los más costosos de los que se vayan a desarrollar.
A diferencia de con los SGBD, no es preciso realizar la prueba en momentos de gran carga, por la diferente filosofía de un almacén de datos orientado al conocimiento, pero sí que será preciso la comprobación de la compatibilidad de la herramienta para los procesos de extracción y carga desde los diferentes sistemas operacionales (sistemas operativos, bases de datos, etc.) implicados .
Debe estar garantizado que el Data Warehouse es capaz de tratar el volumen de datos que se vaya a necesitar en la instalación. Para ello debe verificarse no sólo que el Data Warehouse puede manejar el volumen total de datos, sino que no existe ninguna limitación que impide organizarlo de la forma más conveniente.
No obstante, en este sentido y como factor común de un SGBD con un Data Warehouse, cabe reseñar que muchos problemas de rendimiento se deben más veces a un mal diseño del modelo de datos del Data Warehouse que a un problema de rendimiento de la herramienta en sí.
De lo comentado en los dos puntos anteriores puede deducirse que existe la posibilidad de que sea necesario redimensionar la máquina en la que se instale el Data Warehouse, o mejor aun, disponer de una dedicada al Data Warehouse.
Es necesario que el suministrador detalle cual de las dos versiones está ofreciendo para cada una de las licencias que se compren y si alguna de ellas fuese una versión limitada, que especifique claramente cuales de las funcionalidades ofertadas no se encuentran presentes en la versión restringida.
Existen actualmente varios sistemas de cobro por el uso de Data Warehouse según el fabricante. Los más utilizados son facturar por:
- Cada máquina y/o tipo de máquina en la que se instale.
- Cada usuario que acceda al SGBD.
- Por tiempo de utilización (usualmente renovación anual).
- Por combinación de las anteriores.
Es imprescindible que el suministrador indique con toda claridad el método utilizado.
También debe explicitarse que, salvo indicación en contrario, todas las licencias son de versiones completas sin ninguna restricción respecto a las funcionalidades ofertadas.
También es conveniente pedir los precios de los productos adicionales que no se desee instalar en el momento pero que puedan ser interesantes en el futuro.
Otro factor importante es la duración de la garantía, período de tiempo durante el que el suministrador proporcionará soporte gratuito a sus productos y, también el precio del soporte en años sucesivos. Este último precio debe fijarse sobre variables presentes en el contrato no sobre futuros precios de lista del fabricante.
Otro factor que debe evaluarse es la calidad del soporte ofrecido. Este puede dividirse en un gran número de puntos cuya importancia variará en función de las necesidades del comprador. Entre ellos, se pueden citar:
- La inclusión o no de la instalación en el precio del producto.
- El tiempo máximo de entrega.
- La inclusión o no de prestaciones adicionales gratuitas como puede ser un cierto número de horas de formación.
- Capacitación y experiencia del personal que presta soporte técnico y consultoría.
- Calidad de la documentación, idioma en que está escrita, número de copias suministradas gratuitamente y precio de las copias adicionales.
- Capacidad técnica de la empresa y de la asistencia técnica que presta para lo que es recomendable pedir referencias a otros usuarios de la Administración de este tipo de productos.
Debido a la no existencia de ninguna norma o estándar aplicable a un Data Warehouse, mas que estándares de facto, describimos a continuación cuestionarios técnicos de normalización y valoración de ofertas de SGBD.
Estos cuestionarios han de partir de unas especificaciones previas de:
Host: (Tipo Máquina, Sistema Operativo y Base de Datos Operacional)
Servidor de la aplicación de DW (Tipo Máquina, Nº procesadores, Memoria total y por procesador, Sistema Operativo, Capacidad de Disco)
Clientes (Tipo de Máquina, Memoria, Sistema Operativo, Capacidad de Disco)
Red local (Topología, Protocolos, Sofware de Cliente y Número de Usuarios soportados)
Gestor de Base de Datos para el Data Warehouse
Volumen estimado de la Base de Datos
A continuación y dependiendo del ámbito de aplicación del Data Warehouse describimos un cuestionario aplicado a la creación del Data Warehouse por un lado, por otro del Análisis de la Calidad del dato y la depuración, y por último de su Explotación.
3.3.1.- Cuestionario para la Extracción, Movimiento y Carga
3.3.2.- Cuestionario de Análisis de Calidad
3.3.3.- Cuestionario de Herramientas de Usuario Final: OLAP, EIS y Reporting.
3.3.1.- CUESTIONARIO PARA LA EXTRACCIÓN, MOVIMIENTO Y CARGA
Con carácter general y a fin de utilizar la información recopilada de cara a la contratación, es importante destacar que los datos recogidos en este cuestionario están dirigidos a obtener un resumen estructurado de la oferta y a demostrar la solvencia técnica o profesional de la empresa en aquellos casos en que no sea requerida la clasificación de la misma. Dicha información sólo servirá de base a la valoración cuando esté relacionada con lo expresado en la cláusula "Criterios de adjudicación del contrato", siendo, en el resto de los casos, de carácter meramente informativo.
Nota: (*) significa que hay que indicar "1" en caso afirmativo.
(**) significa que hay que repetir para cada sistema operativo ofertado.
| Cuestión | Respuesta | Referencia a oferta (Página) |
| ------------------------------------------ | ||
| ENTORNO OPERATIVO | ||
| - REQUERIMIENTOS LÓGICOS | ||
| . Especificar para cada uno de las paquetes software ofertados la o las posibles plataformas (servidor central, servidor intermedio y cliente) donde podrían instalarse, detallando los requerimientos físicos y lógicos asociados a cada alternativa, junto con los procesos que se ejecutarían en cada una de las posibles plataformas |
[ ] | [ ] |
| . Compatibilidad con Sistemas operativos (Enumerar) | [ ] | [ ] |
| . Compatibilidad con software de red | [ ] | [ ] |
| . Necesidad de software adicional | [ ] | [ ] |
| - REQUERIMIENTOS FÍSICOS | ||
| . Especificar detalladamente los requerimientos físicos mínimos y recomendados, tales como memoria RAM, espacio libre en disco, procesadores, etc... |
[ ] | [ ] |
| CARACTERÍSTICAS GENERALES | ||
| - FUENTES DE DATOS (ORIGEN) SOPORTADAS | ||
| . Permite extraer datos desde varias plataformas origen simultáneamente | [ ] | [ ] |
| . Indicar las distintas fuentes de datos operacionales a las que es posible acceder, especificando en los casos que sea necesario las últimas versiones certificadas. |
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
| - BASES DE DATOS DESTINO SOPORTADAS | ||
| . Permite cargar datos en varias plataformas destino simultáneamente | [ ] | [ ] |
| .Gestores de bases de datos destino soportados, especificando las últimas versiones certificadas |
||
![]() |
||
| - FUNCIONALIDADES | ||
|
. Enumerar las funcionalidades de la o las herramientas propuestas:
|
[ ] | [ ] |
| - TRATAMIENTO INTERMEDIO DE LOS DATOS RECUPERADOS | ||
|
.Realiza un almacenamiento intermedio de los datos recuperados a partir de . Especificar
|
[ ] | [ ] |
| - BASE DE DATOS COMO FUENTE DE DATOS OPERACIONALES | ||
|
. Conocimiento de la estructura de la base de datos
|
[ ] | [ ] |
|
. Detección a captura de modificaciones en la estructura de las bases
|
[ ] | [ ] |
![]() |
||
|
. Acceso a las bases de datos
|
[ ] | [ ] |
|
. Detección y captura de las modificaciones en los datos
|
[ ] | [ ] |
| - RECOMENDACIONES PRÁCTICAS | ||
| . Enumerar las principales recomendaciones prácticas para asegurar una plena explotación de la potencialidad de los paquetes software ofertados . Enumerar y justificar brevemente los puntos fuertes tanto de la arquitectura funcional propuesta como de las herramientas ofertadas |
[ ] | [ ] |
| FUNCIONALIDAD | ||
| - FACILIDAD DE USO | ||
|
. Especificar los idiomas soportados en cada una de las siguientes áreas:
. Soporta alfabetización internacional . Dispone de ayuda on-line . Es posible la presentación preliminar de la documentación . Posee un interfaz gráfico que permita tener una visión global . Especificar detalladamente los diferentes perfiles de usuario contemplados . Posee un Editor de Diagramas que facilite las tareas de diseño de |
[ ] | [ ] |
| - PROCESOS DE EXTRACCIÓN Y TRANSFORMACIÓN | ||
|
. Indicar el paquete software ofertado que incluye esta funcionalidad . Requiere algún software adicional que complemente esta funcionalidad . Es posible automatizar completamente los procesos de extracción y . Se puede integrar con el planificador externo de tareas . Explicar detalladamente el mecanismo de acceso a las estructuras de . Explicar el mecanismo de extracción de los datos desde los sistemas . Detallar los procedimientos de depuración incorporados . Indicar las funciones de transformación más importantes incluidas
. Es posible definir reglas de transformación generales que se puedan . En caso de exclusión de datos en base a reglas de transformación, . Indicar:
|
[ ] | [ ] |
| - CARACTERÍSTICAS DE LOS PROGRAMAS GENERADOS | ||
| . Especificar el lenguaje utilizado en la generación de código para las distintas fuentes soportadas . Indicar si genera también los JCL o scripts de compilación y ejecución . Es posible modificar los esqueletos de los programas a generar . Enumerar los tipos de programas generados, con una breve descripción de los mismos, y las plataformas (destino u origen) donde deben ser ejecutados |
[ ] | [ ] |
| - GENERACIÓN DE DOCUMENTACIÓN | ||
|
. Posee un Generador de Informes que automatice la generación de la . Indicar el paquete software ofertado que incluye esta funcionalidad . Requiere algún software adicional que complemente esta funcionalidad . Describir la información incluida en dicha documentación
. Soporta el versionado de la documentación generada . Se proporciona algún software que facilite el mantenimiento |
[ ] | [ ] |
| - CARACTERÍSTICAS DEL ENTORNO FUNCIONAL | ||
| . Especificar el software mínimo que es necesario tener instalado en las diferentes plataformas . La transferencia de los programas generados desde el puesto cliente hasta los sistemas operacionales y el Data Warehouse es automática . Son necesarios otros requisitos software adicionales, como por ejemplo compiladores (Observaciones) |
[ ] | [ ] |
| - DETECCIÓN Y CAPTURA DE MODIFICACIONES | ||
|
[ ] | [ ] |
| - DETECCIÓN Y CAPTURA DE MODIFICACIONES EN LA ESTRUCTURA DE LAS BASES DE DATOS DE DATA WAREHOUSE |
||
| . Indicar el paquete software ofertado que incluye esta funcionalidad y la plataforma o plataformas donde ha de instalarse . Requiere algún software adicional que complemente esta funcionalidad . Explicar con detalle los mecanismos utilizados para la detección de modificaciones en los datos de los sistemas operacionales fuente, enumerando las principales consideraciones a tener en cuenta . Es posible automatizar la detección de estas modificaciones . Explicar detalladamente los mecanismos utilizados para la captura de dichas modificaciones . Es posible automatizar la captura de dichas modificaciones . Indicar si la herramienta es capaz de detectar automáticamente las transformaciones a las que afectan las modificaciones realizadas . Es necesario parar las bases de datos operacionales para realizar el proceso de captura de las modificaciones realizadas sobre los datos (Observaciones) |
[ ] | [ ] |
|
. Detección y captura de modificaciones en los datos de los |
|
|
|
|
|
|
[ ] | [ ] |
|
|
|
|
[ ] | [ ] |
|
|
|
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
- MOVIMIENTO Y CARGA |
|
|
|
. Indicar el paquete software ofertado que incluye esta funcionalidad |
|
|
|
. Requiere algún software adicional que complemente esta funcionalidad |
[ ] | [ ] |
|
. Explicar detalladamente los mecanismos de movimiento y carga de |
|
|
|
. Transferencia de datos desde los Sistemas |
[ ] | [ ] |
| . Control de las filas que sean rechazadas en el proceso de carga | [ ] | [ ] |
|
|
|
|
. Para el caso de los datos rechazados indicar |
|
|
|
[ ] | [ ] |
|
||
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
|
|
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
|
|
|
. Indicar las alternativas para realizar la carga final del Data Warehouse |
|
|
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
. Incorpora la herramienta algún proceso de comunicación automática de la disponibilidad |
[ ] | [ ] |
|
. En caso afirmativo indicar |
|
|
|
|
|
|
[ ] | [ ] |
|
|
|
|
[ ] | [ ] |
|
[ ] | [ ] |
|
|
|
|
- CARGA INCREMENTAL |
|
|
|
. Explicar detalladamente el mecanismo de carga incremental de los |
|
|
|
. Enumerar las principales diferencias respecto al proceso de carga |
|
|
|
- FUNCIONALIDADES ADICIONALES |
|
|
|
. Análisis y control de la calidad |
|
|
|
[ ] | [ ] |
|
|
|
|
[ ] | [ ] |
|
. Limpieza |
|
|
|
[ ] | [ ] |
|
|
|
|
[ ] | [ ] |
|
|
|
|
- GESTIÓN DEL METADATA |
|
|
|
. Procedimientos de creación, mantenimiento y consulta |
|
|
|
|
|
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
|
|
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
|
|
|
[ ] | [ ] |
|
[ ] | [ ] |
|
|
|
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
|
|
|
[ ] | [ ] |
|
[ ] | [ ] |
|
|
|
|
[ ] | [ ] |
|
|
|
|
[ ] | [ ] |
|
[ ] | [ ] |
|
|
|
|
|
|
|
[ ] | [ ] |
|
|
|
|
. Integración de los metadatos |
|
|
|
[ ] | [ ] |
|
|
|
|
[ ] | [ ] |
|
[ ] | [ ] |
|
|
|
|
. Control de versiones y documentación del metadato |
|
|
|
[ ] | [ ] |
|
[ ] | [ ] |
|
|
|
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
. Importación y exportación de metadatos |
|
|
|
[ ] | [ ] |
|
|
|
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
|
|
|
[ ] | [ ] |
|
[ ] | [ ] |
|
ADMINISTRACIÓN |
|
|
|
- GESTIÓN DE RECURSOS |
|
|
|
. Administración centralizada |
|
|
|
|
|
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
|
|
|
|
|
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
|
|
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
|
|
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
. Estadísticas y logs de los procesos de extracción, |
|
|
|
[ ] | [ ] |
|
|
|
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
|
|
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
|
|
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
|
|
|
|
|
|
- SEGURIDAD |
|
|
|
. Indicar los niveles de seguridad soportados |
|
|
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
. En qué plataforma se gestiona la seguridad |
|
|
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
| . Se realiza una identificación del usuario a la hora de acceder al sistema | [ ] | [ ] |
|
. Almacenamiento físico de la password |
|
|
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
. Localización física de la password |
|
|
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
|
. Explicar en detalle los mecanismos de seguridad que incorporan la |
|
|
|
- PROCEDIMIENTO DE PLANIFICACIÓN Y MANTENIMIENTO |
|
|
| . Posible construir procedimientos que automaticen las tareas de planificación y mantenimiento |
||
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
| . En caso afirmativo, indicar las posibles bases de dicha planificación |
|
|
|
[ ] | [ ] |
|
[ ] | [ ] |
|
[ ] | [ ] |
| . Indicar el paquete software ofertado que incluye esta funcionalidad y la plataforma o plataformas donde ha de instalarse |
|
|
| . Requiere algún software adicional que complemente dicha funcionalidad | [ ] | [ ] |
|
ACLARACIONES GENERALES |
|
|
|
REFERENCIAS |
|
|
3.3.2.- CUESTIONARIO DE ANÁLISIS DE CALIDAD
Con carácter general y a fin de utilizar la información recopilada de cara a la contratación, es importante destacar que los datos recogidos en este cuestionario están dirigidos a obtener un resumen estructurado de la oferta y a demostrar la solvencia técnica o profesional de la empresa en aquellos casos en que no sea requerida la clasificación de la misma. Dicha información sólo servirá de base a la valoración cuando esté relacionada con lo expresado en la cláusula "Criterios de adjudicación del contrato", siendo, en el resto de los casos, de carácter meramente informativo.
Nota: (*) significa que hay que indicar "1" en caso afirmativo.
(**) significa que hay que repetir para cada sistema operativo ofertado.
| Cuestión | Respuesta |