Informatica 9, una completa plataforma de Integración de Datos

En el mercado de la Integración de Datos uno de los fabricantes líderes es Informatica. Esta compañía es el primer proveedor independiente de software de Integración de Datos. Su herramienta más conocida, y el corazón de su plataforma, es Informatica PowerCenter, que ya ha pasado por muchas versiones, y es una referencia en el mundo de la Integración.

Pero aparte de PowerCenter, Informatica también dispone de otras herramientas que se orientan a propósitos más específicos, a la vez que se integran dentro de la plataforma, y siempre en el marco de la Integración de Datos.

La plataforma de Informatica 9 está ideada para cubrir el ciclo de vida completo de la integración de datos, que consta de cinco pasos principales: acceso, detección, limpieza, integración y entrega.

Plaataforma de Informatica 9 para cubrir el cliclo completo de vida de la integracion de datos 

Como suele pasar con los grandes fabricantes de software, Informatica dispone de muchos productos, opciones y ediciones, y puede costar un poco hacerse una idea de lo que hace cada uno, y de lo que podemos necesitar y lo que no para nuestras necesidades, aunque el hecho de que Informatica sea un proveedor independiente dedicado exclusivamente al software de Integración de Datos facilita mucho las cosas.

En este artículo daré un repaso a los principales productos que componen la plataforma de Informatica 9, agrupándolos por tipo de problemática que resuelven, y realizando una breve descripción de cada uno.

 

Integración de datos

  Informatica PowerCenter

  Informatica PowerExchange

 

Calidad de datos

  Informatica Data Explorer

  Informatica Data Quality 

  Informatica Identity Resolution

 

Intercambio de datos B2B

  Informatica B2B Data Exchange

  Informatica B2B Data Transformation

 

Gestión del ciclo de vida de la Información

  Informatica Data Archive

  Informatica Data Subset

  Informatica Data Privacy

 

 

Integración de datos

Los productos de Integración de Datos son los que tienen un uso más genérico y, por hacer una analogía, podríamos compararlos con las herramientas ETL de otros fabricantes.

Informatica PowerCenter

Es el que podríamos llamar producto estrella de Informatica. Permite conectar con multitud de orígenes de datos en tiempo real, por lotes o incluso por captura de cambios en los datos (CDC).

Como otras herramientas de ETL, permite definir y aplicar sobre estos datos las transformaciones necesarias y después distribuirlos a los sistemas destino según convenga.

De PowerCenter yo destacaría la facilidad de uso de sus herramientas visuales de desarrollo, el rendimiento, la escalabilidad, y las posibilidades de ampliación de funcionalidad mediante la adquisición de opciones 'extra' e integración con otras aplicaciones de la plataforma.

Existen tres ediciones del producto, cada una orientada a cubrir un tipo de requerimientos. Son la Standard Edition con las opciones básicas, la Advanced Edition que incorpora opciones más avanzadas, y la Real Time Edition, que está orientada a la Integración de datos en tiempo real.

Informatica 9. Metadata Manager de Powercenter 
 

Informatica PowerExchange

Esta herramienta permite acceder directamente, tratar y distribuir datos que se encuentran en plataformas que en muchas ocasiones requieren de pasos intermedios para poder gestionarlos con una ETL estandar.

PowerExchange se puede conectar con aplicaciones SaaS (Software como Servicio), todo tipo de bases de datos, Email, LDAP, Servicios Web, XML, etc.

En su versión avanzada Complex Data Exchange puede incluso trabajar con formatos de datos complejos como EDI, HL7, SWIFT, EDIFACT, etc.

 

Con algunas de estas plataformas puede trabajar en tiempo real, o también utilizar la tecnología CDC (Captura de Cambios), que permite detectar cambios en los datos de manera no intrusiva, y sin sobrecargar así el sistema origen con consultas innecesarias.

Además se integra con Informatica Powercenter y con Informatica Data Quality.

Informatica PowerExchange 
 

Calidad de datos

No es necesario comentar mucho para definir este grupo, todas las herramientas ideadas para dar ayudar en la mejora de la calidad de datos de las compañias están aquí.

Informatica Data Explorer

Es la herramienta de perfilado de datos de Informatica. Permite realizar fácilmente perfilado de datos a nivel de columna, de tabla y entre tablas, lo que Informatica bautiza como Análisis de datos en tres dimensiones que permite trabajar sobre datos complejos.

A partir del análisis y el perfilado se generan metadatos, se relacionan fuentes y destinos, y se crean informes que permiten controlar todo el proceso de Calidad de los datos, las anomalías, las carencias y las mejoras a lo largo del tiempo.

Además se integra con Informatica PowerCenter e Informatica DataQuality para visualizar resultados, crear mappings automáticamente, o desplegar especificaciones de limpieza y transformación de datos.

Informatica Data Explorer 
 

Informatica Data Quality 

Data Quality tiene un alcance más amplio que Data Explorer, está orientada a gestionar todo el proceso de Calidad de Datos, perfilado, especificación, limpieza, validación y supervisión, permitiendo participar en él de manera coordinada tanto a analistas de datos como a desarrolladores y administradores. Cada uno dispone de su propia interfaz orientada a su perfil, y accesible en entorno web.

De su funcionalidad destaca la posibilidad de definición de reglas y servicios de calidad que pueden ser reutilizados en diferentes proyectos de calidad de datos.

También dispone de reglas predefinidas y limpieza de direcciones con codificación geográfica para más de 60 paises.

Informatica Data Quality 
 

Informatica Identity Resolution

Este software de resolución de identidades permite detectar registros que constan en el sistema como individuos diferentes, pero que por la semejanza entre valores asociados a los mismos se puede deducir que corresponden a la misma identidad. En otros ámbitos este proceso se llama también deduplicación de clientes, y no puede faltar en un proyecto de Calidad de datos.

Informatica Identity Resolution combina algoritmos de comparación por semejanza de una manera eficiente, tiene en cuenta posibles errores tipográficos, variaciones de los datos e incluso compara datos informados en idiomas e incluso alfabetos diferentes.

Puede funcionar tanto en procesos batch como en tiempo real, y dispone de API's que permiten incorporar funciones de detección de identidades otras aplicaciones.

Informatica Identity Resolution 
 

Intercambio de datos B2B

En este grupo se engloban las herramientas que se utilizan para facilitar la integración con datos de otros negocios, con el mundo exterior, donde la manera de acceder a la información, las normas y los protocolos cambian, y donde es vital garantizar la calidad de los datos entrantes, y que no se vea comprometida la seguridad de los sistemas internos.

Esta familia de productos, formada por Informatica B2B Data Exchange e Informatica B2B Data Transformation está orientada al intercambio efectivo de información entre empresas, y ofrece una gran flexibilidad en cuanto a formatos, admitiendo datos tanto estructurados como no estructurados. 

Las herramientas se integran con el resto de la plataforma de Informatica, y al recoger datos externos también incorporan las medidas de seguridad necesarias para que puedan integrarse sin problemas con los datos internos. 

Informatica B2B Data Exchange, Informatica B2B Data Transformation

Informatica B2B Data Transformation ofrece funciones de transformación y calidad de datos de fácil utilización para que el paso de datos externos a internos sea sencillo y sin necesidad de programación.

Informatica B2B Data Exchange permite también definir interna y externamente perfiles de socios con las empresas con las que se intercambia información, de manera que en la misma plataforma se puedan definir reglas para las transacciones y se agilice el protocolo anterior a la puesta en marcha del intercambio.

También gestiona eventos, actuales e históricos y permite llevar un control de las transacciones.

 

Gestión del ciclo de vida de la Información

La información tiene un ciclo de vida, y muchos datos se van quedando obsoletos a medida que va pasando el tiempo. Los datos también se mueven y replican en diferentes entornos, unos más críticos que otros, y la gestión eficiente del espacio es importante. Muchos de los datos que se manejan necesitan ser protegidos y garantizar que sólo puedan verlos en claro los perfiles adecuados. Es importante gestionar bien el ciclo de vida de la Información, y estas son las herramientas que Informatica proporciona para ayudar en esta tarea.

Informatica Data Archive

Informatica Data Archive se encarga de gestionar el archivado, con o sin compresión, de datos inactivos, de manera que dejen de consumir espacio y recursos en los principales sistemas de producción, y a la vez sigan manteniendo su integridad referencial y siendo accesibles a través de la herramienta y las diversas interfaces que proporciona.

Permite definir reglas y crear metadatos para el archivado de datos, y proporciona conectividad directa con diversas bases de datos, sistemas ERP y CRM, e incluso aplicaciones personalizadas.

Otra característica importante es que al gestionar el archivado, permite analizar y controlar activamente el crecimiento de los datos.

Informatica Data Archive

Informatica Data Subset

Esta aplicación se utiliza para crear subconjuntos de datos a partir de, por ejemplo, los datos completos de un sistema del entorno de producción.

Permite definir estos subconjuntos y las políticas de creación y replicación o mantenimiento de estos datos a partir de los del origen 'completo'. El software también se encarga de mantener la integridad referencial dentro de los datos que forman los subconjuntos.

Incluye aceleradores para utilizarlo sobre varios ERP's y CRM's, y puede facilitar mucho la creación y mantenimiento de entornos de desarrollo de tamaño reducido, y actualizados. 

Informatica Data Subset 
 

Informatica Data Privacy

Para terminar, esta aplicación se encarga de gestionar de manera centralizada el enmascaramiento de los datos que lo requieran dentro de la organización, ayudando así a cumplir con las leyes de protección de datos, evitar fugas de datos sensibles, y facilitar la creación de entornos de desarrollo 100% operativos, pero que no muestren datos críticos.

Permite definir reglas de enmascaramiento, y cuenta con diferentes algoritmos o maneras de aplicarlo, a la vez que asegura la coherencia y la integridad de los datos enmascarados. Destacar que mediante la disociación de valores permite enmascarar datos, pero manteniendo la funcionalidad y legibilidad de los mismos.

Como era de esperar, también incorpora aceleradores de aplicaciones que incluyen reglas predefinidas para aplicar enmascaramiento rápidamente sobre diversas aplicaciones de ERP y CRM.

Informatica Data Privacy 
 

Coméntalo en el foro