Power MatchMaker es una herramienta de Data Cleansing que SQLPower ha liberado convirtiendo la licencia en Open Source, junto con la de Power Architect (herramienta para modelización de datos).
Como no es que haya demasiadas herramientas Open Source en el campo de la limpieza de datos, me ha podido la curiosidad y la he instalado para ver que tal funciona.
La instalación ha sido muy sencilla, el software se descarga desde Descarga de Power MatchMaker, en diferentes versiones según el SO. Yo he probado la de windows, que se instala a golpe de botón en 2 minutos.
Importante no olvidarse del requerimiento del Java Runtime 5.
Una vez instalado, para ver como funciona lo mejor es seguir el tutorial que se encuentra en la misma ayuda de la herramienta. También recomiendo ver la demo accesible desde la misma página de MatchMaker.
El funcionamiento del software es muy sencillo, se crea un repositorio sobre una de las diferentes BBDD sobre las que puede trabajar, y con las que conecta por JDBC, y se pueden crear proyectos de 3 tipos diferentes: Deduplicación, Datacleansing y Referencias cruzadas.
Eso en teoría, porque la funcionalidad de referencias Cruzadas aún no está implementada y no se puede utilizar.
El proyecto de Datacleansing tampoco aporta nada nuevo, ya que toda la funcionalidad que utiliza es un subconjunto de la que ofrece uno de Deduplicación, con lo que con crear un proyecto de este último tipo ya lo vemos todo.
En cuanto a la deduplicación, se organiza el proceso en varios pasos:


Qué buen post gracias, yo la tenía pero no había podido instalarla ya que tenia BOE XIR2 instalado y no trabaja con java 5 :(, a menos que tenga el SP3 instalado lo cual no era el caso,
se agradece el análisis, probaste Power Arquitect? jeje no es que quiera ahorrar análisis pero liberaron las 2 herramientas juntas por lo que quizá tb la tengas :D
Saludos,
Diego.
He probado MatchMaker porque es la primera herramienta Open Source que he encontrado orientada a la limpieza de datos (eso no significa que no haya más).
Power Architect seguro que también está muy bien, pero a primera vista no parece muy diferente a otras herramientas del mismo tipo.
Sería interesante analizarla pero no creo que encuentre el tiempo necesario para hacerlo.
Si finalmente la puedes probar tu, o cualquiera que lea el post, agradeceremos cualquier comentario al respecto.
A lo mejor si alguien nos anima acabamos utilizándola todos.
Saludos,
Carlos.