<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0" xml:base="http://www.dataprix.com" xmlns:dc="http://purl.org/dc/elements/1.1/">
<channel>
 <title>Calidad de datos</title>
 <link>http://www.dataprix.com/es/data-quality</link>
 <description>The taxonomy view with a depth of 0.</description>
 <language>es</language>
<item>
 <title>Dataclean.es: un proyecto de servicios de limpieza de datos</title>
 <link>http://www.dataprix.com/es/datacleanes-un-proyecto-servicios-limpieza-datos</link>
 <description>&lt;p&gt;Hace ya bastante tiempo me plante&amp;eacute; la posibilidad de arrancar un proyecto para ofrecer servicios de limpieza de datos online. Si hablamos en t&amp;eacute;rminos de lo que ara se oye m&amp;aacute;s, podr&amp;iacute;amos interpretarlo como un nuevo significado de las siglas DAAS: Datacleansing As A Service.&lt;/p&gt;
&lt;p&gt;En aquel momento escog&amp;iacute; el nombre de Dataclean.es, entre otras cosas porque el dominio estaba libre. Lo registr&amp;eacute; a mi nombre e hice una aproximaci&amp;oacute;n a un plan de empresa. Hasta comenc&amp;eacute; a preparar una web donde quer&amp;iacute;a crear una primera versi&amp;oacute;n sencilla de la idea. Este prototipo se qued&amp;oacute; en pr&amp;aacute;cticamente una simple estructura, pero pienso que puede servir para ilustrar la intenci&amp;oacute;n que ten&amp;iacute;a.&lt;/p&gt;
&lt;p&gt;Como al final no me decid&amp;iacute; a dar el gran paso y desarrollar el proyecto, y es una pena que el esfuerzo que dediqu&amp;eacute; a hacer el planteamiento se quede en un documento de mi port&amp;aacute;til, he decidido compartir el &lt;a href=&quot;http://www.dataprix.com/es/system/files/PlanEmpresaDataclean.pdf&quot; rel=&quot;nofollow&quot;&gt;plan de empresa&lt;/a&gt;, adjunto en este post. Tamb&amp;eacute; he puesto online el prototipo web que comenc&amp;eacute;. Aviso que est&amp;aacute; tal como lo dej&amp;eacute;, no funciona casi nada.&lt;/p&gt;
&lt;p&gt;&lt;img height=&quot;420&quot; width=&quot;800&quot; alt=&quot;Web Dataclean.es&quot; src=&quot;/files/uploads/2/dataclean_es.jpg&quot; /&gt;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;Lo he activado en &lt;a target=&quot;_blank&quot; href=&quot;http://www.dataclean.es&quot; rel=&quot;nofollow&quot;&gt;Dataclean.es&lt;/a&gt;. Como podr&amp;eacute;is comprobar, mi intenci&amp;oacute;n era comenzar con servicios de depuraci&amp;oacute;n de Nombres, Direcciones, Tel&amp;eacute;fonos, NIFs y Cuentas Corrientes. De estas opciones, la &amp;uacute;nica con la que se puede hacer algo (y es bien poco) es la de tel&amp;eacute;fonos. Obviamente la intenci&amp;oacute;n era desarrollar servicios mucho m&amp;aacute;s sofisticados, utilizando bases de datos, y retornando datos depurados, enriquecidos y normalizados. Tambi&amp;eacute;n quer&amp;iacute;a ofrecer servicios de matching y deduplicaci&amp;oacute;n, primero entre tipos de datos simples como los comentados, y despu&amp;eacute;s de registros o uniones de registros completos, con componentes o campos de diferentes tipos.&lt;/p&gt;
&lt;p&gt;Bueno, espero que este post sirva al menos para animar el tema de &lt;a href=&quot;http://www.dataprix.com/data-quality&quot; rel=&quot;nofollow&quot;&gt;Calidad de datos&lt;/a&gt; de Dataprix, que reconozco que &amp;uacute;ltimamente tengo un poco olvidado, y espero ver en el tema &lt;a href=&quot;http://www.dataprix.com/es/projecte-daas-datacleansing-as-a-service&quot; target=&quot;_blank&quot; rel=&quot;nofollow&quot;&gt;DAAS: Datacleansing As A Service&lt;/a&gt; que he creado en el foro vuestras cr&amp;iacute;ticas y comentarios sobre la viabilidad del proyecto, sobre el Datacleansing As A Service en general, sobre otros enfoques posibles, o sobre cualquier aspecto relacionado con la tem&amp;aacute;tica o el &lt;a href=&quot;http://www.dataprix.com/es/system/files/PlanEmpresaDataclean.pdf&quot; rel=&quot;nofollow&quot;&gt;documento del plan de empresa&lt;/a&gt;.&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
</description>
 <category domain="http://www.dataprix.com/es/datacleansing">Limpieza de datos</category>
 <category domain="http://www.dataprix.com/es/data-quality">Calidad de datos</category>
 <category domain="http://www.dataprix.com/es/category/calidad-datos/limpieza-datos/deduplicaci-n">Deduplicación</category>
 <category domain="http://www.dataprix.com/es/category/calidad-datos/limpieza-datos/normalizaci-n-datos">Normalización de datos</category>
 <category domain="http://www.dataprix.com/es/category/etiquetas/daas">DAAS</category>
 <category domain="http://www.dataprix.com/es/category/etiquetas/dataclean">dataclean</category>
 <category domain="http://www.dataprix.com/es/category/etiquetas/datacleansing">datacleansing</category>
 <category domain="http://www.dataprix.com/es/category/etiquetas/emprendedor">emprendedor</category>
 <category domain="http://www.dataprix.com/es/category/etiquetas/proyectos">proyectos</category>
 <category domain="http://www.dataprix.com/es/category/etiquetas/servicios">servicios</category>
 <enclosure url="http://www.dataprix.com/es/system/files/PlanEmpresaDataclean.pdf" length="227472" type="application/pdf" />
 <pubDate>Fri, 12 Dec 2008 12:23:00 +0100</pubDate>
 <dc:creator>carlos</dc:creator>
 <guid isPermaLink="false">318 at http://www.dataprix.com</guid>
</item>
<item>
 <title>Informatica World 2008 en Las Vegas</title>
 <link>http://www.dataprix.com/es/informatica-world-2008-las-vegas</link>
 <description>&lt;p&gt;Finalmente he podido asistir al &lt;a target=&quot;_blank&quot; href=&quot;http://www.informatica.com/events/customer_conference/default.htm&quot; rel=&quot;nofollow&quot;&gt;Informatica World 2008&lt;/a&gt; y qu&amp;eacute; menos que explicar un poco lo que me encontr&amp;eacute; por all&amp;iacute;. La conferencia se celebr&amp;oacute; del 3 al 5 de junio bajo el lema &#039;&lt;em&gt;Gain the Edge&lt;/em&gt;&#039;, una expresi&amp;oacute;n con mucha fuerza en ingl&amp;eacute;s pero dif&amp;iacute;cil de traducir al castellano, a ver si alguien se anima y nos da una traducci&amp;oacute;n v&amp;aacute;lida.&lt;/p&gt;
&lt;p&gt;&lt;img width=&quot;640&quot; height=&quot;428&quot; alt=&quot;&quot; src=&quot;/files/uploads/2/Chris_boorman.JPG&quot; /&gt;&lt;/p&gt;
&lt;p&gt;El d&amp;iacute;a 3 comenz&amp;oacute;, despu&amp;eacute;s del desayuno, con una &lt;strong&gt;sesi&amp;oacute;n general&lt;/strong&gt; que llevaba por t&amp;iacute;tulo &lt;em&gt;Vision. Strategy. Technology Announcements. Industry leadership.&lt;/em&gt; En la misma, tanto Sohaib Abbasi, CEO y Presidente de &lt;a target=&quot;_blank&quot; href=&quot;http://www.informatica.com&quot; rel=&quot;nofollow&quot;&gt;Inform&amp;aacute;tica&lt;/a&gt;, como Chris Boorman, Ivan Chong y Girish Pancha, Vicepresidentes en las &amp;agrave;reas de M&amp;aacute;rqueting, Calidad de Datos e Integraci&amp;oacute;n de Datos, respectivamente,&amp;nbsp;nos mostraron su visi&amp;oacute;n actual del mercado, c&amp;oacute;mo est&amp;aacute;n evolucionando la tecnolog&amp;iacute;a y los negocios, y qu&amp;eacute; papel juegan en este marco los datos y&amp;nbsp;las aplicaciones que los gestionan.&lt;/p&gt;
&lt;p&gt; &lt;!--break--&gt;
&lt;p&gt;Mucho de lo que comentaron ya hab&amp;iacute;a podido escucharlo en las presentaciones del &lt;a href=&quot;http://www.dataprix.com/es/integraci-n-y-calidad-datos-el-powerday-2008&quot; rel=&quot;nofollow&quot;&gt;Powerday 2008 de Barcelona&lt;/a&gt;, cosa que muestra que la compa&amp;ntilde;ia mantiene una estrategia bien&amp;nbsp;definida, y&amp;nbsp;la comparte con sus partners.&amp;nbsp;&lt;/p&gt;
&lt;p&gt;Se hizo especial hincapi&amp;eacute;, cada ponente bajo la perspectiva de su &amp;agrave;rea, del valor que representan&amp;nbsp;los datos, y&amp;nbsp;lo importante que es la&amp;nbsp;habilidad de cada organizaci&amp;oacute;n para gestionarlos,&amp;nbsp;mantener su coherencia y calidad,&amp;nbsp;garantizar su accesibilidad en el momento oportuno, protegerlos, sincronizarlos y poder intercambiarlos con otras organizaciones.&lt;/p&gt;
&lt;p&gt;Nos hicieron notar que ahora ya no s&amp;oacute;lo se trata de crear un almac&amp;eacute;n de datos corporativo que nos porporcione informaci&amp;oacute;n actualizada cada cierto intervalo de tiempo. La evoluci&amp;oacute;n tecnol&amp;oacute;gica y&amp;nbsp;de Internet, la globalizaci&amp;oacute;n&amp;nbsp;y la competencia nos hacen plantearnos que con el Data Warehouse no es suficiente. Se oyeron mucho los t&amp;eacute;rminos SaaS, Real Time y Data Quality, cosa que nos da pistas sobre hacia donde van encaminadas las nuevas funcionalidades de las herramientas de la compa&amp;ntilde;ia.&lt;/p&gt;
&lt;p&gt;Tambi&amp;eacute;n realizaron una interesante &lt;strong&gt;demo &lt;/strong&gt;sobre c&amp;oacute;mo una aplicaci&amp;oacute;n como Salesforce.com puede sincronizarse en tiempo real, y a trav&amp;eacute;s de Internet,&amp;nbsp;con una hoja&amp;nbsp;de c&amp;aacute;lculo&amp;nbsp;de Google Docs. Este ejemplo de cloud to cloud computing lo prepararon mostrando en la pantalla de la izquierda Salesforce.com y en la de la derecha&amp;nbsp;una spreadsheet de Google Docs, cada aplicaci&amp;oacute;n &#039;controlada&#039; desde un portatil. En el portatil de Salesforce realizaron un cambio, y pudimos ver c&amp;oacute;mo se actualizaba al momento la hoja de c&amp;aacute;lculo. Despu&amp;eacute;s hicieron otra modificaci&amp;oacute;n en la hoja de c&amp;aacute;lculo, y la aplicaci&amp;oacute;n de Salesforce tambi&amp;eacute;n se actualiz&amp;oacute;, todo a trav&amp;eacute;s de Internet. Para &lt;em&gt;poner la guindilla &lt;/em&gt;despu&amp;eacute;s hicieron lo mismo, pero con un iPod touch, no hay que olvidar las posibilidades que nos brindan los nuevos dispositivos m&amp;oacute;viles cuando se conectan a la web.&lt;/p&gt;
&lt;p&gt;Tambi&amp;eacute;n pudimos asistir a una animada presentaci&amp;oacute;n de Royce Bell, CEO de Accenture Information Management Services, que supo c&amp;oacute;mo mantener la atenci&amp;oacute;n de todo el mundo.&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&lt;em&gt;&lt;img width=&quot;640&quot; height=&quot;428&quot; alt=&quot;&quot; src=&quot;/files/uploads/2/general_session.JPG&quot; /&gt;&lt;/em&gt;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;La sesi&amp;oacute;n general de este Informatica World 2008&amp;nbsp;daba paso a las &lt;strong&gt;Breakout Sessions&lt;/strong&gt;, cada una de ellas clasificada en una de las siguientes categor&amp;iacute;as:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Productos y Tecnolog&amp;iacute;a&lt;/li&gt;
&lt;li&gt;Arquitectura&lt;/li&gt;
&lt;li&gt;Gesti&amp;oacute;n de Datos Empresarial&lt;/li&gt;
&lt;li&gt;Soluciones&lt;/li&gt;
&lt;li&gt;Presentaci&amp;oacute;n T&amp;eacute;cnica&lt;/li&gt;
&lt;li&gt;Impacto sobre el negocio&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Adem&amp;aacute;s se catalogaban seg&amp;uacute;n nivel de experiencia y rol del p&amp;uacute;blico al que iban dirigidas.&lt;/p&gt;
&lt;p&gt;Los niveles eran Beginner, Intermediate y Advanced, y los roles Architect, Business and IT Influencer y Practitioner.&lt;/p&gt;
&lt;p&gt;As&amp;iacute; cada uno pod&amp;iacute;a seleccionar las sesiones que m&amp;aacute;s le interesaran y mejor se adaptaran a su perfil profesional.&lt;/p&gt;
&lt;p&gt;&lt;img width=&quot;640&quot; height=&quot;428&quot; alt=&quot;&quot; src=&quot;/files/uploads/2/breakout_sessions.JPG&quot; /&gt;&lt;/p&gt;
&lt;p&gt;En total hab&amp;iacute;a 56 sesiones, de las cuales hab&amp;iacute;a que elegir como mucho 8. Como son tantas, listar&amp;eacute; a continuaci&amp;oacute;n s&amp;oacute;lo el t&amp;iacute;tulo de cada una, dentro de cada categor&amp;iacute;a, todo en el idioma original, y subrayo las que yo seleccion&amp;eacute;:&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;Products and Technology&lt;br /&gt; &lt;/strong&gt;&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;What&amp;rsquo;s New in PowerCenter&lt;/li&gt;
&lt;li&gt;Data Quality with Identity Resolution: A Leap Forward for Data Quality in the Enterprise&lt;/li&gt;
&lt;li&gt;How to Get More from Informatica Metadata Manager&lt;/li&gt;
&lt;li&gt;The Informatica Roadmap: Vision for V9&lt;/li&gt;
&lt;li&gt;Informatica B2B Data Exchange: Building a Data Exchange&lt;/li&gt;
&lt;li&gt;What&amp;rsquo;s New in Informatica Data Explorer and Informatica Data Quality 8.6&lt;/li&gt;
&lt;li&gt;Protecting Private Data Using PowerCenter Data Masking&lt;/li&gt;
&lt;li&gt;Real-Time Data Integration&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;&lt;strong&gt;Architecture&lt;/strong&gt;&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;Customer Panel: Real-Time Integration Architectures for Right-Time Business Value&lt;/li&gt;
&lt;li&gt;Informatica Architecture: Where to Start?&lt;/li&gt;
&lt;li&gt;A Practical Approach to Building Data Services with PowerCenter 8.5&lt;/li&gt;
&lt;li&gt;Informatica Orchestration and Human Workflow: Process-Enabled Data Integration and Data&lt;/li&gt;
&lt;li&gt;Maximizing Operational Uptime: Real-Time Data Integration with Informatica&lt;/li&gt;
&lt;li&gt;On Demand Data Integration: Overview and Demonstration&lt;/li&gt;
&lt;li&gt;Deploying PowerCenter on Grid Computing Architectures&lt;/li&gt;
&lt;li&gt;PowerCenter Data Federation Option: A Unified Platform for Data Integration Flexibility&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;&lt;strong&gt;Enterprise Data Management&lt;/strong&gt;&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;Data Quality, The First Step on the Path to Master Data Management&lt;/li&gt;
&lt;li&gt;&lt;u&gt;Where Real-Time Data Integration Meets Real-Time Data Warehousing&lt;/u&gt;&lt;/li&gt;
&lt;li&gt;IMS Health: Global Data Integration for Financial Information Management&lt;/li&gt;
&lt;li&gt;&lt;u&gt;Customer Master Data Management at Major Telecommunications Company KPN, Netherlands&lt;/u&gt;&lt;/li&gt;
&lt;li&gt;&lt;u&gt;Measuring and Improving Data Governance Maturity: A Practical Approach&lt;/u&gt;&lt;/li&gt;
&lt;li&gt;&lt;u&gt;Information Management: An Implementer&amp;rsquo;s Perspective&lt;/u&gt;&lt;/li&gt;
&lt;li&gt;Measuring Data Quality in Philips Consumer Lifestyle&lt;/li&gt;
&lt;li&gt;Lowering Cost and Risk with the Data Migration Factory&lt;/li&gt;
&lt;li&gt;&lt;u&gt;Data Profiling and Data Quality Improvement: A Practitioner&#039;s Approach&lt;/u&gt;&lt;/li&gt;
&lt;li&gt;Velocity Methodology: Best Practices&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;&lt;strong&gt;Solutions&lt;/strong&gt;&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;u&gt;Campaign Marketing and Customer Relationship Management at Daimler AG&lt;/u&gt;&lt;/li&gt;
&lt;li&gt;A Trip to Better and Faster Corporation Travel Management: A B2B Data Transformation Success&lt;/li&gt;
&lt;li&gt;Informatica B2B Data Transformation: Success with LOGTEC for the Defense Logistics Agency&lt;/li&gt;
&lt;li&gt;Assuring Success When Integrating Salesforce CRM with the Rest of Your Business: A Partner Profile with Case Studies from Ellie Mae and Millennium Pharma&lt;/li&gt;
&lt;li&gt;Data Migration Success at G&amp;amp;K Services&lt;/li&gt;
&lt;li&gt;Leveraging HP and Informatica for Large-Scale Data Migration Efforts: A Case Study at CVS Caremark&lt;/li&gt;
&lt;li&gt;&lt;u&gt;Strategy to Implementation: How to Get Started on your Data Quality Initiative&lt;/u&gt;&lt;/li&gt;
&lt;li&gt;Identity Resolution: What It Is and Why It Is Important&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;&lt;strong&gt;Tech Talk&lt;/strong&gt;&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;Extreme Automation: Traceability of Requirements through Testing, Governance and Compliance&lt;/li&gt;
&lt;li&gt;Planning and Tuning Informatica for Large Loads&lt;/li&gt;
&lt;li&gt;Tips to Improve Productivity Using Self-Service Support Tools&lt;/li&gt;
&lt;li&gt;Command and Control: Using Informatica Workflows to Regulate Complex Business Processes&lt;/li&gt;
&lt;li&gt;Informatica Developer: Tips and Tricks for Architecture and Development&lt;/li&gt;
&lt;li&gt;Upgrading to the Latest PowerCenter Release: Tips and Tricks, Testing and Pitfalls to Avoid&lt;/li&gt;
&lt;li&gt;Using Team-Based Development: A Practical Expos&amp;eacute;&lt;/li&gt;
&lt;li&gt;High-Volume Data Processing (&gt;150GB) Using Informatica&lt;/li&gt;
&lt;li&gt;Informatica Developer Tips for Troubleshooting Common Issues&lt;/li&gt;
&lt;li&gt;Power of Informatica PowerCenter at Verizon Wireless&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;&lt;strong&gt;Business Impact&lt;/strong&gt;&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;Driving Business Value with Integration Competency Centers: Customer Presentations, a Two-Part Series (Part 1 of 2)&lt;/li&gt;
&lt;li&gt;Integration Competency Centers: Panel Discussion, a Two-Part Series (Part 2 of 2)&lt;/li&gt;
&lt;li&gt;&lt;u&gt;Anti-Money Laundering Compliance: Stopping Financial Crime - a Data Quality Approach&lt;/u&gt;&lt;/li&gt;
&lt;li&gt;Quantifying Business Value with Informatica: Best Practices and Techniques for Funding Enterprise Data Integration and Data Quality Projects&lt;/li&gt;
&lt;li&gt;Informatica B2B Data Exchange: Success with Paramount Pictures&lt;/li&gt;
&lt;li&gt;Integration Competency Center at Duke Energy&lt;/li&gt;
&lt;li&gt;Building a Business Case for B2B Data Exchange at a Major HMO&lt;/li&gt;
&lt;li&gt;Data Governance in a Global Enterprise&lt;/li&gt;
&lt;li&gt;Enterprise Data Warehouse at a Medical Device Manufacturing Company&lt;/li&gt;
&lt;li&gt;Informatica B2B Data Transformation: Success with GfK Group&amp;nbsp;&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;&amp;nbsp;Como se puede apreciar, la categor&amp;iacute;a que m&amp;aacute;s me interes&amp;oacute; fue la de Gesti&amp;oacute;n de Datos en la Empresa, seguida de la de Soluciones. De todas maneras debo aclarar que actualmente no utilizo productos de Inform&amp;aacute;tica, por lo que las categor&amp;iacute;as relacionadas con desarrollo o temas espec&amp;iacute;ficos del software no me resultaban tan atractivas.&lt;/p&gt;
&lt;p&gt;Encontr&amp;eacute; la mayor&amp;iacute;a de las sesiones muy enriquecedoras, nadie mejor que los expertos de Inform&amp;aacute;tica para asentar conceptos sobre las &amp;uacute;ltimas tendencias en gesti&amp;oacute;n y calidad de datos, en Data Warehousing, o para recomendarte &lt;em&gt;best practices&lt;/em&gt;, o pasos a seguir para abordar un proyecto de este tipo.&lt;/p&gt;
&lt;p&gt;De todas maneras siempre lo mejor es la presentaci&amp;oacute;n de alguien que ha vivido en su empresa una implantaci&amp;oacute;n o una experiencia, y que la cuenta bajo una perspectiva m&amp;aacute;s imparcial. En este sentido creo que la mejor sesi&amp;oacute;n a la que asist&amp;iacute; fue la Customer Data Management en KPN, presentada por Thomas Reichel (KPN) y Chris Phillips (Informatica)&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;Tras estos d&amp;iacute;as de Breakout Sessions lleg&amp;oacute; el jueves 5 en que se celebr&amp;oacute; la &lt;strong&gt;sesi&amp;oacute;n general&lt;/strong&gt; que marcaba el &lt;strong&gt;final del evento&lt;/strong&gt;. El t&amp;iacute;tulo de la misma era &lt;em&gt;Gaining the Edge. In Real Time&lt;/em&gt;&lt;/p&gt;
&lt;p&gt;&lt;img width=&quot;640&quot; height=&quot;428&quot; alt=&quot;&quot; src=&quot;/files/uploads/2/general_session_pant.JPG&quot; /&gt;&lt;/p&gt;
&lt;p&gt;Despu&amp;eacute;s de haber mostrado en la sesi&amp;oacute;n inicial la necesidad de las organizaciones de gestionar sus datos con la mayor eficiencia, y adapt&amp;aacute;ndose al progreso tecnol&amp;oacute;gico, esta sesi&amp;oacute;n se enfoc&amp;oacute; m&amp;aacute;s a c&amp;oacute;mo conseguirlo con la ayuda del software y el soporte de Inform&amp;aacute;tica, se mostraron las nuevas funcionalidades que ofrece la versi&amp;oacute;n 9 del producto, y c&amp;oacute;mo aprovecharlas.&lt;/p&gt;
&lt;p&gt;Me gust&amp;oacute; la demo que realiz&amp;oacute; Ivan Chong sobre c&amp;oacute;mo gestionar y realizar procesos de Data Quality con esta nueva versi&amp;oacute;n, pero lo que m&amp;aacute;s me impresion&amp;oacute; fue la presentaci&amp;oacute;n que hizo Ron Swift, vicepresidente de Teradata, sobre la importancia de gestionar datos en tiempo real para poder reaccionar a tiempo ante determinadas situaciones. Puso el acertado ejemplo de un casino que hab&amp;iacute;a implementado un sistema que analizaba en tiempo real el comportamiento de sus clientes mientras jugaban y que, si detectaba que alguno estaba perdiendo demasiado dinero, para no acabar perdi&amp;eacute;ndolo hac&amp;iacute;a saltar una alarma que avisaba para que el personal pudiera persuadirlo de seguir jugando.&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;Para finalizar s&amp;oacute;lo agradecer a &lt;a target=&quot;_blank&quot; href=&quot;http://www.powerdataib.com/&quot; rel=&quot;nofollow&quot;&gt;Powerdata &lt;/a&gt;la invitaci&amp;oacute;n para poder asistir a esta edici&amp;oacute;n del&amp;nbsp;Informatica World, y el amable trato que me han brindado durante todo el viaje.&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
</description>
 <comments>http://www.dataprix.com/es/informatica-world-2008-las-vegas#comments</comments>
 <category domain="http://www.dataprix.com/es/data-quality">Calidad de datos</category>
 <category domain="http://www.dataprix.com/es/category/calidad-datos/informatica">Informatica</category>
 <category domain="http://www.dataprix.com/es/category/calidad-datos/integraci-n">integración</category>
 <pubDate>Wed, 11 Jun 2008 00:20:35 +0200</pubDate>
 <dc:creator>carlos</dc:creator>
 <guid isPermaLink="false">203 at http://www.dataprix.com</guid>
</item>
<item>
 <title>Integracion y calidad de datos en el PowerDay 2008</title>
 <link>http://www.dataprix.com/es/integraci-n-y-calidad-datos-el-powerday-2008</link>
 <description>&lt;p&gt;En marzo-abril&amp;nbsp;se celebr&amp;oacute; la s&amp;eacute;ptima edici&amp;oacute;n de&amp;nbsp;Powerday, un evento anual&amp;nbsp;que&amp;nbsp;organiza &lt;a target=&quot;_blank&quot; href=&quot;http://www.powerdataib.com/&quot; rel=&quot;nofollow&quot;&gt;PowerData&lt;/a&gt;, y que este a&amp;ntilde;o ten&amp;iacute;a por objetivo proporcionar a los asistentes una visi&amp;oacute;n global de la&amp;nbsp;estrategia adecuada para sacar el m&amp;aacute;ximo partido a los datos. Yo tuve la oportunidad de asistir al de Barcelona, y disfrutar con las interesantes ponencias que se&amp;nbsp;realizaron en el mismo.&amp;nbsp;&lt;/p&gt;
&lt;p&gt;Fueron presentaciones de una media hora, en las que se habl&amp;oacute; sobre la importancia de la calidad de datos y los procesos de integraci&amp;oacute;n, sobre la situaci&amp;oacute;n tecnol&amp;oacute;gica y de mercado actual y, por supuesto, sobre c&amp;oacute;mo facilitar las cosas con la utilizaci&amp;oacute;n de herramientas de &lt;a target=&quot;_blank&quot; href=&quot;http://www.informatica.com/&quot; rel=&quot;nofollow&quot;&gt;Inform&amp;aacute;tica &lt;/a&gt;como &lt;a target=&quot;_blank&quot; href=&quot;http://www.informatica.com/products/powercenter/default.htm&quot; rel=&quot;nofollow&quot;&gt;PowerCenter&lt;/a&gt;.&lt;/p&gt;
&lt;p&gt;Estos son los t&amp;iacute;tulos de las presentaciones:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;El valor de los datos correctos trasciende el departamento TI&lt;/li&gt;
&lt;li&gt;Principios pr&amp;aacute;cticos para garantizar una buena calidad de los datos dentro de la organizaci&amp;oacute;n&lt;/li&gt;
&lt;li&gt;Enmascaramiento de datos: una respuesta efectiva a demandas de confidencialidad&lt;/li&gt;
&lt;li&gt;Integraci&amp;oacute;n de datos corporativos en Caprabo&lt;/li&gt;
&lt;li&gt;Importancia de contar con buenos datos en entornos anal&amp;iacute;ticos&lt;/li&gt;
&lt;li&gt;El modelo de organizaci&amp;oacute;n en tiempo real impone nuevas exigencias en la gesti&amp;oacute;n de la informaci&amp;oacute;n&lt;/li&gt;
&lt;li&gt;Tendencias del mercado espa&amp;ntilde;ol de gesti&amp;oacute;n de datos&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Encontr&amp;eacute; especialmente interesante la de &lt;a target=&quot;_blank&quot; href=&quot;http://www.caprabo.es/&quot; rel=&quot;nofollow&quot;&gt;Caprabo&lt;/a&gt;, realizada por&amp;nbsp;Sergio Champel, el&amp;nbsp;Jefe del Area de Arquitectura e Integraci&amp;oacute;n de esta empresa.&amp;nbsp;Sergio&amp;nbsp;explic&amp;oacute; c&amp;oacute;mo se hab&amp;iacute;an organizado tanto a nivel de gesti&amp;oacute;n como de arquitectura para llevar a cabo con&amp;nbsp;&amp;eacute;xito&amp;nbsp;un ambicioso proyecto de integraci&amp;oacute;n y remodelaci&amp;oacute;n del sistema de Business Intelligence de&amp;nbsp;Caprabo, con el que han conseguido mejorar importantes procesos de negocio, y &#039;estrechar los lazos&#039; entre los sistemas operacionales y el Data Warehouse.&lt;/p&gt;
&lt;p&gt;Me llam&amp;oacute; mucho la atenci&amp;oacute;n la frase &lt;em&gt;Aprendemos a utilizar un martillo y todo nos parece un clavo, &lt;/em&gt;que Sergio mencion&amp;oacute; para dejar claro lo que quer&amp;iacute;an evitar cuando definieron la arquitectura. Me pareci&amp;oacute; un frase muy acertada, y aplicable a m&amp;uacute;ltiples situaciones.&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;Destacar tambi&amp;eacute;n que la presentaci&amp;oacute;n &lt;em&gt;Importancia de contar con buenos datos en entornos anal&amp;iacute;ticos &lt;/em&gt;la realiz&amp;oacute; Jorge Zaera, director general de &lt;a href=&quot;http://microstrategy.es/&quot; rel=&quot;nofollow&quot;&gt;Microstrategy&lt;/a&gt;.&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;Las dem&amp;aacute;s fueron presentadas por expertos y directivos&amp;nbsp;de Powerdata,&amp;nbsp;que supieron mostrar los diferentes aspectos a tener en cuenta&amp;nbsp;en todo&amp;nbsp;lo relacionado&amp;nbsp;con la integraci&amp;oacute;n y calidad de los datos, y qu&amp;eacute; papel&amp;nbsp;juegan estas materias&amp;nbsp;en las &amp;uacute;ltimas tendencias tecnol&amp;oacute;gicas del mercado, cada vez m&amp;aacute;s orientadas al &lt;strong&gt;proceso &lt;/strong&gt;y al &lt;strong&gt;servicio&lt;/strong&gt;,&amp;nbsp;como SaaS (Software as a Service), SOA (Service Oriented Architecture), BPM (Business Process Management), CPM (Corporate Process Management) o&amp;nbsp;EIM (Enterprise Information Management)&lt;/p&gt;
&lt;p&gt;Para el que prefiera hablar de cosas m&amp;aacute;s tangibles, tambi&amp;eacute;n se proporcion&amp;oacute; una&amp;nbsp;clasificaci&amp;oacute;n de tipos de proyectos que nos podemos encontrar en cuanto a&amp;nbsp;la gesti&amp;oacute;n de los datos:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Data warehouse&lt;/li&gt;
&lt;li&gt;Migraci&amp;oacute;n de datos&lt;/li&gt;
&lt;li&gt;Consolidaci&amp;oacute;n de datos&lt;/li&gt;
&lt;li&gt;Master Data Management&lt;/li&gt;
&lt;li&gt;Sincronizaci&amp;oacute;n de datos&lt;/li&gt;
&lt;li&gt;Intercambio de datos B2B&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Tras las presentaciones se realiz&amp;oacute; un sorteo de un viaje a Las Vegas para asistir a &lt;a target=&quot;_blank&quot; href=&quot;http://www.informatica.com/events/customer_conference/default.htm&quot; rel=&quot;nofollow&quot;&gt;Informatica World 2008&lt;/a&gt;. Resulta que el afortunado ganador del sorteo fui yo, por lo que en unas semanas espero estar publicando un nuevo art&amp;iacute;culo sobre mis experiencias en este evento al otro lado del charco.&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
</description>
 <comments>http://www.dataprix.com/es/integraci-n-y-calidad-datos-el-powerday-2008#comments</comments>
 <category domain="http://www.dataprix.com/es/category/calidad-datos/limpieza-datos/etl">ETL</category>
 <category domain="http://www.dataprix.com/es/datacleansing">Limpieza de datos</category>
 <category domain="http://www.dataprix.com/es/data-quality">Calidad de datos</category>
 <category domain="http://www.dataprix.com/es/category/calidad-datos/datacleansing">datacleansing</category>
 <category domain="http://www.dataprix.com/es/category/calidad-datos/informatica">Informatica</category>
 <category domain="http://www.dataprix.com/es/category/calidad-datos/integraci-n">integración</category>
 <pubDate>Mon, 26 May 2008 02:16:37 +0200</pubDate>
 <dc:creator>carlos</dc:creator>
 <guid isPermaLink="false">195 at http://www.dataprix.com</guid>
</item>
<item>
 <title>Datacleansing con Power*MatchMaker</title>
 <link>http://www.dataprix.com/es/datacleansing-con-powermatchmaker</link>
 <description>&lt;p&gt;Power MatchMaker es una herramienta de Data Cleansing que SQLPower ha liberado convirtiendo la licencia en Open Source, junto con la de Power Architect (herramienta para modelizaci&amp;oacute;n de datos). Como no es que haya demasiadas herramientas Open Source en el campo de la limpieza de datos, me ha podido la curiosidad y la he instalado para ver que tal funciona.  La instalaci&amp;oacute;n ha sido muy sencilla, el software se descarga desde &lt;a href=&quot;http://download.sqlpower.ca/matchmaker/current.html&quot; rel=&quot;nofollow&quot;&gt;Descarga de Power MatchMaker&lt;/a&gt;, en diferentes versiones seg&amp;uacute;n el SO. Yo he probado la de windows, que se instala a golpe de bot&amp;oacute;n en 2 minutos. Importante no olvidarse del requerimiento del Java Runtime 5.  Una vez instalado, para ver como funciona lo mejor es seguir el tutorial que se encuentra en la misma ayuda de la herramienta. Tambi&amp;eacute;n recomiendo ver la demo accesible desde la misma &lt;a href=&quot;http://www.sqlpower.ca/page/MatchMaker&quot; rel=&quot;nofollow&quot;&gt;p&amp;aacute;gina de MatchMaker&lt;/a&gt;.  El funcionamiento del software es muy sencillo, se crea un repositorio sobre una de las diferentes BBDD sobre las que puede trabajar, y con las que conecta por JDBC, y se pueden crear proyectos de 3 tipos diferentes: Deduplicaci&amp;oacute;n, Datacleansing y Referencias cruzadas. Eso en teor&amp;iacute;a, porque la funcionalidad de referencias Cruzadas a&amp;uacute;n no est&amp;aacute; implementada y no se puede utilizar.  El proyecto de Datacleansing tampoco aporta nada nuevo, ya que toda la funcionalidad que utiliza es un subconjunto de la que ofrece uno de Deduplicaci&amp;oacute;n, con lo que con crear un proyecto de este &amp;uacute;ltimo tipo ya lo vemos todo.  En cuanto a la deduplicaci&amp;oacute;n, se organiza el proceso en varios pasos:&lt;/p&gt;
&lt;h4&gt;1. Definici&amp;oacute;n de procesos de transformaci&amp;oacute;n de los campos origen y comparaci&amp;oacute;n entre ellos&lt;/h4&gt;
&lt;p&gt;Se pueden definir varios procesos de comparaci&amp;oacute;n, aplicando diferentes operadores a los datos originales para obtener datos m&amp;aacute;s significativos de cara a la comparaci&amp;oacute;n, y se define tambi&amp;eacute;n exactamente lo que se quiere comparar. La interfaz para realizar estas acciones es muy intuitiva y visual, y en un momento se define todo. La pega es que los operadores de comparaci&amp;oacute;n son bastante simples. Aunque hay operadores como los de comparaci&amp;oacute;n fon&amp;eacute;tica, se echan de menos funciones de fuzzy logic para comparar palabras parecidas, o que se trabaje un porcentaje de similitud por campo y por registro. Los resultados finales son que coincida o no todo lo que se ha definido. Lo &amp;uacute;nico que se puede hacer es asignar una prioridad y un color para despu&amp;eacute;s distinguirlo visualmente a cada proceso de comparaci&amp;oacute;n. Se echan tambi&amp;eacute;n de menos funciones espec&amp;iacute;ficas de direcciones u otro tipo de datos &#039;estandar&#039;, aunque hay un operador que realiza una validaci&amp;oacute;n de la direcci&amp;oacute;n con Google Maps. Yo no he conseguido que me funcione, pero es algo a explorar con m&amp;aacute;s calma. Tambi&amp;eacute;n se pueden definir diccionarios de traducci&amp;oacute;n de palabras, cosa muy &amp;uacute;til cuando se comparan nombres o direcciones, por ejemplo.&lt;/p&gt;
&lt;p align=&quot;center&quot;&gt;&lt;img border=&quot;0&quot; alt=&quot;Datacleansing MatchMaker&quot; src=&quot;http://www.dataprix.com/files/match_munge.jpg&quot; /&gt;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h4&gt;2. Ejecuci&amp;oacute;n de la comparaci&amp;oacute;n&lt;/h4&gt;
&lt;p&gt;Nada que destacar, con pocos registros funciona bien, habr&amp;iacute;a que probar con tablas grandes y valorar el rendimiento.&lt;/p&gt;
&lt;h4&gt;3. Validaci&amp;oacute;n de las coincidencias&lt;/h4&gt;
&lt;p&gt;Esta parte tambi&amp;eacute;n est&amp;aacute; muy bien. La herramienta muestra de una manera muy visual las coincidencias encontradas, con un color para cada proceso definido, y permite ver las diferencias entre registros, y descartar coincidencias, decidir cu&amp;aacute;l es el registro maestro (el que va a conservar los datos tras la fuci&amp;oacute;n), y qu&amp;eacute; es lo que se va a fusionar y c&amp;oacute;mo. Por defecto se escogen los datos del registro maestro, a menos que el campo sea nulo, y tambi&amp;eacute;n se pueden concatenar los datos, o coger el m&amp;aacute;ximo, el m&amp;iacute;nimo o la suma de todos. Si se quiere se puede dejar escoger a la herramienta autom&amp;aacute;ticamente el registro que queda como maestro, y hacer que se fusionen todos los registros en los que se ha encontrado coincidencia. La herramienta est&amp;aacute; muy bien para trabajar con un n&amp;uacute;mero limitado de registros, que puedan ser revisados por una persona antes de la fusi&amp;oacute;n, pero le falta un poco de &#039;inteligencia&#039; para poder tratar con un n&amp;uacute;mero elevado de registros, y realizar fusiones sin necesitar intervenci&amp;oacute;n manual. Tambi&amp;eacute;n deber&amp;iacute;a poderse escoger el dato maestro a nivel de campo, y no a nivel de registro, y con los mejores datos de cada campo crear el mejor registro maestro.&lt;/p&gt;
&lt;p align=&quot;center&quot;&gt;&lt;img border=&quot;0&quot; alt=&quot;Validacion Merge MatchMaker&quot; src=&quot;http://www.dataprix.com/files/match_validacion.jpg&quot; /&gt;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;h4&gt;4. Proceso de fusi&amp;oacute;n de registros&lt;/h4&gt;
&lt;p&gt;Funciona correctamente, deja un log y guarda los identificadores de lo que se fusiona en una tabla de resultados. S&amp;oacute;lo hay que tener cuidado porque trabaja directamente sobre la tabla origen, y borra los registros que se han marcado como duplicados.&lt;/p&gt;
&lt;h4&gt;Conclusiones&lt;/h4&gt;
&lt;p&gt;En definitiva, es una herramienta muy &amp;uacute;til para realizar procesos de limpieza, sobretodo si la cantidad de datos a revisar no es muy grande. Sin grandes complicaciones permite realizar todo el proceso y facilita mucho la comparaci&amp;oacute;n entre candidatos y la elecci&amp;oacute;n de los registros que quedar&amp;aacute;n como maestros. Tiene varios aspectos a mejorar, pero seguro que no se va a quedar en esta versi&amp;oacute;n, sobretodo sabiendo que ahora es de c&amp;oacute;digo abierto.&lt;/p&gt;
</description>
 <comments>http://www.dataprix.com/es/datacleansing-con-powermatchmaker#comments</comments>
 <category domain="http://www.dataprix.com/es/datacleansing">Limpieza de datos</category>
 <category domain="http://www.dataprix.com/es/data-quality">Calidad de datos</category>
 <category domain="http://www.dataprix.com/es/category/calidad-datos/limpieza-datos/deduplicaci-n">Deduplicación</category>
 <category domain="http://www.dataprix.com/es/category/calidad-datos/limpieza-datos/normalizaci-n-datos">Normalización de datos</category>
 <category domain="http://www.dataprix.com/es/taxonomy/term/76">Limpieza de datos</category>
 <category domain="http://www.dataprix.com/es/open-source">Software libre</category>
 <pubDate>Wed, 19 Mar 2008 22:23:16 +0100</pubDate>
 <dc:creator>carlos</dc:creator>
 <guid isPermaLink="false">162 at http://www.dataprix.com</guid>
</item>
<item>
 <title>Caso de estudio: Business Intelligence aplicado a la banca</title>
 <link>http://www.dataprix.com/es/caso-de-estudio-business-intelligence-aplicado-la-banca</link>
 <description>&lt;p&gt;En estas diapositivas se presenta el caso de estudio de un banco que se plantea la necesidad de un mayor conocimiento de sus clientes para poder definir adecuadamente sus estrategias de negocio. Gracias a la utilizaci&amp;oacute;n de herramientas de Business Intelligence, en concreto de Data Warehouse y Data Mining, y a la definici&amp;oacute;n de unos claros objetivos de negocio, este banco pudo analizar el comportamiento de sus clientes, segmentarlos, tomar decisiones estrat&amp;eacute;gicas en funci&amp;oacute;n de este comportamiento, realizar predicciones y analizar los resultados de la aplicaci&amp;oacute;n de estas decisiones, valorando as&amp;iacute; el retorno de la inversi&amp;oacute;n. La presentaci&amp;oacute;n est&amp;aacute; estructurada en los siguientes apartados: - La econom&amp;iacute;a del negocio y la gesti&amp;oacute;n de clientes - Modelamiento de valor - Modelamiento de potencial - Segmentaci&amp;oacute;n - Modelamiento de deserci&amp;oacute;n - Aplicaciones pr&amp;aacute;cticas - Resultados&lt;/p&gt;
&lt;div style=&quot;width: 425px; text-align: left;&quot; id=&quot;__ss_48970&quot;&gt;&lt;object width=&quot;425&quot; height=&quot;355&quot; style=&quot;margin: 0px;&quot;&gt;&lt;/p&gt;
&lt;param value=&quot;http://static.slideshare.net/swf/ssplayer2.swf?doc=caso-de-estudio-banca-14898&quot; name=&quot;movie&quot; /&gt;
&lt;param value=&quot;true&quot; name=&quot;allowFullScreen&quot; /&gt;
&lt;param value=&quot;always&quot; name=&quot;allowScriptAccess&quot; /&gt;&lt;embed width=&quot;425&quot; height=&quot;355&quot; src=&quot;http://static.slideshare.net/swf/ssplayer2.swf?doc=caso-de-estudio-banca-14898&quot; allowscriptaccess=&quot;always&quot; allowfullscreen=&quot;true&quot; type=&quot;application/x-shockwave-flash&quot;&gt;&lt;/embed&gt;&lt;/object&gt;&lt;/p&gt;
&lt;div style=&quot;font-size: 11px; padding-top: 2px; font-family: tahoma,arial; height: 26px;&quot;&gt;&lt;a href=&quot;http://www.slideshare.net/?src=embed&quot; rel=&quot;nofollow&quot;&gt;&lt;img src=&quot;http://static.slideshare.net/swf/logo_embd.png&quot; alt=&quot;SlideShare&quot; style=&quot;border: 0px none ; margin-bottom: -5px;&quot; /&gt;&lt;/a&gt; | &lt;a href=&quot;http://www.slideshare.net/customersforever/caso-de-estudio-banca&quot; title=&quot;View &#039;Caso de Estudio - Banca&#039; on SlideShare&quot; rel=&quot;nofollow&quot;&gt;View&lt;/a&gt; | &lt;a href=&quot;http://www.slideshare.net/upload&quot; rel=&quot;nofollow&quot;&gt;Upload your own&lt;/a&gt;&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
</description>
 <comments>http://www.dataprix.com/es/caso-de-estudio-business-intelligence-aplicado-la-banca#comments</comments>
 <category domain="http://www.dataprix.com/es/knowledge">Gestión del conocimiento</category>
 <category domain="http://www.dataprix.com/es/businessintelligence">Business Intelligence</category>
 <category domain="http://www.dataprix.com/es/datacleansing">Limpieza de datos</category>
 <category domain="http://www.dataprix.com/es/data-quality">Calidad de datos</category>
 <category domain="http://www.dataprix.com/es/taxonomy/term/32">Agregación</category>
 <category domain="http://www.dataprix.com/es/taxonomy/term/35">Evaluación de modelos</category>
 <category domain="http://www.dataprix.com/es/datamining">Minería de datos</category>
 <pubDate>Thu, 06 Dec 2007 21:33:23 +0100</pubDate>
 <dc:creator>carlos</dc:creator>
 <guid isPermaLink="false">147 at http://www.dataprix.com</guid>
</item>
</channel>
</rss>
