BI: AnalisisBI

Distribuir contenido
Tecnologías, Metodologías, Opiniones, Eventos, Herramientas, Evaluaciones, Recomendaciones, Noticias, Modelos, Mejores Prácticas, Análisis, y mucho más relacionado con el mundo de Business Intelligence.
Actualizado: hace 2 días 5 horas

Data Quality v/s Data Cleansing

18 Noviembre, 2008 - 20:40
Existen varios términos para denominar el tratamiento de datos.

Quiero explicar la diferencia entre Data Quality y Data Cleansing, está en que la calidad de datos se inserta en un proceso constante, destinado a mejorar la calidad de datos de las bases operacionales o de información a través del tiempo. La limpieza de datos por lo general se aplica al un evento puntual como es el mejoramiento de la calidad de un conjunto de datos que será utilizado para elaborar un modelo de data mining por ejemplo, pero que no representa una mejora contínua sino específica.

SQL Server 2005 SP3 - CTP

3 Noviembre, 2008 - 17:18
Está disponible para la comunidad el Services Pack 3 de SQL Server 2005.

Contiene todas las actualizaciones acumulativas para SQL Server 2005 y algunos arreglos. Principales mejoras en los servicios de Notificación y de Reportes

Integración de SSRS para generar reportes de BD Teradata,

Descarga: SQL Server 2005 SP3 - CTP.
Que es lo nuevo?:  WhatsNewSQLServer2005SP3.

Paper Agile Business Intelligence Governance

28 Octubre, 2008 - 00:07
Comparto un paper muy interesante de Jorge Fernández González sobre Agile Business Intelligence Governance, el cual presenta una propuesta de cómo "gobernar los sistemas de BI reduciendo el gap entre IT y el negocio", considerando tres factores en IT: Business Intelligence, IT Governance y Metodologías Ágiles.

Jorge es autor y mantenedor del blog Sistemas Decisionales, algo mas que Business Intelligence. Como bonus dejo un video de Jorge en una conferencia en Madrid sobre el mismo tema.

Links:

TCO en BI

24 Octubre, 2008 - 22:41
¿Qué es el TCO?, es la sigla en inglés de Total Cost of Ownership que para proyectos BI suele ser alto en comparación con otros tipos de proyectos o tecnologías. Recordemos que BI ya no es una ventaja sino una obligación.

En los proyectos de BI se involucra una variedad de elementos que deben estar alineados para guiar un proyecto BI exitoso como por ejemplo:
  • Hardware: máquinas (servidores), estaciones, infraestructura, almacenamiento, etc.
  • Software: tenemos las licencias de la suite, contrato(s) proveedor(es) de proyectos nuevos y de mantención, además de las licencias de todas aquellas suites que utilicemos en las diferentes etapas Recolección y Carga de datos; almacenamiento y procesamiento; presentación de información, generación de conocimiento, etc.
  • Recursos Humanos, las capacidades técnicas y otras habilidades de los profesionales de business intelligence, con conocimentos en tecnologías, con habilidades tanto técnicas como personales. Con competencias en análisis de información, y por supuesto la capacidad de entender y aprender del negocio para el cual la solución final será utilizada.
Los costes de hardware, software y recursos humanos son base para el desarrollo de un proyecto que por lo general considera varias etapas como por ejemplo: análisis de las necesidades de información (requerimientos), análisis de las fuentes de datos, análisis de la calidad de datos, diseño del/los modelo(s) de datos de la(s) solución(es) y del modelo de entrega de información, perfilamiento de usuarios, capacitación de usuarios, etc., etc., etc.

Dependiendo del tamaño, alcance, impacto en el negocio, prioridad, urgencia, etc. del proyecto los costos y recursos necesarios varían pero el alto costo es un factor constante, "no importa lo qué necesites, eso te costará", y esto es debido a la importancia que representa conocer el negocio de una compañía y a la criticidad de la información oportuna para la toma de decisiones.

El TCO es el mismo usando una Suite BI de licencia propietaria que utilizando una Suite Open Source?, ¿cuál es el costo real de implementar soluciones BI basadas en tecnologías Open Source?, o de ¿Adquirir soluciones BI como servicios?.

Preguntas abiertas:
  1. ¿Qué otros factores determinan el costo de un proyecto BI?
  2. ¿Podemos lograr lo mismo con tecnologías Open Source?
  3. ¿Podemos comparar hoy (Google Docs + Panorama) v/s (Microsot BI + MS Excel), o debemos esperar unos meses más?
Siéntase libre de dejar sus comentarios y/o preguntas.

Cuadrante Mágico Gartner de Integración de Datos

20 Octubre, 2008 - 19:38
Les dejo el Cuadrante Mágico de herramientas de Integración de Datos de Gartner, con fecha 22 de septiembre de 2008. El informe califica varias herramientas de acuerdo a sus capacidades y características y una breve descripción de cada vendedor.

La integración de datos es un proceso clave en inteligencia de negocios, apunta a automatizar las tareas de recolección de datos estructurados y "no estructurados" (como si los emails no tuvieran emisor, receptor, cuerpo, firma, etc.) permitiendo analizar los datos transversalmente independiente de los orígenes de los datos.

SAS acostumbra a difundir algunos informes de Gartner en materias de Aplicaciones Analíticas de Negocio. Estaremos pendientes de los próximos.

Visto en Intelligent Enterprise.

Frase BI 004

3 Octubre, 2008 - 04:36
"Nothing is more difficult, and therefore more precious, than to be able to decide".

"Nada es más difícil, y sin embargo más apreciado, que ser capaz de decidir".

- Napoleón Bonaparte.

Frase BI 005

30 Septiembre, 2008 - 16:53
“- So, what does exactly the word table mean?
- Ah, that’s just acronym for two-dimensional cube!
(From conversation of two DBAs in 2000)

"- Entonces, ¿qué significa exactamente la palabra tabla?.
- Ah, es simplemente un acrónimo para un cubo de dos dimensiones!"
(De una conversación entre dos DBAs en el 2000)

Vista en MDX for Everyone.

MDX Studio

22 Septiembre, 2008 - 21:13
MDX Studio es una herramienta para los desarrolladores de cubos en Microsoft Analysis Services, permite analizar (complejas) expresiones MDX, monitorear rendimiento e interactuar con el modelo de datos y sus relaciones, además provee de una representación de visualización de MDX.

Se puede descargar la última versión 0.4.7, trae varias mejoras y nuevas utilidades como el trace profiling que permite ver el costo de las consultas MDX. También hay una versión de MDX Studio Online.

Una de las mejoras de esta versión es el botón Reconnect (que reemplaza al botón Disconnect) que hace más simple la reconexión al cubo cuando es actualizado en el servidor, aunque no guarda el string de conexión, es decir, no recuerda el catálogo ni el cubo al que estaba conectado, Mosha lo tendrá presente para la próxima versión.

Mosha Paasumansky actualmente es arquitecto de MS Analysis Services y uno de los
inventores del lenguaje MDX, el lenguaje de consultas multidimensionales
que ha resultado ser uno de los estándares de facto para consultas OLAP o a bases de datos multidimensionales.

Acá les dejo un link al (excelente) tutorial MDX Essentials de Database Journal sobre MDX, aunque está hecho para SQL Server 2000 lo pueden seguir sin problemas con MDX Studio y SSAS.

MDX Studio me ha resultado muy útil, y es totalmente recomendable!.

Frase BI 003

8 Septiembre, 2008 - 16:55
"La Inteligencia está en los Datos, no en el Software"

"The Intelligence is in the Data, not the Software"

Leída en Data Doghouse.

HEFESTO Datawarehousing

4 Septiembre, 2008 - 15:50
Desde Dataprix anuncian la publicación de una metología llamada Hefesto para construcción de un Data Warehouse por Ricardo Dario Bernabeu, con licencia de Documentación Libre GNU.

El documento incluye dos secciones bien diferenciadas y no dependientes entre sí, la primera parte es recomendada para quienes quieran aprender un poco más sobre Business Intelligence o repasar algunos conceptos, ya que otorga un adecuado resumen sobre los principales conceptos manejados en Inteligencia de Negocios. La segunda es una guía, de alto nivel además de flexible, para el desarrollo de un almacen de datos a partir de las necesidades de información que se recolecten durante el proceso y además un ejemplo aplicado en el primer apéndice.


Pueden descargar el documento de Metodología Hefesto en pdf.

Felicitaciones por este ejercicio de difusión y aporte al mundo de la Inteligencia de Negocios.

Fuente: Dataprix

Dashboards Videos

16 Agosto, 2008 - 21:11
En Dashboards.tv publican videos sobre Dashboards y Business Intelligence. La independencia de las Suites de BI y PM lo convierte en una recopilación interesante de videos comerciales y tutoriales visuales para quien desee conocer un poco mejor el apasionante mundo del BI. Entre los temas hablan de herramientas, KPIs, etc.

Dashboard.tv es parte del sitio DashboardSpy Network que publica contenido relacionado a tableros de control principalmente.

Y un tercer recurso para aprender sobre Dashboards es Dashboards by Example que publica dashboards aplicados bastante útil para sacar algunas ideas y si tienes algo construido lo puedes enviar, el material es de excelente calidad.

Fuente: Dashboard Spy.

Recursos MS BI

12 Agosto, 2008 - 15:18
El sitio Learn Microsoft BI disponibiliza video tutoriales para quien quiera aprender un poco más sobre BI, también hay videos sobre el uso de las herramientas MS como SSIS, SSAS y SSRS.El registro es gratuito. Obviamente poner al alcance los tutoriales genera una vitrina importante a ojos de quien desee adquirir alguna suite de BI para mejorar el proceso de toma de decisiones.

Fuente: Miky Schreiber's Blog

Dimension Fecha

31 Julio, 2008 - 18:48
Sí, dimensión Fecha y NO dimensión Tiempo (es cosa de gustos), por lo general se conoce como dimensión tiempo pero prefiero nombrarla "Date Dimension", si bien permite que los datos sean analizados a través del tiempo, los registros de esta dimensión por lo general son fechas (días). Explicaré la diferencia.

Kimball hace este cambio y aclaración en la segunda versión de su libro The Datawarehouse Toolkit, para no confundir con la dimensión Tiempo (o dimensión Hora) que permite analizar por horas y minutos además.

Es mejor tener 2 dimensiones distintas para el análisis temporal, la dimensión Fecha y la dimensión Tiempo (se puede colocar el nombre que guste lo importante es el contenido).

Si almacenamos 20 años la dimensión Fecha tendrá 7.300 registros (365 x 20) con una granularidad de día y la dimensión Tiempo tendrá 1.440 registros (60*24) con una granularidad de minutos. Además en nuestras Facts Tables debemos dejar 2 columnas para el cruce con cada una de estas dimensiones.

Si dejáramos todo en una sola dimensión Tiempo, ésta tendría 10.512.000 registros, pueden sacar sus propias conclusiones...

La dimensión Tiempo (Hora o cómo se quiera llamar) es útil cuando se desea análizar tráfico de red, comportamiento en sitio web, llamadas telefónicas, ventas por horas, etc.

Como dato aparte, en Haciendo Cubos se hace un buen ejemplo de uso de la gráfica de radar para analizar datos horarios.

Busqueda con el motor de Google

Google