Comprensión de datos

  1. Comprensión de Datos

Los resultados de la fase Comprensión de Datos por lo general son documentados en varios informes. Idealmente, estos informes serían los escritos mientras se estaban realizando las respectivas tareas. Los informes describen el conjunto de datos que es explorado durante la comprensión de datos.

Para el informe definitivo, un sumario de las partes más relevantes es suficiente.

Informe de colección de datos iniciales

Este informe describe como las diferentes fuentes de datos identificadas en el inventario fueron capturadas y extraídos.

Temas para ser cubiertos:

  • Contexto de datos

  • Lista de fuentes de datos con amplia área de cobertura de datos requeridos por cada uno

  • Para cada fuente de datos, método de adquisición o extracción

  • Problemas encontrados en adquisición de datos o extracción

Informe de descripción de datos

Cada conjunto de datos adquirido es descrito en este informe.

Temas para ser cubiertos:

  • Cada fuente de datos descrita detalladamente

  • Lista de tablas (puede ser sólo uno) u otros objetos de base de datos

  • Descripción de cada campo, incluyendo unidades, códigos usados, etc.

Informe de exploración de datos

  • Este informe describe la exploración de datos y sus resultados.

    • Temas para ser cubiertos:

    • Contexto, incluyendo los amplios objetivos de exploración de datos. Para cada área de exploración emprendida:

    • Las regularidades esperadas o patrones

    • Método de detección

    • Regularidades o patrones encontrados, esperados e inesperados

    • Cualquier otra sorpresa

    • Conclusiones para transformación de datos, limpieza de datos, y cualquier otro proceso previo

    • Conclusiones relacionadas con datos que extraen objetivos u objetivos de negocio

    • Sumario de conclusiones

Informe de calidad de datos

Este informe describe lo completo y la exactitud de los datos.

Temas para ser cubiertos:

  • Contexto, incluyendo amplias expectativas sobre calidad de datos. Para cada conjunto de datos:

    • Acercar tomas para evaluar la calidad de datos

    • Los resultados de evaluación de calidad de datos

    • Sumario de conclusiones de calidad de datos