Diseño de esquemas y modelos de datos escalables — normalización, desnormalización y modelos por acceso

Buen diseño y mal diseño de esquemas

El diseño de esquemas de datos es la decisión arquitectónica más duradera y costosa de modificar en cualquier plataforma. Este capítulo desmitifica el dilema normalización vs desnormalización, proporcionando criterios cuantitativos basados en patrones de acceso reales, no en dogmas académicos.
Aprenderás cuándo y cómo aplicar particionado, sharding e índices estratégicos para escalar sin re-arquitecturas dolorosas. Incluye un caso real donde el rediseño basado en patrones de acceso redujo la latencia de 2.3s a 180ms (92% de mejora) y los costes de infraestructura en 48%, junto con checklists operativos, antipatrones documentados y frameworks de decisión para CIOs, arquitectos e ingenieros que necesitan que sus sistemas escalen sin colapsar..

SAS proporciona a sus clientes una visión más completa de la información crítica usando soluciones desarrolladas especialmente para EMC Greenplum

 

SAS implementará su oferta en plataformas de alto rendimiento analítico con el lanzamiento de SAS High-Perfomance Analytics, que estará disponible para bases de datos EMC.

Los clientes quieren poder modelizar sus datos en todos los departamentos y escenarios para conseguir mayor precisión y una visión integral de sus negocios y poder tomar decisiones basadas en datos. Esta nueva oferta de SAS para EMC Greenplum Data Computing proporcionará a los clientes un entorno donde realizar la explotación analítica y de la totalidad de sus datos...

Completo mapa 'interactivo' de introducción a la Minería de Datos

Mapa Interactivo de proceso de Minería de DatosEn la web de Universidad de Toronto se puede encontrar este práctico Mapa de Introducción al Data Mining, en el se muestran organizadas las diferentes fases habituales de un proceso de Minería de Datos, y las técnicas o algoritmos que se pueden utilizar en cada fase.

Cada fase, agrupación o algoritmo está representado en un botón en el que se puede hacer click y llegar a una página de detalle del mismo...

El tutorial de Datamining con RapidMiner ya está completo

 

Pantalla de proceso de Datamining con RapidMiner

Ya hemos completado la publicación del Tutorial online de RapidMiner 5.0, una de las mejores herramientas Open Source para minería de datos, que además dispone de versiones Enterprise.

 

Este tutorial muestra los conceptos básicos de RapidMiner y las configuraciones de procesos simples que se pueden realizar. Se muestra cómo se puede realizar cada proceso de datamining mediante un ejemplo que detalla los pasos a seguir..