Big Data: volumen, velocidad y variedad
- Lee más sobre Big Data: volumen, velocidad y variedad
- Inicie sesión para enviar comentarios
Desde el punto de vista puramente técnico, se denomina Big Data a los sistemas de información que sobrepasan las capacidades de las tecnologías tradicionales basadas principalmente en base de datos relacionales.
Las características de la información que hace que se requiera esta nueva tecnología son principalmente 3: Volumen, Velocidad y Variedad..
Data science: caso aplicado a sector retail (análisis cesta de la compra)
Existen múltiples aplicaciones de business analytics para el sector retail. Desde diferentes perspectivas los sistemas de business intelligence ayudan cuestiones críticas para el negocio, como pueden ser:
- Analizar clientes (segmentación, captación, retención, fidelización)
- Optimizar precios (elasticidad, pricing)
- Procesos de previsión de la demanda y previsión de ventas
- Análisis de las redes de distribución, transporte y almacenamiento
- Control geográfico de redes comerciales de gran capilaridad
- Seguimiento transacciones de venta (análisis productos y cesta de la compra)
En este post vamos a centrarnos en los procesos de análisis de cesta de la compra, realizando un rápido ejemplo..
Conectando SAS y R
- Lee más sobre Conectando SAS y R
- Inicie sesión para enviar comentarios


En los procesos de tratamiento de datos de los proyectos de Data Science es habitual encontrarse con la necesidad de conectar dos herramientas. Por ejemplo, podemos encontrarnos el caso de realizar la obtención y la preparación del dato en SAS y su modelización y análisis en R. Es una opción útil sobre todo si trabajamos con altos volúmenes de datos para los que R puede tener alguna limitación al trabajar en memoria. Haciendo el tratamiento previo en SAS podemos dejar la información depurada y agregada para R.
Data Science - Breve guía para interpretar modelos cluster
- Lee más sobre Data Science - Breve guía para interpretar modelos cluster
- Inicie sesión para enviar comentarios
En clustering se deja que los datos se agrupen de acuerdo a su similitud. Estos modelos son agrupaciones de segmentos -clusters- que contienen casos, tales como clientes, pacientes, autos, etc.
Una vez que un modelo de cluster es desarrollado, una pregunta emerge: ¿Cómo puedo describir mi modelo?
Aquí presentaremos una manera para acercarnos a la respuesta, a través de la implementación del Gráfico de Coordenadas in R (código disponible al final del post)..
Data Science - Análisis dinámico de outliers con R
- Lee más sobre Data Science - Análisis dinámico de outliers con R
- 1 comentario
- Inicie sesión para enviar comentarios
Los outliers, (o "valores extremos"), son un tema siempre presente cuando se analizan datos, sin importar el origen de los mismos. Aquí se presenta un análisis didáctico y visual hecho con el lenguaje R..
Aprendiendo a crear informes automáticos desde R con rmarkdown y knitr
La semana pasada asistí a un encuentro de RugBcn, el Grupo de Usuarios de R de Barcelona, que tenía por objetivo mostrar cómo crear informes automáticos directamente desde R gracias a las librerías rmarkdown y knitr. El título del evento era 'Automatic Reporting with rmarkdown'.
El evento estuvo muy bien, y fue muy práctico, ya que pudimos comprobar con nuestros propios portátiles cómo funcionaban estas librerías para generar reports desde R.
Reseña del libro 'Mastering Machine Learning with scikit-learn'
- Lee más sobre Reseña del libro 'Mastering Machine Learning with scikit-learn'
- Inicie sesión para enviar comentarios
El libro Mastering Machine Learning with scikit-learn, de la editorial Packt, revisa los principales conceptos y algoritmos de aprendizaje automático (Machine Learning), llevándolos a la práctica con ejemplos para implementar con la librería de Python scikit-learn, una de las más utilizadas en aprendizaje automático.
En el primer capítulo, The Fundamentals of Machine Learning, se revisan los principales conceptos relacionados con el aprendizaje automático, en qué consiste, cómo se clasifican los principales algoritmos de aprendizaje, y cómo se aplican. En este capítulo se aprende a diferenciar los algoritmos de aprendizaje supervisado de los de aprendizaje no supervisado, cómo se utilizan los datos de entrenamiento, los de pruebas o test, y cómo se evalúan los modelos con medidas de rendimiento..

