Reseña del libro 'Mastering Machine Learning with scikit-learn'

Libro Mastering Machine Learning with Scikit-learnEl libro Mastering Machine Learning with scikit-learn, de la editorial Packt, revisa los principales conceptos y algoritmos de aprendizaje automático (Machine Learning), llevándolos a la práctica con ejemplos para implementar con la librería de Python scikit-learn, una de las más utilizadas en aprendizaje automático.

En el primer capítulo, The Fundamentals of Machine Learning, se revisan los principales conceptos relacionados con el aprendizaje automático, en qué consiste, cómo se clasifican los principales algoritmos de aprendizaje, y cómo se aplican. En este capítulo se aprende a diferenciar los algoritmos de aprendizaje supervisado de los de aprendizaje no supervisado, cómo se utilizan los datos de entrenamiento, los de pruebas o test, y cómo se evalúan los modelos con medidas de rendimiento..

Completo mapa 'interactivo' de introducción a la Minería de Datos

Mapa Interactivo de proceso de Minería de DatosEn la web de Universidad de Toronto se puede encontrar este práctico Mapa de Introducción al Data Mining, en el se muestran organizadas las diferentes fases habituales de un proceso de Minería de Datos, y las técnicas o algoritmos que se pueden utilizar en cada fase.

Cada fase, agrupación o algoritmo está representado en un botón en el que se puede hacer click y llegar a una página de detalle del mismo...

Resumen de Minería de Datos Aplicada a la Búsqueda de Perfiles de Alumnos

Aplicación de técnicas de minería de datos basadas en clustering para la búsqueda de perfiles de los alumnos según su rendimiento académico, situación demográfica y socio económica. 

El objetivo principal de este trabajo es encontrar perfiles de alumnos por medio de la aplicación de técnicas de minería de datos a un data warehouse con datos académicos, socio económico y demográfico correspondientes a alumnos de Sistemas Operativos de la Licenciatura en Sistemas de Información de la FACENA de la UNNE.

Soluciones de Business Intelligence

Soluciones de Business IntelligenceDe acuerdo a su nivel de complejidad se pueden clasificar las soluciones de Business Intelligence en:

•Consultas e informes simples (Querys y reports): mediante consultas sobre la base de datos o con herramientas de generación de informes, podemos obtener información simple en multiples formatos. Serían las herramientas que nos permiten que el usuario se construya sus propios reportes. Es el nivel mas simple de solución dentro del BI. Por ejemplo, un informe típico podrían ser las ventas por familia, por zona geográfica, el número de empleados y coste salarial por delegación, etc. Estaría destinado a usuarios con una aptitud técnica limitada y orientado a analizar de una forma sencilla tipo foto la información histórica. Los generadores de informes son cada vez mas avanzados, permitiendonos definir multiples formatos de presentación, definición de filtros, exportación de los datos obtenidos a multiples formatos (excel, pdf, etc), plantillas, campos calculados, totalización, agrupación, etc. Nos permitirian contestar a la pregunta “¿que sucedio?”.

 

Tareas en datamining

 Conviene categorizar las distintas tareas que se pueden realizar en datamining dependiendo de los objetivos que se persigan:

 

-          Análisis exploratorio de datos (EDA). Son técnicas para explorar descriptivamente los datos. Generalmente son técnicas interactivas y visuales o de componentes principales.

Minería de Datos Aplicada a la EPH Encuesta Permanente de Hogares

EHPCon la denominada sociedad de la información se está produciendo un fenómeno curioso, día a día se multiplica la cantidad de datos almacenados. Sin embargo, contrariamente a lo que pudiera esperarse, esta explosión de datos no supone un aumento de nuestro conocimiento, puesto que resulta imposible procesarlos con los métodos clásicos.

La información que se genera diariamente dentro de la organización es uno de sus activos principales, por lo que se debe orientar los recursos tecnológicos de manera que ayuden a los ejecutivos a tomar decisiones estratégicas y oportunas.

La capacidad de solucionar problemas de decisión, y la calidad de las decisiones tomadas, tienen grandes repercusiones en la organización y en su correcto funcionamiento, de modo que actualmente las organizaciones se enfrentan a la paradoja de que, cuantos más datos están disponibles, menos información se tiene.

Para enfrentar estos problemas, en los últimos años han surgido una serie de técnicas que facilitan el procesamiento avanzado de los datos y permiten realizar un análisis en profundidad de los mismos de forma automática. La idea clave es que los datos contienen más información oculta de la que se ve a simple vista....