Mineria de datos
Google Public Data Explorer
Justo he empezado a utilizar
Google Public Data Explorer. Que es? Pues en principio y para mi es un {generador | analizador} de tendencias. Sobre todo teniendo en cuenta que la herramienta es capaz de mostrar el comportamiento de un conjunto de datos en un escenario de manera sensible al tiempo.
Aun no he experimentado con ella como para poder dar una opinión; si hablo de ella aqui y justo ahora no es mas que para comunicar su existencia. Estoy seguro de que llegará a ser una herramienta valorada por profesionales con responsabilidades sobre ventas y marketing y justo ahora se está empezando a conocer.
Estoy convencido de que estamos ante la primera versión de una herramienta que promete, sobre en manos de google, que es quien tiene la mina (de los datos).
Data Mining 2010 - Descontento general
Actualmente estoy cursando un máster en MKT relacional, directo e interactivo en (escuela de marketing anónima). Este año, como novedad, incluyeron un módulo en Data Mining. A mí en lo particular me entusiasmaba muchísimo este modulo, creo que es muy importante poder manejar una gran cantidad de datos para luego presentarlos de una forma útil. Además, no conozco a muchas personas que gestionen proyectos de Data Mining y esta era la forma más inmediata con la que contaba.
El módulo ha durado aproximadamente un mes y medio, mes y medio en el cual los responsables de (escuela de marketing anónima) han intentado meter en un módulo tan concreto tal cantidad de información que nos hemos quedado todos únicamente con pinceladas . No ha habido tiempo para profundizar en ningún tema. Y desgraciadamente hemos tenido profesores que han llegado a la clase comentándonos que no nos podían contar en dos horas lo que han estudiado en 15 años. No creo que sea la forma correcta de presentarse ante alumnos que deseamos aprender y además que pagamos cifras muy altas para recibir una formación de los mejores profesionales en áreas específicas.
No tengo ninguna queja del tutor del curso, quien ha estado siempre a nuestra disposición. Como recomendación para futuros cursos, no creo que sea conveniente mezclar a un grupo que está cursando un máster con alumnos que quieran hacer un modulo especifico. Los alumnos del máster ya vienen con conocimientos adquiridos de los módulos anteriores y tener que explicarles cierto temas a los alumnos que vienen a un modulo especifico únicamente retrasa el aprendizaje del los alumnos del máster.
Con esta reflexión no estoy diciendo que no aprendí nada, solo quiero dejar claro que este módulo se podría modificar para que en un futuro los alumnos que lo cursen puedan aprovecharlo al 100%.
Actualización 15 de febrero 2010
Después de recibir un email enviado por una compañera de máster en donde comentaba todos los puntos negativos que encontró durante el módulo de Data mining, tanto , Director General del centro como el tutor del módulo de Data mining se han comprometido a estudiar la situación y entender bien como y donde se origino el problema para aplicar las medidas necesarias para futuras convocatorias.
Actualización 16 de Enero:
He decidido omitir el nombre de la institución ya que de momento sigo cursando aqui el master y no creo conveniente que se le de más vueltas a este problema. Los encargados del curso ya se han comprometido a mejorar sus servicios. Este clase de reacción es la que cualquier consumidor espera al pagar por un servicio de calidad.
DATA MINING - QUE ES UNA BASE DE DATOS
Para simplificar, una base de datos puede definirse como una caja dotada de una memoria viva, que puede evolucionar, a la demanda, con arreglo a las necesidades de la empresa, los nuevos parámetros, de las nuevas informaciones. Contrariamente a los ficheros tradicionales, proporcionan la maleabilidad necesaria para enriquecerse de manera permanente de fuentes exteriores. Presenta otra ventaja mayor: la flexibilidad de acceso. En efecto las bases de datos disponen de instrumentos de interrogación que le permiten al utilizador efectuar él mismo sus demandas sin movilizar todo un servicio informático.
Analizar, escoger, clasificar los comportamientos de consumo, luego “transformarlos” en acciones de marketing, eso es el papel de los bases de datos (data warehouse) y técnicas de análisis (datamining). Hoy, el 80 % de las empresas del otro lado del Atlántico utilizan este tipo de soporte para trabajar la fidelización. En Francia el 30 % solamente, pero con una aceleración fuerte estos últimos años.
¿Cuáles son las informaciones útiles, y cómo compilarlas?
Los progresos tecnológicos y la multiplicación de las fuentes de información (cartas de fidelidad, cuestionarios, paneles, cupones, centros de llamadas, promociones, etc.) permiten recolectar hasta 200 datos por cliente.
Las bases de datos de las grandes marcas almacenan por lo menos dos años de comportamientos de compra en millares de productos y varios puntos de venta. Toda la dificultad es de explotar bien estas informaciones muy rápidamente obsoletas. Una técnica que Danone domina perfectamente: tres millones de clientes segmentados, según su afecto a la marca, reciben mailing personalizados. El primer pasó hacia el one-to-one.
Ciclo en Espiral, una alternativa a CRISP-DM
Un proyecto de minería de datos difiere mucho de cualquier otro proyecto en donde se aplique alguna tecnología de la información, inclusive de cualquier otro tipo de proyecto de Business Intelligence. Un proyecto de minería de datos no termina con la instalación y configuración del producto a utilizar. La minería de datos es un proceso de aprendizaje, y como tal, es constante y progresivo, basándose en este principio, existe una técnica denominada “Ciclo de vida en espiral”, una metodología alternativa a CRISP-DM.
Al igual que un proceso de aprendizaje, desde el inicio, no se debería pretender a abordar todos los aspectos que se desean estudiar/mejorar dentro de la organización. La propuesta es elegir los aspectos o necesidades más claros y relevantes y, posteriormente, logrados estos objetivos, plantearse otros.
La primera “ronda” de este proceso cíclico, puede constituir a un denominado proyecto “piloto”, a medida que el programa avance se puede ir identificando y definiendo problemas más ambiciosos ¿Cuánto debería durar el primer ciclo?, se sugiere que no debería esperarse más de seis meses para obtenerse los primeros resultados
Referencia: Introducción a la Minería de Datos ( José Hernández Orallo)
aníbal goicochea
We feel fine - Analizando los sentimientos de la raza humana
No recuerdo cómo encontré la página de “We feel fine” (www.wefeelfine.org) pero lo que si recuerdo es que la guardé en mis favoritos porque se me hizo muy interesante. Esta página analiza millones de Blogs todos los días y extrae frases de los mismos para entender los sentimientos de los seres humanos de manera agregada.
Específicamente, este software/algoritmo/herramienta busca la frase “I feel”en miles de Blogs cada minuto. Una vez que encuentra estas frases las graba en un servidor con la ubicación, sexo y edad del autor. Posteriormente un software clasifica cada enunciado en sentimientos específicos que incluyen alegría, tristeza, miedo, esperanza y otros 5000 sentimientos “predefinidos”. Finalmente, esta página nos muestra la información de manera consolidada como una obra de arte con todos los pensamientos de los seres humanos flotando en un océano de sentimientos.
“I feel so paceful at airports”
“I love how I feel today”
“I feel weird”
“I feel strong and centered”
¿Somos más tristes cuando llueve? ¿Quiénes son más felices… los hombres o las mujeres? ¿Los jóvenes o los ancianos? Esta página de Internet nos permite responder estas preguntas ya que la base de datos se encuentra disponible para todo el mundo.
Si tienen tiempo libre, esta es una forma interesante de perderlo.


