Dataprix | El portal sobre software empresarial

Data Science

Plataformas y software para Data Science y AI

Lee más sobre Analitica de datos de Twitter con hojas de cálculo de Google: Hashtags influyentes de un topic
Inicie sesión para enviar comentarios

En el primer artículo de esta serie tratamos cómo obtener datos de Twitter desde triggers o disparadores. En este punto deberíamos empezar a pensar qué campos incluimos en nuestro análisis e ir estudiando el formato de los mismos.

Para ello, recomendamos consultar la página de desarrollo de la API de Twitter, donde se enumeran todos los campos generados por cada tweet y su formato exacto.

En nuestro caso hemos definido un trigger que nos guarda una fila por cada nuevo tweet con el hashtag #datascience y con un número de retweets mayor a 5..

Lee más sobre Obtén el máximo rendimiento de Tableau con ClearPeaks
Inicie sesión para enviar comentarios

Que Tableau se está convirtiendo en una herramienta de referencia en el mundo de la Logo de Tableau visualización de datos no es una afirmación que vaya a resultar novedosa. El porqué de ello y las posibilidades que ofrece quizás sean un objeto más profundo de discusión.

Lee más sobre Data science: caso aplicado a sector retail (análisis cesta de la compra)
1 comentario
Inicie sesión para enviar comentarios

Existen múltiples aplicaciones de business analytics para el sector retail. Desde diferentes perspectivas los sistemas de business intelligence ayudan cuestiones críticas para el negocio, como pueden ser:

Analizar clientes (segmentación, captación, retención, fidelización)
Optimizar precios (elasticidad, pricing)
Procesos de previsión de la demanda y previsión de ventas
Análisis de las redes de distribución, transporte y almacenamiento
Control geográfico de redes comerciales de gran capilaridad
Seguimiento transacciones de venta (análisis productos y cesta de la compra)

En este post vamos a centrarnos en los procesos de análisis de cesta de la compra, realizando un rápido ejemplo..

Lee más sobre Data Science con datos de Twitter: Obtención de datos de Twitter
Inicie sesión para enviar comentarios

Twitter, la red social de los 140 caracteres, se ha convertido en una fuente imprescindible para los que buscan tendencias locales o globales. No sólo eso, sino que podemos encontrar rápidamente los personajes o ideas más influyentes en dicha red analizando los datos que nos proporciona la API de Twitter.

Este artículo pretende darnos unas primeras nociones sobre el paso inicial en el análisis de datos de Twitter, que no es otro que obtener los datos con los que trabajar desde la conocida red social.

Lee más sobre Facetas del Data Scientist
Inicie sesión para enviar comentarios

Las facetas del científico de datos - DataScience La figura del data scientist es clave para ser capaz de ir de los datos a la información, y de la información a la decisión.

El data scientist tiene tres facetas principales: técnica, analítica y funcional..

Lee más sobre Publica tu estudio o crea una presentación con R: slidify, R markdown y Rpubs
1 comentario
Inicie sesión para enviar comentarios

R se ha convertido, por méritos propios, en la plataforma Open Source por excelencia Fallecidos cuando hablamos de Data Science. La multitud de paquetes con los que cuenta, la interoperabilidad entre ellos y la legión de seguidores con los que cuenta le avalan. Facilita también la solución de problemas en R el saber que hay infinidad de foros y preguntas y respuestas de todo tipo que nos pueden orientar hacia el resultado deseado.

Lee más sobre Recursos Open Data, para trabajar con datos abiertos
Inicie sesión para enviar comentarios

Open Data no es, en absoluto, algo nuevo. Este movimiento fomenta la
apertura de datos de diversa índ Fallecidos ole para su posterior utilización de manera libre. Ya en 2010 conseguía uno de sus primeros hitos con la liberación de una licencia para la libre utilización de datos del Archivo Nacional del Reino Unido. Esta misma web, en 2011, dedicaba un interesante artículo explicando en qué consiste Open Data y se citaba una lista de sitios con recursos abiertos.

Para el Data Scientist o científico de datos actual la liberación de datos supone un pilar fundamental de su trabajo y una fuente inagotable de la que obtener información.

Lee más sobre Conectando SAS y R
Inicie sesión para enviar comentarios

SAS

En los procesos de tratamiento de datos de los proyectos de Data Science es habitual encontrarse con la necesidad de conectar dos herramientas. Por ejemplo, podemos encontrarnos el caso de realizar la obtención y la preparación del dato en SAS y su modelización y análisis en R. Es una opción útil sobre todo si trabajamos con altos volúmenes de datos para los que R puede tener alguna limitación al trabajar en memoria. Haciendo el tratamiento previo en SAS podemos dejar la información depurada y agregada para R.

Lee más sobre Data Science - Breve guía para interpretar modelos cluster
Inicie sesión para enviar comentarios

Análisis de cluster En clustering se deja que los datos se agrupen de acuerdo a su similitud. Estos modelos son agrupaciones de segmentos -clusters- que contienen casos, tales como clientes, pacientes, autos, etc.

Una vez que un modelo de cluster es desarrollado, una pregunta emerge: ¿Cómo puedo describir mi modelo?

Aquí presentaremos una manera para acercarnos a la respuesta, a través de la implementación del Gráfico de Coordenadas in R (código disponible al final del post)..

Lee más sobre Analisis predictivo en SAS: árboles de decisión
7 comentarios
Inicie sesión para enviar comentarios

Una de las técnicas más utilizadas dentro del análisis predictivo son los árboles de decisión. Esta técnica tiene múltiples aplicaciones en el campo de la estadística, pero nos vamos a centrar en su uso para realizar predicciones, concretamente obtener probabilidades de eventos. En este post revisamos una posible forma de hacerlo con el software de uno de los principales fabricantes del software de business analytics: SAS

Prueba Semrush gratis 14 días!