Publica tu estudio o crea una presentación con R: slidify, R markdown y Rpubs

R se ha convertido, por méritos propios, en la plataforma Open Source por excelencia Fallecidoscuando hablamos de Data Science. La multitud de paquetes con los que cuenta, la interoperabilidad entre ellos y la legión de seguidores con los que cuenta le avalan. Facilita también la solución de problemas en R el saber que hay infinidad de foros y preguntas y respuestas de todo tipo que nos pueden orientar hacia el resultado deseado.

Conectando SAS y R

SAS

En los procesos de tratamiento de datos de los proyectos de Data Science es habitual encontrarse con la necesidad de conectar dos herramientas. Por ejemplo, podemos encontrarnos el caso de realizar la obtención y la preparación del dato en SAS y su modelización y análisis en R. Es una opción útil sobre todo si trabajamos con altos volúmenes de datos para los que R puede tener alguna limitación al trabajar en memoria. Haciendo el tratamiento previo en SAS podemos dejar la información depurada y agregada para R.

Data Science - Breve guía para interpretar modelos cluster

Análisis de clusterEn clustering se deja que los datos se agrupen de acuerdo a su similitud. Estos modelos son agrupaciones de segmentos -clusters- que contienen casos, tales como clientes, pacientes, autos, etc.

Una vez que un modelo de cluster es desarrollado, una pregunta emerge: ¿Cómo puedo describir mi modelo?

Aquí presentaremos una manera para acercarnos a la respuesta, a través de la implementación del Gráfico de Coordenadas in R (código disponible al final del post)..

Geo Data Science con R

El siguiente análisis está realizado con el lenguaje R y la libreria Google Vis para la visualización de gráficos. Es tan importante medir la esperanza de vida así como también la calidad de la misma. Se analizarán datos de eurostat basados en las variables Healthy life years y Life expectancy..

Aprendiendo a crear informes automáticos desde R con rmarkdown y knitr

Evento de R Automatic Report with rmarkdownLa semana pasada asistí a un encuentro de RugBcn, el Grupo de Usuarios de R de Barcelona, que tenía por objetivo mostrar cómo crear informes automáticos directamente desde R gracias a las librerías rmarkdown y knitr. El título del evento era 'Automatic Reporting with rmarkdown'.

El evento estuvo muy bien, y fue muy práctico, ya que pudimos comprobar con nuestros propios portátiles cómo funcionaban estas librerías para generar reports desde R.

Reseña de 'Practical Data Science Cookbook'

El libro Practical Data Science Cookbook es una introducción al mundo del Data Science a través de ejemplos prácticos en forma de recetas, que van enseñando cómo podría ser el proceso típico de analítica de datos que puede realizar un Científico de Datos con un entorno de analítica configurado para trabajar con el potente lenguaje de analítica y estadística R, o con el versátil lenguaje Python..

SAS, SPSS y R: Ejemplos de componentes para tratamiento de datos. Equivalencias entre herramientas

Equivalencias entre SAS, SPSS y RExisten en el Mercado numerosas herramientas para tratamiento de datos. En este post, nos vamos a centrar en algunas de las más utilizadas: SAS, SPSS y R. Sin entrar a valorar la mejor o peor adecuación de cada una de ellas al tipo de proyecto en el que trabajemos, sus ventajas o sus inconvenientes,  lo que es evidente es que son tres herramientas muy extendidas. 

 

Reseña de Big Data Analytics with R and Hadoop

Big DataEstos días he estado leyendo el libro Big Data Analytics with R and Hadoop, de Vignesh Prajapati, un libro que explica cómo integrar el paquete de análisis estadístico R y la plataforma de Big Data Apache Hadoop, para romper la barrera de la mayor limitación de R, que es la limitada cantidad de datos que acepta como juegos de datos para procesar.

Combinando estas dos herramientas open source se obtiene una potente plataforma de analítica, con la que se pueden aplicar operaciones de estadística e inteligencia artificial sobre grandes conjuntos de datos..