Yo de mayor quiero ser científico de los datos

Parece ser que ahora la profesión de moda es científico de datos. Después de convencernos de que lo más guay era el big data, y de que los especialistas en Big Data tienen el futuro asegurado, ya que todas las empresas están buscando expertos en Big Data para no quedarse atrás frente a sus competidores, alguien se ha dado cuenta de que el término ha cuajado muy bien, pero estamos hablando de una profesión y no tenemos un nombre para ella, porque Experto en Big Data es un poco rebustado.

Data Science con R y RStudio

Analisis de datos con RStudio

Así, lo mejor es inventarnos un nuevo nombre que sea igual de impactante o más, algo así como Data Science, y así ya tenemos un buen nombre para la profesión. Data Scientist o Científico de Datos, que es alguien que no tiene porqué ser científico, pero que como investiga mucho con datos, se va a ganar el atributo. Bueno, en algún sitio también hablan de Big Data Scientist, para que no falte de nada.

Yo sigo pensando que a mi las descripciones que he visto sobre esta ‘nueva profesión’ me suenan mucho, mucho, mucho, no me parece algo tan nuevo. Concretamente, yo diría que el científico de datos se parece mucho a un experto en Minería de datos, por no decir que es lo mismo, y no acabo de ver la diferencia entre el clásico Data Mining y el Data Science, aparte de que en estos años han aumentado mucho las fuentes de datos, la capacidad de procesamiento, las herramientas de analítica y los datos a analizar, que además antes eran más bien internos y ahora son más bien externos y, por tanto, normalmente más desestructurados.

Pero la base estadística, los algoritmos que se utilizan, la metodología, las fases previas de preparación de los datos y la creación de modelos de regresión, de clasificación y demás sigue siendo la misma. Para mi esta profesión ya existía, aunque es cierto que la demanda no tenía nada que ver con la actual, y que ‘científico’ denota más prestigio que ‘minero’.

También tengo que decir que el Data mining siempre me ha atraído, y es de esas cosas que he estudiado, pero que no he llegado a tener la oportunidad de aplicar en la práctica, a pesar de que ganas nunca me han faltado. Dejando de lado discusiones sobre la nomenclatura, me alegro de que por fin las empresas se interesen por analizar los datos más a fondo, y voy a aprovechar para reengancharme al mundo de la tortura de los datos desenpolvando en primer lugar los apuntes de Data Mining de la UOC, y continuando con libros y cursos sobre Data Science.

Espero ir explicando alguna cosa más sobre mis avances en el mundo del Data Science, de momento he comenzado con la lectura y alguna práctica de los libros ‘Practical Data Science Cookbook‘ y de ‘Mastering Machine Learning with scikit-learn‘ y apuntándome al curso online MITx 15.071x – The Analytics Edge, de momento bastante recomendable.