TOP software Data Science

Amazon SageMaker

Amazon SageMaker es una solución de aprendizaje automático que permite a científicos de datos y desarrolladores crear, entrenar e implementar modelos de aprendizaje automático. Es compatible con el aprendizaje por lotes y en línea, y viene con algoritmos preconstruidos para casos de uso comunes.

Cuenta con una interfaz de usuario intuitiva, potentes algoritmos y una infraestructura de nivel empresarial que le permite crear su solución de aprendizaje automático sin tener que ser un experto en infraestructura en la nube o aprendizaje profundo.

KNIME Analytics Platform

KNIME Analytics Platform es una aplicación de software que permite crear y analizar flujos de trabajo basados en datos, o "pipelines", dentro de la plataforma KNIME. El software fue desarrollado originalmente por investigadores de la Universidad de Konstanz en Alemania, pero ahora está disponible bajo licencia open source. 

El software ofrece una serie de características propias de este tipo de plataformas:

IBM Watson Studio

IBM Watson Studio es una herramienta de desarrollo cognitivo que permite incorporar activos de datos existentes a la plataforma Watson, crear modelos personalizados mediante aprendizaje automático, crear nuevos servicios mediante API cognitivas y dar soporte a interfaces de lenguaje natural en las aplicaciones, así como analizar, visualizar e interpretar los datos. 

Watson Studio se ofrece dentro de las herramientas de IBM Cloud Pak for Data.

Dataiku

Dataiku DSS

Dataiku es una plataforma única de software como servicio que combina la potencia de la ciencia de datos, SQL, Hadoop y Spark. Automatiza todo el ciclo de vida de la ciencia de datos: desde la preparación de los datos, el aprendizaje automático y la analítica avanzada hasta el despliegue de la analítica de producción..

DataRobot Platform

DataRobot Series temporales

DataRobot es una plataforma de ciencia de datos que ayuda a las empresas a tomar mejores decisiones utilizando grandes cantidades de datos. Proporciona una interfaz fácil de usar que permite a los usuarios hacer preguntas, extraer y analizar datos y generar modelos predictivos..

Python para Data Science

Clasificacion multilabel con la librería Scikit-learn de Python

Python es un lenguaje open source de propósito general, que gracias al desarrollo de potentes librerías de analítica, procesamiento de datos y modelización predictiva se ha convertido en el principal lenguaje de programación utilizado para proyectos de Data Science, junto con R..

RapidMiner

RapidMiner Studio

RapidMiner es una potente herramienta para análisis avanzado, minería de datos y análisis predictivo. Proporciona una interfaz gráfica que permite a científicos de datos, analistas de datos y usuarios empresariales construir modelos predictivos, realizar estadística descriptiva, crear visualizaciones, probar y desplegar rápidamente modelos de aprendizaje automático para cualquier tipo de datos..

SAS Visual Data Mining and Machine Learning

SAS Visual Data Mining and Machine Learning (VDMML) es un paquete de software, parte de la plataforma SAS Viya, que permite a los usuarios analizar datos, encontrar patrones y hacer predicciones. El software puede utilizarse para diversas tareas, como el análisis predictivo y la creación de modelos, ofreciendo así una solución completa para análisis avanzado.

IBM Watson Analytics

IBM Watson Analytics

IBM Watson Analytics es un servicio de visualización y análisis predictivo de datos, que utiliza técnicas de Inteligencia artificial para permitir el descubrimiento de patrones en los datos de forma rápida y autónoma.

Con el descubrimiento de datos guiado, la analítica predictiva automatizada y funcionalidades cognitivas, Watson permite 'conversar' con los datos y obtener respuestas comprensibles..

R

R Development StudioR es una suite open source de utilidades y un lenguaje de programación para manipulación de datos, cálculos estadisticos, analítica y visualización de gráficos.

El entorno es fácilmente ampliable con nuevos paquetes (estadisticos, de gráficos, analíticos, etc.) aportados por la comunidad de usuarios y desarrolladores de R..