Data Science - TOP software

IBM Watson Studio

IBM Watson Studio es una herramienta de desarrollo cognitivo que permite incorporar activos de datos existentes a la plataforma Watson, crear modelos personalizados mediante aprendizaje automático, crear nuevos servicios mediante API cognitivas y dar soporte a interfaces de lenguaje natural en las aplicaciones, así como analizar, visualizar e interpretar los datos. 

Watson Studio se ofrece dentro de las herramientas de IBM Cloud Pak for Data.

Databricks

Databricks es una plataforma de software basada en la nube para la ingeniería de datos, la ciencia de datos y el aprendizaje automático. Ofrece un entorno escalable para ejecutar aplicaciones de datos de alto rendimiento, y soporte para grandes conjuntos de datos y altos volúmenes de procesamiento de datos..

Amazon SageMaker

Amazon SageMaker es una solución de aprendizaje automático que permite a científicos de datos y desarrolladores crear, entrenar e implementar modelos de aprendizaje automático. Es compatible con el aprendizaje por lotes y en línea, y viene con algoritmos preconstruidos para casos de uso comunes.

Cuenta con una interfaz de usuario intuitiva, potentes algoritmos y una infraestructura de nivel empresarial que le permite crear su solución de aprendizaje automático sin tener que ser un experto en infraestructura en la nube o aprendizaje profundo.

KNIME Analytics Platform

KNIME Analytics Platform es una aplicación de software que permite crear y analizar flujos de trabajo basados en datos, o "pipelines", dentro de la plataforma KNIME. El software fue desarrollado originalmente por investigadores de la Universidad de Konstanz en Alemania, pero ahora está disponible bajo licencia open source. 

El software ofrece una serie de características propias de este tipo de plataformas:

Google Cloud AI

Google Cloud AI Platform es un conjunto completo de herramientas para crear, desplegar y gestionar aplicaciones de aprendizaje automático, o integrarlas en aplicaciones propias. Incluye modelos preentrenados que pueden utilizarse de forma inmediata o personalizarse para satisfacer necesidades específicas de las empresas, así como una amplia variedad de servicios integrados que pueden utilizarse juntos o por separado para crear cualquier tipo de aplicación.

Ofrece como características principales:

Python para Data Science

Clasificacion multilabel con la librería Scikit-learn de Python

Python es un lenguaje open source de propósito general, que gracias al desarrollo de potentes librerías de analítica, procesamiento de datos y modelización predictiva se ha convertido en el principal lenguaje de programación utilizado para proyectos de Data Science, junto con R..

TIBCO Data Science

TIBCO Data Science es un conjunto de herramientas para simplificar y ampliar el proceso de exploración y descubrimiento de datos. TIBCO Data Science permite crear fácilmente modelos predictivos, optimizar la toma de decisiones y obtener información de los datos. Es ideal para las empresas que necesitan obtener un mejor control sobre los datos que están recopilando y convirtiendo en conocimiento..

MATLAB online

MATLAB es un lenguaje de programación y un entorno informático de alto rendimiento para el desarrollo de algoritmos, la visualización de datos, el análisis de datos y el cálculo numérico. Combinando características de programación de alto nivel con tipos de datos dinámicos, MATLAB proporciona un entorno que permite crear rápidamente prototipos de ideas y desarrollar software para resolver problemas de analítica y cálculo técnico...

Dataiku

Dataiku DSS

Dataiku es una plataforma única de software como servicio que combina la potencia de la ciencia de datos, SQL, Hadoop y Spark. Automatiza todo el ciclo de vida de la ciencia de datos: desde la preparación de los datos, el aprendizaje automático y la analítica avanzada hasta el despliegue de la analítica de producción..

R

R Development StudioR es una suite open source de utilidades y un lenguaje de programación para manipulación de datos, cálculos estadisticos, analítica y visualización de gráficos.

El entorno es fácilmente ampliable con nuevos paquetes (estadisticos, de gráficos, analíticos, etc.) aportados por la comunidad de usuarios y desarrolladores de R..