Dataiku

Dataiku és una plataforma de ciència de dades col·laborativa que permet als usuaris preparar, analitzar i modelar dades en un entorn de visualització intuïtiu. Amb Dataiku, els usuaris poden treballar en projectes de ciència de dades de manera col·laborativa, compartir informes i models, i automatitzar el flux de treball de les dades per a accelerar el temps de presa de decisions.

Dataiku combina la potència de la ciència de dades, SQL, Hadoop i Spark. Automatitza tot el cicle de vida de la ciència de dades: des de la preparació de les dades, l'aprenentatge automàtic i l'analítica avançada fins al desplegament de l'analítica de producció.

Dashboard Dataiku

Entre les funcionalitats de Dataiku es troben:

  • Integració de fonts de dades: Dataiku permet integrar i treballar amb una àmplia varietat de fonts de dades, incloent-hi bases de dades relacionals, sistemes d'arxius, APIs web, i sistemes de big data com Hadoop i Spark.

 

  • Neteja i preparació de dades: Dataiku ofereix utilitats per a netejar i preparar les dades, incloent-hi l'eliminació de duplicats, la rellenación de valors que manca, i la normalització de dades.

 

  • Anàlisi estadística i visualització: eines per a analitzar i visualitzar les dades, incloent-hi taules dinàmiques, gràfics i mapes interactius.

 

  • Creació de models de machine learning: el programari proporciona una interfície d'arrossegar i deixar anar per a crear models de machine learning, incloent-hi models de regressió, classificació, i clustering.

 

  • Automatització i escalabilitat: permet automatitzar els fluxos de treball de les dades i escalar els projectes de ciència de dades a través de la integració amb eines d'automatització com a Apatxe Airflow i Kubernetes.

 

  • Col·laboració i gestió de projectes: inclou un sistema de gestió de projectes i col·laboració, permetent als usuaris treballar en projectes de ciència de dades de manera col·laborativa, compartir informes i models, i controlar l'accés a les dades i les tasques dels projectes.

 

  • Suporta diferents entorns de núvol i on-*premise, oferint flexibilitat quant a on s'executa la plataforma.

 

La plataforma proporciona una forma fàcil i flexible de construir i mantenir un pipeline, utilitzant les millors pràctiques amb tecnologies modernes per a anàlisis de big data, aprenentatge automàtic, intel·ligència artificial i computació en el núvol.

Combina el rendiment d'un entorn de programació similar a MATLAB i la potència del framework Spark per a facilitar l'analítica.

Compta amb una interfície d'usuari intuïtiva que permet als usuaris no tècnics explorar, analitzar, netejar i visualitzar les seves dades, sense necessitat de coneixements tècnics.

Disposa de diferents versions adaptades a la grandària de la companyia, i també d'una edició instal·lable gratuïta