Software Open Source

Pentaho Data Integration

Pentaho Data Integration constituye una plataforma de integración y orquestación de procesos ETL. La herramienta combina una interfaz visual con funcionalidades avanzadas de análisis y transformación, permitiendo crear flujos de datos complejos sin necesidad de programar desde cero. Además, ofrece opciones de despliegue en entornos locales, en la nube o híbridos, facilitando la gestión y consolidación de información en distintos contextos organizacionales..

Apache NiFi

Apache NiFi

Apache NiFi es una plataforma de integración de datos diseñada para automatizar el flujo de información entre sistemas. Su enfoque visual permite a los usuarios diseñar, gestionar y monitorear flujos de datos de manera intuitiva, sin necesidad de programación avanzada.
Gracias a su arquitectura basada en procesadores, NiFi facilita la transformación, enrutamiento y procesamiento de datos en tiempo real..

Confluent platform

Confluent Platform es una solución de integración de datos orientada al manejo y transformación de streaming en tiempo real en entornos empresariales. La herramienta reúne componentes esenciales –como Apache Kafka, Schema Registry y Kafka Connect– que facilitan la ingesta, procesamiento y distribución continua de información, permitiendo la consolidación de datos históricos y en vivo para la toma de decisiones estratégicas..

LANSA ERP Frameworks

LANSA ERP Frameworks

LANSA ERP Frameworks es una solución ERP de código abierto para IBM i (System i, iSeries, AS/400) que proporciona una solución empresarial integral, dashboards, flujos de trabajo avanzados, integración de escritorio y consultas y informes flexibles para usuarios finales..

H2O.ai

H2O.ai

H2O.ai es un software de aprendizaje automático que se utiliza para construir y desplegar modelos de análisis predictivo. H2O.ai proporciona una interfaz fácil de usar que permite a los usuarios construir y entrenar modelos de aprendizaje automático sin escribir código. Esto puede hacerse utilizando algoritmos integrados o importando algoritmos personalizados de R y Python..

KNIME Analytics Platform

knime analytics platform

KNIME Analytics Platform es una aplicación de software que permite crear y analizar flujos de trabajo basados en datos, o "pipelines", dentro de la plataforma KNIME. El software fue desarrollado originalmente por investigadores de la Universidad de Konstanz en Alemania, pero ahora está disponible bajo licencia open source..

Python para Data Science

Clasificacion multilabel con la librería Scikit-learn de Python

Python es un lenguaje open source de propósito general, que gracias al desarrollo de potentes librerías de analítica, procesamiento de datos y modelización predictiva se ha convertido en el principal lenguaje de programación utilizado para proyectos de Data Science, junto con R..

Apache Hive

Editor de consultas SQL de Apache Hive

Hive es un software que trabaja sobre clusters de Hadoop creando una capa que permite al desarrollador abstraerse de la gestión de ficheros HDFS y de MapReduce mediante operaciones de consulta de datos basadas en SQL, con el lenguaje HiveQL..

Apache Spark

Apache Spark

Spark es un framework open source de Apache Software Foundation para procesamiento distribuído sobre clusters de ordenadores de grandes cantidades de datos, ideado para su uso en entornos de Big Data, y creado para mejorar las capacidades de su predecesor MapReduce.

Spark hereda las capacidades de escalabilidad y tolerancia a fallos de MapReduce, pero lo supera ampliamente en cuanto a velocidad de procesamiento, facilidad de uso y capacidades analíticas..