Dataprix | El portal sobre software empresarial

Big data

Lee más sobre Introducción a Apache Spark
Inicie sesión para enviar comentarios

Hoy vamos a hacer una introducción a Apache Spark, el nuevo motor del Big Data, se trata de un framework de computación paralela enfocando especialmente hacia la ciencia de datos.

Hay que destacar que Spark lleva incluidas librerías específicas para tratar datos estructurados (SparkSQL), integración con lenguaje R (Spark R), capacidades para el streaming de datos (Spark Streaming), machine learning (MLib) y computación sobre grafos (GraphX).

Esta primera introducción es una guía para su instalación, conceptos, estructura y el primer contacto que tendremos será la implementación de un Clúster Standalone con PySpark, las aplicaciones se ejecutan como un grupo independiente de procesos en el Cluster, dirigido por el programa principal.

El escándalo por las revelaciones de que Estados Unidos espía las comunicaciones y contenidos online de usuarios de todo el mundo mediante el programa Prism ha llevado a muchos usuarios a plantearse si su privacidad está a salvo en Internet. Te damos algunos consejos fáciles de aplicar para protegerte..

Lee más sobre Infografía sobre el perfil de un experto en Big Data
9 comentarios
Inicie sesión para enviar comentarios

Con los nuevos tiempos surgen nuevas profesiones, o nuevas maneras de orientar profesiones ya existentes, y con la llegada de los Big Data la figura del analista de la información 'se reinventa', como dicen ahora, para convertirse en Experto en Big Data, que por lo que parece puede llegar a estar muy bien reconocido según esta infografía de FICO..

Lee más sobre Mover datos en Hadoop
Inicie sesión para enviar comentarios

Cuando trabajamos en Hadoop, una de las tareas más habituales que nos encontraremos es mover datos desde sistemas externos a Hadoop y viceversa. El hecho de que los datos, en su organización, sean de diferente tipo y se encuentren en diferentes sitios complica el proceso de mover los datos. ¿Cómo podemos mover los datos desde una base de datos DBMS hacia Hadoop? ¿O cómo podemos mover los diferentes logs que genera mi organización a Hadoop? ¿Cómo devuelvo a mis DBMS la combinación de datos realizada mediante Hadoop y sus procesos MapReduce?

Una forma es mediante programas MapReduce programados por nosotros, esta forma puede llegar a ser costosa, por lo que necesitamos una formas más simple, y es aquí donde Sqoop entra en juego..

Lee más sobre Introducción a Hadoop y su ecosistema
Inicie sesión para enviar comentarios

Ecosistema de Hadoop Si miramos alrededor nuestro, vemos que cualquier dispositivo que usamos genera datos, estos pueden ser analizados actualmente. De esta gran cantidad de datos que tenemos a nuestro alcance, sólo el 20% se trata de información estructura y el 80% son datos no estructurados. Estos últimos añaden complejidad en la forma que se tienen que almacenar y analizar.

Hadoop aparece en el mercado Big Data como una solución para estos problemas, dando una forma de almacenar y procesar estos datos..

Lee más sobre Infografia con la Historia de Hadoop
Inicie sesión para enviar comentarios

Como sabéis Apache Hadoop está revolucionando la forma en que se accede a la información. GigaOM nos proporciona 4 buenos enlaces para conocer la evolución de Hadoop

Lee más sobre Synology presenta DiskStation DS213
Inicie sesión para enviar comentarios

Synology ha lanzado hoy el DiskStation DS213, un servidor NAS de 2 bahías que ofrece una óptima relación precio-rendimiento como solución para compartir y proteger datos en oficinas y entornos de trabajo.

Lee más sobre Espectacular infografía que reúne las principales cifras de negocio de Google
Inicie sesión para enviar comentarios

Infografia sobre Datos de Negocio de Google Para hacerte una idea del volumen de negocio que mueve Google nada mejor que la infografia que han preparado en pingdom, en la que recopilan en un mismo gráfico una timeline con los principales hitos de la compañia, impresionantes cifras sobre el buscador, evolución de los beneficios, cifras sobre los empleados de la compañía, y los datos más significativos sobre otros productos de éxito como Android, YouTube, Blogger, Gmail, Chrome, Orkut o Analytics.

Una buena fuente de inspiración para que alguien se anime a crear un cuadro de mando donde pudiéramos ver dinámicamente como van evolucionando estos indicadores tan bien escogidos..

Prueba Semrush gratis 14 días!

Big data

Introducción a Apache Spark

El enemigo en casa: cómo defenderse cuando las empresas que deben proteger nuestra privacidad ayudan a que nos espíen

Infografía sobre el perfil de un experto en Big Data

Mover datos en Hadoop

Introducción a Hadoop y su ecosistema

Infografia con la Historia de Hadoop

Synology presenta DiskStation DS213

Espectacular infografía que reúne las principales cifras de negocio de Google

LANSA Integrator