Conector entre oracle y spark

hola a tod@s,

Soy nuevo en el mundo de big data tengo algun duda sobre si es posible conectar apache Spark con oracle para realizar la actualizacion de un Hdfs. Ya que se va seguir utilizando la base de datos oracle 11g que tienen pero quieren para analizar los datos con mayor fluidez un sistema como big data para realizarlo con lo que cada dia se debera de actualizar los datos de Hdfs.

 

Un saludo y gracias de antemano.

kiristof

 

Si ya tenéis los datos en una BBDD  y dependiendo del tipo de consultas que quieras hace...  la opción más sencilla sería utilizar una base de datos orientada a columnas.

 

HP Vertica es la bbdd analítica más extendida y más robusta. Yo la uso en mis proyectos y mejora el rendimiento sobre oracle de forma espectacular.

 

Finalmente.... si quieres usar spark... tendrías que volcar los datos de oracle a spark... un procedimento almacenado que cada dia hiciera el volcado resolvería tu problema... aunque si no das más datos sobre tu objetivo, volúmen de datos, etc... es dificicl saber qué es lo que realmente quieres.

 

Saludos.