Documento de instalacion de Pentaho

Para quien quiera empezar a probar Pentaho, la suite open source de BI más conocida, y busque un manual de instalación sencillo y en castellano, consultar el tutorial de instalación de Pentaho de El Blog de Omar puede ser un buen comienzo. La instalación se hace sobre Linux, en concreto sobre Fedora 7, aunque puede servir también como guia para otros Sistemas Operativos.

Y para el que haya conseguido finalizar la instalación, Omar ofrece un segundo tutorial sobre cómo hacer nuestro primer informe.

En el mismo blog Omar anuncia que en breve publicará más turoriales de Pentaho, estaremos atentos..

Adjunto los dos tutoriales en formato pdf.

Estimas, Estoy comenzando con pentaho (mi tesis), he bajado e intalado sin problemas casi todos los compenentes pero la parte que mas me interesa es la de poder diseñar cubo. He leido que Pentaho trabaja con Modria/cube designer pero no lo puedo encontrar para bajarlo de ningun lado.
Sabrian decirme como hacer para bajarlo, o recomendarme alguna herramienta OpenSource sobre DataWarehouse y OLAP.
Desde ya muchas gracias
Saludos
German

En respuesta a por Carlos

Muchas Gracias Carlos

Estoy comenzando con este tema, y me has sido de gran ayuda.

Mi tesis es sobre mineria de datos utilizando una base de la Universidad Nacional de Argentina (Misiones)

Si estas interesado me gustaria mandarte mis avances y consultas.

Espero no quitarte mucho tiempo,

Saludos cordiales

German

En respuesta a por German PAUTSCH (no verificado)

Ahora lo tienes aún más fácil. Te recomiendo que utilices la imagen de Pentaho que acaba de publicar Dario, con Pentaho Data Integration y el Workbench de Mondrian ya instalados y configurados. Si vas a hacer Data Mining sólo te falta instalar Weka (o Pentaho Data Mining, como lo han rebautizado). Aprovecho para enlazar el wiki de documentación de Pentaho sobre Weka.

Y por supuesto que estoy interesado en tu tesis, últimamente no se habla mucho por aquí sobre Minería de Datos, y es una pena

En respuesta a por Carlos

Que bueno que entres en también contacto con German, ya que el esta trabajando en varios proyectos de investigación ocupando Minería de Datos e incluso aplicando varias técnicas con diferentes Software.

Bueno espero sigan para adelante estas relaciones (España-Argentina).

Un abrazo Carlos y nos estamos manteniendo en Contacto (ahora mas que nunca que tenemos www.dataprix.com  en linea)

 

En respuesta a por alfonsocutro

Es que el mundo es un pañuelo, y sobretodo si hablamos de minería de datos en español. Pues a ver si Germán se anima y nos cuenta un poco de los proyectos en los que está trabajando. Seguro que si unimos las investigaciones de Alfonso y German tenemos temas interesantes que comentar para mucho tiempo.

En respuesta a por Carlos

En respuesta a por Carlos

saludos Carlos

te saluda Omar soy de Ecuador Estudiante de la carrera de ing Sistemas tengo que presentar un proyecto acerca de esta herramienta como es pentaho suite y a su ves esto tengo que configurarlo con b/d oracle , no se si esta en tus mano ayudarme con manuales , descarge los manuales que indicabas y estan muy interesantes despeje ciertas dudas que tenia.

de antemano quedare muy agradecido

En respuesta a por OMAR (no verificado)

Omar, te recomiendo que utilices el buscador de Dataprix poniendo 'Pentaho', y encontrarás bastantes referencias que hemos ido haciendo a esta suite, seguro que más de una te ayuda.

También te puede ir muy bien descargarte la Imagen Virtual de Pentaho 2.0 que preparó Dario Bernabeu, donde tienes preconfiguradas las herramientas más importantes. La versión de Pentaho no es la última, pero el funcionamiento no cambia mucho.

En la misma imagen puedes probar a instalar una BD Oracle y modificar la conexión, que está sobre una BD MySQL, o crear una nueva.

En respuesta a por German PAUTSCH (no verificado)

Estimado German,

 

Tambien estoy trabajando en un proyecto de Data Mingin en una universidad. Me gustaria poder covnersar contigo e itnercambiar opiniones. Con gusta revisaría tus avances.

 

Te dejo mi correo personal: tomodachi123@hotmail.com

 

Exitos.

 

Saludos,

Fredy C.

En respuesta a por German PAUTSCH (no verificado)

GERMAN querido!!!!

Que bueno encontrarte por estos lados, ahora también formamos parte

de esta comunidad.

Ya te estarás dando cuenta la buena onda y predisposición que tiene esta gente

Carlos and Company.

Y desde mi punto de vista ojo hablando de mí experiencia personal,

este es un buen lugar para publicar tus investigaciones ya que el mismo es recurrido por muchos estudiantes de todo el mundo habla hispana.

 

Carlos, buen dia y exitos para ustedes que comparten conocimientos: Yo estoy queriendo iniciarme con Pentaho para mi grado, estoy hacienndo un Data Mart para una empresa que importa y vende Repuestos para motos, el Data Mart sera aplicado a las Areas de Importacion y Ventas, la empresa maneja sus datos con el Sql Server 2000, y mi pregunta es si puedo trabajarlo el data mart con ese mismo manejador de base de datos o lo puedo migara a otro manejador o no viene al caso,,y quiero generar mis cubos con pentaho para que estos sea mostrados via web,, dentro de mi propuesta de solucion esta que el gerente de la emnpresa pueda realizar sus nuevas compras desde cualquier parte del mundo ya sea desde la fabrica de su proveedor con solo conectarse a su data mart desde una portatil o PC conectado a internet, y ver que productos, marca , linea y procedencia a vendio mas en el tiempo que llegara su mercaderia a su empresa y hacer el pedido..estoy un poco desorientado con el pentaho e buscado un intalador que tenga todo lo que necesito y hasta ahora no lo encuentro, trabajre bajo Windows XP, ya qe la empresa trabaja bajo esa plataforma wxp, sql server 2000, carlos por favor agradecere tu ayuda y orientacion dejo mi e-mauil por si quieras ayudarme getaro50@hotmail.com

gracias, que Dios los Ilumine

En respuesta a por GESTER TAFUR ROJAS (no verificado)

Gester, en principio no has de tener problema ni para instalar Pentaho sobre Windows ni para conectarlo con SQLServer. Donde puedes tener un poco más de trabajo de configuración es en la conexión con SQLServer.

De todas maneras lo que sí es recomendable es que tengas el Data Mart separado de los datos origen relacionales. Es decir, que igualmente tienes que crear nuevas estructuras de datos, y si es posible una nueva base de datos, en cuyo caso también te puedes plantear utilizar una base de datos MySQL para ahorrarte problemas de configuración. Si trabajas sobre MySQL también encontrarás más soporte en los foros, o documentación, porque es el motor de BD que más se utiliza con Pentaho.

En respuesta a por Carlos

Carkos gracias por la respuesta, pero el detalle es que la empresa dpoonde aplicare el Data Mart tiene su base de datos transaccional en Sql Server 2000, ya trabaja con ese motor de BD, para trabajar con MySql, tendria que instalar en su servidor MySql aparte del que ya tiene Sql Server 2000, y migrar la data del Sql Server 2000 al MySql, Verdad? pero no crees que estoy haciendo doble trabajo, por que no le puedo decir a la empresa que se cambie de Sql Server 2000 a MySql, no esta dentro de la propuesta del proyecto y no creo que la empresa lo quiera hacer, ahora cual seria la solucion?, como te cometaba que quiero que el gerente pueda ingreasr a su data mart desde cualqueir parte del mundo via web para hacer sus compras de sus productos. de acuerdo a los indicadores de vejnta que generan el data mart.. agradeceria que me ayudaras atte. Gester

En respuesta a por GESTER TAFUR ROJAS (no verificado)

No es cuestión de cambiar de uno a otro. Cuando montas un DWH o un Datamart recoges datos de diferentes sistemas orígenes y montas una estructura de datos paralela, que es la que van a explotar las herramientas de Business Intelligence. Los sistemas origen, en tu caso la BD de SQLServer no se tocan, sólo se consultan.

Obviamente, puedes crear una nueva BD MySQL o SQLServer, o hacerlo dentro de la misma. Yo no te recomiendo hacerlo en la misma BD porque se puede incrementar bastante la carga del servidor, y a nivel de motor de BD no se parametriza igual una base de datos relacional que una de DWH. También has de tener en cuenta el tamaño de tu DM, si es muy pequeño puede que su impacto en el rendimiento también sea mínimo.

Sobre utilizar SQLServer tampoco te digo que no lo utilices, tiene que funcionar igual o mejor que MySQL, sólo que vas a encontrar más soporte con MySQL si tienes algún problema.

En respuesta a por Carlos

CARLOS, gracias por contestar,, queriendo trabajar con MySql, tengo que instalar MySql en el Servidor donde tambiem esta Sql Server 2000, y filtrar desde Sql Server a MySql verdad? osea tendre dos Motores de BD instaladas en la Pc Servidor, carlos no habra problema ?,, y luego trabajar con el pentaho desde MySql verdad..

Carlos otra pregunta, te decia que recien me estoy inciando con pentaho, lei en algunos foros que se necesita instalar el Apache toncat para trabajar con el pentaho para que este funcione como servidor Web, te comentaba que mi proyecto es que el gerente entre desde cualquier parte a su data y via web, y consulte su data mart para tomar desiciones, es neceszsario en mi caso trabajar con apache toncat o hay otra forma..

y si no es molestia Carlos tendras algun tutorial completo y detallado para ttrabajar con pentaho, apache toncat y Sql Server, sino es mucho pedir habra alguna forma que me proveas?

de ante te estoy agradecido carlos,, saludos cordiales
atte.- Gester T...

En respuesta a por GESTER TAFUR ROJAS (no verificado)

La BD de MySQL puedes instalarla donde te vaya mejor, en el mismo servidor de SQLServer, en un servidor independiente, o en el que instales Pentaho, que es lo más habitual.

Pentaho está escrito en JAVA y utiliza tecnología J2EE, por lo que sin un servidor de aplicaciones J2EE como Tomcat no es que no vayas a poder acceder por web, es que no te funcionaría nada. Por supuesto, con Tomcat no vas a tener ningún problema para acceder por web. Puedes probar, por ejemplo, desde labs.dataprix.com cómo se accede por web

Sobre el tutorial, vas a tener que buscar un poco, al ser una herramienta Open Source la documentación cambia muy a menudo y está bastante dispersa. Puedes buscar 'Pentaho' en el buscador de Dataprix, y encontrarás algunos materiales útiles. La documentación oficial está en el wiki de Pentaho. Por último, en la red hispana Open Business Intelligence hay bastantes miembros y grupos especiados en Pentaho que también te podrán ayudar con dudas más específicas.

En respuesta a por Carlos

CARLOS buen dia disculpa la molestia, LA VERDAD estoy cero en pentaho e leido que es una buena herramienta para datamart y la quiero usar, pero no se hasta el momento que herramientas de pentaho  usar para hacer un datamart ya que mi base de datos esta en sql server 2000, observo que hay varias y me confunde y nose cual usar veo que tienen barrias herramientas mondrian, kettle, cubodesigner pero cual se usa para este fin......me confunde y nose como are para conectarme al datamart que ya tengo creado en sql server 2000, o no es necesesario hacer el datamart en sql server 2000, por favor denecesito orientacion en este tema, tengo que terminar mi proyecto hasta fin de mes como maximo... te agradecere un monton

En respuesta a por GETARO50

Sobre los componentes que se necesitan para trabajar con Pentaho, puedes hacerte una idea general en esta entrada de blog de Dario en que se publica una imagen virtual muy completa.

Este post de Stratebi sobre Pentaho BI Suite lo explica mucho más detalladamente.

Sobre SQL Server, los cubos de Pentaho no son compatibles con los de Analysis Services, las tecnologías con diferentes.

Tienes que construir en SQL Server un datamart, pero con Tablas relacionales, que es lo que utilizará Pentaho, y lo que va a explotar Mondrian, que es el motor OLAP que utiliza Pentaho. Sobretodo no intentes crear un cubo MOLAP con Analysis Services, porque no te servirá para nada en Pentaho.

En respuesta a por Carlos

Problemas para crear datamart y cubos olap con sql server 2000, y que herramienta bi usar para mostrar via web.

Carlos, aun tengo algunas dudas sobre las herramientas bi en las consultas a la base de datos, yo estoy creando el data mart y los cubos en sql server 2000, ya esta creado ahora mi pregunta es si la herramienta web en este caso pentaho u otra herramiena como open i, la que estos pensando usar,... estas herramientas hacen la consulta del data mart y cubo ya creado???, o estas herramientas crean el propio data mart y cubo olap,,,  eso es lo que no entiendo por que en sql server 2000 ya cree el datamart y los cubos, ahora mi pregunta, pentaho se conectara al datamart y los cubos ya creados???, o pentaho u otra herramienta construiran el datamart y los cubos solamente de la base de datos referencial,,, esa es la duda bien grande que tengo...

La otra intrigga que tengo es, que para efecto de mi grado nose si diseñar la herrmienta bi que se que es bastante dificil y me tardare bastante tiempo, y con la misma duda que nose si la herramienta se conecatara al datamart y cubo ya creado o la herramienta tendra que crear el datamart y el cubo a mostrar,,o simplemetnete usar heramientas bi que ya existen como pentaho,cognos, open bravo, opei, etc

Amigo carlos espero me orientes en esto con tu experiencia en este tema.. te agradecere infinitamente..

Si alguien quiere aportar a mi problema bienvenido sea.. de ante mano gracias

En respuesta a por GETARO50

La primera cuestión ya la he respondido en el comentario anterior, NO puedes utilizar un cubo de Analysis Services con Pentaho, tienes que conectarte con el modelo relacional.

Sobre si desarrollar tu propia herramienta de BI no te lo recomiendo, seguro que va a ser mucho más complejo que utilizar una existente, detrás de estas herramientas hay mucho trabajo necesario para que puedan ofrecer la funcionalidad que se espera de un software de BI.

Un saludo,

 Buen dia Carlos

 

Estoy ingresando al mundo del BI, y deseo conocerlo con la herramienta PENTAHO BI  - open source...  me podrias indicar una guia para instalacion y cuales componentes que debo instalar. 

 

Yo he bajado lo sgte:

 

analysis - mondrian-3.2.1.13885.zip

bi-plataform - desing studio -  pds-ce-win-32-3.7.0-stable.zip - pds-ce-win-64-3.7.0-stable.zip

                  - Pentaho Metadata - pme-ce-3.7.0-stable.zip

 

ETL-Kettle - pdi-ce-4.1.0-stable.zip

 

Reporting - Reporting Designer - prd-ce-3.7.0-stable.zip 

               - Reporting Engine - pentaho-reporting-engine-classic-demo-3.7.0-GA.zip

               - Reporting SDK - pre-classic-sdk-3.7.0-GA.zip

 

Igual si vos conoces una pagina donde pueda bajar toda la herramienta pentaho bi open source te lo agradeceria.. pues no se si estas versiones sean.

 

Espero tu colaboración y que pena!!.

 

Me copias a mi correo: roechever1@hotmail.com

 

En respuesta a por roechever1

Te puedo decir que donde puedes encontrar las últimas versiones y componentes de la Community Edition es en el proyecto Pentaho de Sourceforge. Después justo lo que necesites depende de donde vayas a instalarlo, y qué vas a utilizar realmente.

Sobre documentación, no es que haya muchos documentos específicos, la documentación está 'dispersa' por la comunidad. Puedes hacer una búsqueda 'Pentaho' en el buscador de Dataprix, y consultar la wiki de Pentaho, te enlazo la página Pentaho Reporting Community Documentation, que es un buen inicio.

Si quieres hacerte una idea de lo que hace cada componente, aunque no sea la última versión, puedes descargarte la Imagen virtual de una instalación completa de Pentaho y probarlos, está todo listo para usar.

Si te suscribes a los comentarios del post ya te llegará un email automáticamente cada vez que alguien haga un comentario.

Saludos,

En respuesta a por Carlos

 Hola .. Carlos

 

El objetivo inicial es hacer un demo con la herramienta pentaho el cual debe contener todo el proceso de:

 

fuente (extracion, bd oracle.., contiene informacion)

transformacion (procedimientos, regla, etc.. )

cargue (mineria datos  -dwh)

visualización (mostrar informes), aqui hay muchas por eje: Bussiness Object, etc..  pero deseamos usar l oq pentaho ofrece!!

 

Del link proyecto Pentaho de Sourceforge. cual version bajo:  Download pdi-ce-4.1.0-stable.zip (106.9 MB) contiene todo? o debo bajar cada componente que menciona.. por ejemplo: Design Studio - Pentaho Metadata - Business Intelligence Server - Report Designer - Data Integration - Report Design Wizard (Legacy) - White Papers

 

 

 

 

 

 

 

Como te lo dije soy nuevo en este tema y te pido la mayor colaboración... inicialmente donde se debe instalar cada componente de pentaho?.. 

 

 

Hola amigos, soy Eduardo Mori de Perú, estudio en una universidad de Lima y me han dejado

un tema para investigacion que es el Pentaho y no se nada sobre ello, ayudenme por donde empiezo. 

Se los agradecere enormemente.

 

Atte,

 

Eduardo Mori G.

Buenas...  tengo algunas dudas sobre el uso de pentaho y la conectividad que pueda aver con SQL SERVER 2005, ya que estoy planteando en mi proyecto de tesis, desarrollar data mart de ventas y cobros, empleando pentaho y con una BD sql server 2005 con historial(la bd pesa 29.5 GB), kisiera saber como seria la conexion y el orden en esta caso para emplear el pentaho , ya que como eh estado leendo tiene varias plataformas de la misma herramienta y q alguos hace confundir un pokito , asi que por favor si hay algun tutorial en sql 2005, o me pueden dar una ayuda con explikacion por favor se los agradeceria infinitamente , quiero hacer algo muy interesante con esta herramienta ... gracias de antemano

 

Hola, iniciare un proyecto el cual consiste en el desarrollo de un cubo de datos programable. el SO que manejo es linux mint, y mi cuestión es si es factible el uso de Pentaho en Mysql para su desarrollo. vi que existen muchas herramientas en SASS, pero solo utiles en un SO Windows