Documento de instalacion de Pentaho

Para quien quiera empezar a probar Pentaho, la suite open source de BI más conocida, y busque un manual de instalación sencillo y en castellano, consultar el tutorial de instalación de Pentaho de El Blog de Omar puede ser un buen comienzo. La instalación se hace sobre Linux, en concreto sobre Fedora 7, aunque puede servir también como guia para otros Sistemas Operativos.

Y para el que haya conseguido finalizar la instalación, Omar ofrece un segundo tutorial sobre cómo hacer nuestro primer informe.

En el mismo blog Omar anuncia que en breve publicará más turoriales de Pentaho, estaremos atentos..

Adjunto los dos tutoriales en formato pdf.

Estimas, Estoy comenzando con pentaho (mi tesis), he bajado e intalado sin problemas casi todos los compenentes pero la parte que mas me interesa es la de poder diseñar cubo. He leido que Pentaho trabaja con Modria/cube designer pero no lo puedo encontrar para bajarlo de ningun lado.
Sabrian decirme como hacer para bajarlo, o recomendarme alguna herramienta OpenSource sobre DataWarehouse y OLAP.
Desde ya muchas gracias
Saludos
German

En respuesta a por Carlos

Muchas Gracias Carlos

Estoy comenzando con este tema, y me has sido de gran ayuda.

Mi tesis es sobre mineria de datos utilizando una base de la Universidad Nacional de Argentina (Misiones)

Si estas interesado me gustaria mandarte mis avances y consultas.

Espero no quitarte mucho tiempo,

Saludos cordiales

German

En respuesta a por German PAUTSCH (no verificado)

Ahora lo tienes aún más fácil. Te recomiendo que utilices la imagen de Pentaho que acaba de publicar Dario, con Pentaho Data Integration y el Workbench de Mondrian ya instalados y configurados. Si vas a hacer Data Mining sólo te falta instalar Weka (o Pentaho Data Mining, como lo han rebautizado). Aprovecho para enlazar el wiki de documentación de Pentaho sobre Weka.

Y por supuesto que estoy interesado en tu tesis, últimamente no se habla mucho por aquí sobre Minería de Datos, y es una pena

En respuesta a por Carlos

Que bueno que entres en también contacto con German, ya que el esta trabajando en varios proyectos de investigación ocupando Minería de Datos e incluso aplicando varias técnicas con diferentes Software.

Bueno espero sigan para adelante estas relaciones (España-Argentina).

Un abrazo Carlos y nos estamos manteniendo en Contacto (ahora mas que nunca que tenemos www.dataprix.com  en linea)

 

En respuesta a por alfonsocutro

Es que el mundo es un pañuelo, y sobretodo si hablamos de minería de datos en español. Pues a ver si Germán se anima y nos cuenta un poco de los proyectos en los que está trabajando. Seguro que si unimos las investigaciones de Alfonso y German tenemos temas interesantes que comentar para mucho tiempo.

En respuesta a por Carlos

En respuesta a por Carlos

saludos Carlos

te saluda Omar soy de Ecuador Estudiante de la carrera de ing Sistemas tengo que presentar un proyecto acerca de esta herramienta como es pentaho suite y a su ves esto tengo que configurarlo con b/d oracle , no se si esta en tus mano ayudarme con manuales , descarge los manuales que indicabas y estan muy interesantes despeje ciertas dudas que tenia.

de antemano quedare muy agradecido

En respuesta a por OMAR (no verificado)

Omar, te recomiendo que utilices el buscador de Dataprix poniendo 'Pentaho', y encontrarás bastantes referencias que hemos ido haciendo a esta suite, seguro que más de una te ayuda.

También te puede ir muy bien descargarte la Imagen Virtual de Pentaho 2.0 que preparó Dario Bernabeu, donde tienes preconfiguradas las herramientas más importantes. La versión de Pentaho no es la última, pero el funcionamiento no cambia mucho.

En la misma imagen puedes probar a instalar una BD Oracle y modificar la conexión, que está sobre una BD MySQL, o crear una nueva.

En respuesta a por German PAUTSCH (no verificado)

Estimado German,

 

Tambien estoy trabajando en un proyecto de Data Mingin en una universidad. Me gustaria poder covnersar contigo e itnercambiar opiniones. Con gusta revisaría tus avances.

 

Te dejo mi correo personal: tomodachi123@hotmail.com

 

Exitos.

 

Saludos,

Fredy C.

En respuesta a por German PAUTSCH (no verificado)

GERMAN querido!!!!

Que bueno encontrarte por estos lados, ahora también formamos parte

de esta comunidad.

Ya te estarás dando cuenta la buena onda y predisposición que tiene esta gente

Carlos and Company.

Y desde mi punto de vista ojo hablando de mí experiencia personal,

este es un buen lugar para publicar tus investigaciones ya que el mismo es recurrido por muchos estudiantes de todo el mundo habla hispana.

 

Carlos, buen dia y exitos para ustedes que comparten conocimientos: Yo estoy queriendo iniciarme con Pentaho para mi grado, estoy hacienndo un Data Mart para una empresa que importa y vende Repuestos para motos, el Data Mart sera aplicado a las Areas de Importacion y Ventas, la empresa maneja sus datos con el Sql Server 2000, y mi pregunta es si puedo trabajarlo el data mart con ese mismo manejador de base de datos o lo puedo migara a otro manejador o no viene al caso,,y quiero generar mis cubos con pentaho para que estos sea mostrados via web,, dentro de mi propuesta de solucion esta que el gerente de la emnpresa pueda realizar sus nuevas compras desde cualquier parte del mundo ya sea desde la fabrica de su proveedor con solo conectarse a su data mart desde una portatil o PC conectado a internet, y ver que productos, marca , linea y procedencia a vendio mas en el tiempo que llegara su mercaderia a su empresa y hacer el pedido..estoy un poco desorientado con el pentaho e buscado un intalador que tenga todo lo que necesito y hasta ahora no lo encuentro, trabajre bajo Windows XP, ya qe la empresa trabaja bajo esa plataforma wxp, sql server 2000, carlos por favor agradecere tu ayuda y orientacion dejo mi e-mauil por si quieras ayudarme getaro50@hotmail.com

gracias, que Dios los Ilumine

En respuesta a por GESTER TAFUR ROJAS (no verificado)

Gester, en principio no has de tener problema ni para instalar Pentaho sobre Windows ni para conectarlo con SQLServer. Donde puedes tener un poco más de trabajo de configuración es en la conexión con SQLServer.

De todas maneras lo que sí es recomendable es que tengas el Data Mart separado de los datos origen relacionales. Es decir, que igualmente tienes que crear nuevas estructuras de datos, y si es posible una nueva base de datos, en cuyo caso también te puedes plantear utilizar una base de datos MySQL para ahorrarte problemas de configuración. Si trabajas sobre MySQL también encontrarás más soporte en los foros, o documentación, porque es el motor de BD que más se utiliza con Pentaho.

En respuesta a por Carlos

Carkos gracias por la respuesta, pero el detalle es que la empresa dpoonde aplicare el Data Mart tiene su base de datos transaccional en Sql Server 2000, ya trabaja con ese motor de BD, para trabajar con MySql, tendria que instalar en su servidor MySql aparte del que ya tiene Sql Server 2000, y migrar la data del Sql Server 2000 al MySql, Verdad? pero no crees que estoy haciendo doble trabajo, por que no le puedo decir a la empresa que se cambie de Sql Server 2000 a MySql, no esta dentro de la propuesta del proyecto y no creo que la empresa lo quiera hacer, ahora cual seria la solucion?, como te cometaba que quiero que el gerente pueda ingreasr a su data mart desde cualqueir parte del mundo via web para hacer sus compras de sus productos. de acuerdo a los indicadores de vejnta que generan el data mart.. agradeceria que me ayudaras atte. Gester

En respuesta a por GESTER TAFUR ROJAS (no verificado)

No es cuestión de cambiar de uno a otro. Cuando montas un DWH o un Datamart recoges datos de diferentes sistemas orígenes y montas una estructura de datos paralela, que es la que van a explotar las herramientas de Business Intelligence. Los sistemas origen, en tu caso la BD de SQLServer no se tocan, sólo se consultan.

Obviamente, puedes crear una nueva BD MySQL o SQLServer, o hacerlo dentro de la misma. Yo no te recomiendo hacerlo en la misma BD porque se puede incrementar bastante la carga del servidor, y a nivel de motor de BD no se parametriza igual una base de datos relacional que una de DWH. También has de tener en cuenta el tamaño de tu DM, si es muy pequeño puede que su impacto en el rendimiento también sea mínimo.

Sobre utilizar SQLServer tampoco te digo que no lo utilices, tiene que funcionar igual o mejor que MySQL, sólo que vas a encontrar más soporte con MySQL si tienes algún problema.

En respuesta a por Carlos

CARLOS, gracias por contestar,, queriendo trabajar con MySql, tengo que instalar MySql en el Servidor donde tambiem esta Sql Server 2000, y filtrar desde Sql Server a MySql verdad? osea tendre dos Motores de BD instaladas en la Pc Servidor, carlos no habra problema ?,, y luego trabajar con el pentaho desde MySql verdad..

Carlos otra pregunta, te decia que recien me estoy inciando con pentaho, lei en algunos foros que se necesita instalar el Apache toncat para trabajar con el pentaho para que este funcione como servidor Web, te comentaba que mi proyecto es que el gerente entre desde cualquier parte a su data y via web, y consulte su data mart para tomar desiciones, es neceszsario en mi caso trabajar con apache toncat o hay otra forma..

y si no es molestia Carlos tendras algun tutorial completo y detallado para ttrabajar con pentaho, apache toncat y Sql Server, sino es mucho pedir habra alguna forma que me proveas?

de ante te estoy agradecido carlos,, saludos cordiales
atte.- Gester T...

En respuesta a por GESTER TAFUR ROJAS (no verificado)

La BD de MySQL puedes instalarla donde te vaya mejor, en el mismo servidor de SQLServer, en un servidor independiente, o en el que instales Pentaho, que es lo más habitual.

Pentaho está escrito en JAVA y utiliza tecnología J2EE, por lo que sin un servidor de aplicaciones J2EE como Tomcat no es que no vayas a poder acceder por web, es que no te funcionaría nada. Por supuesto, con Tomcat no vas a tener ningún problema para acceder por web. Puedes probar, por ejemplo, desde labs.dataprix.com cómo se accede por web

Sobre el tutorial, vas a tener que buscar un poco, al ser una herramienta Open Source la documentación cambia muy a menudo y está bastante dispersa. Puedes buscar 'Pentaho' en el buscador de Dataprix, y encontrarás algunos materiales útiles. La documentación oficial está en el wiki de Pentaho. Por último, en la red hispana Open Business Intelligence hay bastantes miembros y grupos especiados en Pentaho que también te podrán ayudar con dudas más específicas.

Buenas...  tengo algunas dudas sobre el uso de pentaho y la conectividad que pueda aver con SQL SERVER 2005, ya que estoy planteando en mi proyecto de tesis, desarrollar data mart de ventas y cobros, empleando pentaho y con una BD sql server 2005 con historial(la bd pesa 29.5 GB), kisiera saber como seria la conexion y el orden en esta caso para emplear el pentaho , ya que como eh estado leendo tiene varias plataformas de la misma herramienta y q alguos hace confundir un pokito , asi que por favor si hay algun tutorial en sql 2005, o me pueden dar una ayuda con explikacion por favor se los agradeceria infinitamente , quiero hacer algo muy interesante con esta herramienta ... gracias de antemano