Pentaho y manipulacion de datos en Excel

alex_xp

Gold Member
Se incorporó
12 Octubre 2004
Mensajes
2.572
Buenas tarde estimados.

Tengo la siguiente problemática:

Estoy viendo unos servicios de integración OSB que viven en distintos dominios y realice un extracción de varios datos (de los servicios), los manipule y los deje en un consolidado de Excel.

Ahora tengo que hacer un filtro para crear una hoja que me permita ver si ciertos servicios que se llaman igual viven en más de un dominio y si sus demás datos también son iguales. Como con las formulas de Excel no me permiten encontrar más de una coincidencia pensé que podría hacerlo con algunas de las herramientas de Pentaho cosa que en una lista dada, encontrar todas las coincidencias y mostrarlas.
Lo otro sería hacer por VBA pero tal vez me demoraría más.

Eso, saludos y gracias por leerme
 

t3b4n

Ocioso
Se incorporó
27 Febrero 2006
Mensajes
1.640
No entiendo si tienes una consulta o sólo quieres compartir lo que estás haciendo. Si es alguna consulta sobre Pentaho a lo mejor puedo ayudar.
 
Upvote 0

alex_xp

Gold Member
Se incorporó
12 Octubre 2004
Mensajes
2.572
Es una consulta estimado, estoy compartiendo la problemática. Si me puedes ayudar sería genial.
Saludos
 
Upvote 0

t3b4n

Ocioso
Se incorporó
27 Febrero 2006
Mensajes
1.640
No entiendo la consulta. ¿Podrías elaborar un poco más? Para ayudar en un tema así de técnico, se requiere un poco más de información y, de ser posible, un ejemplo de lo que tienes y otro de lo que quieres conseguir.
 
Upvote 0

alex_xp

Gold Member
Se incorporó
12 Octubre 2004
Mensajes
2.572
No entiendo la consulta. ¿Podrías elaborar un poco más? Para ayudar en un tema así de técnico, se requiere un poco más de información y, de ser posible, un ejemplo de lo que tienes y otro de lo que quieres conseguir.
Hola y disculpa la demora en responder pero el trabajo no me dejo:
Bueno el problema ya lo resolví pero aún me gustaría ver si se puede resolver con BI ya que esto después hay que replicarlo a otros negocios.

Espero poder explicarlo mejor esta vez:

Tengo un archivo Excel en el que la Hoja 1,2 y 3 poseen datos en 2 columnas ( nombre del servicio y cantidad de transacciones)
En la hoja 4 hice un consolidado de todos los servicios de todos los dominios, es decir tiene el detalle completo de los servicios. (Nombre del servicio, dominio, ubicación, etc), por lo cual un mismo servicio puede estar repetido varias veces.
Lo que tengo que hacer es :

De los nombre del servicio de la hoja 1,2 y 3 se deben buscar todas las coincidencias que existen en la Hoja4 y esas coincidencias dejar el detalle completo (Nombre del servicio, dominio, ubicación, etc) en una nueva Hoja (Hoja 5).

Eso, no se si ahora me explique mejor?

Saludos
 
Upvote 0

t3b4n

Ocioso
Se incorporó
27 Febrero 2006
Mensajes
1.640
Ahora sí se entiende :)

En Pentaho Data Integrator puedes conseguirlo con unos pocos steps. Necesitas lo siguiente:

  1. Crear una nueva transformación.
  2. Agregar un step Microsoft Excel Input para leer las hojas 1 a 4. Un step por cada hoja.
  3. Conectar todos los steps de entrada, por separado, a un step "Sort rows". Eso te permitira ordenar los registros. Debes hacer el sorting por la columna que tus hojas usan como clave para hacer el join.
  4. Agregar un step Merge Join que conecte los sort mediante el campo clave (inner join). Primero conectas el sort de la hoja 1 y 4, luego conectas la salida de este con el sort de la hoja 2 y finalmente la salida de ese con el sort de la hoja 3.
  5. Por último, conectas la salida de ese último join a un Microsoft Excel Writer para escribir los resultados a la hoja 5. Para que no te sobreescriba el archivo debes cambiar la opción "If input file exists" a "Use existing file for writing"
Eso es todo, a grandes rasgos.
 
Upvote 0

alex_xp

Gold Member
Se incorporó
12 Octubre 2004
Mensajes
2.572
Buena, te pasaste.
Voy a hacer algunas pruebas conceptos ya que para este tipo de análisis es necesario agregar tecnología dejar de hacer algunas cosas a mano.

Saludos
 
Upvote 0
Subir