Carga Inicial
Hasta este momento los pasos metodológicos se han descritos de manera esquemática. Para la carga de la información se requiere utilizar una de las herramientas de que dispone Pentaho y que ayuda tanto al proceso de limpieza como de carga al Data WareHouse; dicha herramienta se llama Pentaho Data-Integration (PDI).Dentro de las mejores prácticas se recomienda el uso de áreas intermedias de almacenamiento de información, conocidas como Stage Area las cuales nos servirán como repositorios temporales de los datos.
Para habilitar el uso de PDI, abrimos una sesión de terminal y en el prompt del Sistema de Ubuntu, tecleamos, lo siguiente:
Lo primero que haremos será importar la información de los Cierres de Ejercicio que se encuentran en archivos de Excel y posteriormente lo cargaremos a una base temporal del servidor Mysql.
Carga inicial de la información de los Cierres de Ejercicio al área intermedia (stage area) del Data WareHouse
La lógica de spoon radica en el poder realizar tareas secuenciales conocidas como “Steps” y conectarla a la siguiente tarea mediante “Hops”; los pasos son acciones configurables que se seleccionan desde la pestaña de diseño, “Design”. Al conjunto de pasos que realizan una acción común se le conoce como “transformación”. Así mismo, es posible que un grupo de transformaciones que tengan un fin común puedan configurarse en un “Job” o trabajo.