Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ......

167
Universidad Central del Ecuador UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE INGENIERÍA, CIENCIAS FÍSICAS Y MATEMÁTICA CARRERA DE INGENIERÍA INFORMÁTICA IMPLEMENTACIÓN DE UNA SUITE DE INTELIGENCIA DE NEGOCIOS PARA EL “SISTEMA DE INFORMACIÓN PARA LA GESTIÓN DEL PATRIMONIO CULTURAL ABACO” TRABAJO DE GRADUACIÓN PREVIO A LA OBTENCIÓN DEL TÍTULO DE INGENIERO EN INFORMÁTICA AUTOR: ANABELL GERELDINNE CARRERA PAREDES TUTOR: ING. SANTIAGO MORALES CARDOSO M.SC. QUITO-ECUADOR 2015

Transcript of Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ......

Page 1: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

Universidad Central del Ecuador

UNIVERSIDAD CENTRAL DEL ECUADOR

FACULTAD DE INGENIERÍA, CIENCIAS FÍSICAS

Y MATEMÁTICA

CARRERA DE INGENIERÍA INFORMÁTICA

IMPLEMENTACIÓN DE UNA SUITE DE INTELIGENCIA DE NEGOCIOS

PARA EL “SISTEMA DE INFORMACIÓN PARA LA GESTIÓN DEL

PATRIMONIO CULTURAL – ABACO”

TRABAJO DE GRADUACIÓN PREVIO A LA OBTENCIÓN DEL TÍTULO DE

INGENIERO EN INFORMÁTICA

AUTOR:

ANABELL GERELDINNE CARRERA PAREDES

TUTOR: ING. SANTIAGO MORALES CARDOSO M.SC.

QUITO-ECUADOR

2015

Page 2: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

II

DEDICATORIA

El presente trabajo de investigación quiero dedicarlo primeramente a Dios

quien ha sido mi luz, mi guía y mi fuerza para seguir adelante.

A mis padres Napoleón y Mónica, quien con su amor, esfuerzo, dedicación y

valores me han formado con principios sólidos para ser una persona de bien y

enseñarme que se debe luchar por las metas que uno se propone en la vida.

A mis hermanos Christian, Gabriel, Katty y a mi abuelita Piedad quienes con su

amor, cariño y consejos me han brindado su apoyo incondicional.

A mis grandes amigos Luis y Diana, por el apoyo, cariño y esos momentos

inolvidables que hemos pasado que han permitido que nuestra amistad sea

sincero y duradera.

Anabell Carrera

Page 3: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

III

AGRADECIMIENTO

Primeramente quiero agradecer a Dios por su inmenso amor y por ser mi guía

en cada paso que doy, cuidándome y dándome fortaleza para continuar.

A mis Padres les estoy eternamente agradecida por ser los pilares

fundamentales y apoyo incondicional en mi vida, su tenacidad y lucha

insaciable han hecho de ellos el gran ejemplo a seguir no solo para mi sino

para mis hermanos, porque han velado por nuestro bienestar y educación.

A mí querida madre que ha depositado su entera confianza en mí en cada reto

que se me presentaba sin dudar ni un solo momento en mí.

Principalmente quiero agradecer a mi Padre Napoleón Carrera que ha sido mi

ejemplo para luchar y alcanzar mis metas propuestas, por sus consejos, sus

llamas de atención e incluso por sus enojos que me hicieron ver que nunca

debo darme por vencida,

Por su incondicional apoyo, tanto al inicio como al final de mi carrera; por estar

pendiente de mí a cada momento. Gracias Papá por ser ejemplo de arduo

trabajo y tenaz lucha en la vida.

No obstante quiero agradecer a mi tutor por el apoyo y el tiempo que me ha

brindado en este proyecto, por su esfuerzo y dedicación quien con sus

conocimientos, su experiencia, su paciencia y su motivación ha logrado en mí

que pueda terminar mis estudios con éxito.

Son muchas las personas que han formado parte de mi vida profesional a las

que me encantaría agradecer por su amistad, consejos, apoyo, ánimo y

compañía en los momentos más difíciles de mi vida. Algunas están aquí

conmigo y otras en mis recuerdos y en mi corazón, sin importar en donde estén

quiero darles las gracias por formar parte de mí, por todo lo que me han

brindado y por todas sus bendiciones.

Anabell Carrera

Page 4: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

IV

AUTORIZACIÓN DE LA AUTORÍA INTELECTUAL

Page 5: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

V

CERTIFICACIÓN

Page 6: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

VI

Page 7: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

VII

CONTENIDO

AGRADECIMIENTO ......................................................................................... III

CERTIFICACIÓN ............................................................................................... V

CONTENIDO .................................................................................................... VII

LISTA DE TABLAS ........................................................................................... X

LISTA DE GRÁFICOS ...................................................................................... XI

RESUMEN ...................................................................................................... XV

ABSTRACT .................................................................................................... XVI

CAPÍTULO I. GENERALIDADES ...................................................................... 1

1.1 Reseña Histórica INPC ........................................................................... 1

2.1.1.1 Valores Corporativos, Misión y Visión. .............................. 1

2.1.1.2 Cadena de valor. .................................................................. 3

2.1.1.3 Estructura Organizacional del INPC. .................................. 5

1.2 Base Legal............................................................................................... 8

1.3 Planteamiento del Problema .................................................................. 9

1.4 Formulación del Problema................................................................... 10

1.4.1 Interrogantes de la Investigación ................................................ 11

1.5 Objetivos de la Investigación .............................................................. 11

1.5.1 Objetivo General ......................................................................... 11

1.5.2 Objetivos Específicos ................................................................. 11

1.6 Justificación .......................................................................................... 12

1.7 Delimitación .......................................................................................... 12

CAPÍTULO II MARCO REFERENCIAL ......................................................... 13

2.2 Fundamentación Teórica ..................................................................... 13

2.2.1 Patrimonio Cultural ..................................................................... 13

2.2.2 Patrimonio Cultural Inmaterial .................................................... 15

2.2.3 Patrimonio Cultural Material ....................................................... 15

2.2.3.1 Bienes Muebles .................................................................. 16

2.2.3.1.1 Bienes Inmuebles .................................................. 16

2.2.3.1.2 Bienes Documentales ........................................... 17

2.2.3.1.3 Bienes Arqueológicos ........................................... 18

Page 8: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

VIII

2.2.4 Diferencia entre Datos, información y Conocimientos ................ 19

2.2.5 Inteligencia de Negocios ............................................................. 20

2.2.6 Datawarehouse y Datamart ........................................................ 23

2.2.6.1 Datawarehouse ................................................................... 23

2.2.6.2 Datamarts............................................................................ 28

2.2.7 Modelos Multidimensionales ....................................................... 29

2.2.8 Esquema de Presentación .......................................................... 31

2.3 Marco Conceptual ................................................................................ 32

2.4 Metodología de Desarrollo de Software. ............................................ 41

2.5 Selección de la metodología de Desarrollo ........................................ 41

2.6 Selección de Herramientas .................................................................. 42

2.6.1 Gestor de Base de Datos PostgreSQL ....................................... 42

2.6.2 Pentaho BI Plataforma y Servidor............................................... 43

2.6.3 Mondrian ..................................................................................... 45

CAPÍTULO III. IMPLEMENTACIÓN DE UNA SUITE BI PARA EL INPC ..... 46

3.1 Análisis de Inteligencia de Negocios ...................................... 46

3.2 Procesos de Inteligencia de Negocios ................................... 47

3.2.1 Integración de fuentes de datos ....................................... 47

3.2.2 Análisis de datos ................................................................ 47

3.3 Definición de Requisitos Funcionales BI ............................... 48

3.1.1 Catalogación de Requisitos .............................................. 48

3.1.2 Requisitos de Usuario ....................................................... 48

3.1.3 Requisitos Funcionales ..................................................... 48

3.1.4 Requisitos Tecnológicos. .................................................. 51

3.4 Análisis de Requerimientos ..................................................... 52

3.1.5 Simbologías de la herramienta utilizada Umbrello ................ 52

3.1.6 Diagrama de Contexto .............................................................. 53

3.1.7 Paquete de DSS ........................................................................ 55

3.1.7.1 Paquete de Análisis Bienes Inmateriales ......................... 55

3.1.7.2 Paquete de Análisis Bienes Muebles ............................... 57

3.1.7.3 Paquete de Análisis Bienes Inmuebles ............................ 61

3.1.7.4 Paquete de Análisis Bienes Arqueológicos..................... 63

3.1.7.5 Paquete de Análisis de Bienes Documentales ................ 67

Page 9: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

IX

3.5 Modelo de Datos Fuente. ......................................................... 67

3.5.1 Entidades y Descripciones................................................ 68

3.6 Submodelos .............................................................................. 69

3.6.1 DataMart Inmateriales ........................................................ 71

3.6.1.1 ETLs Bienes Inmateriales .................................................. 71

3.6.2 DataMart Bienes Muebles .................................................. 74

3.6.2.1 ETLs Bienes Muebles ........................................................ 74

3.6.3 DataMart Bienes Arqueológicos ....................................... 77

3.6.3.1 ETLs Bienes Arqueológicos .............................................. 78

3.6.4 Tableros Gráficos ............................................................... 80

CAPÍTULO V. CONCLUSIONES Y RECOMENDACIONES ......................... 83

REFERENCIA BIBLIOGRAFICA ..................................................................... 85

ANEXO 1: MANUAL DE MONDRIAN SCHEMA WORKBENCH ........ 88

ANEXO 2: MANUAL BUSINESS INTELLIGENCE PENTAHO ......... 110

ANEXO 3: MANUAL DE INSTALACIÓN DE POSTGRESQL 9.0 ..... 127

ANEXO 4: MANUAL DE CONFIGURACIÓN DEL SERVIDOR DE PENTAHO

146

ANEXO 5: MANUAL DE EJECUCIÓN SCRIPT ETL PENTAHO DEL INPC

147

Page 10: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

X

LISTA DE TABLAS

Tabla 1: Detalle Registros Bienes Inmateriales .................................................. 7

Tabla 2: Detalle de las Direcciones Regionales del INPC .................................. 8

Tabla 3: Clasificación de los Bienes del Patrimonio Cultural ............................ 14

Tabla 4: Detalle Bienes Muebles ...................................................................... 16

Tabla 5 : Detalle Bienes Inmuebles .................................................................. 17

Tabla 6 : Detalle Bienes Inmuebles .................................................................. 17

Tabla 7: Detalle Bienes Documentales ............................................................ 18

Tabla 8: Detalle Bienes Documentales ............................................................ 18

Tabla 9: Diferencias entre sistemas Transaccionales y Basados en DW ......... 25

Tabla 10: Diferencias entre un Datawarehouse y Datamart ............................. 28

Tabla 11: Subdivisión de Bienes Muebles ........................................................ 49

Tabla 12: Subdivisión de Bienes Arqueológicos............................................... 50

Tabla 13: Simbología Utilizada UML Umbrello ................................................. 53

Tabla 14: Caso de Uso Análisis Bienes Inmateriales ...................................... 57

Tabla 15: Caso de Uso Análisis Bienes Muebles ............................................ 59

Tabla 16: Caso de Uso Análisis Bienes Muebles Arqueológicos .................... 61

Tabla 17: Caso de Uso Análisis Bienes Inmuebles .......................................... 63

Tabla 18: Caso de Uso Bienes Arqueológicos – Yacimientos .......................... 65

Tabla 19: Caso de Uso Análisis Bienes Arqueológicos – Colecciones ........... 67

Tabla 20: Principales entidades del modelo de datos fuente ........................... 68

Tabla 21: Principales entidades de los Submodelos ........................................ 70

Page 11: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

XI

LISTA DE GRÁFICOS

Figura 1: Cadena de Valor ................................................................................. 4

Figura 2: Mapa de Procesos .............................................................................. 5

Figura 3: Estructura Organizacional del INPC ................................................... 5

Figura 4: Pirámide de datos, información y conocimiento ................................ 19

Figura 5: Pirámide Organizacional ................................................................... 21

Figura 6: Pirámide Organizacional ................................................................... 21

Figura 7: Elementos Básicos de un DW ........................................................... 26

Figura 8: Estructura Básica de un DW ............................................................. 27

Figura 9: Estructura Básica de un DW ............................................................. 27

Figura 10: Diagrama de Contexto INPC ........................................................... 54

Figura 11: Diagrama de Contexto Ampliado..................................................... 54

Figura 12: DSS Ámbitos del INPC .................................................................... 55

Figura 13: Diagrama de Casos de Uso Bienes Inmateriales ............................ 56

Figura 14: Diagrama de Casos de Uso Bienes Muebles .................................. 58

Figura 15: Diagrama de Casos de Uso Bienes Muebles Arqueológicos .......... 60

Figura 16: Diagrama de Casos de Uso Bienes Inmuebles ............................... 62

Figura 17: Diagrama de Casos de Uso Bienes Arqueológicos - Yacimientos .. 64

Figura 18: Diagrama de Casos de Uso Bienes Arqueológicos - Colecciones .. 66

Figura 19: Datamart Bienes Inmateriales ......................................................... 71

Figura 20: ETL Tabla de Hechos fac_control_periosidad ................................. 71

Figura 21: ETL Tabla de Hechos fac_identificacion ......................................... 71

Figura 22: ETL Tabla de Dimensiones Provincia ............................................. 72

Figura 23: ETL Tabla de Dimensiones Canton................................................. 72

Figura 24: ETL Tabla de Dimensiones Parroquia ............................................. 72

Figura 25: ETL Tabla de Dimensiones Lengua ................................................ 72

Figura 26: ETL Tabla de Dimensiones Sub_Ambito ......................................... 72

Figura 27: Analisis Dimensional de Bienes Inmateriales por provincia, cantón y

Lengua ............................................................................................................. 73

Figura 28: Análisis Grafico de Bienes Inmateriales por provincia, cantón y

Lengua ............................................................................................................. 73

Figura 29: Datamart Bienes Muebles ............................................................... 74

Page 12: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

XII

Figura 30: ETL Tabla de Hechos fac_control_muebles .................................... 74

Figura 31: ETL Tabla de Dimensiones Provincia ............................................. 75

Figura 32: ETL Tabla de Dimensiones Canton................................................. 75

Figura 33: ETL Tabla de Dimensiones Parroquia ............................................. 75

Figura 34: ETL Tabla de Dimensiones tipo_bien .............................................. 75

Figura 35: ETL Tabla de Dimensiones dim_material ........................................ 75

Figura 36: Análisis Dimensional de Bienes Muebles por Fechas, provincia, y

Entidad ............................................................................................................. 76

Figura 37: Análisis Gráfico de Bienes Muebles por Fechas, provincia, y Entidad

......................................................................................................................... 77

Figura 38: DataMart Bienes Arqueológicos ...................................................... 77

Figura 39: ETL Tabla de Hechos fac_control_regimen .................................... 78

Figura 40: ETL Tabla de Dimensiones Provincia ............................................. 78

Figura 41: ETL Tabla de Dimensiones Canton................................................. 78

Figura 42: ETL Tabla de Dimensiones Parroquia ............................................. 78

Figura 43: ETL Tabla de Dimensiones dim_material ........................................ 79

Figura 44: ETL Tabla de Dimensiones dim_bien_cultural ................................ 79

Figura 45: Ejemplo Reporte de Bienes Arqueológico ....................................... 79

Figura 46: Ejemplo Gráfico de Bienes Arqueológicos ...................................... 80

Figura 47: Ejemplo de Indicadores de Mando del INPC ................................... 82

Figura 48: Acceso a Worbench ........................................................................ 89

Figura 49: Conexión ......................................................................................... 89

Figura 50: Conexión PostgreSql ....................................................................... 90

Figura 51: Schema ........................................................................................... 93

Figura 52: Crear Cubo ...................................................................................... 94

Figura 53: Enabled controla Mondrian ............................................................. 94

Figura 54: Tabla de Hechos ............................................................................. 95

Figura 55: Alias Tabla ...................................................................................... 96

Figura 56: Dimensión ....................................................................................... 96

Figura 57: Jerarquía Cubos .............................................................................. 97

Figura 58: Añadir Jerarquías ............................................................................ 98

Figura 59: Niveles de Jerarquías ...................................................................... 99

Figura 60: Forenkey Tabla hechos ................................................................. 101

Page 13: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

XIII

Figura 61: Estructura Tabla hechos ............................................................... 102

Figura 62: Dimensiones Fechas ..................................................................... 103

Figura 63: Varios niveles en una dimensión ................................................... 104

Figura 64: Estructura con varios niveles ........................................................ 105

Figura 65: Medidas ......................................................................................... 106

Figura 66: Orden de las medidas ................................................................... 106

Figura 67: Medida Cantones .......................................................................... 108

Figura 68: Guardar Cubo ............................................................................... 109

Figura 69: Publicar Cubo ................................................................................ 109

Figura 70: Imagen comprobación máquina virtual .......................................... 110

Figura 71: Configuración variables de entorno ............................................... 111

Figura 72: Configuración Variables de entorno dos ....................................... 112

Figura 73: Creación variables de entorno ...................................................... 113

Figura 74: Imagen administración consola .................................................... 114

Figura 75: Códigos correctos administración consola .................................... 114

Figura 76: Dirección navegador administración consola ................................ 115

Figura 77: Imagen usuario administrador y password .................................... 115

Figura 78: Imagen accesos a la consola de administración ........................... 116

Figura 79: Anadir usuarios administración ..................................................... 117

Figura 80: Añadir permisos a los usuarios. .................................................... 117

Figura 81: Inicio servidor Pentaho .................................................................. 119

Figura 82: Imagen login Pentaho ................................................................... 120

Figura 83: Acceso al servidor con un usuario administrador .......................... 120

Figura 84: Imagen de acceso al servidor ....................................................... 121

Figura 85: Selección de esquema .................................................................. 121

Figura 86: Imagen Interactiva de un cubo ...................................................... 122

Figura 87: Imagen con varias dimensiones .................................................... 122

Figura 88: Imagen select reporte mondrian .................................................... 123

Figura 89: Imagen con columnas, filas y filtros............................................... 123

Figura 90: Imagen modificación columnas y filtros ......................................... 124

Figura 91: Imagen con nuevas dimensiones .................................................. 124

Figura 92: Imagen modificación datos dimensión .......................................... 125

Figura 93: Imagen con nuevos medidas y grafico .......................................... 126

Page 14: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

XIV

Figura 94: Imagen Ejecutable Administrador PostgreSql ............................... 128

Figura 95: Imagen Advertencia de Ejecución ................................................. 129

Figura 96: Imagen Proceso siguiente paso de instalación ............................. 129

Figura 97: Imagen Ruta de Instalación ........................................................... 130

Figura 98: Imagen Almacén de datos ............................................................. 130

Figura 99: Imagen Contraseña de acceso ..................................................... 131

Figura 100: Imagen Puerto PostgreSql .......................................................... 132

Figura 101: Imagen Configuración Regional .................................................. 132

Figura 102: Imagen Inicio Instalación ............................................................. 133

Figura 103: Imagen proceso Instalación ........................................................ 134

Figura 104: Imagen Stack Builder .................................................................. 134

Figura 105: Imagen Selección paquetes extras ............................................ 135

Figura 106: Imagen marcar selección ............................................................ 135

Figura 107: Imagen Servicios PostgreSql ...................................................... 136

Figura 108: Imagen Subcarpetas PostgreSql ................................................ 136

Figura 109: Imagen Almacén datos ................................................................ 137

Figura 110: Inicio aplicación PostgreSql ........................................................ 138

Figura 111: Imagen Conexión PostgreSql ...................................................... 139

Figura 112: Imagen Introducción contraseña PostgreSql ............................... 139

Figura 113: Imagen Interactiva de un cubo .................................................... 140

Figura 114: Imagen Creación de roles ........................................................... 141

Figura 115: Imagen Propiedades Rol ............................................................. 142

Figura 116: Imagen Privilegios Rol ................................................................. 143

Figura 117: Imagen Creación Tablas ............................................................. 144

Figura 118: Imagen Propiedades Tabla ......................................................... 145

A

Page 15: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

XV

RESUMEN

IMPLEMENTACIÓN DE UNA SUITE DE INTELIGENCIA DE NEGOCIOS

PARA EL “SISTEMA DE INFORMACIÓN PARA LA GESTIÓN DEL

PATRIMONIO CULTURAL – ABACO”

El presente trabajo de tesis, tiene como principal propósito aplicar los

conocimientos adquiridos en el trascurso de la carrera de Ingeniería

Informática, por tal motivo se trata de aportar una suite de Inteligencia de

Negocios que automatice de mejor manera la extracción de la información para

minimizar el tiempo que se emplea en realizar un análisis de la información

filtrada en el INPC.

A continuación se detalla el aporte de cada capítulo para facilitar la lectura de

los apartados en base a la investigación realizada:

CAPITULO I. Generalidades: En este capítulo se describe la reseña histórica,

Base Legal, Planteamiento y formulación del problema así como los objetivos,

Justificación y delimitación del proyecto.

CAPITULO II. Marco Referencial: En este capítulo se presentan la

Fundamentación teórica, marco conceptual, metodología y selección de

herramientas.

CAPITULO III. Implementación de una Suite de BI para el INPC: En este

capítulo se observa el análisis y procesos de Inteligencia de Negocios,

Definición de Requerimientos, Modelos de Datos de fuentes, definición y

análisis de requisitos.

CAPITULO IV. Conclusiones y Recomendaciones: Este capítulo complementa

con la presentación de las conclusiones, recomendaciones, referencia

bibliográfica utilizada, anexos que incluyen Manuales de Instalación y

configuración de Mondrian Workbench, Pentaho, Postgresql, Servidor Pentaho.

DESCRIPTORES

APLICACIÓN WEB / ABACO / POSTGRES / GOBERNABILIDAD/ PENTAHO/

WORKBENCH

Page 16: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

XVI

ABSTRACT

IMPLEMENTATION OF A SUITE OF BUSINESS INTELLIGENCE FOR THE

"INFORMATION SYSTEM FOR MANAGEMENT OF CULTURAL HERITAGE -

ABACO"

This thesis work has as main purpose to apply the knowledge acquired in the

course of the Computer Engineering career for that reason is to provide a suite

of Business Intelligence to improve automate the extraction information to

minimize the time spent in performing an analysis of the filtered information in

the CPI.

Then the contribution of each chapter to facilitate detailed reading of

paragraphs based on the investigation :

CHAPTER I. Overview : In this chapter the historical review , Legal Base,

Planning and formulation of the problem and the objectives, rationale and

definition of the project is described .

CHAPTER II. Reference Framework : In this chapter the theoretical

foundations, conceptual framework , methodology and tool selection are

presented .

CHAPTER III. Deploying a BI Suite for the CPI : In this chapter the analysis and

business intelligence processes , Requirements Definition , Models Data

sources , definitions and requirements analysis are observed.

CHAPTER IV. Conclusions and Recommendations: This chapter complements

the presentation of findings , recommendations , bibliographic references used ,

including accompanying manuals Installation and Configuration Workbench

Mondrian , Pentaho , Postgresql , Pentaho server.

DESCRIPTOR

WEB APPLICATION / ABACO / POSTGRES / GOVERNANCE / PENTAHO /

WORKBENCH

Page 17: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

XVII

Page 18: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

XVIII

Page 19: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

1

CAPÍTULO I. GENERALIDADES

1.1 Reseña Histórica INPC

En el marco de las nuevas políticas estatales de implementación de un modelo

de desarrollo integral, dentro del proceso general de reforma del Estado, el

Instituto Nacional de Patrimonio Cultural (INPC) es un ente con énfasis en

investigación y generación de metodologías.

Creado mediante Decreto Supremo 2600 del 9 de junio de 1978 (Registro

Oficial No. 618 de 29 de junio de 1978), el INPC es el encargado de investigar,

conservar, preservar, restaurar, exhibir y promocionar el Patrimonio Cultural en

el Ecuador; así como regular, de acuerdo a la ley, todas las actividades de esta

naturaleza que se realicen en el país.

El INPC cuenta ahora con una estructura organizacional, acorde a la naturaleza

y especialización de la misión consagrada en la Ley de Patrimonio Cultural.

El Instituto Nacional de Patrimonio Cultural (INPC) es un ente con énfasis en

investigación y generación de metodologías, en el marco de las nuevas

políticas estatales de implementación de un modelo de desarrollo integral,

dentro del proceso general de reforma del Estado,

2.1.1.1 Valores Corporativos, Misión y Visión.

Misión

El INPC es una Entidad del Sector Público con ámbito nacional, encargada de

investigar, normar, regular, asesorar y promocionar las políticas sectoriales de

la gestión patrimonial, para la preservación, conservación, apropiación y uso

adecuado del patrimonio material e inmaterial.

Page 20: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

2

Visión

En el 2015 el INPC se consolidará como un centro de investigación

especializado, con una alta capacidad científico-técnica, que permita el estudio,

análisis y aplicación de teorías, metodologías y técnicas para: catalogar,

documentar, proteger y potenciar los bienes patrimoniales, con la finalidad de

difundir y lograr la concienciación de los diversos actores involucrados, sobre la

importancia y preservación del patrimonio cultural para beneficio de las

presentes y futuras generaciones.

Valores Corporativos

El espíritu constructivo hace referencia a la actitud positiva, al optimismo, al

incremento de la cadena de valor, a la creatividad que debe prevalecer en la

intención y en la acción de quienes laboran en el Instituto Nacional de

Patrimonio Cultural.

Esto, sin olvidar que el objetivo primordial del INPC es consolidarse como un

centro de Investigación-Desarrollo y sistematización del conocimiento

Científico-Técnico del patrimonio cultural, mediante el estudio, análisis y

aplicación de teorías, metodologías y técnicas para: catalogar, documentar,

conservar, proteger y potenciar el patrimonio material o tangible e inmaterial o

intangible, con la finalidad de difundir hacia los actores involucrados las

mejores opciones de conservación del patrimonio.

Como fundamento en los valores del INPC se tienen:

Demostrar en todo momento una actitud positiva, emprendedora y

optimista sobre el trabajo buscando siempre soluciones y decisiones

acertadas sumándose a la misión que tiene como instituto.

Actuar permanentemente con decisiones rectas en la ejecución de los

proyectos y tareas, buscando siempre las formas y métodos que

aseguren los óptimos resultados de éxito, productividad y eficiencia.

Page 21: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

3

El respeto a los demás es un valor básico que induce a la cordialidad,

armonía, aceptación e inclusión que deben tener dentro del ámbito laboral del

INPC, considerando este valor se debe promover relaciones humanas

cordiales, respetuosas con los miembros que conforman el INPC, como son:

directores, colaboradores y compañeros de trabajo.

La lealtad hace referencia a la fidelidad, la identificación y sobre todo la

confidencialidad y defensa de intereses que en todo momento debe demostrar

todas las personas que conforman el INPC.

La excelencia en el logro de objetivos es un valor determinante que demanda

calidad, esfuerzo y empeño para lograr resultados exitosos y por consiguiente

el cumplimiento del objetivo primordial del INPC.

El profesionalismo es la responsabilidad, seriedad, constancia con la que el

INPC cada día se entrega con dedicación y esmero.

La honestidad es la rectitud, honorabilidad y el respeto que tienen todas las

personas que laboran en el INPC.

2.1.1.2 Cadena de valor.

Los procesos del INPC, se ordenan y clasifican en función de su grado de

contribución o valor agregado al cumplimiento de la misión institucional.

Los procesos gobernantes: Orientan la gestión institucional a través de la

formulación de políticas, la expedición de directrices, políticas, normas,

procedimientos, planes estratégicos, acuerdos, resoluciones e instrumentos

para el funcionamiento de la organización, la articulación, coordinación y

establecimiento de mecanismos para la ejecución de los planes, programas,

proyectos, directrices para el buen desempeño de la gestión cultural a nivel

nacional.

Los procesos agregadores de valor: Son los responsables de generar,

administrar y controlar el portafolio de productos y servicios primarios

destinados satisfacer las demandas de los usuarios externos, los cuales

Page 22: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

4

permiten cumplir con la misión institucional, los objetivos estratégicos y

constituyen la razón de ser de la Institución.

Los procesos habilitantes: Están encaminados a generar el portafolio de

productos y servicios secundarios institucionales demandados por los procesos

gobernantes, agregadores de valor y para sí mismos, viabilizando la gestión.

.

Figura 1: Cadena de Valor

Autor: Ministerio de Cultura del Ecuador

Fuente: http://www.culturaypatrimonio.gob.ec/

Page 23: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

5

Figura 2: Mapa de Procesos

Autor: Ministerio de Cultura del Ecuador

Fuente: http://www.culturaypatrimonio.gob.ec/

2.1.1.3 Estructura Organizacional del INPC.

La estructura organizacional del INPC está conformada de la siguiente manera:

Figura 3: Estructura Organizacional del INPC

Autor: Ministerio de Cultura del Ecuador

Fuente: http://www.culturaypatrimonio.gob.ec/

Page 24: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

6

Instituto Nacional de Patrimonio Cultural

Responsable: Director/a de Patrimonio Cultural

Estructura básica:

El Instituto Nacional de Patrimonio Cultural se gestiona a través de las

siguientes Direcciones y de la Unidad de Investigación:

1. Dirección de conservación y riesgo

Responsable: director/a de conservación y riesgo

Misión: Implementar herramientas técnicas y jurídicas que permitan fiscalizar

el manejo, tránsito y difusión integral del Patrimonio Cultural, para la reducción

de riesgos, manejo de emergencias y seguimiento de proyectos orientados a la

salvaguarda del patrimonio presentados por personas naturales o jurídicas a

nivel nacional e internacional.

2. Dirección de regulación y control

Responsable: Director/a de regulación y control

Misión: Dirigir los procesos de construcción de políticas públicas para regular y

controlar la conservación, restauración, fiscalización, difusión y puesta en valor

de bienes patrimoniales, lucha contra el tráfico ilícito de bienes culturales,

manejo de emergencias y seguimiento de proyectos, registro, inventario,

catalogación para su oportuna gestión, protección, circulación y control.

3. Dirección de registro, inventario y catalogación

Responsable: director/a de inventario y catalogación

Misión: Dirigir los procesos de construcción de políticas públicas para el

registro, inventario y catalogación del patrimonio cultural y la gestión de la

información patrimonial.

A continuación se detalla los procesos que realiza el mencionado ítem:

Page 25: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

7

Tabla 1: Detalle Registros Bienes Inmateriales

En el marco de las nuevas políticas estatales de implementación de un modelo

de desarrollo integral, dentro del proceso general de reforma del Estado, el

Instituto Nacional de Patrimonio Cultural es un ente con énfasis en

investigación y generación de metodologías.

El INPC cuenta ahora con una estructura organizacional, acorde a la naturaleza

y especialización de la misión consagrada en la Ley de Patrimonio Cultural.

Como parte del proceso de descentralización, el INPC se inserta en la

regionalización nacional con siete Direcciones Regionales las cuales los

directores regionales administrarán sus respectivas zonas administrativas.

REGISTRO INVENTARIO CATALOGACIÓN

Identifica los bienes culturales,

materiales e inmateriales.

Describe los bienes que tienen

una valoración patrimonial y por

lo tanto valores excepcionales

que deben ser protegidos,

conservados y difundidos.

Estudia, a mayor profundidad, los

bienes inventariados, mediante

estudios hiistoricos,

iconográficos, arquitectónicos,

antropológicos, etnográficos, etc.

Refiere el universo cultural que

tiene el pais.

Especifica el universo del

Patrimonio Cultural que tiene el

país.

Documenta de manera científica,

sistémica y metodológica los

bienes Patrimoniales

Establece el estado de

conservación de los bienes

culturales materiales y

salvaguardia del patrimonio

cultural inmaterial.

Detalla el estado de

vulnerabilidad y amenaza de los

bienes inmateriales y materiales

del Patrimonio Cultural, que

tiene en relacion a los riesgos

naturales y antrópicos

Page 26: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

8

Tabla 2: Detalle de las Direcciones Regionales del INPC

1.2 Base Legal

La Gestión del Patrimonio en el país cuenta con importantes instrumentos

legales que la amparan.

La Constitución de la República en varios de sus artículos establece los

principios para la conservación y gestión del Patrimonio Cultural, así:

• Art. 21 al 25, sobre los derechos culturales.

• Art.264, sobre la competencia exclusiva de los Gobiernos Autónomos

Descentralizados en la planificación, construcción, conservación y

defensa del Patrimonio.

• Art. 377, sobre la conformación del Sistema Nacional de Cultura.

• Art. 379, sobre los ámbitos del Patrimonio Cultural tangible e intangible.

El Código Orgánico de Ordenamiento Territorial, Autonomías y

Descentralización (COOTAD) en el Art. 144 señala:

“Corresponde a los gobiernos autónomos descentralizados municipales,

formular, aprobar, ejecutar y evaluar los planes, programas y proyectos

REGIONAL

1

REGIONAL

2

REGIONAL

3

REGIONAL

4

REGIONAL

5

REGIONAL

6

REGIONAL

7

REGIÓN

NORTE

REGIÓN

CENTRO

NORTE

REGIÓN

CENTRO

REGIÓN

PACÍFICO

REGIÓN

LITORAL

REGIÓN

CENTRO-

SUR

REGIÓN

SUR

 Carchi  Napo Chimborazo  Manabí  Bolívar  Azuay  El Oro

Esmeraldas  Pichincha  Cotopaxi

 Santo

Domingo de

los

 Guayas  Cañar  Loja

 Imbabura  Orellana  Pastaza  Los Ríos Morona

Santiago

 Zamora

Chinchipe

Sucumbíos Tungurahua  Santa Elena

Page 27: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

9

destinados a la preservación, mantenimiento y difusión del Patrimonio

arquitectónico, cultural y natural, de su circunscripción y construir los espacios

públicos para estos fines…Será responsabilidad del Gobierno Central, emitir

las políticas nacionales, salvaguardar la memoria social y el Patrimonio Cultural

y Natural, por lo cual le corresponde declarar y supervisar el Patrimonio

Nacional y los bienes materiales e inmateriales…”

La Ley de Patrimonio Cultural y su reglamento norman, regulan y sancionan

las actuaciones sobre el Patrimonio Cultural del Estado.

El INPC, preocupado por la inclusión de nuevas herramientas tecnológicas que

apoyen la gestión institucional, ha trabajado en la vinculación de herramientas

geoespaciales que apoyen en el proceso de planificación, conservación,

rescate y demás aspectos relacionados al Patrimonio Cultural.

1.3 Planteamiento del Problema

El INPC1 es una Entidad del Sector Público con ámbito nacional, encargada

de investigar, normar, regular, asesorar y promocionar las políticas

sectoriales de la gestión patrimonial, para la preservación, conservación,

apropiación y uso adecuado del patrimonio material e inmaterial.

El INPC maneja información a nivel nacional por lo que ve la necesidad de

obtener un sistema que optimice el manejo y análisis de la misma apoyando

en la toma de decisiones de manera que los usuarios tengan acceso a

herramientas de análisis que les permitan seleccionar manipular y

visualizar aquellos datos que les interesen.

El INPC cuenta con varios departamentos, los cuales manejan información

fundamental para que los directivos de estas áreas tengan información idónea

y puedan tomar mejores decisiones para beneficio del Patrimonio Cultural

1 Instituto Nacional de Patrimonio Cultural

Page 28: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

10

Al Sistema de Información para la Gestión del Patrimonio Cultural se lo

conoce como ABACO y es administrado por el Instituto Nacional de

Patrimonio Cultural INPC.

El sistema ABACO2 se alimenta de varias fuentes: de inventarios históricos

y actuales realizados por el INPC3; de los registros de los bienes culturales

realizados durante el Decreto de Emergencia del Patrimonio; de los

inventarios realizados por otras Instituciones afines al Patrimonio

Cultural como: Municipios, Ministerio de Cultura, (ex Banco Central del

Ecuador), Ministerio Coordinador de Patrimonio e inclusive organizaciones

privadas.

Para el apoyo de la toma de decisiones de los directivos, se requiere

información de sus distintas áreas y estas a su vez pedir al departamento de

Sistemas del INPC lo cual es un proceso complejo lo cual produce pérdida

de tiempo, información no adecuada con respecto a las necesidades que

muchas veces requieren los directivos.

Esta problemática condujo a la elección del tema de estudio, de tal manera

que la implementación de una herramienta BI permita generar información

resumida y sumarizada para el análisis de la información que se requiere en

el INPC, de tal forma que se puede visualizar la información de manera óptica

a los directivos del INPC, o administradores del mismo.

1.4 Formulación del Problema

¿Cómo contribuirá la implementación de un sistema de inteligencia de negocios

para mejorar la gestión del patrimonio cultural “ABACO” del INPC?

Variables

Variable independiente: Implementación de una herramienta de la Inteligencia

de Negocios para la gestión del patrimonio cultural.

2 Sistema de Información para la Gestión del Patrimonio Cultural

Page 29: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

11

Variable dependiente: Transformar los datos en información, y la información

en conocimiento, para optimizar el proceso de toma de decisiones.

1.4.1 Interrogantes de la Investigación

¿Qué tipo de información requieren las personas inmersas en el INPC?

¿Qué tipos de reportes son los que requieren?

¿En base a que reportes las personas realizan los análisis del negocio?

1.5 Objetivos de la Investigación

1.5.1 Objetivo General

Proveer una herramienta que facilite la explotación y el análisis de información

del INPC para transformarlo en conocimientos que apoyen a la toma de

decisiones a nivel Directivo en el INPC.

1.5.2 Objetivos Específicos

Adecuar un servidor de aplicaciones que soporte las distintas herramientas

de Inteligencia de Negocios a utilizar.

Realizar el análisis, diseño, desarrollo, implementación y pruebas del

Módulo de Inteligencia de Negocios.

Utilizar herramientas de software libre.: Según el Decreto Ejecutivo N. 1014

emitido el 10 de Abril de 2008 por la Presidencia de la República del

Ecuador.

Page 30: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

12

1.6 Justificación

En la actualidad es importante que las organizaciones exploten los datos y la

información existente, con el fin de convertirla en conocimiento que sirva de

apoyo al proceso de toma de decisiones.

La utilización de la información para generar conocimiento, produce mejoras en

los procesos de negocios y guían a las organizaciones a tener operaciones

mucho más efectivas y optimizadas. Esto se logra ya que el acceso e

interpretación de la información es un elemento diferenciador.

Por tales motivos es fundamental que el Instituto Nacional de Patrimonio

Cultural disponga de una herramienta que ayude en la toma de decisiones y

contribuya en la planificación del día a día, a mediano o largo plazo, donde la

calidad, disponibilidad y presentación de la información juegan un papel

determinante.

Al implementar esta herramienta se busca obtener un producto que permita

generar información tratada y útil, la cual apoyará el análisis del INPC

(procesos), lo que permitirá dar soporte a los directivos en la toma de

decisiones, con lo que se pretende que el INPC pueda analizar diferentes

situaciones que pudiesen afectarlo, y de esta manera pueda adelantarse a las

posibles decisiones estratégicas a tomar.

1.7 Delimitación

El presente proyecto de Investigación tiene como alcance el diseño e

implementación de un sistema de la Inteligencia de Negocios conforme a las

especificaciones y requerimientos generales del Instituto Nacional de

Patrimonio Cultura para el apoyo en la toma de decisiones del INPC basado en

la utilización de herramientas de código abierto.

Page 31: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

13

Para las fases de análisis, diseño, desarrollo, implementación y pruebas del

módulo de BI4 del INPC5, se elaborarán los siguientes productos:

• Documentos de análisis de recursos del proyecto.

• Documento de levantamiento de requerimientos de tipo funcional.

• Glosario de términos.

• Diseño de la arquitectura del módulo.

• Manual de instalación y configuración del módulo.

• Manual de usuario final.

Para la implementación del módulo de Inteligencia de Negocios se utilizarán

herramientas de Software Libre seleccionadas por el Instituto Nacional de

Patrimonio Cultural.

Una vez que culmine el desarrollo del módulo, se efectuarán las pruebas

funcionales del sistema, así como también se depurarán los errores y no

conformidades encontradas.

Finalmente se efectuará la elaboración de los manuales referidos como

productos entregables.

CAPÍTULO II MARCO REFERENCIAL

2.2 Fundamentación Teórica

2.2.1 Patrimonio Cultural

El Patrimonio Cultural es el conjunto de bienes tangibles e intangibles, que

constituyen la herencia de un grupo humano, que refuerzan emocionalmente su

sentido de comunidad con una identidad propia y que son percibidos por otros

4 Inteligencia de Negocios/Bussiness Inteligence

5 Instituto Nacional de Patrimonio Cultural

Page 32: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

14

como característicos. El Patrimonio Cultural como producto de la creatividad

humana, se hereda, se transmite, se modifica y optimiza de individuo a

individuo y de generación a generación.

El Patrimonio Cultural de un pueblo comprende las obras de sus artistas,

arquitectos, músicos, escritores y sabios, así como las creaciones anónimas,

surgidas del alma popular, y el conjunto de valores que dan sentido a la vida,

El Patrimonio Cultural abarca todo lo realizado por un pueblo a lo largo de su

historia pasada y presente. Estas creaciones han sido transmitidas, entre

miembros de un mismo grupo por aprendizaje social, es decir: por imitación,

por educación, enseñanza o por asimilación.

El Ecuador, posee un patrimonio cultural riquísimo y variado. Abarca períodos

de tiempo de épocas prehispánicas, colonial, republicano y continuo en el

presente con las creaciones vivas en los diversos campos de la cultura.

La diversidad geográfica, humana y cultural ecuatoriana se expresa en su

patrimonio tangible o material e intangible o Inmaterial, y cobra sentido gracias

a la apropiación asumida por las colectividades. Esta riqueza patrimonial que

acumula el país es incalculable y requiere de un proceso sistémico para su

registro, inventario y catalogación.

Los bienes del Patrimonio Cultural se clasifica en:

Patrimonio Tangible o Material Patrimonio Intangible

Bienes Muebles Bienes Inmuebles Bienes Documentales Bienes Arqueológicos

Bienes Inmateriales

Tabla 3: Clasificación de los Bienes del Patrimonio Cultural

Autor: Tesista

Fuente Documentación INPC

Page 33: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

15

2.2.2 Patrimonio Cultural Inmaterial

Comprende los usos, representaciones, conocimientos, técnicas, tradiciones o

expresiones vivas heredadas de nuestros antepasados y transmitidas a

nuestras futuras generaciones.

El patrimonio Inmaterial está ligado a la memoria y a la herencia en la medida

en que su vigencia y representatividad generan procesos identitarios y de

pertenencia a la comunidad. En este sentido, el patrimonio Inmaterial está

conformado por aquellas manifestaciones y expresiones cuyos saberes,

conocimientos, técnicas y practicas han sido transmitidas de generación en

generación, tienen vigencia y son pertinentes para una comunidad ya que han

sido recreadas constantemente en función de los contextos sociales y

naturales, en un proceso vivo y dinámico que legitima la re significación de los

sentidos.

Bienes de Patrimonio Inmaterial:

• Tradiciones y expresiones orales.

• Artes del espectáculo.

• Usos sociales, rituales y actos festivos.

• Conocimientos y usos relacionados con la naturaleza y el universo.

• Técnicas artesanales tradicionales.

2.2.3 Patrimonio Cultural Material

Es la herencia cultural propia del pasado de una comunidad que poseen un

especial interés histórico, artístico, arquitectónico, urbano, arqueológico.

Page 34: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

16

Clasificación del Patrimonio Material:

2.2.3.1 Bienes Muebles

Los bienes muebles son la evidencia material de este proceso y la expresión

artística, social, económica y cultural de un periodo histórico definido, en

cualquiera de sus manifestaciones, se los llama así porque son objetos

susceptibles de ser movilizados y su clasificación varía de acuerdo con las

legislaciones propias de cada región o país.

Entre los bienes muebles se identifican

Tabla 4: Detalle Bienes Muebles

Autor: Tesista

Fuente: Instructivo para fichas de registro e Inventario Bienes Muebles,

http://www.inpc.gob.ec/component/content/article/225

2.2.3.1.1 Bienes Inmuebles

Son aquellas obras o producciones humanas, que no se pueden trasladar de

un lugar a otro y están íntimamente relacionadas con el suelo. Los bienes

inmuebles conservan valores históricos, culturales y simbólicos con

características tipológicas, morfológicas y técnico-constructivas de singular

BIENES MUEBLESArmamento, carpinteria,

documentos relevantes, equipo

industriual, equipo urbano,

escultura, filatelia, instrumentos

científicos, instrumientos

musicales, metalurgía, moviliario

utilitario, decoración mural,

numismática, orfebreria, piedra

tallada, pintura, retablo,

textil,vitrales, yeseria, medios de

transporte, lapidaria, etc.

Page 35: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

17

importancia como arquitectura: civil, religiosa, vernácula, industrial, funeraria,

haciendas y yacimientos arqueológicos.

Tabla 5 : Detalle Bienes Inmuebles Tabla 6 : Detalle Bienes Inmuebles

Autor: Tesista

Fuente: Instructivo para fichas de registro e Inventario Bienes Inmuebles,

http://www.inpc.gob.ec/component/content/article/224

2.2.3.1.2 Bienes Documentales

Constituyen documentos históricos aquellos que tienen como objetivo registrar,

transmitir y conservar, a lo largo del tiempo, información que forma parte de la

historia ecuatoriana o de sus personajes ilustres, y que por sus características

son considerados como Patrimonio Cultural del Estado.

Estos testimonios se encuentran registrados en diversos tipos de materiales o

soportes, como:

BIENES INMUEBLESPueblos, ciudades, parques,

plaza, caminos, vías, puentes,

cementerios, haciendas, molinos,

etc.

Page 36: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

18

Tabla 7: Detalle Bienes Documentales Tabla 8: Detalle Bienes Documentales

Autor: Tesista

Fuente: Instructivo para fichas de registro e Inventario Bienes Muebles,

http://www.inpc.gob.ec/component/content/article/225

2.2.3.1.3 Bienes Arqueológicos

Comprenden los vestigios más antiguos (lugares y objetos) dejado por antiguas

civilizaciones que ocuparon el actual Ecuador. Pueden encontrarse solos o

agrupados y corresponder a un asentamiento simple y complejo, Estas

evidencias dan cuenta de la vida de los grupos así como de sus estructuras

habitacionales, centros ceremoniales y administrativos.

Los bienes arqueológicos pueden encontrarse en la superficie, enterrados o

bajo las aguas. Son de gran diversidad y tamaño, generalmente están hechos

MATERIALES EJEMPLOS

Documentos munuscritos puede

ser a mano o mecanografiados

Libros escrito a mano, cartas

personales, comunicaciones,

documentos oficiales (cédulas

reales,decretos, bulas, cartas

pastorales, informes, tesis,etc)

Documentos legalesTestamentos, escrituras,

hipotecas,contratos, finanzas, etc.

Documentos Impresoslibros, revistas, folletos, hojas

volantes, etc.

Documentos FotográficosFotografías, daguerrotipos, placas

de vidrio, albúminas, ambrotipos,

negativos de acetato.

Documentos Cartográficos Planos, mapas, croquis

Documentos Sonoros

Discos de pizarra, disco de

acetato, casetes de audio, discos

compactos, partituras

Documentos Audiovisuales

Cintas de video y

cinematográficas, discos

compactos.

Page 37: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

19

de piedra, concha, hueso, arcilla y metales. Su trabajo artesanal les

proporciona características propias que lo diferencian de artefactos hechos,

con maquinarias o instrumentos modernos. Por lo tanto Los objetos

arqueológicos son únicos, ninguno se parece a otro, excepto los objeto por sus

atributos formales establecidos por los arqueológicos.

2.2.4 Diferencia entre Datos, información y Conocimientos

Los tres términos suelen utilizarse indistintamente y esto puede llevar a un

interpretación libre de conceptos de conocimiento.

Los conceptos que se muestran a continuación se basan en las definiciones de

Davenport y Prusak (1999).

Figura 4: Pirámide de datos, información y conocimiento

Fuente http://www.sinnexus.com/business_intelligence/piramide_negocio.aspx

Datos

Los datos son la mínima unidad semántica, son elementos primarios de

información que por sí solos son irrelevantes como apoyo a la toma de

decisiones.

Page 38: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

20

Información

Se puede definir como un conjunto de datos procesados e interrelacionados

que tienen un significado relevante, y que por lo tanto son de utilidad para

quien debe tomar decisiones.

Por los tanto, los datos se transforman en información cuando se aplican a un

propósito concreto y proporcionan valor al receptor.

Conocimiento

En última instancia, la gran cantidad de información generada sólo será útil si

puede aplicarse a la creación de conocimiento dentro de la organización.

El conocimiento es una mezcla de experiencia, valores, información y know-

how que sirve como marco para la incorporación de nuevas experiencias e

información, y es útil para la acción.

La información por sí sola no crea una organización basada en el conocimiento

pero es un pilar fundamental para ello. Tener la información correcta impulsa el

desarrollo de capital intelectual, lo que a su vez promueve la innovación y

mejora el rendimiento.

2.2.5 Inteligencia de Negocios

2.2.5.1 Introducción

El auge de la Informática en el mundo ha sido vertiginoso, caracterizándose por

ingresar en las costumbres sociales y económicas del individuo y de la

empresa. Por lo que resulta común que muchas instituciones cuenten entre sus

recursos con equipos informáticos y sistemas de información.

La tendencia actual de las organizaciones es demandar información en los

niveles donde antes la administración se basaba en la intuición y el sentido

común para tomar decisiones, la información fluye en todos los niveles de la

Page 39: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

21

organización con diferentes fines (comunicación, control, administración,

evaluación, etc.) independientemente del cargo del usuario.

Las empresas están comprendiendo que los niveles directivos tienen una gran

responsabilidad al tomar decisiones, puesto que el impacto que generen

recaerá sobre toda la organización, pero también existen más personas que

toman decisiones y, a pesar de que éstas no tienen un impacto global, deben

ser también correctas y oportunas, pues ciertos grupos dependen de las

mismas.

Directores, gerentes, supervisores, jefes, todos aquellos que toman decisiones

deben tener suficiente información para apoyarse en su trabajo cotidiano, el

lugar que ocupen en la pirámide organizacional se vuelve secundario cuando el

enfoque es hacia el manejo de procesos y todos los puestos tienen cierta

relación y dependencia entre sí.

Figura 5: Pirámide Organizacional

Figura 6: Pirámide Organizacional

Fuente:http://cvonline.uaeh.edu.mx/Cursos/Maestria/MGIEMV/GestionAdmtiva

EV04/materiales/Unidad_1/Lectura2_EstructuraOrg_U1_MGIEV001.pdf

Los usuarios son distintos inclusive en la misma pirámide organizacional.

Mientras los sistemas operativos tienen interfaces muy especializadas para un

usuario que realiza una operación rutinaria, los usuarios estratégicos realizan

consultas variadas y no previstas de la información, por lo que los sistemas

Page 40: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

22

deben ser sencillos y con toda la información disponible que satisfaga cualquier

consulta requerida.

La inteligencia de negocios gira alrededor de un principio muy elemental: los

negocios se sustentan en la información y, por tanto, dependen de ella.

Comprende las mejores prácticas, aplicaciones informáticas, información y

herramientas que ayudan a una compañía a entender su negocio, mejorar su

toma de decisiones y optimizar su eficiencia. Ya sea en las áreas de marketing,

ventas, finanzas, operaciones, recursos humanos, etc., teniendo como objetivo

principal la entrega ágil de información para la toma de decisiones gerenciales

acertadas, por lo tanto actúa como un factor estratégica para una empresa u

organización, generando una potencial ventaja competitiva, que no es otra que

proporcionar información privilegiada para responder a los problemas del

negocio.

2.2.5.2 Definición

Basándose en el Glosario de Gartner6 se define un BI como: Tecnologías de

Información y Comunicación.

"Un conjunto de tecnologías que permiten a las empresas utilizar la

información disponible en cualquier parte de la organización para hacer

mejores análisis, descubrir nuevas oportunidades y tomar decisiones

más acertadas. (Glosario de Gartner, www.gartner.com, enero 2006.)"

Desde un punto de vista más pragmático se define a la Inteligencia de

Negocios como “El conjunto de metodologías, aplicaciones y

tecnologías que permiten reunir, depurar y transformar datos de los

sistemas transaccionales e información desestructurar en información

estructurada, para su explotación directa o para su análisis y conversión

en conocimiento, dando así soporte a la toma de decisiones sobre el

negocio. (Glosario de Gartner, www.gartner.com, enero 2006.)”

6 Gartner es una consultora internacional especializada en Tecnologías de Información y Comunicación

Page 41: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

23

Considerando los elementos comunes en cualquier definición, el BI puede

alinearse a una definición más acertada,

"Inteligencia de Negocios es una combinación de tecnologías de colección de

datos y manejo de información, que implementa soluciones orientadas al

usuario final para apoyar la toma de decisiones, aprovechando la información

estratégica disponible en cualquier parte de la organización. (Glosario de Gartner,

www.gartner.com, enero 2006.)"

2.2.5.3 Objetivos del BI

Los principales objetivos de la implementación de soluciones de BI son:

Accesibilidad: Los usuarios pueden consultar la información requerida

y manipular las diferentes variables por medio de una herramienta de

fácil manejo y administración.

Integración tecnológica: El usuario final puede consultar diferentes

fuentes de datos sobre una interfaz que le permita manipular las

variables de consulta para elaborar reportes e indicaciones.

Toma de decisiones: Las soluciones de la inteligencia de negocio es

brindar la posibilidad al usuario final de visualizar mediante herramientas

gráficas indicadores que ayuden en la toma de decisiones.

2.2.6 Datawarehouse y Datamart

2.2.6.1 Datawarehouse

Un Datawarehouse es una base de datos que almacena información para la

toma de decisiones, dicha información es construida a partir de bases de datos

que registran las transacciones de los negocios de la organización.

Page 42: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

24

El DW7 convierte los datos operacionales de una organización en una

herramienta competitiva, por estar a disposición de las personas que requieran

hacer un análisis para tomar decisiones.

El objetivo del DW es satisfacer los requerimientos de información internos de

la empresa para una mejor gestión. El contenido de los datos, la organización y

estructura son dirigidos a satisfacer las necesidades de información de los

analistas y usuarios tomadores de decisiones.

El DW puede verse como una bodega donde están almacenados todos los

datos necesarios para realizar las funciones de gestión de la empresa, de

manera que puedan utilizarse fácilmente según se necesiten.

Los almacenes de datos generan bases de datos tangibles con una perspectiva

histórica, utilizando datos de múltiples fuentes que se fusionan en forma

adecuada. Estos datos se mantienen actualizados, pero no cambian al ritmo de

los sistemas transaccionales.

Muchos datawarehouse se diseñan para contener un nivel de detalle hasta el

nivel de transacción, con la intención de hacer disponible todo tipo de datos y

características, para reportar y analizar. Así un datawarehouse resulta ser un

recipiente de datos transaccionales para proporcionar consultas operativas, y la

información para poder llevar a cabo análisis multidimensional.

Los datawarehouse están basados en un procesamiento distinto al utilizado por

los sistemas operacionales, es decir, este se basa en OLAP8 usado en el

análisis de negocios y otras aplicaciones que requieren una visión flexible del

negocio.

7 Datawarehouse / Almacén de datos

8 Proceso de Análisis en Línea / On line Analysis Process

Page 43: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

25

Diferencias entre sistemas Transaccionales y Basados en DW

Tabla 9: Diferencias entre sistemas Transaccionales y Basados en DW

1.9.6.1.1 Componentes de un Datawarehouse

Los elementos o componentes básicos de un DW9 son:

9 Datawarehouse

TRANSACCIONALES BASADOS EN DATAWAREHOUSEAdmiten el acceso simultáneo de

muchos usuarios que agregan y

modifican datos.

Admiten el acceso simultáneo de

cientos de usuarios que consultan y

no modifican datos.

Representan el cambio constante

de la organizaciòn, pero no

guardan su historial

Guardan el historial de una

organizaciòn

Tienen estructuras de base de

datos complejas

Tienen estructuras de base de datos

simples

Se ajustan para dar respuesta a la

actividad transaccional

Se ajustan para dar respuesta a la

actividad de consultas

Las consultas analìticas que

resumen grandes volumenes de

datos afectan negativamente a la

capacidad del sistema para

responder a las

Organizan los datos en strcucturas

simplificadas buscando la eficiencia

de las consultas analìticas mas que

del proceseo de transacciones

El rendimiento del sistema

cuando está respondiendo a

consultas analìticas complejas

puede ser lento o impredecible,

lo que causa un servicio poco

eficiente a los usuarios del

proceso analítico en línea

Contiene datos transformados que

son válidos, coherentes,

consolidados y con el formato

adecuado para realizar el análisis

son inferir en la operatoria

transaccional diaria

Los datos que se modifican con

frecuencia interfieren en la

coherencia de la información

analítica

Proporcionan datos estables que

representam el historial de la

empresa. Se actualizan

periódicamente con datos

adicionales, no son transacciones

frecuentes.

Page 44: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

26

Figura 7: Elementos Básicos de un DW

Fuente: http://www.tecnicas.com/Conceptos/OLAP/Elementos.aspx

Fuente de Datos: es el conjunto de las bases de datos de los sistemas

de tipo OLTP, archivos planos, hojas Excel, etc. que guarda datos en

un área de almacenamiento o repositorio.

Área de Almacenamiento de Datos: Es un repositorio de datos

normalizados.

Objetivo: Consiste en un servidor de presentación para el nuevo

almacén de datos donde los datos son organizados y almacenados

para el acceso directo de los usuarios finales mediante reportes de

análisis, consultas u otras aplicaciones.

1.9.6.1.2 Arquitectura de un Datawarehouse

La estructura básica de la arquitectura DW está compuesta por:

1. Datos operacionales: un origen o fuente de datos para poblar el

componente de almacenamiento físico DW. El origen de los datos son los

sistemas transaccionales internos de la organización como también datos

externos a ésta.

2. Extracción de Datos: selección sistemática de datos operacionales usados

para poblar el componente de almacenamiento físico DW.

Page 45: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

27

3. Transformación de datos: procesos para sumarizar y realizar otros cambios

en los datos operacionales para reunir los objetivos de orientación a temas

e integración principalmente.

4. Carga de Datos: inserción sistemática de datos en el componente de

almacenamiento físico DW.

5. Datawarehouse: almacenamiento físico de datos de la arquitectura DW.

6. Herramientas de Acceso al componente de almacenamiento físico DW:

herramientas que proveen acceso a los datos. Estas herramientas pueden

ser herramientas específicas de mercado para visualización de bases

multidimensionales almacenadas en DW como también aplicaciones

desarrolladas dentro de la organización del tipo EIS/DSS.

7.

Figura 8: Estructura Básica de un DW

Figura 9: Estructura Básica de un DW

Fuente: http://etl-tools.info/en/bi/datawarehouse_concepts.htm

Page 46: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

28

2.2.6.2 Datamarts

El acceso a los datos de toda la empresa a veces no es necesario para

determinados usuarios que solo necesitan un subconjunto de estos datos, en

estos casos se utilizan los Datamarts.

El concepto Datamart es una especialización del datawarehouse, y está

enfocado a un departamento o área específica, como por ejemplo los

departamentos de Finanzas o Marketing. Permitiendo así un mejor control de la

información.

Diferencias entre un datawarehouse y un datamart:

DATA WAREHOUSE DATAMART

ALCANCE Organizacional Área de la Organización

Fuente de Datos Múltiples

Especifica el área para el cual está diseñado, por ejemplo: Inmuebles, Muebles, Inmateriales, RRHH, etc.

Tiempo de Implementación

Meses a Años Meses

Objetivo Realiza un análisis de toda la organización en conjunto

Realiza un análisis de un área específica dentro de la organización

Tabla 10: Diferencias entre un Datawarehouse y Datamart

Fuente: http://www.dataprix.com/

Page 47: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

29

2.2.7 Modelos Multidimensionales

Dentro del entorno de las bases de datos, es una disciplina de diseño que se

sustenta en el modelo entidad relación.

Dadas las características de los almacenes de datos es ideal la utilización en

su diseño de un Modelo Multidimensional Este tipo de diseño tiene como

ventajas sobre el Modelo Entidad-Relación, que es muy flexible, está

desnormalizado y orientado a los intereses de un usuario final, aunque esto no

significa que existan inconsistencias en los datos.

Mediante la utilización de un MMD10 se disminuye la cantidad de tablas y

relaciones entre ellas, lo que agiliza el acceso a los datos.

El modelo multidimensional se representa a través de la definición de las tablas

de hechos y dimensiones.

Tablas de Hechos: Es la tabla central de un esquema dimensional, que

contiene los valores de las medidas de negocio a ser analizadas, este tipo de

tabla representa el hecho o actividad del negocio.

Es decir representan la ocurrencia de un determinado proceso dentro de la

organización y no tienen relación entre sí. Generalmente, almacenan medidas

numéricas, las que representan valores de las dimensiones, aunque en

ocasiones estas no están presentes y se les denominan “tablas de hechos sin

hechos”. La llave de la tabla de hecho, es una llave compuesta, debido a que

se forma de la composición de las llaves primarias de las tablas dimensionales

a las que está unida.

Existen tablas de hechos que no contienen medidas, a estas tablas se les

denomina tablas de hechos sin hechos, es decir, la relación entre las

dimensiones que definen la llave de esta tabla de hecho implica por si sola la

ocurrencia de un evento.

10

Modelo Multidimensional

Page 48: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

30

Una tabla de hecho está dividido por dos tipos de atributos, que son: las claves

foráneas provenientes de las dimensiones, y por los indicadores o medidas del

hecho.

Tablas de Dimensiones: Son tablas que describen a la tabla de hecho,

mediante atributos descriptores que poseen de acuerdo a un tema específico

del negocio.

Contienen, generalmente, una llave simple y atributos que la describen. En

dependencia del esquema de diseño que se asuma pueden contener llaves

foráneas de otras tablas de dimensión. Existe una dimensión fundamental en

todo DW11, la dimensión tiempo. Esto ocurre porque todo registro que se

incluya constituye la ocurrencia de un fenómeno en un instante de tiempo

definido. Dicha dimensión es la que establece uno de los objetivos

fundamentales de la construcción de un DW, la conservación de un “histórico”.

Los atributos dimensionales son fundamentalmente textos descriptivos, estos

juegan un papel determinante porque son la fuente de gran parte de todas las

necesidades que deben cubrirse, además, sirven de restricciones en la mayoría

de las consultas que realizan los usuarios. Esto significa, que la calidad del

modelo multidimensional, dependerá en gran parte de cuan descriptivos y

manejables, sean los atributos dimensionales escogidos. La dimensión más

importante de un Datawarehouse, es la dimensión tiempo, ya que esta será la

encargada de decir en qué momento ocurrió este hecho.

Nivel: En las dimensiones se pueden especificar características

(atributos) en particular de acuerdo a cada dimensión. Estos atributos necesitan

ser ordenados o agrupados de acuerdo a un fin específico.

Jerarquía: Son estructuras lógicas usadas para categorizar los datos, de

acuerdo a los niveles definidos, la jerarquía también ayuda a definir la

11

Datawarehouse

Page 49: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

31

navegación por la información que va a tener la dimensión en un orden

definido.

2.2.8 Esquema de Presentación

Puede instrumentarse usando un esquema relacional en estrella (Star Shema)

o usando un esquema de copo de nieve (Show Flake Schema).

Esquema Relacional en estrella

Es la técnica de diseño más usada para un DW, consiste en estructurar la

información en procesos, vistas y métricas recordando a una estrella. Es decir,

se obtiene una visión multidimensional de un proceso que se mide a través de

métricas.

A nivel de diseño, consiste en una tabla de hechos en el centro para el hecho

objeto de análisis y una o varias tablas de dimensión por cada dimensión de

análisis que participa de la descripción de ese hecho. En la tabla de hecho

encontramos los atributos destinados a medir (cuantificar) el hecho: sus

métricas. Mientras, en las tablas de dimensión, los atributos se destinan a

elementos de nivel (que representan los distintos niveles de las jerarquías de

dimensión) y a atributos de dimensión (encargados de la descripción de estos

elementos de nivel).

En el esquema en estrella la tabla de hechos es la única tabla del esquema que

tiene múltiples joins que la conectan con otras tablas. El resto de tablas del

esquema únicamente hacen join con esta tabla de hechos.

Las tablas de dimensión se encuentran además totalmente denormalizadas, es

decir, toda la información referente a una dimensión se almacena en la misma

tabla

Por lo general este esquema es utilizado cuando hay grandes volúmenes de

información y/o cuando existe un proceso robusto de administración de

información.

Page 50: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

32

Esquema Copo de Nieve

Es un esquema de representación derivado del esquema en estrella, en el que

las tablas de dimensión se normalizan en múltiples tablas. Por esta razón, la

tabla de hechos deja de ser la única tabla del esquema que se relaciona con

otras tablas, y aparecen nuevas joins debido a que las dimensiones de análisis

se representan ahora en tablas de dimensión normalizadas.

En la estructura dimensional normalizada, la tabla que representa el nivel base

de la dimensión es la que hace join directamente con la tabla de hechos.

La diferencia entre ambos esquemas reside entonces en la estructura de las

tablas de dimensión. Para conseguir un esquema en copo de nieve se ha de

tomar un esquema en estrella y conservar la tabla de hechos, centrándose

únicamente en el modelado de las tablas de dimensión, que si bien en el

esquema en estrella se encontraban totalmente sueltas es decir no se

encontraban relacionadas, ahora se dividen en subtablas tras un proceso de

normalización.

2.3 Marco Conceptual

En el siguiente apartado se detallan los términos utilizados en la investigación

del proyecto de graduación con sus respectivos significados:

A

Abaco: Sistema de Información para la Gestión del Patrimonio Cultural

Acrecentamiento: Hacer más grande, fuerte o intenso algo.

Accesibilidad: Es el grado en el que todas las personas pueden utilizar un

objeto, visitar un lugar o acceder a un servicio, independientemente de sus

capacidades técnicas, cognitivas o físicas.

Analítico: Proveniente de análisis o relativo a él.

Page 51: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

33

Análisis: Distinción y separación de las partes de un todo hasta llegar a

conocer sus principios, elementos, etc. para estudiar su naturaleza, su función

y/o su significado.

Archivos Planos: conocido también como archivo de texto llano, texto simple,

texto sencillo, es un archivo informático compuesto únicamente por texto sin

formato, sólo caracteres, lo que lo hace también legible por humanos. Estos

caracteres se pueden codificar de distintos modos dependiendo de la lengua

usada. Algunos de los sistemas de codificación más usados son: ASCII, ISO-

8859-1 o Latín-1 y UTF-8.

Arqueología: Ciencia que investiga las civilizaciones antiguas mediante el

estudio, la descripción y la interpretación de los restos que han perdurado.

Arquitectura: En las tecnologías de la información (TI), especialmente en lo

que refiere a computadores y más recientemente en lo que se refiere a redes,

arquitectura es un término que se aplica al proceso y resultado de pensar y

especificar la estructura, componentes lógicos, e interrelaciones lógicas de un

computador, sistema operativo, red u otro concepto.

Atributo: Es una especificación que define una propiedad de un objeto,

elemento o archivo. También puede referirse o establecer el valor específico

para una instancia determinada de los mismos.

Automatización: Sistema de fabricación diseñado con el fin de usar la

capacidad de las máquinas para llevar a cabo determinadas tareas

anteriormente efectuadas por seres humanos, y para controlar la secuencia de

las operaciones sin intervención humana.

API: (Interfaz de programación de aplicaciones, Application Programming

Interface). Una especificación de convenciones de llamadas a funciones que

define una interfaz para un servicio.

Page 52: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

34

Almacén de datos: en inglés: Data Warehouse, es una colección de datos

orientada a un dominio, integrada, no volátil y que varía en el tiempo.

B

Balanced Scorecard -BSC (Cuadro de Mando Integral - CMI): Metodología

de medida de resultados de la empresa de forma global, donde aparecen

resultados financieros, métricas operativas, impacto en el cliente y preparación

de la compañía para afrontar futuros retos de crecimiento y transformación.

Base de datos: Conjunto de datos que pertenecen al mismo contexto

almacenados sistemáticamente. En una base de datos, la información se

organiza en campos y registros. Los datos pueden aparecer en forma de texto,

números, gráficos, sonido o vídeo.

Base de datos multidimensional (Multidimensional database): Base de

datos que almacenan los datos en una matriz multidimensional donde todas las

combinaciones de datos posibles se reflejan en celdas con acceso directo. Los

analistas usan bases de datos multidimensionales para resumir información,

acceder a ella de manera rápida, sin necesidad de buscar en grandes

almacenes de datos.

Bienes: Son objetos útiles, provechosos o agradables que proporcionan a

quienes los consumen un cierto Valor de uso o Utilidad.

Bienes Muebles: Son aquellos con los cuales se puede comerciar o hacer

intercambios en el entorno nacional e internacional. Ejemplos de bienes

transables serían libros, zapatos, maquinaria, etc.

Bienes Inmuebles: Son los apartamentos, terrenos, casas, edificios, etc. Que

no pueden desplazarse de un lugar a otro, por estar íntimamente ligado a la

tierra

Page 53: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

35

Business Intelligence: Conjunto de estrategias y herramientas enfocadas a la

administración y creación de conocimiento mediante el análisis de datos

existentes en una organización o empresa.

C

Casos de uso: Es una especificación de secuencias de acciones, incluyendo

secuencias alternas y secuencias de error que un sistema puede realizar al

interactuar con actores externos.

Catalogación: Registrar ordenadamente libros, documentos u otros objetos

formando catálogo de ellos.

Concurrencia: Es la propiedad de los sistemas que permiten que múltiples

procesos sean ejecutados al mismo tiempo, y que potencialmente puedan

interactuar entre sí.

Conservación: Mantener y cuidar una cosa para que no pierda sus

características y propiedades con el paso del tiempo.

Control: Es un mecanismo preventivo y correctivo adoptado por la

administración de una dependencia o entidad que permite la oportuna

detección y corrección de desviaciones, ineficiencias o incongruencias en el

curso de la formulación, instrumentación, ejecución y evaluación de las

acciones, con el propósito de procurar el cumplimiento de la normatividad que

las rige, y las estrategias, políticas, objetivos, metas y asignación de recursos.

Cubo: Colección de dimensiones y medidas en un área temática particular.

D

Datamart: Es un almacén de datos departamental, o sea, orientado a un sector

determinado de la organización. Es también conocido: mercado de datos.

Decisión: Resolución o determinación acerca de algo dudoso.

Page 54: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

36

Diseño: Definimos el diseño, como un proceso o labor a , proyectar, coordinar,

seleccionar y organizar un conjunto de elementos para producir y crear objetos

visuales destinados a comunicar mensajes específicos a grupos determinados.

Dimensión: Perspectiva que contextualiza una medida. Suele ser un valor

alfanumérico. Consiste en la agrupación de elementos con características

comunes, tales como región, cliente, fecha, producto, proveedor, línea, etc.

DSS: (Sistema de soporte a las decisiones) Es un sistema informático utilizado

para servir de apoyo, más que automatizar, el proceso de toma de decisiones.

E

ETL: Acrónimo de Extraction, Transformation and Load, es decir, procesos de

extracción, transformación y carga de datos. Suele ser el elemento fundamental

para la carga de datos en el datawarehouse.

G

GAD: Gobiernos Autónomos Descentralizados

GPL: (General Public License): Es una licencia que está orientada

principalmente a proteger la libre distribución, modificación y uso de software.

I

Interfaz: Es un conjunto de métodos para lograr interactividad entre un usuario

y una computadora

J

JPivot: Es una librería de componentes JSP que se utiliza para construir tablas

OLAP generadas de forma dinámica. Este tipo de tablas es de gran utilidad ya

que permite mostrar los resultados de las consultas filtrando por los campos de

Page 55: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

37

la tabla de manera que se puedan quitar y poner distintos criterios de búsqueda

de los datos, consiguiendo un amplio abanico de posibilidades.

L

Legítimo: Define la cualidad de ser conforme a un mandato legal, a la justicia,

a la razón o a cualquier otro mandato cierto.

M

Metodología: Es un marco de trabajo usado para estructurar, planificar y

controlar el proceso de desarrollo en sistemas de información.

Medida: Valor, generalmente numérico, que cuantifica la intersección de

dimensiones.

Minería de Datos: Conjunto de técnicas para la inducción de conocimiento útil

a partir de masas muy grandes de datos. Tiene un solapamiento importante

con otras disciplinas como la estadística tradicional, el reconocimiento de

patrones, la inteligencia artificial, etc.

Mondrian: Es un servidor OLAP que trabaja con los datos almacenados en

una base de datos relacional. Su funcionalidad es traducir las consultas de

algún lenguaje dimensional (MDX, XMLA,...) a SQL estándar y arrojarlas contra

la base relacional.

O

Open source: Código fuente abierto software libre, se refiere a un programa

cuyo código fuente está disponible al público general, gratis, para usar y

modificar. El software libre no es siempre software gratuito (equivocación

bastante habitual que tiene su origen de la palabra en inglés "free" que significa

tanto "libre" como "gratuito").

Page 56: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

38

OLAP: Es el acrónimo en inglés de procesamiento analítico en línea (On-Line

Analytical Processing). Es una solución utilizada en el campo de la llamada

Inteligencia empresarial cuyo objetivo es agilizar la consulta de grandes

cantidades de datos.

P

PDI: No es un generador de código, es un motor de transformación, donde los

datos y sus transformaciones están separadas. Las Transformaciones y Jobs

son almacenadas en formato XML, donde se especifican las acciones a realizar

en los datos.

Patrimonio: Es el conjunto de bienes y derechos pertenecientes a una

persona, física o jurídica.

Patrimonio cultural: Es la herencia cultural propia del pasado de una

comunidad, con la que ésta, vive en la actualidad y que transmite a las

generaciones presentes y futuras

Plataforma: Es un sistema que sirve como base para hacer funcionar

determinados módulos de hardware o de software con los que es compatible.

Dicho sistema está definido por un estándar alrededor del cual se determina

una arquitectura de hardware y una plataforma de software (incluyendo

entornos de aplicaciones). Al definir plataformas se establecen los tipos de

arquitectura, sistema operativo, lenguaje de programación o interfaz de usuario

compatibles.

PostgreSQL: Es un sistema de gestión de base de datos relacional orientada a

objetos y libre, publicado bajo la licencia BSD.

Como muchos otros proyectos de código abierto, el desarrollo de PostgreSQL

no es manejado por una empresa y/o persona, sino que es dirigido por una

comunidad de desarrolladores que trabajan de forma desinteresada, altruista,

libre y/o apoyada por organizaciones comerciales. Dicha comunidad es

denominada el PGDG (PostgreSQL Global Development Group).

Page 57: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

39

Procesamiento Analítico en Línea: (OLAP), consiste en la realización de

consultas a estructuras multidimensionales que contienen datos resumidos. Su

objetivo fundamental es lograr altas velocidades en consultas complejas.

R

Regulación: Es la intervención gubernamental por medio de una política

pública (puede ser una norma, ley, control de precios), cuyo objetivo es,

modificar la conducta de los participantes en una actividad económica

específica. La aplicación de una regulación, supone, el aumento del bienestar

social o evitar la pérdida del mismo al corregir la falla de mercado a la cual se

dirige la acción gubernamental.

Requerimientos: Es una especificación de algo que debería ser implementado

en el sistema.

S

Servidor: Es un nodo que, formando parte de una red, provee servicios a otros

nodos denominados clientes.

Sistémico: De la totalidad de un sistema o relativo a ella:

Sistema: Es un conjunto de partes o elementos organizadas y relacionadas

que interactúan entre sí para lograr un objetivo

Sistema Transaccional: Los sistemas transaccionales se basan en

transacciones, es decir, tienen un proceso de inicio y fin claramente definidos y

no pueden ser interrumpidos en el proceso general. Como ejemplo, tenemos

los sistemas tradicionales de facturación, ventas, matrícula, notas, caja, etc.

Software Libre: Software que, una vez obtenido, puede ser usado, copiado,

estudiado, modificado y redistribuido libremente. El software libre suele estar

Page 58: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

40

disponible gratuitamente en Internet, o a precio del costo de la distribución a

través de otros medios.

Spoon: Es una herramienta gráfica que permite diseñar Jobs y

Transformations ETL. Con esta herramienta se podrá conectar a diversos

orígenes de datos y transformarlos para cargarlos dentro de su estructura del

datawarehouse.

T

Tablero o cuadro de Mando (Dashboard): Sistema de gestión y no solamente

de medición, que permite a las organizaciones clarificar sus visiones y

estrategias y trasladarlas a acciones. Este provee una retroalimentación

alrededor de los procesos de negocios internos y las salidas externas con el

objetivo de mejorar el rendimiento estratégico. También llamado panel de

control.

Transacción: Es un evento o proceso que genera o modifica la información

que se encuentran eventualmente almacenados en un sistema de información.

X

XML: sigla en inglés de Extensible Markup Language (lenguaje de marcas

ampliable). Es un metalenguaje extensible de etiquetas y permite definir la

gramática de lenguajes. Se propone como un estándar para el intercambio de

información estructurada entre diferentes plataformas.

Y

Yacimiento: Sitio donde se halla naturalmente una roca, un mineral, un fósil, o

restos arqueológicos:

Yacimiento Arqueológico: También denominado asentamiento, zona o sitio

arqueológico, y es el sitio o lugar donde se encuentran restos arqueológicos.

Page 59: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

41

2.4 Metodología de Desarrollo de Software.

La metodología de desarrollo de software es usada para planear y controlar

procesos a través de un conjunto de actividades, ayudando a ser más eficiente

el desarrollo de sistemas de información, para todo esto se utiliza herramientas,

técnicas, modelos y métodos para asistir en el proceso de desarrollo de

software.

2.5 Selección de la metodología de Desarrollo

Existen varias metodologías de diseño y construcción de DW. Cada fabricante

de software de inteligencia de negocios busca imponer una metodología con

sus productos, y entre las principales metodologías están:

Metodología ROADMAP (Business Intelligence RoadMap BIR)

Metodología de KIMBALL

Metodología DWEP (Data Warehouse Engineering Process)

BIR KIMBALL DWEP

Se definen las

actividades necesarias

en un proyecto BI para

mantener la integración

de la infraestructura del

entorno al que

pertenecen.

Las infraestructuras

técnicas y no técnicas

son las competencias

esenciales para la

alineación

organizacional.

Además, se deben

Se enfoca

principalmente en el

diseño de la base de

datos que

almacenará la

información para la

toma de decisiones.

El diseño se basa en

la creación de tablas

de hechos que son

tablas que contienen

la información

numérica de los

indicadores a

Basada en RUP y en

la herramienta UML

para desarrollar un

Data Warehouse o

DataMart.

El DWEP divide el

desarrollo del

almacén de datos, al

igual que en RUP, en

4 fases: Inicio,

Elaboración,

construcción y

Transición.

Es iterativo e

Page 60: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

42

definir los roles y

responsabilidades

asignados a cada

persona del equipo

para cada paso del

desarrollo.

analizar, es decir la

parte cuantitativa de

la información.

incremental.

Está dirigido por

casos de uso, es

centrado en la

arquitectura

De acuerdo al análisis de a las metodologías antes mencionadas se concluye

que la más acorde es la metodología de Kimball por cuanto proporciona un

enfoque de menor a mayor, muy versátil y una serie de herramientas prácticas

que ayudan a la implementación de un DW.

Esta metodología se alinea al proyecto porque se pueden implementar

pequeños datamarts en áreas específicas de las mismas con pocos recursos y

de ahí irlos integrando en un gran almacén de datos

2.6 Selección de Herramientas

Mediante Decreto Ejecutivo No. 1014 emitido el 10 de Abril de 2008, se

dispone el uso de Software Libre en los sistemas y equipamientos informáticos

de la Administración Pública de Ecuador, por lo que el Instituto Nacional de

Patrimonio Cultural se alinea al uso de herramientas libres para sus

aplicaciones.

2.6.1 Gestor de Base de Datos PostgreSQL

El gestor de base de datos a utilizar es PostgreSQL versión 9.1, se trata de un

servidor de bases de datos relacional orientado a objetos de software libre,

publicado bajo la licencia BSD 12.

12

Distribución de Software Berkeley

Page 61: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

43

PostgreSQL presenta las siguientes características destacándose por su

amplísima lista de prestaciones que lo hacen capaz de competir con cualquier

SGBD13.

Cuenta con un amplio conjunto de tipos de datos, permitiendo además

su extensión mediante tipos y operadores definidos programados por el

usuario.

Su administración se basa en usuarios y privilegios.

Es altamente confiable en cuanto a estabilidad se refiere.

Control de concurrencia- multiversión, lo que mejora sensiblemente las

operaciones de bloqueo y transacciones en sistemas multiusuario.

Tiene una arquitectura que involucra muchos estilos, en su nivel más

alto es un esquema cliente-servidor, mientras que el acceso a la data es

un esquema en capas.

Amplia variedad de tipos nativos

2.6.2 Pentaho BI Plataforma y Servidor

La Plataforma de BI14 Pentaho proporciona la arquitectura y la infraestructura

necesaria para crear soluciones a los problemas de inteligencia de negocio

(BI). El marco proporciona los servicios básicos, incluyendo la autenticación,

registro, auditoría, servicios web y motores de reglas.

La plataforma también incluye un motor de solución que integra informes,

análisis, cuadros de mando y los componentes de minería de datos. El diseño

modular y la arquitectura basada en plug-in permiten a todo o parte de la

plataforma para ser embebido en aplicaciones de terceros por los usuarios

finales, así como fabricantes de equipos originales.

13

Sistema Gestor de Base de Datos 14

Business Intelligence

Page 62: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

44

2.6.2.1 Módulos de Pentaho BI

Los módulos de la plataforma Pentaho BI son:

Reporting Pentaho ofrece la solución adecuada a las necesidades de los

usuarios, está basado en el proyecto JFreeReport permitiendo generar

informes ágiles y de gran capacidad. Permite la distribución de los resultados

del análisis en múltiples formatos, todos los informes incluyen la opción de

imprimir o exportar a formato PDF, XLS, HTML y texto. Brinda programación de

tareas y ejecución automática de informes con una determinada periodicidad.

Analysis Pentaho suministra a los usuarios un sistema avanzado de análisis

de información, con el uso de las tablas dinámicas (pívot tables, crosstabs),

generadas por Mondrian y JPivot, el usuario puede navegar por los datos,

ajustando la visión de los datos, los filtros de visualización, añadiendo o

quitando los campos de agregación.

Los datos pueden ser representados en una forma de SVG15 o Flash, los

dashboards widgets, o también integrados con los sistemas de minería de

datos y los portales web (portlets). Además, con el Microsoft Excel Analysis

Services, se puede analizar los datos dinámicos en Microsoft Excel (usando la

conexión a OLAP server Mondrian).

Dashboards todos los componentes del módulo Pentaho Reporting y Pentaho

Análisis pueden formar parte de un Dashboard, es muy fácil incorporar una

gran variedad en tipos de gráficos, tablas y velocímetros (dashboard widgets) e

integrarlos con los Portlets JSP, en donde podrá visualizar informes, gráficos y

análisis OLAP.

15

Gráficos Vectoriales Escalables

Page 63: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

45

Data Mining para realizar un análisis de minería de datos en Pentaho se

realiza con una herramienta WeKa.

Pentaho Data Integration se realiza con una herramienta Kettle ETL16 que

permite implementar los procesos ETL. Últimamente Pentaho lanzó una nueva

versión - PDI 3.0 – que marcó un gran paso adelante en OSBI17 ETL y que hizo

Pentaho Data Integration una alternativa interesante para las herramientas

comerciales.

2.6.3 Mondrian

Es un servidor de procesamiento en línea (OLAP) que permite a los usuarios

de negocio para analizar grandes de datos en tiempo real. Los usuarios

exploran datos empresariales mediante la perforación de entrada y tabulación

cruzada de información con tiempo de respuesta de la velocidad de

pensamiento para consultas analíticas complejas.

El núcleo de Mondrian es un JAR18 que actúa como JDBC 19 para OLAP,

proporcionando conexiones y ejecutando consultas SQL20 contra la BD

relacional que sirven los datos.

Mondrian Esquema Workbench

Es una interfaz de diseño que te permite crear y probar Mondrian OLAP cubo

mediante esquemas visuales. El motor Mondrian procesa las solicitudes de

MDX21 con los esquemas ROLAP22 estos archivos de esquemas son modelos

16

Extraer, Transformar y Cargar 17

Open Source Business Intelligence 18

Java Archive 19

Java database Connectivity 20

Structure query language 21

Multidimensional Expressions 22

OLAP Relational

Page 64: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

46

de metadatos XML23 que se crean en una estructura especifica que utiliza el

motor de Mondrian.

Estos modelos XML pueden ser consideradas estructuras de forma de cubo

que utilizan tablas de dimensiones que se encuentran en su RDBMS24 HECHO

y existentes. No se requiere que un cubo físico real se construya o se

mantenga solo que se cree el modelo de metadatos.

Se proporciona la siguiente funcionalidad:

Editor de esquema integrado con la fuente de datos subyacente para la

validación.

Consultas MDX de prueba en contra del esquema y la BD de pantalla.

Revisar BD subyacentes de estructura de pantalla.

CAPÍTULO III. IMPLEMENTACIÓN DE UNA SUITE BI PARA EL INPC

3.1 Análisis de Inteligencia de Negocios

Comenzamos por los datos a recopilar, la selección se basa en un

entendimiento básico y en supuestos de cómo opera la institución INPC,

considerando a aquello que es relevante a los funcionarios, empleados, y los

factores que afectan los bienes patrimoniales sean materiales, muebles,

inmuebles, documentales y arqueológicos del INPC.

En el INPC implica el estudio minucioso de los hechos y la situación además de

considerar el rumbo que puede tomar el caso de estudio, el escenario que

abarca la reflexión depende del nivel jerárquico que la está realizando y la

consideración del ambiente externo.

La reflexión nace de un análisis libre de preguntas que solo los ejecutivos

pueden formular y que se encaminan al descubrimiento de patrones relevantes.

23

Extensible Markup Language 24

Relational database management system

Page 65: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

47

3.2 Procesos de Inteligencia de Negocios

La implementación de un sistema de BI de negocios requiere de dos procesos:

Integración de fuentes de datos y análisis de datos.

3.2.1 Integración de fuentes de datos

Es el proceso donde se realiza la combinación de las diferentes fuentes de

datos del INPC por medio del proceso de extracción, transformación y carga

(ETL) cuyo resultado es una bodega de datos.

Almacén o Bodega de datos se puede interpretar como una base de datos que

organiza y almacena una colección de información derivada directamente de

los sistemas operacionales y de algunos datos externos. Esta información se

basa en el paradigma MD25 : hechos y dimensiones.

Un hecho representa medidas importantes del proceso de negocio que se

pretende analizar mientras que las dimensiones representan un contexto para

analizar dichas medidas.

3.2.2 Análisis de datos

Este proceso permite habilitar componentes, administrar consultas, monitorear

procesos, cálculos, métricas, etc.

Se realiza a través de dos procesos diferentes:

Consultas Simples y Reportes: Se caracterizan porque presentan informes

predefinidos y análisis de información mediante técnicas OLAP.

Técnicas de Minería de Datos: Permiten encontrar comportamientos en

conjunto de datos analizados, para realizar clasificaciones o predicciones o

generar información para los IES26, DSS27 o el BSC28

Forma los diferentes objetos de cada pantalla.

25

Multidimensional 26

Sistema de Información 27

Sistema de Ayuda a la toma de Decisiones 28

Cuadro de mandos Integral

Page 66: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

48

3.3 Definición de Requisitos Funcionales BI

Esta actividad incluye la determinación de los requisitos, mediante una serie de

entrevistas con los usuarios participantes del INPC, una vez finalizada la

participación con dichos usuarios se realizó el análisis para definir los

requisitos y sus prioridades.

3.1.1 Catalogación de Requisitos

En este apartado se detallan los requisitos funcionales definidos por los

usuarios del INPC, como una necesidad de información para su departamento,

luego se exponen los requisitos tecnológicos, que son necesarios para dar

soporte al servidor Pentaho y finalmente los recursos humanos que ponen en

marcha el proyecto.

3.1.2 Requisitos de Usuario

Los usuarios que utilizarán la herramienta BI Pentaho deberán tener un

conocimiento intermedio-avanzado de computación y deberán estar

periódicamente en capacitación para el uso de esta herramienta.

.

3.1.3 Requisitos Funcionales

El departamento de sistemas del INPC ha formulado los siguientes

requerimientos o necesidades de información. Estos requerimientos se han

agrupado en diferentes ámbitos, de Inmuebles, Muebles, Inmateriales,

Arqueológicos, Con el fin de realizar un análisis rápido para mejorar la toma de

decisiones a través de herramientas de software libre que permitan reunir,

almacenar, analizar, y proporcionar acceso a los datos de gestión del INPC, se

realizara:

Una estadística general de fichas de registro en los 5 ámbitos, los cuales

son:

Page 67: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

49

1. BIENES INMATERIALES.- En estos bienes se deben obtener los

siguientes datos:

Datos de localización:

o Provincia

o Cantón

o Parroquia

Comunidad

Lengua

Ámbito, Subámbito y Detalle de Subámbito

Datos de control

o Revisado por y fecha de revisión.

o Aprobado por y fecha de aprobación

o Adicionado por y fecha de adición

2. BIENES MUEBLES.- En estos bienes se deben obtener los siguientes

datos:

Tabla 11: Subdivisión de Bienes Muebles

Fuente: Requisitos INPC

Page 68: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

50

3. BIENES INMUEBLES.- En estos bienes se deben obtener los siguientes

datos:

Comunidad

Denominación

Datos de control

o Revisado por y fecha de revisión.

o Aprobado por y fecha de aprobación

o Adicionado por y fecha de adición

Datos de localización:

o Provincia

o Cantón

o Parroquia

4. BIENES ARQUEOLOGICOS.- Estos bienes se subdividen en

Yacimientos y Colecciones, obteniendo los siguientes datos:

Tabla 12: Subdivisión de Bienes Arqueológicos

Fuente: Requisitos INPC

Page 69: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

51

BIENES DOCUMENTALES.- Este bien se encuentra en constantes cambios

que por el momento no se encuentran totalmente definidos por lo cual no se

procederá a la realización del mismo

3.1.4 Requisitos Tecnológicos.

Dentro de los requisitos tecnológicos requeridos para el BI del INPC, tanto

para servidores como clientes se debe disponer:

Hardware de Servidor.

o Computador. Con un procesador como mínimo de 2600 MHZ o

superior con 2 a 4 procesadores como como un CORE i7.

o Memoria. Una memoria RAM como mínimo de 4GB, o superior.

o Disco Duro. Un disco duro mínimo de 20 GB.

o Conectividad de RED. Se necesita de una tarjeta de red lo

suficientemente rápida puede ser una 10/100 para acceso a las fuentes

de datos del sistema ABACO.

Hardware de Clientes.

o Computador. Con un procesador como mínimo de 1700 MHZ o

superior con 2 a 4 procesadores como como un CORE i7.

o Memoria. Una memoria RAM como mínimo de 1GB, o superior.

o Disco Duro. Un disco duro mínimo de 20 GB.

o Conectividad de RED. Se necesita de una tarjeta de red lo

suficientemente rápida puede ser una 10/100 esto es para el acceso de

los clientes al respectivo análisis de los datos

Software de Servidor.

o Sistema Operativo. Se dispondrá de un sistema operativo de software

libre como es el CENTOS VERSION 6.2 el más estable con todos los

paquetes instalados para no tener problemas de procesos.

o Motor de BD. Se dispondrá de postgreSql 9.2.

Page 70: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

52

o Herramientas de Inteligencia de Negocios. Las herramientas utilizadas

para el BI serán Pentaho BI Server V4.8, workbench para el análisis de

los cubos.

Software del Cliente

o Navegador. Se dispondrá de cualquier navegador que nos permitirá

acceder a la herramienta del Pentaho BI.

3.4 Análisis de Requerimientos

El INPC está compuesto de tres componentes principales:

Componente Datawarehouse

Componente Datamarts

Componentes de servicios OLAP

3.1.5 Simbologías de la herramienta utilizada Umbrello

Page 71: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

53

Tabla 13: Simbología Utilizada UML Umbrello

Fuente: http://docs.kde.org/stable/es/kdesdk/umbrello/uml-elements.html

3.1.6 Diagrama de Contexto

A continuación se describe la modelación de dichos componentes:

Se describe en primer lugar un diagrama de contexto, luego continuamos con

el análisis de requerimientos de los usuarios, el cual está agrupados en

paquetes lógicos, finalmente se describirá el DW y el DM del INPC.

La Figura 4.6 muestra el diagrama de contexto del INPC.

En el diagrama se observa a los usuarios tomadores de decisiones, la interfaz

gráfica denominada DSS (Pentaho) por medio de los cuales se podrá acceder

Page 72: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

54

a los datos, para realizar un análisis de dicha información; el DW donde se

encuentran físicamente los datos para la toma de decisiones y finalmente la BD

del sistema ABACO.

Figura 10: Diagrama de Contexto INPC

Diagrama de Contexto Ampliado

Figura 11: Diagrama de Contexto Ampliado

Page 73: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

55

3.1.7 Paquete de DSS

El paquete DSS está dividido en subpaquetes lógicos que agrupan

funcionalidades orientadas a una misma entidad conceptual, facilitando su

entendimiento y mejor análisis como también el desarrollo de cada

funcionalidad.

La figura 4.8 muestra las diferentes agrupaciones de los ámbitos del INPC.

Figura 12: DSS Ámbitos del INPC

3.1.7.1 Paquete de Análisis Bienes Inmateriales

La siguiente figura muestra la especificación funcional de los casos de uso que

compone dicho paquete.

Page 74: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

56

Figura 13: Diagrama de Casos de Uso Bienes Inmateriales

CASO DE USO Análisis de Bienes Inmateriales

Autor Teísta

Requerimientos que implementa

Ver apartado, 4, 6,2 requisito Nº 1.

Actores Usuario Tomador de decisiones

Precondición

El usuario deberá ingresar su usuario y contraseña para acceder a Pentaho BI Server, creados anteriormente por el administrador en la consola de administración de Pentaho.

Descripción.

El usuario podrá realizar un análisis del ámbito inmaterial, para la toma de decisiones. En este ámbito se realizara la toma de decisiones por provincia, cantón y parroquia.

Page 75: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

57

Pasos

- Abrir el navegador web que se desee.

- - Insertar la dirección Web o IP

asignado para Pentaho BI Server o Pentaho Data Integration.

- - Ingresar usuario y contraseña. - - Elegir la herramienta a utilizar

(SAIKU/ Visualizador del Pentaho Data Integration) para realizar el análisis por localización: provincia, cantón y parroquia, así como por comunidad lengua y ámbito del bien Inmaterial.

Post-condición El usuario obtendrá el reporte requerido del bien a consultar

Fuente de la información

Sistema ABACO

Dimensiones de Análisis de la Información

Provincia.

Cantón

Parroquia

Fórmulas de calculo Ninguna

Observaciones Ninguna

Tabla 14: Caso de Uso Análisis Bienes Inmateriales

3.1.7.2 Paquete de Análisis Bienes Muebles

Los bienes muebles se subdividen en Muebles y Muebles Arqueológicos.

La siguiente figura muestra la especificación funcional de los casos de uso que

compone dicho paquete.

Page 76: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

58

Figura 14: Diagrama de Casos de Uso Bienes Muebles

CASO DE USO Análisis de Bienes Muebles

Autor Teísta

Requerimientos que implementa

Ver apartado, 4, 6,2 requisito Nº 2.1.

Actores Usuario Tomador de decisiones

Precondición

El usuario deberá ingresar su usuario y contraseña para acceder a Pentaho BI Server, creados anteriormente por el administrador en la consola de administración de Pentaho.

Descripción.

El usuario podrá realizar un análisis del ámbito Muebles, para la toma de decisiones. En este ámbito se realizara la toma de decisiones por provincia, cantón y parroquia.

Page 77: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

59

Pasos

- Abrir el navegador web que se desee.

- - Insertar la dirección Web o IP

asignado para Pentaho BI Server o Pentaho Data Integration.

- - Ingresar usuario y contraseña. - - Elegir la herramienta a utilizar

(SAIKU/ Visualizador del Pentaho Data Integration) para realizar el análisis por localización: provincia, cantón y parroquia, así como por comunidad, lengua y ámbito del bien Mueble.

Post-condición El usuario obtendrá el reporte requerido del bien a consultar

Fuente de la información

Sistema ABACO

Dimensiones de Análisis de la Información

Provincia.

Cantón

Parroquia

Fórmulas de calculo Ninguna

Observaciones Ninguna

Tabla 15: Caso de Uso Análisis Bienes Muebles

Page 78: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

60

Figura 15: Diagrama de Casos de Uso Bienes Muebles Arqueológicos

CASO DE USO Análisis de Bienes Muebles Arqueológicos

Autor Teísta

Requerimientos que implementa

Ver apartado, 4, 6,2 requisito Nº 2.2.

Actores Usuario Tomador de decisiones

Precondición

El usuario deberá ingresar su usuario y contraseña para acceder a Pentaho BI Server, creados anteriormente por el administrador en la consola de administración de Pentaho.

Descripción.

El usuario podrá realizar un análisis del ámbito Muebles, para la toma de decisiones. En este ámbito se realizara la toma de decisiones por provincia, cantón y parroquia.

Pasos

- Abrir el navegador web que se desee.

- - Insertar la dirección Web o IP

asignado para Pentaho BI Server o Pentaho Data Integration.

- - Ingresar usuario y contraseña.

Page 79: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

61

- - Elegir la herramienta a utilizar

(SAIKU/ Visualizador del Pentaho Data Integration) para realizar el análisis por localización: provincia, cantón y parroquia, así como el análisis por comunidad lengua y ámbito del bien Arqueológico.

Post-condición El usuario obtendrá el reporte requerido del bien a consultar

Fuente de la información

Sistema ABACO

Dimensiones de Análisis de la Información

Provincia.

Cantón

Parroquia

Fórmulas de calculo Ninguna

Observaciones Ninguna

Tabla 16: Caso de Uso Análisis Bienes Muebles Arqueológicos

3.1.7.3 Paquete de Análisis Bienes Inmuebles

La siguiente figura muestra la especificación funcional de los casos de uso que

compone dicho paquete.

Page 80: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

62

Figura 16: Diagrama de Casos de Uso Bienes Inmuebles

CASO DE USO Análisis de Bienes Inmuebles

Autor Teísta

Requerimientos que implementa

Ver apartado, 4,6,2 requisito Nº3

Actores Usuario Tomador de decisiones

Precondición

El usuario deberá ingresar su usuario y contraseña para acceder a Pentaho BI Server, creados anteriormente por el administrador en la consola de administración de Pentaho.

Descripción.

El usuario podrá realizar un análisis del ámbito inmuebles, para la toma de decisiones. En este ámbito se realizara la toma de decisiones por provincia, cantón y parroquia.

Page 81: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

63

Pasos

- Abrir el navegador web que se desee.

- - Insertar la dirección Web o IP

asignado para Pentaho BI Server o Pentaho Data Integration.

- - Ingresar usuario y contraseña. - - Elegir la herramienta a utilizar

(SAIKU/ Visualizador del Pentaho Data Integration) para realizar el análisis por localización: provincia, cantón y parroquia del bien Inmueble.

Post-condición El usuario obtendrá el reporte requerido del bien a consultar

Fuente de la información

Sistema ABACO

Dimensiones de Análisis de la Información

Provincia.

Cantón

Parroquia

Fórmulas de calculo Ninguna

Observaciones Ninguna

Tabla 17: Caso de Uso Análisis Bienes Inmuebles

3.1.7.4 Paquete de Análisis Bienes Arqueológicos

La siguientes figuras muestran la especificación funcional de los casos de uso

que compone dicho paquete se dividen en Análisis de Bienes Arqueológicos

Yacimientos y Análisis de Bienes Arqueológicos Colecciones.

Page 82: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

64

Análisis Bienes Arqueológicos Yacimientos

Figura 17: Diagrama de Casos de Uso Bienes Arqueológicos - Yacimientos

CASO DE USO Análisis de Bienes Arqueológicos -Yacimientos

Autor Resista

Requerimientos que implementa

Ver apartado, 4,6,2 requisito Nº 4.1

Actores Usuario Tomador de decisiones

Precondición

El usuario deberá ingresar su usuario y contraseña para acceder a Pentaho BI Server, creados anteriormente por el administrador en la consola de administración de Pentaho.

Descripción.

El usuario podrá realizar un análisis del ámbito Arqueológicos-Yacimientos, para la toma de decisiones. En este ámbito se realizara la toma de decisiones por provincia, cantón y parroquia.

Page 83: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

65

Pasos

- Abrir el navegador web que se desee.

- - Insertar la dirección Web o IP

asignado para Pentaho BI Server o Pentaho Data Integration.

- - Ingresar usuario y contraseña. - - Elegir la herramienta a utilizar

(SAIKU/ Visualizador del Pentaho Data Integration) para realizar el análisis por localización: provincia, cantón y parroquia, así como por comunidad, zona geográfica del bien de colecciones así como por comunidad, zona geográfica, calidad, clase del bien arqueológico.

Post-condición El usuario obtendrá el reporte requerido del bien a consultar

Fuente de la información

Sistema ABACO

Dimensiones de Análisis de la Información

Provincia.

Cantón

Parroquia

Fórmulas de calculo Ninguna

Observaciones Ninguna

Tabla 18: Caso de Uso Bienes Arqueológicos – Yacimientos

Análisis Bienes Arqueológicos Colecciones

Page 84: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

66

Figura 18: Diagrama de Casos de Uso Bienes Arqueológicos - Colecciones

CASO DE USO Análisis de Bienes Arqueológicos - Colecciones

Autor Teísta

Requerimientos que implementa

Ver apartado, 4,6,2 requisito Nº 4.2

Actores Usuario Tomador de decisiones

Precondición

El usuario deberá ingresar su usuario y contraseña para acceder a Pentaho BI Server, creados anteriormente por el administrador en la consola de administración de Pentaho.

Descripción.

El usuario podrá realizar un análisis del ámbito Arqueológicos-Colecciones, para la toma de decisiones. En este ámbito se realizara la toma de decisiones por provincia, cantón y parroquia.

Pasos

- Abrir el navegador web que se desee.

- - Insertar la dirección Web o IP

asignado para Pentaho BI Server o Pentaho Data Integration.

- - Ingresar usuario y contraseña. - - Elegir la herramienta a utilizar

(SAIKU/ Visualizador del Pentaho Data Integration) para realizar el análisis por localización:

Page 85: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

67

provincia, cantón y parroquia, así como por comunidad, zona geográfica del bien de colecciones.

Fuente de la información

Sistema ABACO

Post-condición El usuario obtendrá el reporte requerido del bien a consultar

Dimensiones de Análisis de la Información

Provincia.

Cantón

Parroquia

Fórmulas de calculo Ninguna

Observaciones Ninguna

Tabla 19: Caso de Uso Análisis Bienes Arqueológicos – Colecciones

3.1.7.5 Paquete de Análisis de Bienes Documentales

Como se especificó anteriormente el ámbito de bienes documentales no va

hacer realizado por cuanto se encuentran en constante cambio en el INPC.

3.5 Modelo de Datos Fuente.

El modelo de datos que se describe a continuación pertenece al sistema

ABACO, el cual es la fuente de datos para el INPC, a partir de este modelo de

datos se empieza a construir el DW.

El modelo de datos fuente se divide en varios sub-modelos para tener una

mejor comprensión y facilitar el uso del mismo.

Cada sub-modelo agrupa un conjunto de entidades que se relacionan con:

provincias, cantones, parroquias, lengua, materiales, muebles, inmuebles.

Las ventajas de utilizar sub-modelos son:

Reduce el número de objetos con los que se debe trabajar

Facilita el manejo de diagramas muy grandes

Page 86: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

68

Ayuda a ubicarse de mejor manera en la función del negocio.

3.5.1 Entidades y Descripciones

A continuación se describen las entidades principales del modelo de datos

fuentes ABACO, utilizadas para la construcción de los DM.

NOMBRE ENTIDAD DESCRIPCION DE ENTIDAD

arq_yacimientos Almacena los diferentes yacimientos del ecuador. Ej.: La Loma, Machangara, Guabo, Pan de azúcar etc.

imt_ambito Almacena los ámbitos sociales. Ej.: Artes del espectáculo, Rituales, actos festivos, etc.

imt_comunidad Almacena las comunidades. Ej.: Tsáchilas, Shuar, etc.

imt_detalle_subambito Almacena los detalles de los subambitos. Ej.: Amorfino, trabalenguas, pintores, gastronomía, etc.

imt_inmateriales Almacena los bienes inmateriales del Ecuador. Ej.: Conocimiento, cultura, etc.

imt_lengua Almacena las diferentes lenguas que existen en el Ecuador. Ej.: Quichua, Achuar, Shuar, Andoa, etc.

imt_subambito Almacena los subambitos sociales. Ej.: cuentos, leyendas, teatro, música. Etc.

imu_regimen_propiedad Almacena las descripciones de los regímenes de propiedad. Ej.: Militar, municipal, estatal. Etc.

inmt_inmuebles Almacena lo inmuebles. Ej.: Pueblos, parques, cementerios, etc.

loc_cantones Almacena los cantones del Ecuador.

loc_parroquias Almacena las Parroquias del Ecuador.

loc_provincias Almacena las provincias del Ecuador.

mue_arqueologica Almacena las piezas arqueológicas del Ecuador.

rbi_general Almacena los registros de bienes inmateriales.

Tabla 20: Principales entidades del modelo de datos fuente

Page 87: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

69

Como se mencionó en el capítulo II, en el apartado - Esquema de

Presentación, existen dos modelos para crear un Data Warehouse, el modelo

estrella o el copo de nieve.

Para el desarrollo del proyecto de investigación se usará el modelo estrella,

debido a que el tiempo de respuesta que provee es más rápido y su diseño es

sencillo, por el uso de una tabla central “tabla de hechos” y las tablas de

dimensiones que alimentan a la tabla central.

3.6 Submodelos

Como se expuso anteriormente el modelo se subdivide en cinco ámbitos más

pequeños, estos ámbitos comprenden las siguientes agrupaciones lógicas:

Bienes Inmateriales

Bienes Muebles

Bienes Inmuebles

Bienes Arqueológicos

Bienes Documentales

La tabla 3.2 que se muestra a continuación, describe para cada submodelo las

entidades que lo componen:

Page 88: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

70

Tabla 21: Principales entidades de los Submodelos

NOMBRE SUBMODELO NOMBRE ENTIDAD DEL SUBMODELO

Parroquias

Cantones

Provincias

Lengua

Comunidad

Ambito

Subámbito

Detalle subámbito

Parroquias

Cantones

Provincias

Material

Bien Cultural

Parroquias

Cantones

Provincias

Denominación

Parroquias

Cantones

Provincias

Material

Bien Cultural

DOCUMENTALESlas entidades de este submodelo se

encuentran en constantes cambios

INMATERIAL

MUEBLES

INMUEBLES

ARQUEOLÓGICOS

Page 89: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

71

3.6.1 DataMart Inmateriales

La figura 19 muestra el datamart de los bienes Inmateriales del INPC

Figura 19: Datamart Bienes Inmateriales

3.6.1.1 ETLs Bienes Inmateriales

Tabla de Hechos

Figura 20: ETL Tabla de Hechos fac_control_periosidad

Figura 21: ETL Tabla de Hechos fac_identificacion

Page 90: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

72

Tabla de Dimensiones

Figura 22: ETL Tabla de Dimensiones Provincia

Figura 23: ETL Tabla de Dimensiones Canton

Figura 24: ETL Tabla de Dimensiones Parroquia

Figura 25: ETL Tabla de Dimensiones Lengua

Figura 26: ETL Tabla de Dimensiones Sub_Ambito

Page 91: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

73

Figura 27: Analisis Dimensional de Bienes Inmateriales por provincia, cantón y

Lengua

Figura 28: Análisis Grafico de Bienes Inmateriales por provincia, cantón y

Lengua

Page 92: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

74

3.6.2 DataMart Bienes Muebles

La figura 29 muestra el dataMart de los Bienes Muebles del INPC

Figura 29: Datamart Bienes Muebles

3.6.2.1 ETLs Bienes Muebles

Tabla de Hechos

Figura 30: ETL Tabla de Hechos fac_control_muebles

Page 93: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

75

Tabla de Dimensiones

Figura 31: ETL Tabla de Dimensiones Provincia

Figura 32: ETL Tabla de Dimensiones Canton

Figura 33: ETL Tabla de Dimensiones Parroquia

Figura 34: ETL Tabla de Dimensiones tipo_bien

Figura 35: ETL Tabla de Dimensiones dim_material

Page 94: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

76

Figura 36: Análisis Dimensional de Bienes Muebles por Fechas, provincia, y

Entidad

Page 95: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

77

Figura 37: Análisis Gráfico de Bienes Muebles por Fechas, provincia, y Entidad

3.6.3 DataMart Bienes Arqueológicos

Figura 38: DataMart Bienes Arqueológicos

Page 96: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

78

3.6.3.1 ETLs Bienes Arqueológicos

Tabla de Hechos

Figura 39: ETL Tabla de Hechos fac_control_regimen

Tabla de Dimensiones

Figura 40: ETL Tabla de Dimensiones Provincia

Figura 41: ETL Tabla de Dimensiones Canton

Figura 42: ETL Tabla de Dimensiones Parroquia

Page 97: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

79

Figura 43: ETL Tabla de Dimensiones dim_material

Figura 44: ETL Tabla de Dimensiones dim_bien_cultural

Figura 45: Ejemplo Reporte de Bienes Arqueológico

Page 98: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

80

Figura 46: Ejemplo Gráfico de Bienes Arqueológicos

3.6.4 Tableros Gráficos

Saiku es un excelente visor OLAP que proporciona al usuario final una

magnifica herramienta para realizar análisis de forma fácil e intuitiva, ofreciendo

soluciones de excelente calidad a la vanguardia de la tecnología y delicada

experiencia de usuario.

A continuación se presentan indicadores de los bienes del Patrimonio Cultural

Page 99: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

81

Page 100: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

82

Figura 47: Ejemplo de Indicadores de Mando del INPC

Page 101: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

83

CAPÍTULO V. CONCLUSIONES Y RECOMENDACIONES

CONCLUSIONES

Se cumplieron los objetivos propuestos en la tesis y se dotó al INPC con

una herramienta fácil utilización que ayudará a mejorar la toma de

decisiones.

En el presente trabajo la implementación de una herramienta ETL (Pentaho

Data Integration) permitió el análisis de la información del INPC de una

manera óptima, ya que un ETL permite homogenizar datos, consolidar y

transformar la información para que sea de fácil consumo por los usuarios

mejorando la productividad.

Las herramientas de inteligencia de negocios permite la integración de

datos de diferentes bases de datos, así como diferentes fuentes de

información.

Con el uso de las herramientas de BI los resultados son rápidos y visibles.

El resultado final de un proyecto informático depende mucho de que las

fuentes de información se encuentren estructuradas correctamente, es decir

que las tablas, claves y relaciones de la misma no guarden inconsistencias.

El desarrollo de soluciones de inteligencia de negocios con herramientas

open source implica un proceso complicado con una curva de aprendizaje

bastante amplia.

No existe toda la documentación que uno quisiera y la que existe no

siempre suele ser tan clara, como ejemplo el uso de las herramientas de

configuración de Pentaho, Schema Workbench, Creación de ETLs, etc.

Page 102: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

84

El INPC no cuenta con documentación que facilite la investigación, como es

el caso de un diccionario de datos, modelado de la base de datos.

RECOMENDACIONES

Implementar en el INPC estándares de desarrollo y diseño de base de

datos; así como para documentación técnica de todos sus proyectos debido

a que se encontraron muchos problemas al momento de buscar información

para desarrollar la solución.

Capacitar periódicamente a los usuarios que administran la herramienta

debido a que las aplicaciones de software libre se encuentran en

constantes cambios y arrojan nuevas aplicaciones propias de la misma,

permitiendo así realizar mejoras en el análisis de datos como en la

presentación de la información, como es el caso de las herramientas

Worbench o el Saiku que es un aplicativo extra de Pentaho.

Utilizar las últimas versiones de herramientas para no tener problemas al

momento de migrar de una versión a otra.

Identificar adecuadamente a todos los integrantes en un proyecto tanto a

nivel de personas con nivel de decisión como de técnicos especializados en

el entorno del INPC, de tal forma que se facilite levantar los requerimientos

necesarios y de calidad ara el INPC.

Para el estudio y la implementación de una herramienta BI se debe tener de

manera clara y precisa los requerimientos de los usuarios del INPC, de tal

forma que se pueda disponer de una herramienta que contenga información

de calidad y que sea útil a los usuarios.

Seleccionar la metodología de desarrollo adecuada estandarizar el sistema

de Business Intelligence, logrando así que el proyecto sea fácil de

comprender y sirva de base para nuevos proyectos de Business

Intelligence, sobre la herramienta Open Source Pentaho.

Page 103: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

85

REFERENCIA BIBLIOGRAFICA

1. MCGRAW Hill, (1999) PRESSMAN, R: S Ingeniería de Software: Un

enfoque práctico.

2. BOUMAN R. y DONGEN J. V. (2009). “Pentaho Solutions: Business

Intelligence and Data Warehousing with Pentaho and MySQL”. Wiley

Publishing, Inc.

3. BERNABEU, Ricardo Darío (2010). “DATA WAREHOUSING:

Investigación y Sistematización de Conceptos – HEFESTO: Metodología

propia para la Construcción de un Data Warehouse”.

Desde http://tgx-hefesto.blogspot.com/2010/07/hefesto-v20.html

4. http://inpc.gob.ec/

5. http://www.rimisp.org/wp-

content/files_mf/1367521220Valor_patrimonio_cultural.pdf

6. http://community.Pentaho.com

7. http://kettle.Pentaho.org

8. http://www.slideshare.net/soreygarcia/inteligencia-de-negocios-1092940

9. http://www.onuva.com/wp-content/uploads/2012/07/Taller_Tema_5.pdf

10. download.microsoft.com/download/C/8/F/C8FF6EEE.../binextel.pdf

11. http://www.redciencia.info.ve/memorias/ProyProsp/trabajos/l3.doc

12. http://www.vicolinker.net/solucion-java-no-se-reconoce-como-un-

comando-interno-o-externo-programa-o-archivo-por-lotes-ejecutable/

13. http://www.slideshare.net/jramflor/instalacin-y-configuracin-de-Pentaho-

bi-y-mysql

14. http://www.summan.com/Pentaho/Pentaho-bi-platform-server

15. http://mondrian.Pentaho.com/documentation/schema_workbench.pdf

Page 104: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

86

Page 105: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

87

ANEXOS

Page 106: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

88

ANEXO 1: MANUAL DE MONDRIAN SCHEMA WORKBENCH

A1.1. Instalación

Descargar Mondrian Schema Workbench:

http://sourceforge.net/projects/mondrian/files/

La versión que se utilizó para el desarrollo del proyecto de grado es la versión

3.5.0

En Windows: seleccionar el archivo psw-ce-3.1.1.12687.zip

En GNU/Linux: seleccionar el archivo psw-ce-3.1.1.12687.tar.gz

Una vez descargando el archivo se procede a descomprimirlo.

A1. 2. Configuración.

Como parte esencial de la configuración al momento de utilizar PSW29 es la

ubicación de los archivos .jar correspondientes que se emplearán en las

conexiones con las distintas Bases de Datos.

Para lo cual se debe añadir la librería JDBC de PostgreSql en la carpeta

/drivers de nuestra instalación de Schema Workbench.

Para la bd PostgreSql es “ojdbc14.jar”, recuerden que lo deben ubicar en la

carpeta "drivers" añadiendo el archivo .jar correspondiente.

(http://jdbc.postgresql.org/download.html)

Una vez copiado el archivo .jar a la carpeta /drivers será necesario reiniciar el

Schema Workbench para que los cambios surtan efecto.

29

Pentaho Schema Workbench

Page 107: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

89

A1.3. Acceso

Para poder acceder a la herramienta de schema Workbench se debe ejecutar

los siguientes pasos:

• En Windows: Acceder al directorio raíz y ejecutar “workbench.bat”

• En GNU/Linux: Abrir una consola, accede al directorio raíz y escribir:

[root@anabell Anabell]# cd /opt/psw-ce-3.5.0/schema-workbench/

[root@anabell schema-workbench]# ./workbench.sh

Figura 48: Acceso a Worbench

Autor: Tesista

Fuente: http://mondrian.Pentaho.com/documentation/schema_workbench.pdf

A1.4. Conexión

Una vez que accedemos a PSW, se deberá establecer la conexión con la BD,

como se muestra a continuación:

Ir al menú Option – Connection

Figura 49: Conexión

Autor: Tesista

Fuente: http://mondrian.Pentaho.com/documentation/schema_workbench.pdf

Page 108: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

90

A continuación se desplegara la siguiente pantalla:

Figura 50: Conexión PostgreSql

Autor: Tesista

Fuente: http://mondrian.Pentaho.com/documentation/schema_workbench.pdf

A1.5. EJECUCION SCRIPT CUBO OLAP INPC

A continuación se detalla como los administradores del INPC pueden ejecutar

el archivo o script realizado en el schema workbench.

El script se guarda con la extensión .xml el cual tiene el nombre de

DW_GENERAL_INPC.xml, este archivo se entrega al administrador del

Departamento de Tecnología del Instituto Nacional de Patrimonio Cultural, el

cual estará en todos los archivos entregados, guardados en un CD.

Page 109: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

91

En la siguiente pantalla se observa que el archivo se lo copia en un directorio

que se debe crear para el presente propósito que es subir el cubo OLAP.

Como ejemplo, el archivo se coloca en el disco local D, disco donde se guarda

la información de respaldos, para evitar la pérdida de información por parte del

sistema operativo que se puedan presentar.

A1.6. Archivo de configuración para publicar los Cubos con Schema

Workbench

Para poder publicar los cubos a través de una consola se realizó la siguiente

configuración en el archivo, en el cual se debe agregar una clave a elección del

usuario, en el presente proyecto se colocó la clave “root”:

...\pentaho-solutions\system\publisher_config.xml

<publisher-config>

<publisher-password>root</publisher-password>

</publisher-config>

Para la publicación de los cubos Olap se lo realiza mediante la interfaz del

Schema Workbench que es la herramienta de creación de cubos que

proporcional la Plataforma de Pentaho, mediante la cual se ejecuta el archivo

xml y se lo publica previo a la configuración mostrada anteriormente del

publisher_config.xml

Page 110: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

92

Los pasos para poder abrir y cargar el script del cubo OLAP INPC son los

siguientes:

1. Abrir Schema Workbech

2. Ubicarse en el directorio donde se encuentra el archivo .XML

3. Seleccionar el archivo el cual se cargará.

A continuación se presenta un manual que facilite a los usuarios del INPC la

creación de cubos Olap si posteriormente los usuarios del INPC requieren

realizar nuevos esquemas de análisis:

A1.6. MANUAL SCHEMA WORKBENCH CREACION CUBO OLAP

A1.6.1. SCHEMA WORKBENCH CREACION CUBO OLAP

Un esquema define una base de datos multi-dimensional. Contiene un modelo

lógico, que consiste en cubos, jerarquías, y los miembros, y una asignación de

este modelo a un modelo físico.

Page 111: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

93

El modelo lógico se compone de los constructores utilizados para escribir

consultas en lenguaje MDX: cubos, dimensiones, jerarquías, niveles, y los

miembros.

El modelo físico es la fuente de los datos que se presenta a través del modelo

lógico. Es normalmente un esquema en estrella, que es un conjunto de tablas

en una base de datos relacional.

Los Schemas de Mondrian están representados en un archivo XML, y permite

realizar las siguientes operaciones:

A1.6.2 Crear un schema

Al crear un esquema este presenta las siguientes propiedades:

Name: Nombre que se le va asignar al esquema

Description: Descripción breve del esquema.

Measurescaption: Nombre para la dimensión que agrupara a las medidas

DefaultRole: Un rol por defecto para utilizar en las conexiones de base de

datos.

Figura 51: Schema

Autor: Tesista

Fuente: http://mondrian.Pentaho.com/documentation/schema_workbench.pdf

Page 112: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

94

A1.6.3 Crear cubos dentro de un Schema

Una vez creado el Schema, procederemos a crear el cubo, dando clic en el

botón Add Cube

Figura 52: Crear Cubo

Autor: Tesista

Fuente: http://mondrian.Pentaho.com/documentation/schema_workbench.pdf

Un cubo es un conjunto de dimensiones y medidas en un área determinada,

presenta los siguientes atributos:

Name: Nombre del cubo usado en los queries MDX para referenciarse al cubo.

Debe ser único en el esquema.

Caption: Especifica un nombre a mostrar, usado por las interfaces de usuario.

Cache: Controla si los datos traídos de la tabla de hechos permanecerán en

cache.

Enabled: Controla si Mondrian cargará o ignorará el cubo.

Figura 53: Enabled controla Mondrian

Autor: Tesista

Fuente: http://mondrian.Pentaho.com/documentation/schema_workbench.pdf

Page 113: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

95

A1.6.4. Definir tabla de Hechos

Una tabla de hechos es una tabla principal en el modelado multidimensional y

que almacena las medidas del rendimiento del negocio. El término "hecho" se

usa para referirse a una medida de negocio, siendo esta medida el dato que se

toma de la sumarización de las dimensiones que intervienen en el esquema

multidimensional".

Una vez creado el cubo “DT_inmateriales” damos clic sobre el mismo para que

se despliegue la opción “Table” para crear la tabla de hechos, (a partir de la

cual podremos calcular las medidas o indicadores).

Figura 54: Tabla de Hechos

Autor: Tesista

Fuente: http://mondrian.Pentaho.com/documentation/schema_workbench.pdf

Los atributos de la tabla son:

Schema: El schema de la base de datos que contiene la tabla. Cuando no es

especificado, toma el schema por default.

Name: Nombre de la tabla de hechos.

Alias: un alias para la tabla cuando se genere la sentencia SQL.

Page 114: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

96

Figura 55: Alias Tabla

Autor: Tesista

Fuente: http://mondrian.Pentaho.com/documentation/schema_workbench.pdf

A1.6.5. Añadir Dimensiones

Tablas de dimensiones: tablas que contienen los descriptores del negocio. En

un modelo bien diseñado estas tablas tienen bastantes columnas o atributos

para que cada fila quede bien definida. Cada dimensión está definida por su

clave primaria, manteniendo así la integridad referencial con cualquier tabla de

hechos con la que pueda ser relacionada.

Seleccionamos el cubo “DT_inmateriales creado anteriormente, dando clic

sobre este, el cual desplegara un menú y escogeremos la opción “Add

Dimension.

Figura 56: Dimensión

Autor: Tesista

Fuente: http://mondrian.Pentaho.com/documentation/schema_workbench.pdf

Page 115: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

97

Figura 57: Jerarquía Cubos

Autor: Tesista

Fuente: http://mondrian.Pentaho.com/documentation/schema_workbench.pdf

Como se puede observar se añadió un nuevo elemento “Provincias”, es aquí

donde se hará referencia a las tablas de “Dimensiones” que se quieran utilizar.

Este elemento a su vez contiene en su interior otras estructuras.

Una dimensión es un atributo o conjunto de atributos, con la que se puede

dividir las medidas en sub-categorías.

Existen dos tipos de dimensiones

Dimensiones propias del cubo: son dimensiones “privadas”, porque

son sólo conocidas dentro del cubo en que se definen y no pueden ser usadas

fuera de él.

Los atributos para las dimensiones son:

Name: Es el nombre con el cual será referenciada la dimensión en el MDX.

Debe ser único dentro del cubo.

ForeignKey: Es el nombre de una columna de la tabla de hechos del cubo,

que es la referencia a la primaryKey de la tabla de dimensión.

Type: Si la dimensión es el tiempo o una fecha, debe usarse TimeDimension.

Esto permite usar funciones relacionadas con estos tipos de datos en el MDX.

Para cualquier otro caso usar StandarDimension.

Page 116: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

98

UsagePrefix: se aplica sólo para dimensiones privadas, para evitar nombres

duplicados.

Caption: es el nombre a mostrar en el front-end (la interface de usuario)

Dimensiones del schema: son dimensiones “compartidas” y pueden

ser asociadas con múltiples cubos. Se recomienda el uso de dimensiones

compartidas sobre las privadas.

Una vez creado el elemento “Provincias” damos clic sobre este y se

desplegara el siguiente menú

Figura 58: Añadir Jerarquías

Autor: Tesista

Fuente: http://mondrian.Pentaho.com/documentation/schema_workbench.pdf

Como se puede observar el elemento “Provincias” contiene en su interior una

jerarquía “Add Hierarchy” (Todas las provincias), quien a su vez contiene una

tabla “Table” (loc_Provincia).

A1.6.6. Añadir Niveles a la Jerarquía

Una vez creada la jerarquía, se deben definir niveles.

Page 117: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

99

Figura 59: Niveles de Jerarquías

Autor: Tesista

Fuente: http://mondrian.Pentaho.com/documentation/schema_workbench.pdf

Las propiedades de un nivel son:

Name: Nombre que es usado para referenciar el nivel en el MDX.

Table: Nombre de la tabla que contiene la columna dónde el dato de la

dimensión es almacenado para el nivel, en un esquema “estrella”.

Column: Nombre de la columna que representa el miembro que identifica el

nivel. Este debe corresponderse con la tabla de nivel.

Namecolum: Nombre de la columna que contiene el nombre del nivel. Cuando

no se especifica, es usado el valor de la propiedad name. Normalmente se deja

en blanco.

Page 118: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

100

Parentcolumn: se aplica sólo a un tipo especial de jerarquía padre-hijo.

Normalmente estará en blanco, pero si se cuenta con este tipo de jerarquía

“parent-child”, se usa esta propiedad para especificar que columna hace

referencia al miembro padre.

Nullparentvalue: Si existe una relación padre-hijo, podemos usar este atributo

cuales valores indican que miembro padre no existe. Quedará en blanco si no

es una jerarquía padre hijo.

OrdinalColumn: Indica que columnas definen el orden de los miembros.

Debería ser especificada si el orden natural de los miembros no se ajusta con

el orden deseado, sino se deja en blanco...

Type: Indica el tipo de dato de los valores de los miembros

UniqueMembers: Indica si todos los miembros en el nivel tiene valores únicos.

Esta es siempre “verdadera” para el primer nivel (sin contar el nivel “All”) para

cualquier jerarquía.

LevelType: Si está en blanco se asumirá que es un nivel “regular”, que es

correcto para la mayoría de las dimensiones. En las dimensiones del tipo

TimeDimension se debe especificar un tipo de nivel específico: TimeYears,

TimeQuarters, TimeMonths, TimeWeeks, y TimeDays, es este caso es

necesario para poder hacer uso de las funciones date/time.

Hidememberif: Determina si un miembro estará oculto. Normalmente estará

en blanco, lo que es equivalente a resetear el valor “Never”. En este caso el

miembro siempre se muestra.

ApproxRowCount: Número estimado de miembros en este nivel. Una buena

estimación mejorará el rendimiento.

Caption: Nombre del nivel a ser mostrado en la interface con el usuario.

CaptionColumn: Especifica que columna de los niveles en la tabla de

dimensión se usará para presentar los miembros al usuario final. Cuando no es

especificada, se usa el identificador del miembro (propiedad column)

Formatter: Formato personalizado.

Page 119: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

101

Figura 60: Forenkey Tabla hechos

Autor: Tesista

Fuente: http://mondrian.Pentaho.com/documentation/schema_workbench.pdf

Observen detenidamente, se cuenta con un campo “foreingKey” eso se debe a

que esta capa más arriba, está conectada a la tabla del cubo “imt_inmateriales”

por lo que cuando vemos la lista que brinda “foreingKey” vemos todos los

campos con los que cuenta la tabla hecho de este cubo, y como todos y todas

sabemos las tablas hechos deben tener como llaves principales las llaves de

las dimensiones que usa. De esta forma ya hemos establecido los campos por

los que se indexan las tablas “loc_provincias”, “loc_parroquias”, etc.

Para la configuración de estas estructuras compuestas de forma correcta es de

adentro hacia afuera.

Page 120: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

102

Figura 61: Estructura Tabla hechos

Autor: Tesista

Fuente: http://mondrian.Pentaho.com/documentation/schema_workbench.pdf

A1.6.7. Anadir dimensiones fechas

Se pueden agregar dimensiones de tiempo, es el mismo procedimiento

simplemente que se elige el tipo de dato como tiempo tal cual como se muestra

en la figura a continuación.

Page 121: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

103

Figura 62: Dimensiones Fechas

Autor: Tesista

Fuente: http://mondrian.Pentaho.com/documentation/schema_workbench.pdf

Ahora esta dimensión “Aprobado y Fecha” tiene una pequeña diferencia con

respecto a “Provincias” y es que aquí se desean mostrar más de un nivel, pues

se desea organizar aprobación y fecha, por cada aprobación, y por las fechas.

A continuación veremos como se debe hacer para lograr esto.

Se crea un primer nivel que va a coger el campo “imt_aprobado_por”, que

referencia al usuario que aprobó.

Page 122: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

104

.

Figura 63: Varios niveles en una dimensión

Autor: Tesista

Fuente: http://mondrian.Pentaho.com/documentation/schema_workbench.pdf

Luego se crea otro nivel que guardará el campo referente a las fechas de

aprobación: “imt_fecha_aprobacion”.

Page 123: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

105

Figura 64: Estructura con varios niveles

Autor: Tesista

Fuente: http://mondrian.Pentaho.com/documentation/schema_workbench.pdf

A1.6.8. Añadir Indicadores

Existen medidas que se calculan directamente con campos de la base de

datos, y los Miembros Calculados, que son formulas en las que utilizamos otras

medidas.

Hacemos clic sobre el cubo y se desplegara el siguiente menú, seleccionando

“Add Measure”

Page 124: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

106

Figura 65: Medidas

Autor: Tesista

Fuente: http://mondrian.Pentaho.com/documentation/schema_workbench.pdf

El orden en que se creen las medidas es importante, dado que implícitamente

la primera medida es la considerada como medida por default.

Figura 66: Orden de las medidas

Autor: Tesista

Fuente: http://mondrian.Pentaho.com/documentation/schema_workbench.pdf

Los atributos de las medidas son:

Page 125: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

107

Name: Identificador que se usará en los queries MDX para referirse a la

medida. Debe ser único en el cubo.

Aggregator: Nombre de la función de agregación que se aplica sobre la

medida.

Column: Nombre de una columna de la tabla de hechos.

FormatString: Formato en el que se muestra la medida.

Visible: Indica si la medida se muestra en la interface de usuario.

DataType: Tipo de dato que queremos que retorne el MDX

Formatter: Formato personalizado. Debe implementarse en la interface java

mondrian.olap.CellFormatter.

Caption: Nombre a ser mostrado en la interface de usuario.

Como se observa en la siguiente figura se creó una medida de cantones

siempre se despliegue un dato único q no se repita para lo cual se utilizó

“distinct-count”.

Page 126: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

108

Figura 67: Medida Cantones

Autor: Tesista

Fuente: http://mondrian.Pentaho.com/documentation/schema_workbench.pdf

A1.6.9. Guardar el Cubo

Solo nos queda salvar este cubo, el cual tendrá una extensión de formato

“.xml”, es el formato de lenguaje de etiquetas que usa Mondrian.

Damos clic sobre el Menú “File” y seleccionamos “Save As” como se muestra

en la figura:

Page 127: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

109

Figura 68: Guardar Cubo

Autor: Tesista

Fuente: http://mondrian.Pentaho.com/documentation/schema_workbench.pdf

A1.6.10. Publicar el Cubo

Una vez finalizado el cubo se publicara en nuestro servidor Pentaho.

Figura 69: Publicar Cubo

Autor: Tesista

Fuente: http://mondrian.Pentaho.com/documentation/schema_workbench.pdf

Page 128: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

110

ANEXO 2: MANUAL BUSINESS INTELLIGENCE PENTAHO

A2.1. Requisitos Previos

Para poder ejecutar la plataforma de BI de Pentaho es necesario disponer de

una máquina virtual Java instalada en el equipo donde se disponga trabajar.

Pentaho recomienda la última versión 1.5 de Sun JRE o superior con versiones

anteriores no funciona.

Una vez que se tenga instalada la máquina virtual se puede comprobar la

versión instalada ejecutando el comando: javac aparece una pantalla como la

siguiente.

Figura 70: Imagen comprobación máquina virtual

Autor: Tesista

Fuente: http://www.youtube.com/watch?v=yLKKHsd0fnE

Page 129: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

111

A continuación comprobaremos que la variable de entorno JAVA_HOME

apunte al directorio donde tenemos instalado JAVA. Igualmente la variable

PATH también deberá apuntar al directorio de ejecutables de la instalación de

JAVA. En mi caso el valor de las variables será.

JAVA_HOME C:\Program Files (x86)\Java\jdk1.7.0_05

PATH C:\Program Files (x86)\Java\jdk1.7.0_05\bin

Para configurar las variables se realiza desde propiedades del sistema,

configuración avanzada luego en variables de entorno.

Figura 71: Configuración variables de entorno

Autor: Tesista

Fuente: http://www.youtube.com/watch?v=yLKKHsd0fnE

Page 130: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

112

Figura 72: Configuración Variables de entorno dos

Autor: Tesista

Fuente: Varios

Page 131: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

113

Figura 73: Creación variables de entorno

Autor: Tesista

Fuente: http://www.youtube.com/watch?v=yLKKHsd0fnE

A2.2. Administración de Consola

La consola de administración de Pentaho nos permite crear usuarios para el

ingreso al sistema de Pentaho por defecto tiene un usuario administrador en

nuestro caso se creó un usuario administrador con todos los permisos.

A2.2.1 Acceso a la consola

Para poder acceder a la consola de administración nos dirigimos a la carpeta o

paquete descargada este se llama administration-console abrimos esta

carpeta y nos dirigimos al archivo start-pac.bat el cual lo ejecutamos si lo

realizamos desde Centos es el mismo para lo cual se ingresa a la consola de

comandos para poder ejecutar el archivo.

Page 132: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

114

Figura 74: Imagen administración consola

Autor: Tesista

Fuente:

Fuente: http://www.youtube.com/watch?v=yLKKHsd0fnE

Una vez que se ejecuta el archivo aparece una ventana como la siguiente.

Figura 75: Códigos correctos administración consola

Autor: Tesista

Fuente:

Fuente: http://www.youtube.com/watch?v=yLKKHsd0fnE

Page 133: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

115

Para poder ingresar a la consola de administración abrimos un navegador y

colocamos la siguiente dirección: localhost: 8099 como se muestra en la

imagen

Figura 76: Dirección navegador administración consola

Autor: Tesista

Fuente:

Fuente: http://www.youtube.com/watch?v=yLKKHsd0fnE

Después de esto nos aparecerá la siguiente imagen pidiendo el nombre de

usuario y la contraseña.

Figura 77: Imagen usuario administrador y password

Autor: Tesista

Fuente:

Fuente: http://www.youtube.com/watch?v=yLKKHsd0fnE

Page 134: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

116

Una vez que coloquemos el nombre de usuario y la contraseña correcta

podremos acceder a la consola para crear usuarios como se observa en la

siguiente imagen.

Figura 78: Imagen accesos a la consola de administración

Autor: Tesista

Fuente:

Fuente: http://www.youtube.com/watch?v=yLKKHsd0fnE

En la imagen se puede observar que se tiene roles y usuarios a continuación

creamos un usuario de ejemplo. Este usuario se llama Luis y la descripción es

q va a ser administrador.

Page 135: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

117

Figura 79: Anadir usuarios administración

Autor: Tesista

Fuente:

Fuente: http://www.youtube.com/watch?v=yLKKHsd0fnE

Le asignamos un rol de administrador como se observa en la imagen.

Figura 80: Añadir permisos a los usuarios.

Autor: Tesista

Fuente: http://www.youtube.com/watch?v=yLKKHsd0fnE

Page 136: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

118

Una vez realizado esta ya se puede acceder al sistema con este usuario para

poder crear reportes, realizar análisis de datos, crear cubos de datos o

presentar simples reportes.

A2.3 Pentaho Plataforma Biserver

La Plataforma Pentaho BI provee el soporte y la infraestructura necesarios para

crear soluciones de inteligencia empresarial (BI) a problemas de negocios. El

marco proporciona los servicios básicos, incluidos autenticación, registro,

auditoría, servicios web y motor de reglas. La plataforma también incluye un

motor de solución que integra reportes, análisis, tableros de comandos y

componentes de minería de datos. El diseño modular y arquitectura basada en

plug-in permite a todos o parte de la plataforma para estar embebida en

aplicaciones de terceros por los usuarios finales, así como fabricantes de

equipos originales.

La aplicación más conocida de la Plataforma Pentaho BI es la BI Server, que

funciona como un sistema basado en administración web de informes, el

servidor de integración de aplicaciones y un motor de flujo de trabajo ligero

(secuencias de acción.) Está diseñado para integrarse fácilmente en cualquier

proceso de negocio.

A2.3.1Pentaho BI Data Integration

Pentaho Data Integration también conocido como Kettle, ofrece poderosas

capacidades de Extracción, Transformación y Carga (ETL) mediante un

enfoque innovador, de metadatos. Con un ambiente intuitivo, gráfico, diseño

drag and drop y una arquitectura probada, escalable, basada en estándares, la

integración de datos de Pentaho es la elección más demandada por las

empresas.

Page 137: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

119

A2.3.2 Pentaho BI Analysis Services

Pentaho Analysis, también conocido como Mondrian, es un procesamiento

analítico en línea (OLAP) que permite a los usuarios de negocio analizar

grandes cantidades de datos en tiempo real. Los usuarios exploran los datos

de negocio internándose en la información y la tabulación cruzada con

respuestas a la velocidad del pensamiento en consultas analíticas.

A2.4 Inicio Servidor

Para poder iniciar el servidor Pentaho primero se debe abrir un navegador

Web y vaya a la dirección Web de Pentaho BI Server. Si ha instalado la

aplicación en su máquina local, la URL para llegar a las muestras de informes y

análisis es http://localhost:8080/Pentaho.

Figura 81: Inicio servidor Pentaho

Autor: Tesista

Fuente: http://www.youtube.com/watch?v=yLKKHsd0fnE

Si se desea acceder a la aplicación desde un equipo remoto, la URL será

http://example.com:8080/Pentaho, sustituyendo example.com con el nombre

de host de la máquina remota, la dirección IP o nombre de dominio.

En la siguiente imagen se muestra una imagen como se observa una vez que

se coloca la dirección del servidor.

Page 138: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

120

Figura 82: Imagen login Pentaho

Autor: Tesista

Fuente: http://www.youtube.com/watch?v=yLKKHsd0fnE

Para poder acceder al servidor se coloca el nombre de usuario y la contraseña

creadas al momento de crear los usuarios como en el ejemplo de la consola de

administrador en este caso el usuario Anabell que es administradora del

sistema de análisis INPC.

Figura 83: Acceso al servidor con un usuario administrador

Autor: Tesista

Fuente: http://www.youtube.com/watch?v=yLKKHsd0fnE

Una vez que se ha ingresado el usuario y password correcto se observa la

siguiente imagen. Podemos colocarnos en la carpeta INPC donde se encuentra

los análisis de datos guardados en esta carpeta.

Page 139: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

121

Figura 84: Imagen de acceso al servidor

Autor: Tesista

Fuente: http://www.youtube.com/watch?v=yLKKHsd0fnE

Si no se desea esos análisis de datos se puede seleccionar New Analysis

para poder crear otros cubos OLAP tal cual como se muestra en la siguiente

imagen.

Figura 85: Selección de esquema

Autor: Tesista

Aquí puede observar varios esquemas para poder realizar un análisis, para

nuestro caso seleccionaremos DW_GENERAL_INPC_final, cuando se

Page 140: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

122

selecciona este esquema nos muestra los cubos olap a los cuales podemos

realizar un análisis.

Con los cubos creados podemos observar, como es el caso de

BIENES_MUEBLES en la siguiente imagen.

Figura 86: Imagen Interactiva de un cubo

Autor: Tesista

Tenemos un análisis de datos que nos muestra los yacimientos por provincias,

cantones, parroquias, la zona geográfica, la clases de yacimiento, la calidad, el

nombre del yacimiento, la entidad investigadora, el área geográfica, el usuario

que aprobó y fecha de aprobación, el usuario revisor y fecha de revisión y

finalmente el usuario que adiciono y la fecha de adición.

Figura 87: Imagen con varias dimensiones

Autor: Tesista

Si nos colocamos en MDX podemos observar el SELECT utilizado por

Mondrian para poder obtener estos datos de forma rápida.

Page 141: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

123

Figura 88: Imagen select reporte mondrian

Autor: Tesista

De igual forma podemos observar las medidas las cuales tiene nuestro cubo

realizado un clic en el cubo de la parte izquierda del menú del reporte tal cual

como se muestra en la imagen.

Figura 89: Imagen con columnas, filas y filtros

Autor: Tesista

Fuente: Varios

Como se observa en la imagen el usuario puede colocar lo que desee que

aparezca en las columnas, filas o de igual forma que desea q trabaje como

filtro, en la siguiente imagen se muestra los filtros de clase yacimiento, entidad

Page 142: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

124

investigadora, nombre yacimiento zona geográfica, tal como se muestra en la

siguiente imagen.

Figura 90: Imagen modificación columnas y filtros

Autor: Tesista

Fuente: http://www.slideshare.net/jramflor/instalacin-y-configuracin-de-Pentaho-

bi-y-mysql

Si queremos que se apliquen los filtros realizamos un clic en aplicar, y se va a

observar un reporte tal como se muestra en la siguiente imagen.

Figura 91: Imagen con nuevas dimensiones

Autor: Tesista

Fuente: http://www.slideshare.net/jramflor/instalacin-y-configuracin-de-Pentaho-

bi-y-mysql

Page 143: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

125

Si deseamos que el reporte nos presente solo de una provincia específica

podemos hacer clic en las columnas en provincia como se muestra en la

imagen.

Figura 92: Imagen modificación datos dimensión

Autor: Tesista

Fuente: http://www.slideshare.net/jramflor/instalacin-y-configuracin-de-Pentaho-

bi-y-mysql

Una vez realizado clic ahí se observa la siguiente imagen donde podemos

marcar si deseamos que se muestre reporte de yacimientos por todas las

provincias o una provincia especifica en este caso con la provincia de pichincha

y calidad no monumental y no definida se puede observar el siguiente reporte

con un gráfico general.

Page 144: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

126

Figura 93: Imagen con nuevos medidas y grafico

Autor: Tesista

Fuente: http://www.slideshare.net/jramflor/instalacin-y-configuracin-de-Pentaho-

bi-y-mysql

Page 145: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

127

ANEXO 3: MANUAL DE INSTALACIÓN DE POSTGRESQL 9.0

A3.1 Descargar e instalar PostgreSQL 9.0

Abriremos un navegador web y accederemos a la URL:

http://www.postgresql.org/download/windows

En nuestro caso descargaremos la versión aún no estable 9.0.0 RC1.

Una vez descargado el archivo de instalación de PostgreSQL (postgresql-9.0.0-

rc1-windows.exe de 45,5 MB) pulsaremos con el botón derecho del ratón sobre

él y seleccionaremos "Ejecutar como administrador":

Page 146: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

128

Figura 94: Imagen Ejecutable Administrador PostgreSql

Autor: Tesista

Fuente: http://www.postgresql.org/download/windows

Si tenemos activado el control de cuentas de usuario nos mostrará una

advertencia con el texto "¿Desea permitir que este programa realice cambios

en el equipo?", pulsaremos "Sí" para continuar con la instalación de

PostgreSQL:

Page 147: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

129

Figura 95: Imagen Advertencia de Ejecución

Autor: Tesista

Fuente: http://www.lazos.cl/wiki/Instalaci%C3%B3n_de_PostgreSQL_9.2

Se iniciará el asistente para instalar PostgreSQL, pulsaremos "Siguiente":

Figura 96: Imagen Proceso siguiente paso de instalación

Autor: Tesista

Fuente: http://www.lazos.cl/wiki/Instalaci%C3%B3n_de_PostgreSQL_9.2

Indicaremos la carpeta de instalación de PostgreSQL, donde se guardarán los

ejecutables, librerías y ficheros de configuración de PostgreSQL:

Page 148: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

130

Figura 97: Imagen Ruta de Instalación

Autor: Tesista

Indicaremos también la carpeta donde se guardarán los datos por defecto de

PostgreSQL:

Figura 98: Imagen Almacén de datos

Autor: Tesista

Fuente: http://www.lazos.cl/wiki/Instalaci%C3%B3n_de_PostgreSQL_9.2

Page 149: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

131

Introduciremos la contraseña para el super-usuario " PostgreSql" que será con

el que iniciemos sesión para administrar la base de datos:

Figura 99: Imagen Contraseña de acceso

Autor: Tesista

Fuente: http://www.lazos.cl/wiki/Instalaci%C3%B3n_de_PostgreSQL_9.2

Introduciremos el puerto de escucha para la conexión con el servidor

PostgreSQL, por defecto el 5432:

Page 150: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

132

Figura 100: Imagen Puerto PostgreSql

Autor: Tesista

Fuente: http://www.lazos.cl/wiki/Instalaci%C3%B3n_de_PostgreSQL_9.2

Seleccionaremos la configuración regional:

Figura 101: Imagen Configuración Regional

Autor: Tesista

Fuente: http://www.lazos.cl/wiki/Instalaci%C3%B3n_de_PostgreSQL_9.2

Page 151: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

133

Pulsaremos "Siguiente" para iniciar la instalación definitiva del servidor

PostgreSQL:

Figura 102: Imagen Inicio Instalación

Autor: Tesista

Fuente: http://www.lazos.cl/wiki/Instalaci%C3%B3n_de_PostgreSQL_9.2

Se iniciará el asistente para instalar el motor de base de datos PostgreSQL,

que creará las carpetas oportunas, copiará los ficheros necesarios y creará el

servicio Windows para iniciar de forma automática el motor de base de datos:

Page 152: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

134

Figura 103: Imagen proceso Instalación

Autor: Tesista

Fuente: http://www.lazos.cl/wiki/Instalaci%C3%B3n_de_PostgreSQL_9.2

Una vez finalizada la instalación el asistente nos dará la posibilidad de ejecutar

Stack Builder, aplicación que nos permitirá instalar otros componentes y

herramientas para PostgreSQL:

Figura 104: Imagen Stack Builder

Autor: Tesista

Fuente: http://www.lazos.cl/wiki/Instalaci%C3%B3n_de_PostgreSQL_9.2

Page 153: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

135

Si hemos marcado la opción de Stack Builder, se iniciará, seleccionaremos

"PostgreSQL 9.0 on port 5432" y pulsaremos "Next":

Figura 105: Imagen Selección paquetes extras

Autor: Tesista

Fuente: http://www.lazos.cl/wiki/Instalaci%C3%B3n_de_PostgreSQL_9.2

Seleccionaremos las aplicaciones, componentes y herramientas a instalar y

pulsaremos "Next" (en nuestro caso cancelaremos Stack Builder pues no

instalaremos más componentes):

Figura 106: Imagen marcar selección

Autor: Tesista

Fuente: http://www.lazos.cl/wiki/Instalaci%C3%B3n_de_PostgreSQL_9.2

Page 154: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

136

El asistente para instalar el servidor PostgreSQL habrá creado un servicio que

estará iniciado y en tipo de inicio automático llamado "postgresql-9.0":

Figura 107: Imagen Servicios PostgreSql

Autor: Tesista

Fuente: http://www.lazos.cl/wiki/Instalaci%C3%B3n_de_PostgreSQL_9.2

Y habrá creado la carpeta en archivos de programa "PostgreSql" con las

subcarpetas:

Figura 108: Imagen Subcarpetas PostgreSql

Autor: Tesista

Fuente: http://www.lazos.cl/wiki/Instalaci%C3%B3n_de_PostgreSQL_9.2

Page 155: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

137

Y la carpeta de datos:

Figura 109: Imagen Almacén datos

Autor: Tesista

Fuente: http://www.lazos.cl/wiki/Instalaci%C3%B3n_de_PostgreSQL_9.2

Con esto habremos convertido nuestro en un servidor de base de datos

PostgreSQL, independientemente del sistema operativo.

Si queremos que los equipos de nuestra red tengan acceso al servidor

PostgreSQL y tenemos algunos cortafuegos (firewall) deberemos abrir el puerto

5432. Y si queremos que se tenga acceso desde Internet al servidor

PostgreSQL deberemos re direccionar (mapear) el puerto 5432 en el router o

cortafuegos de nuestra empresa.

A3.2 Administración de PostgreSQL, creación de usuarios (roles),

catálogos

Crear roles de login (usuarios) en PostgreSQL

Page 156: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

138

Para el acceso a la administración del motor de base de datos PostgreSQL

accederemos al botón "Iniciar" - "PostgreSQL 9.0" - "pgAdmin III":

Figura 110: Inicio aplicación PostgreSql

Autor: Tesista

Fuente: http://www.lazos.cl/wiki/Instalaci%C3%B3n_de_PostgreSQL_9.2

Desplegaremos "Server Groups", dentro desplegaremos "Servidores" y dentro

de éste pulsaremos con el botón derecho del ratón sobre "PostgreSQL 9.0

(localhost:5432), en el menú emergente seleccionaremos "Conectar":

Page 157: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

139

Figura 111: Imagen Conexión PostgreSql

Autor: Tesista

Fuente: http://www.postgresql.org.es/node/361

Introduciremos la contraseña para el súper usuario PostgreSql (la contraseña

introducida en la instalación):

Figura 112: Imagen Introducción contraseña PostgreSql

Autor: Tesista

Fuente: http://www.postgresql.org.es/node/361

Si todo es correcto nos conectaremos al servidor PostgreSQL, desde pgAdmin

podremos configurar y administrar el servidor de PostgreSQL:

Page 158: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

140

Figura 113: Imagen Interactiva de un cubo

Autor: Tesista

Fuente: http://www.postgresql.org.es/node/361

Para crear un rol de login pulsaremos con el botón derecho del ratón sobre

"Roles de Login", seleccionaremos "Nueva Rol de Login":

Page 159: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

141

Figura 114: Imagen Creación de roles

Autor: Tesista

Fuente: http://www.postgresql.org.es/node/361

En la pestaña "Propiedades" introduciremos los siguientes datos:

Nombre del Rol: nombre del usuario, en nuestro caso "ajpdsoft".

Contraseña: contraseña para este usuario (rol).

La cuenta caduca: si queremos que la cuenta de usuario caduque en

una fecha la estableceremos en este campo.

Page 160: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

142

Figura 115: Imagen Propiedades Rol

Autor: Tesista

Fuente: http://www.postgresql.org.es/node/361

En la pestaña "Privilegios de Rol" podremos indicar si este usuario será súper

usuario, si puede crear objetos de la base de datos y si puede crear roles:

Page 161: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

143

Figura 116: Imagen Privilegios Rol

Autor: Tesista

Fuente: http://www.postgresql.org.es/node/361

Pulsaremos "OK" en la ventana anterior para crear el rol de login.

El script SQL para crear un usuario (rol) en PostgreSQL, script que podremos

ver en la pestaña "SQL", antes de pulsar en "OK" en la ventana anterior:

CREATE ROLE ajpdsoft

LOGIN ENCRYPTED PASSWORD 'md55f8e1f359c12dafag3h3hfjbxxxb857'

VALID UNTIL 'infinity';

A3.4 Crear tablas en PostgreSql

Antes de crear una base de datos, podemos crear el tablespace donde

guardaremos los datos de la misma, si bien se pueden utilizar los tablespaces

por defecto de PostgreSQL (pg_default y pg_global) es recomendable crear

Page 162: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

144

tablespaces separados. Para crear un tablespace accederemos a la

administración pgAdmin, sobre "Tablespaces" pulsaremos con el botón

derecho y seleccionaremos "Nuevo Tablespace":

Figura 117: Imagen Creación Tablas

Autor: Tesista

Fuente: http://www.postgresql.org.es/node/361

En la pestaña "Propiedades" introduciremos los siguientes datos:

Nombre: nombre que identificará el tablespace, en nuestro caso "tb_ajpdsoft".

Locación: ubicación de los datos del tablespace, en nuestro caso:

C:datos_postgresqltb_ajpdsoft

Propietario: seleccionaremos el usuario creado anteriormente "ajpdsoft".

Pulsaremos "OK" para crear el tablespace:

Page 163: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

145

Figura 118: Imagen Propiedades Tabla

Autor: Tesista

Fuente: http://www.postgresql.org.es/node/361

Nota: la carpeta de destino de existir, de lo contrario mostrar un error como

este:

---------------------------

pgAdmin III

---------------------------

Ha ocurrido un error:

ERROR: directory "C:/datos_postgresql/tb_ajpdsoft" does not exist

---------------------------

Aceptar

---------------------------

El script SQL que creará el tablespace en PostgreSQL (si lo hiciésemos sin el

modo gráfico de pgAdmin

Page 164: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

146

CREATE TABLESPACE tb_ajpdsoft

OWNER ajpdsoft

LOCATION E'C: datos_postgresql b_ajpdsoft';

Inicialmente, PostgreSQL creará una subcarpeta dentro de la carpeta indicada

para el tablespace con un nombre como este: PG_9.0_201008051

ANEXO 4: MANUAL DE CONFIGURACIÓN DEL SERVIDOR DE PENTAHO

Para cambiar la configuración del servidor de Pentaho y no trabajar por defecto

con localhost e ingresar un nombre a la dirección se realiza el siguiente

proceso:

#TU_CARPETA_PENTAHO/biserver-ce/tomcat/webapps/Pentaho/WEB-

INF/web.xml donde se encuentra las siguientes líneas:

<context-param>

<param-name>fully-qualified-server-url</param-name>

<param-value>http://localhost:8080/pentaho/</param-value>

</context-param>

Donde se encuentra la siguiente línea de código http://localhost:8080/pentaho/,

se sustituye "localhost" por la ip o dirección deseada del servidor.

Guarda la nueva configuración y reinicia todo el servidor.

Page 165: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

147

ANEXO 5: MANUAL DE EJECUCIÓN SCRIPT ETL PENTAHO DEL INPC

A continuación se detalla como los administradores del INPC pueden ejecutar

el archivo o script realizado en Pentaho data integration

El script se guarda con la extensión .ktr dependiendo del etl a realizarse se

escogerá el nombre con el cual se guardará los script ETL como ejemplo

BIENES_COLECCIONES_INPC.ktr, estos archivos se entregan al

administrador del Departamento de Tecnología del Instituto Nacional de

Patrimonio Cultural, el cual se encuentra en un CD que se extiende al INPC.

En la siguiente pantalla se observa que el archivo se lo copia en un directorio

que se debe crear para el presente propósito que es subir el ETL.

Como ejemplo, el archivo se coloca en el disco local D, disco donde se guarda

la información de respaldos, para evitar pérdidas de información por parte del

sistema operativo que se puedan presentar.

Los pasos para poder abrir y cargar el script del ETL INPC son los siguientes:

Page 166: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

148

1. Abrir Pentaho Data Integration

2. Ubicarse en el directorio donde se encuentra el archivo .krt

3. Seleccionar el archivo el cual se cargará y se mostrará de la siguiente

forma.

Para ejecutar el archivo se realiza un clic en el icono tal como se

muestra en la siguiente pantalla.

El momento que se ejecuta el ETL las tablas se crearán en un nuevo

esquema de bd llamada dwh, que se encuentra en la base de datos del

INPC, como se refleja en la siguiente imagen:

Page 167: Universidad Central del Ecuador - Repositorio Digital ... · 2.2.6 Datawarehouse y Datamart ... Figura 9: Estructura Básica de un DW ... Figura 73: Creación variables de entorno

149