Versión Definitiva Inteligencia de Negocios Espaciales

10
1 AbstractThe article focuses on a brief but comprehensive review of the spatial business intelligence also called SOLAP, also presents a series of steps that allow to apply SOLAP on a real project, from the initial processing of the data in the design of the spatial data warehouse, modeling of the spatial cube schema, spatial data mining and the user interface of results according to factors required for this purpose "maps and graphics statistics", databases used were ICFES Saber 11 of the years 2005 to 2012 as input information; in the project used Free Software evidencing its utility and showing how different applications can be used together to develop a support for decision making spatial. Index TermsSpatial Business Intelligence, Spatial Data Warehouse, Spatial Data Mining, Geographic Information Systems, Online Spatial Analytical Processing. ResumenEl artículo se centra en una breve pero completa revisión de la inteligencia de negocio espacial también llamado SOLAP, también presenta una serie de pasos que permiten aplicar SOLAP en un proyecto real, desde el procesamiento inicial de los datos en el diseño del almacén de datos espaciales, modelado del esquema de cubo espacial, minería de datos espacial y la interfaz de usuario de los resultados de acuerdo a los factores necesarios para este fin "mapas y estadísticas gráficas", las bases de datos utilizadas fueron ICFES Saber 11 de los años 2005 a 2012, como información de entrada, en el proyecto se utiliza Software Libre evidenciando su utilidad y mostrando cómo las diferentes aplicaciones se pueden utilizar en conjunto para desarrollar un soporte para la toma de decisiones espaciales. Palabras claveInteligencia de Negocios Espaciales, Almacén de Datos Espaciales, Minería de Datos Espaciales, Sistemas de Información Geográfica, Procesamiento Analítico en Línea Espacial. I. INTRODUCCIÓN a información almacenada en una organización a través del tiempo puede contener datos de cualquier tipo: enteros, flotantes, caracteres, cadenas de caracteres (String), booleanos, entre otros. Al mismo tiempo estos datos se relacionan con procesos y procedimientos en diversas temáticas en sectores educativos, sociales, empresariales o políticos, que requieren de análisis de resultados o cifras históricas para cumplir con las metas propuestas actuales y futuras. Para obtener respuestas se utilizan técnicas de inteligencia de negocios que resultan bastante útiles y que proporcionan un amplio marco de referencia para la toma de decisiones sobre los posibles problemas a contemplar, sin embargo, estos análisis se quedan cortos o incompletos cuando se quiere obtener información que compromete un sitio, lugar o marco geográfico [1]. Teniendo en cuenta lo anterior se incorporó al análisis de toma de decisiones datos de tipo espacial o geométrico como: puntos, polígonos y líneas que permiten analizar la información desde otro nivel o perspectiva, incorporando herramientas y técnicas con estos datos, a esto se le denomina Inteligencia de Negocios Espaciales [2]. En la aplicación de inteligencia de negocios espaciales se realizan una serie de etapas que en su orden permiten estructurar elementos para soporte en la toma de decisiones, se comienza con los datos transaccionales históricos recolectados con su componente espacial, luego se procede a la extracción, transformación y carga para diseñar y construir la bodega de datos espacial, posteriormente se analizan y diseñan las dimensiones y medidas para el modelamiento del cubo espacial para así poder aplicar la minería de datos espaciales, de esta manera se tienen los insumos de información suficientes para llegar a los resultados para la toma de decisiones, que en este caso serán estadísticos y espaciales, dando una visión mucho más amplia de cómo se relacionan estos datos y que decisiones se deberían tomar [1]. El conjunto de pasos anteriores se automatiza en un conjunto de herramientas de software libre que permiten realizar estas tareas de forma clara y ordenada, aunque no existe una única herramienta para el desarrollo de inteligencia de negocios espaciales, la combinación de los sistemas software utilizados en este proyecto permite su aplicación, ofreciendo soporte para la toma de decisiones espaciales [3]. Inteligencia de Negocios Espaciales Orientada al Análisis de datos sobre pruebas Saber 11 del Instituto Colombiano para la Evaluación de la Educación a Nivel Nacional (Enero 2014) Christiam Alejandro Niño Peña, Autor, Gustavo Cáceres Castellanos, Director L

Transcript of Versión Definitiva Inteligencia de Negocios Espaciales

Page 1: Versión Definitiva Inteligencia de Negocios Espaciales

1

Abstract— The article focuses on a brief but comprehensive

review of the spatial business intelligence also called SOLAP, also

presents a series of steps that allow to apply SOLAP on a real

project, from the initial processing of the data in the design of the

spatial data warehouse, modeling of the spatial cube schema,

spatial data mining and the user interface of results according to

factors required for this purpose "maps and graphics statistics",

databases used were ICFES Saber 11 of the years 2005 to 2012 as

input information; in the project used Free Software evidencing

its utility and showing how different applications can be used

together to develop a support for decision making spatial.

Index Terms— Spatial Business Intelligence, Spatial Data

Warehouse, Spatial Data Mining, Geographic Information

Systems, Online Spatial Analytical Processing.

Resumen— El artículo se centra en una breve pero completa

revisión de la inteligencia de negocio espacial también llamado

SOLAP, también presenta una serie de pasos que permiten

aplicar SOLAP en un proyecto real, desde el procesamiento

inicial de los datos en el diseño del almacén de datos espaciales,

modelado del esquema de cubo espacial, minería de datos

espacial y la interfaz de usuario de los resultados de acuerdo a los

factores necesarios para este fin "mapas y estadísticas gráficas",

las bases de datos utilizadas fueron ICFES Saber 11 de los años

2005 a 2012, como información de entrada, en el proyecto se

utiliza Software Libre evidenciando su utilidad y mostrando

cómo las diferentes aplicaciones se pueden utilizar en conjunto

para desarrollar un soporte para la toma de decisiones espaciales.

Palabras clave— Inteligencia de Negocios Espaciales, Almacén

de Datos Espaciales, Minería de Datos Espaciales, Sistemas de

Información Geográfica, Procesamiento Analítico en Línea

Espacial.

I. INTRODUCCIÓN

a información almacenada en una organización a través

del tiempo puede contener datos de cualquier tipo: enteros,

flotantes, caracteres, cadenas de caracteres (String),

booleanos, entre otros. Al mismo tiempo estos datos se

relacionan con procesos y procedimientos en diversas

temáticas en sectores educativos, sociales, empresariales o

políticos, que requieren de análisis de resultados o cifras

históricas para cumplir con las metas propuestas actuales y

futuras.

Para obtener respuestas se utilizan técnicas de inteligencia

de negocios que resultan bastante útiles y que proporcionan un

amplio marco de referencia para la toma de decisiones sobre

los posibles problemas a contemplar, sin embargo, estos

análisis se quedan cortos o incompletos cuando se quiere

obtener información que compromete un sitio, lugar o marco

geográfico [1]. Teniendo en cuenta lo anterior se incorporó al

análisis de toma de decisiones datos de tipo espacial o

geométrico como: puntos, polígonos y líneas que permiten

analizar la información desde otro nivel o perspectiva,

incorporando herramientas y técnicas con estos datos, a esto se

le denomina Inteligencia de Negocios Espaciales [2].

En la aplicación de inteligencia de negocios espaciales se

realizan una serie de etapas que en su orden permiten

estructurar elementos para soporte en la toma de decisiones, se

comienza con los datos transaccionales históricos recolectados

con su componente espacial, luego se procede a la extracción,

transformación y carga para diseñar y construir la bodega de

datos espacial, posteriormente se analizan y diseñan las

dimensiones y medidas para el modelamiento del cubo

espacial para así poder aplicar la minería de datos espaciales,

de esta manera se tienen los insumos de información

suficientes para llegar a los resultados para la toma de

decisiones, que en este caso serán estadísticos y espaciales,

dando una visión mucho más amplia de cómo se relacionan

estos datos y que decisiones se deberían tomar [1].

El conjunto de pasos anteriores se automatiza en un

conjunto de herramientas de software libre que permiten

realizar estas tareas de forma clara y ordenada, aunque no

existe una única herramienta para el desarrollo de inteligencia

de negocios espaciales, la combinación de los sistemas

software utilizados en este proyecto permite su aplicación,

ofreciendo soporte para la toma de decisiones espaciales [3].

Inteligencia de Negocios Espaciales Orientada al Análisis

de datos sobre pruebas Saber 11 del Instituto Colombiano

para la Evaluación de la Educación a Nivel Nacional (Enero 2014)

Christiam Alejandro Niño Peña, Autor, Gustavo Cáceres Castellanos, Director

L

Page 2: Versión Definitiva Inteligencia de Negocios Espaciales

2

II. ESTADO ACTUAL DE LA INTELIGENCIA DE NEGOCIOS

ESPACIALES

La inteligencia de negocios espacial provee una serie de

pasos para la toma de decisiones que permite integrar la

información de tipo geográfico o espacial, estos pasos según

[1] son:

--Inteligencia: para formular y encontrar el problema.

--Diseño: para analizar una solución.

--Elección: para seleccionar la más indicada.

Cada paso debe cumplir un manejo de la información

preciso para obtener un resultado óptimo y que se acomode

con lo que se espera.

A. Bodegas de datos espaciales

Las organizaciones se han preocupado por atender las

diversas situaciones de oferta y demanda de sus productos y

servicios basados en los lugares donde se encuentran, ya sea

departamentos, municipios, veredas, predios, etc. Además sus

bases de datos llamadas también bodegas de datos pueden

contener información de clientes, proveedores, años, contactos

y otros relacionados con alguna posición geográfica que

permite realizar un análisis de tipo espacial ya sea en relación

a un polígono, punto o línea [4].

El volumen de información manejado por estas bodegas es

elevado, razón por la cual se requiere que los sistemas que las

contienen utilicen mayor procesamiento, memoria y aplicación

de una serie de consultas multidimensionales que soporten

jerarquías predefinidas para acelerar el rendimiento, para

lograr esto se utilizan índices llamados SB-Index1 y HSB-

Index2 que permiten agrupar muchos datos en poco tiempo [5].

Estos rendimientos suponen que se maneje una serie de

granularidad espacial para permitir la clasificación de los

datos, esta forma de representación toma un enfoque

cualitativo para el manejo de la información, representando la

misma en forma discreta y/o continua [6].

El objetivo principal de la bodega de datos espacial es el de

agrupar todo tipo de información relevante al soporte de

decisiones alfanumérica y geográfica con el fin de ser el punto

de partida para generar el cubo espacial del cual se

desprenderán los resultados [7].

B. Algoritmos y Técnicas de Minería de datos espaciales

La minería de datos espaciales permite obtener un resultado

profundo y completo de un cuestionamiento dado en un

almacén de datos espacial, pero para llegar a obtener este

resultado se hace necesario encontrar el mejor método. Existen

métodos de minería que permiten realizar esto aplicando

algoritmos diseñados para tal fin, clasificados según la tabla 1

así:

1 SB-Índex: Índice de mapa de bits de estructura de datos secuencial 2 HSB-Índex: Índice de mapa de bits de estructura de datos jerárquica

TABLA I

TÉCNICAS DE MINERÍA DE DATOS

Minería de datos no espacial

Técnica Tipo

Arboles de decisión Supervisados

Inducción o redes

neuronales

Regresión lineal

Series de tiempo

Detección de desviaciones o

Naive Bayes

No supervisados

Reglas de asociación

Patrones secuenciales

Minería de datos espacial

Técnica Algoritmo

Generalización Jerarquías

Atributos

Agrupación Particional

Jerárquica

Localización K-Means

Localización K-Medoids

Clarans

SD-Clarans

NSD-Clarans

Asociación espacial A priori

Fuente. El autor

Cada uno de estos algoritmos espaciales utiliza

procedimientos de manejo de la información geométrica para

llegar a los resultados esperados, la tabla de clasificación de

técnicas y algoritmos se desarrolló en base a [8].

C. Aplicación SOLAP en proyectos de diversas áreas

La aplicabilidad de la inteligencia de negocios espaciales o

SOLAP se extiende a diversas áreas del conocimiento

permitiendo que se puedan desarrollar proyectos de todo tipo,

para mencionar algunos de ellos y su aplicabilidad se muestra

la tabla 2.

TABLA II

CASOS DE ÉXITO SOLAP

Estudio Aplicación Enlace

SDSS de Clasificación

de Imágenes

Evaluación de Superficies de

Arroz

[9]

Sistema de apoyo a

decisiones espaciales

para planificación del

uso de la tierra

Identificación de unidades de

tierra, verificación de

ecosistemas, desarrollo de

software Exgis y ForAndesT

[10]

Evaluar impactos de

deposición atmosférica

de azufre

Sistemas acuáticos en la región

sur de los Apalaches

[11]

SDSS para gestión de

aguas pluviales y

evaluación de calidad

Uso de la tierra en Estados

Unidos, geolocalizar

contaminación en una zona

urbana

[12]

Análisis de indicadores

energéticos agrícolas

Verificación de consumos de

energía en actividades

agropecuarias con reportes de

producción

[13]

Page 3: Versión Definitiva Inteligencia de Negocios Espaciales

3

Estudio Aplicación Enlace

SDSS Web para ruteo de

vehículos utilizando

Google Maps

Generación de rutas optimizadas

y mapas, fue probado en

Coimbra, Portugal

[14]

Minería de datos

espaciales para la

agricultura

Utilización del algoritmo k-means

y métodos de optimización de

refinamiento progresivo

[15]

SDSS de gran escala de

enrutamiento de

vehículos

Mejorar la eficiencia y reducir los

costos de transporte, aplicado en

una compañía China

[16]

Diseño de almacenes de

datos espaciales para la

toma de decisiones en

datos geoespacial

Mejor manejo de información en

instituciones como autoridad y

gobiernos

[17]

Análisis de datos socio-

espaciales con gráficos

interactivos

Provincia de Buenos Aires en

manejo de datos atípicos

espaciales en SIG y sistemas de

ayuda de Decisión espacial

(SADE)

[18]

SDSS para ayuda en el

sector publico

Sistema de información

SIGGESC para apoyo a SDSS en

SIG en Portugal

[19]

Modelos de simulación

demográficos y

económicos

Uso de un modelo de simulación

PRIMA con herramientas SOLAP

[20]

SDSS para el manejo

integrado de la salud y la

educación en

instalaciones a nivel

local

Utilización de SDSS en el manejo

de datos históricos para mejor

organización de servicios de

educación y salud en Brasil

[21]

Fuente. El autor.

III. ANÁLISIS, DISEÑO Y DESARROLLO DE LA BODEGA DE

DATOS ESPACIALES

En el desarrollo del proyecto se utilizaron las bases de datos

del ICFES Pruebas Saber 11 de los años 2005 a 2012 donde se

clasifico información básica de los estudiantes en base

condiciones socioeconómicas, instituciones educativas

organizadas según carácter, naturaleza, calendario, jornada,

idioma y zona, los resultados según pruebas de núcleo común

y componente flexible, así como la clasificación de los

estudiantes e instituciones a nivel nacional según el año y

semestre con su localización geográfica municipal y

departamental [22].

La información anteriormente mencionada se descargó en

formato CSV3 proporcionada por el ICFES4 con los datos

clasificados según año y semestres.

A. Organización y adaptación de la información

El primer paso para poder diseñar la bodega de datos

espaciales consistió en la organización de la información

recibida utilizando el Sistema Gestor de Bases de Datos

POSTGRESQL [23] en su versión 8.4 y su componente

3 Valores separados por comas. 4 Instituto colombiano para la evaluación de la educación.

espacial POSTGIS [24] en su versión 1.5, teniendo estas

herramientas instaladas con su respectiva plantilla espacial se

crea la base de datos y tablas necesarias por año y semestre

para con el comando Copy de POSTGRESQL realizar la

importación de la información en la base de datos, el comando

utilizado se muestra en la figura 1.

Fig. 1. Carga de datos de CSV a PostgreSQL

Después de tener la información cargada en el SGBD5 se

procedió a organizar y seleccionar los datos con el uso de

consultas SQL6 con declaración DDL7 y DML8, esta

organización se definió según el diccionario de datos versión

1.6 ICFES [25] para relacionar las llaves primarias y llaves

foráneas y así obtener el conjunto de tablas, índices y vistas

necesarias para realizar el modelamiento completo de la base

de datos, en la figura 2 se muestra el compilado de tablas

obtenido.

Fig. 2. Objetos base de datos db_saber en PostgreSQL 8.4

Al tener la información organizada y completa se procedió a

realizar la optimización de datos, revisión de campos erróneos

y organización de referencias.

B. Extracción, Transformación y Carga

Para iniciar el proceso de creación del almacén de datos

espaciales se procedió a indagar que factores serian

importantes para realizar el análisis espacial y que permitieran

obtener elementos para poder realizar la toma de decisiones. A

partir de esto se procedió a consultar el documento de

“Informe histórico prueba saber 11” [22] donde se obtuvieron

criterios para el análisis, la tabla 3 muestra estos factores:

5 Sistema gestor de bases de datos. 6 Lenguaje de consulta estructurado. 7 Lenguaje de definición de datos. 8 Lenguaje de manipulación de datos.

Page 4: Versión Definitiva Inteligencia de Negocios Espaciales

4

TABLA III

FACTORES DE ANÁLISIS ICFES PRUEBAS SABER 11 Resultados Nacionales

Población Evaluada --Total de evaluados por periodo según tipo

de inscripción.

--Características de la población evaluada:

Sexo y Edad “menores de 16, menores de

18, entre 17 y 18, entre 18 y <21 y mayores

a 21”.

--Número de estudiantes y establecimientos

educativos evaluados según zona y sector.

--Número de estudiantes y establecimientos

educativos de jornada diurna evaluados.

--Puntajes promedio en núcleo común y en

áreas académicas, según sector y zona.

--Niveles de dominio del inglés según

sector y zona.

--Puntajes en núcleo común y áreas

académicas según género.

--Niveles de dominio del inglés según

género

Establecimientos educativos --Por grupos de clasificación

socioeconómica, según sector y zona

--Por categorías de desempeño en el

examen, según sector y zona

Resultados Territoriales Población Evaluada --Población total evaluada en A-2008 y B-

2009 por tipo de inscripción

--Número de estudiantes y establecimientos

educativos (sedes-jornada), evaluados en

los últimos cinco periodos de calendarios A

y B

Resultados de los estudiantes --Número de estudiantes evaluados de

municipios certificados y no certificados

--Municipios certificados y no certificados

---Media en núcleo común y en las áreas en

los últimos cinco periodos del calendario A

---Media en núcleo común y en las áreas

académicas en los últimos cinco períodos

del calendario B

---Desempeño en inglés. Calendarios A-

2008 y B-2009 Resultados de los

establecimientos educativos --Municipios certificados y no certificados

---Por categorías de desempeño en el

examen por años

---Por grupos de clasificación

socioeconómica (CSE) Fuente. El autor.

Los factores mencionados anteriormente son los elementos

de análisis para la realización del cubo espacial.

A partir de esto se procedió a la realización de la bodega de

datos espaciales con la herramienta libre GEOKETTLE [26], la

cual permite realizar la extracción, transformación y carga de

datos, pero con el adicional que permite utilizar datos de tipo

espacial, también permite extraer datos de 35 tipos de bases de

datos, formato de archivo como XLS, XML, Archivos planos,

entre otros. Además permite realizar transformaciones de

datos con herramientas como mapeo, selección, filtro, unión,

duplicación, análisis espacial, vistas de cartografía y otras,

finalmente permite la salida de estos resultados para

conformar la bodega de datos.

Utilizando la aplicación GEOKETTLE se visualiza el

componente espacial obtenido, en este caso se utilizaron los

polígonos y puntos de los municipios de Colombia, la

visualización de los mismos se observa en la figura 3 con los

municipios de Colombia en Polígono y la figura 4 de los sitios

en puntos.

Fig. 3. Mapa de Colombia - Polígonos

Fig. 4. Sitios de Colombia - Puntos

El diseño de la bodega de datos espaciales se rige según los

factores que se quiere tener respuesta, a partir de ello se

modelo la bodega espacial en el sistema GEOKETTLE, para

ello se utilizaron herramientas de lectura y extracción de

campos como se ve en la figura 5 de forma específica y en la

figura 6 de forma general.

Fig. 5. Carga en Geokettle de forma específica

Page 5: Versión Definitiva Inteligencia de Negocios Espaciales

5

Fig. 6. Diseño de bodega de datos espacial

Después de tener el diseño de la bodega de datos se ejecuta

el procesamiento para almacenar en el sistema gestor de bases

de datos, el resultado obtenido es el insumo para realizar el

cubo de datos espacial, en la figura 7 se muestra el diseño de

la bodega de datos espacial en la que se utilizó el modelo

estrella para mejorar rendimiento tanto en la consulta SQL y

MDX9 como en el procesamiento de la posterior minería

espacial y visualización geográfica.

Fig. 7. Bodega de Datos Espacial

IV. DISEÑO DEL ESQUEMA E IMPLEMENTACIÓN DEL CUBO DE

DATOS ESPACIAL

A. Identificación de dimensiones y medidas

En la identificación de las dimensiones y medidas se

relacionaron los factores de los que se deseó obtener respuesta

para crear el cubo de datos espacial y de esta forma obtener el

soporte de decisiones.

Las dimensiones diseñadas y obtenidas en este ejercicio se

diseñaron primero en forma gráfica, para luego utilizar la

herramienta SCHEMA WORKBECH [27].

9 Expresiones Multidimensionales.

B. Diseño del esquema del cubo espacial

En el diseño del cubo espacial se utilizó la herramienta

SCHEMA WORKBENCH la cual permitió desarrollar el

esquema espacial adaptando las dimensiones necesarias y las

medidas que proporcionarían los resultados de los factores a

evaluar, en la figura 8 se observa la forma en que se construyó

el cubo de datos espaciales y la figura 9 el proceso más

detallado.

Fig. 8. Diseño del cubo de datos espaciales

Fig. 9. Esquema del cubo más detallado

El modelado del cubo espacial de relaciones OLAP

(Procesamiento analítico en línea) tomo la tabla municipios

para la utilización de los campos geométricos y su conexión

con las tablas periodos, estudiantes, instituciones y exámenes

para obtener las medidas de temáticas y resultados.

Además la aplicación de modelado de esquemas válida la

información y forma del cubo para evitar romper restricciones

en la bodega de datos y el mal manejo de la información

ocasionando datos erróneos.

Page 6: Versión Definitiva Inteligencia de Negocios Espaciales

6

C. Importación y adaptación del esquema del cubo espacial

En el momento de guardar el esquema en formato XML10 se

obtiene en detalle la organización del cubo de análisis de

información espacial como se ve en la figura 10.

Fig. 10. Esquema XML del cubo de datos espacial

El archivo XML es el responsable de llamar los datos de la

bodega de datos para que se relacionen con las dimensiones y

medidas, este esquema requiere un sistema servidor donde

pueda realizar las operaciones de consulta de datos utilizando

el lenguaje MDX, el cual es la forma de realizar las sentencias

de selección y manipulación de los datos y el procesamiento

de la información para su manejo espacial y alfanumérico.

Para el procesamiento de información espacial y de la

bodega de datos se utilizó la aplicación GEOMONDRIAN [28]

para de esta manera obtener reportes de datos en tablas y

estadísticos en forma de gráficos, en la figura 11 se puede ver

una vista del servidor de análisis espacial en ejecución.

Fig. 11. Ejecución de GEOMONDRIAN

De esta manera se obtuvo el cubo espacial en ejecución con

los datos proporcionados por el esquema realizado en

SCHEMA WORKBENCH.

10 Lenguaje de marcas extensible.

V. APLICACIÓN DE MINERÍA ESPACIAL

Para el cumplimiento del siguiente objetivo en el desarrollo

de la inteligencia de negocios espacial se procedió a utilizar la

herramienta libre GEOKNIME [29] la cual permite desarrollar

los modelos en entorno visual así como aplicar los diversos

algoritmos de minería de datos espaciales para obtener la

información de soporte a la toma de decisiones.

Al utilizar el dato espacial en la tabla municipios para

obtener geometrías se hace necesario el uso de un algoritmo

de datos espacial, este se decidió según el factor a evaluar para

el manejo de los resultados, la técnica elegida para aplicar la

minería espacial es la de agrupación con los algoritmos k-

Means y k-Medoids.

A. Aplicación de los algoritmos de minería espacial

El algoritmo a utilizar como se mencionó anteriormente se

basó en el factor a evaluar, un ejemplo claro es el número de

estudiantes y establecimientos educativos según zona y sector,

en este factor se tienen en cuenta la dimensión estudiantes,

establecimientos y municipios para lo cual se requeriría un

algoritmo de agrupamiento para poder obtener el valor de

número de estudiantes, además GEOKNIME permitió la

utilización de datos espaciales, en la figura 12 se muestra al

software en el proceso de minería de datos espacial en el

algoritmo k-Means y la figura 13 en el algoritmo k-Medoids.

Fig. 12. Aplicación de algoritmo k-Means

Fig. 13. Aplicación de algoritmo k-Medoids

Los resultados obtenidos se almacenan en una tabla

temporal que tiene los resultados para soportar la toma de

decisiones, para cada factor se realizó un procesamiento de

minería para el manejo de los resultados.

Page 7: Versión Definitiva Inteligencia de Negocios Espaciales

7

VI. IMPLEMENTACIÓN DEL VISOR DE RESULTADOS DE

INFORMACIÓN GEOGRÁFICA

El proceso de visualización de los resultados toma diversas

formas según como se quiera analizar la información, se

pueden utilizar gráficos estadísticos como barras, tortas y

esquemas lineales, también se permiten ver las tablas de datos

con los resultados, sumado a esto se adquiere una nueva forma

de representar la información que permite que los datos se

reflejen en un mapa visualizando los puntos y sitios

(polígonos) de interés de un dato dado, esta información

además permite la manipulación interactiva en el mapa.

A. Incorporación y uso del cubo espacial en el visor de

análisis de negocio SAIKU

Luego de tener los datos en el servidor de análisis espacial

GEOMONDRIAN con el respectivo cubo de información con

los elementos espaciales, se hace necesario la visualización y

manipulación por parte de herramientas software que

interpreten las consultas MDX, los datos, el cubo espacial y

representar espacialmente, por estas razones se utilizó SAIKU

[30], que permite un análisis de la información de forma Drag

and Drop arrastrando los componentes que se requieren en un

área de trabajo, los resultados de la combinación de

dimensiones y medidas son calculadas automáticamente por el

software y se muestran los valores, los gráficos y mapas

relacionados, la visualización de mapas es posible integrando

un componente llamado ChartPlus que nos muestra la

información en un mapa con la ayuda de Google Maps. La

utilización del cubo espacial se puede ver en la figura 14, en

figura 15 las dimensiones y en la figura 16 las medidas.

Fig. 14. Tabla de información analizada en SAIKU

En total el número de dimensiones es de 58 en las que se

evalúan todos los aspectos de los factores inicialmente

planteados, del mismo modo se obtuvieron 38 medidas que

permiten realizar los cálculos de inteligencia de negocios

espaciales, algunos de estos cálculos son sumatorias,

promedios, desviación estándar y contadores.

Fig. 15. Dimensiones del cubo

Fig. 16. Medidas del cubo

Algunos de los resultados mencionados se muestran en

gráficos estadísticos en la figura 17.

Page 8: Versión Definitiva Inteligencia de Negocios Espaciales

8

Fig. 17. Gráficos estadísticos

También se tiene el valor agregado en que la herramienta

soporta plataformas web y móvil lo que permite realizar

análisis desde cualquier sitio que tenga internet y acceso al

servidor.

B. Implementación del visor geográfico SAIKU con

CHARTPLUS y aplicación i3GEO

La visualización espacial toma un nuevo rumbo con el

manejo de datos espaciales, para el proyecto se utilizaron dos

herramientas que permiten utilizar este tipo de información,

una de ellos es CHARTPLUS [31], el cual maneja HTML5

para la carga de información mucho más rápida y con un

detalle grafico completo, la adaptación de CHARTPLUS al

visor SAIKU fue un punto clave en la visualización de la

información de negocio ya que al poder manipularse y verse

en un mapa se hace más clara la toma de decisiones, en la

figura 18 se puede apreciar el mapa de Colombia con

información tomada de SAIKU.

Fig. 18. Carga de mapa con CHARTPLUS

El software libre CHARTPLUS permite la adaptación de

una gran cantidad de plugins que facilita aún más el manejo de

la información.

Por otra parte se utilizó también el software Brasileño

i3GEO [32], que permite también la manipulación de

información espacial, a diferencia de CHARTPLUS, i3GEO

proporciona una mayor cantidad de herramientas pero su

rendimiento es mucho más bajo, aunque este rendimiento es

debido a la manipulación de datos vectoriales y el uso de gran

cantidad de información, i3GEO permite la exploración de

diversas temáticas según se requiera, en la figura 19 se

muestra la caracterización de inscritos al examen ICFES Saber

11 por departamento en Colombia para el año 2012.

Fig. 19. Uso de i3GEO

La implementación de estos visores tuvo que adecuarse a

los lineamientos del servidor de análisis espacial

GEOMONDRIAN.

C. Implementación del visor geográfico SOLAP LAYERS 2.0

Existe otro desarrollo libre llamado SOLAP LAYERS [33]

que permite la visualización de información espacial y que

agrega un componente de consultas MDX para realizar la

operación, este sistema software no es adecuado ya que no es

rápido y consume bastante memoria, en la figura 20 se puede

apreciar la interfaz gráfica de la herramienta y el modo de

operar.

Fig. 20. Interfaz SOLAPLAYERS

VII. CONCLUSIONES

El proyecto realizado logro la implementación de una

inteligencia de negocios espaciales completa, desarrollando

cada una de las fases comprendidas. La utilización del

software libre permitió que los datos fueran tratados y

manejados según los factores de decisión que se establecieron,

en resumen cada fase se completó con la utilización de una

herramienta software para tal fin, en la figura 21 se puede

apreciar un esquema grafico de las herramientas utilizadas y

del paso de cada una para completar el análisis espacial.

Page 9: Versión Definitiva Inteligencia de Negocios Espaciales

9

Fig. 21. Software Spatial BI [34]

Al día de hoy se han desarrollado una cantidad limitada de

proyectos relacionados con la Inteligencia de Negocios

Espaciales, esto por ser una tecnología un tanto nueva ya que

involucra nuevos tipos de datos y un alto manejo de

procesamiento y memoria, por esta razón el almacenamiento

espacial ha evolucionado incorporando nuevas formas de

obtener el tipo de dato espacial y mejorando la distribución de

las tablas e índices para la recuperación de los mismos, a su

vez los modelos y consultas espaciales incrementan el

rendimiento e integridad en la recuperación de la información

teniendo en cuenta que el procesamiento de estas consultas

exige más y mejores procedimientos. En concordancia, el

surgimiento de nuevos algoritmos para extraer la información

espacial hace que la minería de datos espacial adquiera nuevas

técnicas de transformación de los datos para que cumplan con

los requerimientos exigidos.

Como se ha denotado la aplicabilidad de la Inteligencia de

Negocios Espaciales se relaciona en un número amplio de

temáticas, permitiendo que la misma se involucre con áreas

del conocimiento que posibilita obtener resultados más

completos y visibles para la toma de decisiones para presente

y futuro. En orden de uso según las tareas involucradas, las

herramientas utilizadas para la aplicación de inteligencia de

negocios espaciales en las bases de datos del ICFES pruebas

Saber 11 fueron:

TABLA IV

SOFTWARE LIBRE UTILIZADO Tarea Software

Base de datos OLTP Espacial Postgres Postgis

Almacén de datos espacial GeoKettle

Esquema cubo de datos espacial Schema Workbench

Servidor de análisis espacial GeoMondrian

Minería de datos espacial GeoKnime

Visores gráficos de mapas I3Geo, ChartPlus, Solap Layers

Visor de resultados espacial SAIKU

Fuente. El autor.

Actualmente no existe un software que unifique estos pasos

y tengan un análisis espacial de forma directa, razón por la

cual este es un camino viable y completo para la realización de

inteligencia de negocios espaciales, además con este conjunto

de pasos desarrollados se logra obtener respuesta para los

factores de evaluación del soporte para la toma de decisiones

en las bases de datos del ICFES pruebas SABER 11.

REFERENCIAS

[1] Sugumaran, R. and J. Degroote, "Spatial Decision Support Systems -

Principles and Practices", in CRC Press, ed. New York (USA):2011,

pp. 507

[2] Flacke, J., (2012, nov). "Spatial Decision Support Systems –

Introduction to Concepts and Requirements". Web-GIS and Spatial

Data Infrastructure. pp. 30.

[3] Lamas, A., et al., (2013, jul). "Creación de un módulo espacial OLAP

para Saiku". VIII Jornadas de SIG Libre de Girona. pp. 9.

[4] Viswanathan, G. and M. Schneider, (2012, jun). "User-centric spatial

data warehousing: a survey of requirements and approaches".

International Journal of Data Mining, Modelling and Management.

[5] Siqueira, T.L., et al., (2012, jun). "The SB-index and the HSB-index:

efficient indices for spatial data warehouses". Geoinformatica. (ACM),

pp. 165-205

[6] Bimonte, S. and M.-A. Kang, (2010, sep). "Towards a Model for the

Multidimensional Analysis of Field Data ". Proceedings of the 14th east

European conference on Advances in databases and information

systems. (ACM), pp. 58-72.

[7] Vaisman, A. and E. Zimányi, (2009, nov). "A multidimensional model

representing continuous fields in spatial data warehouses".

Proceedings of the 17th ACM SIGSPATIAL International Conference

on Advances in Geographic Information Systems. (ACM), pp. 168-177.

[8] Reyes, M.X.D., (2009, jan). "Minería de datos espaciales en búsqueda

de la verdadera información". Pontificia Universidad Javeriana.

(Scielo), pp. 20.

[9] Wan, S., T.C. Lei, and T.Y. Chou, (2010, apr). "An enhanced

supervised spatial decision support system of image classification:

consideration on the ancillary information of paddy rice area".

International Journal of Geographical Information Science. (Taylor

Francis), pp. 623-642.

[10] Meyer, A.D., et al., (2013, nov). "A conceptual framework and its

software implementation to generate spatial decision support

systems for land use planning". Land Use Policy. (Science Direct),

pp. 271-282.

[11] Reynolds, K.M., et al., (2012, jan). "Spatial Decision Support for

Assessing Impacts of Atmospheric Sulfur Deposition on Aquatic

Ecosystems in the Southern Appalachian Region". Hawaii International

Conference on (IEEE Xplorer), pp. 1197 - 1206.

[12] Kaunda-Bukenya, N., et al., (2012, apr). "Spatial Decision Support

System (SDSS) for Stormwater Management and Water Quality

Assessment ". Water Quality Monitoring and Assessment. (Intech), pp.

22.

[13] Bimonte, S., et al., (2012, jun). "Definition and analysis of new

agricultural farm energetic indicators using spatial OLAP".

Computational Science and Its Applications. (Springer), pp. 373-385

[14] Santos, L., J. Coutinho-Rodrigues, and C.H. Antunes, (2011, apr). "A

web spatial decision support system for vehicle routing using Google

Maps". Decision Support Systems. (Science Direct), pp. 1-9.

[15] D.Rajesh, (2011, feb). "Application of Spatial Data Mining for

Agriculture". International Journal of Computer Applications (0975 –

8887). International Journal of Computer Applications (Springer), pp.

3.

[16] Yu, X. and K. Liu, (2009, apr). "A Spatial Decision Support System for

Large Scale Vehicle Routing". Measuring Technology and

Mechatronics Automation International Conference on (IEEE Xplorer),

pp. 444-449.

Page 10: Versión Definitiva Inteligencia de Negocios Espaciales

10

[17] Kyung, M.-J., J.-H. Yom, and S.-Y. Kim, (2012, sep). "Spatial data

warehouse design and spatial OLAP implementation for decision

making of geospatial data update". KSCE Journal of Civil Engineering.

(Springer), pp. 1023-1031.

[18] Humacata, L.M., (2010, jan). "Análisis exploratorio de datos socio-

espaciales mediante gráficos interactivos". Revista digital del Grupo de

Estudios sobre Geografía y Análisis Espacial con Sistemas de

Información Geográfica (gesig), pp. 135-163.

[19] Oliveira, T.H.M.d., M. Painho, and R. Henriques, (2012, nov). "A

spatial decision support system for the Portuguese public

transportation sector". Proceedings of the Third ACM SIGSPATIAL

International Workshop on GeoStreaming. (ACM), pp. 84-90

[20] Mahboubi, H., S. Bimonte, and G. Deffuant, (2011, jun). "Analyzing

demographic and economic simulation model results: a semi-automatic

spatial OLAP approach". Computational Science and Its Applications.

(Springer), pp. 17-31

[21] LIMA, R.d.S., A.N.R.d. Silva, and J.F.G. Mendes, (2003, may). "A

SDSS For integrated management of health and education facilities at

the local level: Challenges and opportunities in a developing country".

International Conference on Computers in Urban Planning and Urban

Management. (sdum), pp. 15.

[22] ICFES. (2013). "Informe de resultados históricos Saber 11". [online].

Available from: http://www2.icfes.gov.co/resultados/saber-11-

resultados.

[23] Postgresql. (2013). "Postgresql". [online]. Available from:

http://www.postgresql.org.es/.

[24] Postgis. (2013). "Postgis". [online]. Available from: http://postgis.net/.

[25] ICFES. (2014). "Repositorio FTP ICFES". [online]. Available from:

ftp://ftp.icfes.gov.co.

[26] Spatialytics.org. (2008). "Geokettle". [online]. Available from:

http://www.spatialytics.org/projects/geokettle/.

[27] Mondrian. (2013). "Schema Workbench". [online]. Available from:

http://sourceforge.net/projects/mondrian/files/schema%20workbench/.

[28] Spatialytics.org. (2013). "Geomondrian". [online]. Available from:

http://www.spatialytics.org/projects/geomondrian/.

[29] AG. (2013). "Geoknime". [online]. Available from:

http://www.knime.org.

[30] BI, M., (2013). "Saiku". [online]. Available from:

http://meteorite.bi/saiku.

[31] it4biz. (2014). "Saiku ChartPlus". [online]. Available from:

it4biz.github.io/SaikuChartPlus/.

[32] Software, B.P., (2013). "i3GEO". [online]. Available from:

http://www.gvsig.org/web/projects/i3Geo/.

[33] tbadard. (2010). "Solaplayers". [online]. Available from:

http://sourceforge.net/projects/spatialytics/.

[34] Badard, T., (2010). "Open source Geospatial Business Intelligence in

action with GeoMondrian and SOLAPLayers!". [online]. Available

from: http://www.slideshare.net/tbadard/open-source-geospatial-

business-intelligence-geobi-definition-architectures-projects-

challenges-and-outlooks-8810753.

CHRISTIAM ALEJANDRO NIÑO PEÑA

-AUTOR Ingeniero de Sistemas,

Especialista en Gerencia de Sistemas

Informáticos, Especialista en Bases de Datos,

Candidato a Magister en Tecnología

Informática de la Universidad Pedagógica y

Tecnológica de Colombia. Ingeniero de

Sistemas DBA en la Gobernación de Boyacá. Áreas de

Trabajo: Bases de Datos, Ingeniería del Software, Sistemas de

Información Geográfica, Bases de datos espaciales,

Inteligencia de Negocios Espaciales, Programación Web.

GUSTAVO CACERES CASTELLANOS –

DIRECTOR. Magister en Ciencias de la

Información y las Comunicaciones,

Especialista en Diseño de Sistemas de

Auditoría, Cursos de Doctorado en

Informática e Inteligencia Artificial,

Ingeniero de Sistemas. Docente Tiempo

Completo de la Universidad Pedagógica y Tecnológica de

Colombia. Áreas de Trabajo: Bases de Datos, Lenguajes

Formales, Matemáticas Discretas, Sistemas de Información

Geográfica, Bases de datos espaciales, Inteligencia de

Negocios.