Versión Definitiva Inteligencia de Negocios Espaciales
-
Upload
christiam-nino -
Category
Documents
-
view
72 -
download
0
Transcript of Versión Definitiva Inteligencia de Negocios Espaciales
1
Abstract— The article focuses on a brief but comprehensive
review of the spatial business intelligence also called SOLAP, also
presents a series of steps that allow to apply SOLAP on a real
project, from the initial processing of the data in the design of the
spatial data warehouse, modeling of the spatial cube schema,
spatial data mining and the user interface of results according to
factors required for this purpose "maps and graphics statistics",
databases used were ICFES Saber 11 of the years 2005 to 2012 as
input information; in the project used Free Software evidencing
its utility and showing how different applications can be used
together to develop a support for decision making spatial.
Index Terms— Spatial Business Intelligence, Spatial Data
Warehouse, Spatial Data Mining, Geographic Information
Systems, Online Spatial Analytical Processing.
Resumen— El artículo se centra en una breve pero completa
revisión de la inteligencia de negocio espacial también llamado
SOLAP, también presenta una serie de pasos que permiten
aplicar SOLAP en un proyecto real, desde el procesamiento
inicial de los datos en el diseño del almacén de datos espaciales,
modelado del esquema de cubo espacial, minería de datos
espacial y la interfaz de usuario de los resultados de acuerdo a los
factores necesarios para este fin "mapas y estadísticas gráficas",
las bases de datos utilizadas fueron ICFES Saber 11 de los años
2005 a 2012, como información de entrada, en el proyecto se
utiliza Software Libre evidenciando su utilidad y mostrando
cómo las diferentes aplicaciones se pueden utilizar en conjunto
para desarrollar un soporte para la toma de decisiones espaciales.
Palabras clave— Inteligencia de Negocios Espaciales, Almacén
de Datos Espaciales, Minería de Datos Espaciales, Sistemas de
Información Geográfica, Procesamiento Analítico en Línea
Espacial.
I. INTRODUCCIÓN
a información almacenada en una organización a través
del tiempo puede contener datos de cualquier tipo: enteros,
flotantes, caracteres, cadenas de caracteres (String),
booleanos, entre otros. Al mismo tiempo estos datos se
relacionan con procesos y procedimientos en diversas
temáticas en sectores educativos, sociales, empresariales o
políticos, que requieren de análisis de resultados o cifras
históricas para cumplir con las metas propuestas actuales y
futuras.
Para obtener respuestas se utilizan técnicas de inteligencia
de negocios que resultan bastante útiles y que proporcionan un
amplio marco de referencia para la toma de decisiones sobre
los posibles problemas a contemplar, sin embargo, estos
análisis se quedan cortos o incompletos cuando se quiere
obtener información que compromete un sitio, lugar o marco
geográfico [1]. Teniendo en cuenta lo anterior se incorporó al
análisis de toma de decisiones datos de tipo espacial o
geométrico como: puntos, polígonos y líneas que permiten
analizar la información desde otro nivel o perspectiva,
incorporando herramientas y técnicas con estos datos, a esto se
le denomina Inteligencia de Negocios Espaciales [2].
En la aplicación de inteligencia de negocios espaciales se
realizan una serie de etapas que en su orden permiten
estructurar elementos para soporte en la toma de decisiones, se
comienza con los datos transaccionales históricos recolectados
con su componente espacial, luego se procede a la extracción,
transformación y carga para diseñar y construir la bodega de
datos espacial, posteriormente se analizan y diseñan las
dimensiones y medidas para el modelamiento del cubo
espacial para así poder aplicar la minería de datos espaciales,
de esta manera se tienen los insumos de información
suficientes para llegar a los resultados para la toma de
decisiones, que en este caso serán estadísticos y espaciales,
dando una visión mucho más amplia de cómo se relacionan
estos datos y que decisiones se deberían tomar [1].
El conjunto de pasos anteriores se automatiza en un
conjunto de herramientas de software libre que permiten
realizar estas tareas de forma clara y ordenada, aunque no
existe una única herramienta para el desarrollo de inteligencia
de negocios espaciales, la combinación de los sistemas
software utilizados en este proyecto permite su aplicación,
ofreciendo soporte para la toma de decisiones espaciales [3].
Inteligencia de Negocios Espaciales Orientada al Análisis
de datos sobre pruebas Saber 11 del Instituto Colombiano
para la Evaluación de la Educación a Nivel Nacional (Enero 2014)
Christiam Alejandro Niño Peña, Autor, Gustavo Cáceres Castellanos, Director
L
2
II. ESTADO ACTUAL DE LA INTELIGENCIA DE NEGOCIOS
ESPACIALES
La inteligencia de negocios espacial provee una serie de
pasos para la toma de decisiones que permite integrar la
información de tipo geográfico o espacial, estos pasos según
[1] son:
--Inteligencia: para formular y encontrar el problema.
--Diseño: para analizar una solución.
--Elección: para seleccionar la más indicada.
Cada paso debe cumplir un manejo de la información
preciso para obtener un resultado óptimo y que se acomode
con lo que se espera.
A. Bodegas de datos espaciales
Las organizaciones se han preocupado por atender las
diversas situaciones de oferta y demanda de sus productos y
servicios basados en los lugares donde se encuentran, ya sea
departamentos, municipios, veredas, predios, etc. Además sus
bases de datos llamadas también bodegas de datos pueden
contener información de clientes, proveedores, años, contactos
y otros relacionados con alguna posición geográfica que
permite realizar un análisis de tipo espacial ya sea en relación
a un polígono, punto o línea [4].
El volumen de información manejado por estas bodegas es
elevado, razón por la cual se requiere que los sistemas que las
contienen utilicen mayor procesamiento, memoria y aplicación
de una serie de consultas multidimensionales que soporten
jerarquías predefinidas para acelerar el rendimiento, para
lograr esto se utilizan índices llamados SB-Index1 y HSB-
Index2 que permiten agrupar muchos datos en poco tiempo [5].
Estos rendimientos suponen que se maneje una serie de
granularidad espacial para permitir la clasificación de los
datos, esta forma de representación toma un enfoque
cualitativo para el manejo de la información, representando la
misma en forma discreta y/o continua [6].
El objetivo principal de la bodega de datos espacial es el de
agrupar todo tipo de información relevante al soporte de
decisiones alfanumérica y geográfica con el fin de ser el punto
de partida para generar el cubo espacial del cual se
desprenderán los resultados [7].
B. Algoritmos y Técnicas de Minería de datos espaciales
La minería de datos espaciales permite obtener un resultado
profundo y completo de un cuestionamiento dado en un
almacén de datos espacial, pero para llegar a obtener este
resultado se hace necesario encontrar el mejor método. Existen
métodos de minería que permiten realizar esto aplicando
algoritmos diseñados para tal fin, clasificados según la tabla 1
así:
1 SB-Índex: Índice de mapa de bits de estructura de datos secuencial 2 HSB-Índex: Índice de mapa de bits de estructura de datos jerárquica
TABLA I
TÉCNICAS DE MINERÍA DE DATOS
Minería de datos no espacial
Técnica Tipo
Arboles de decisión Supervisados
Inducción o redes
neuronales
Regresión lineal
Series de tiempo
Detección de desviaciones o
Naive Bayes
No supervisados
Reglas de asociación
Patrones secuenciales
Minería de datos espacial
Técnica Algoritmo
Generalización Jerarquías
Atributos
Agrupación Particional
Jerárquica
Localización K-Means
Localización K-Medoids
Clarans
SD-Clarans
NSD-Clarans
Asociación espacial A priori
Fuente. El autor
Cada uno de estos algoritmos espaciales utiliza
procedimientos de manejo de la información geométrica para
llegar a los resultados esperados, la tabla de clasificación de
técnicas y algoritmos se desarrolló en base a [8].
C. Aplicación SOLAP en proyectos de diversas áreas
La aplicabilidad de la inteligencia de negocios espaciales o
SOLAP se extiende a diversas áreas del conocimiento
permitiendo que se puedan desarrollar proyectos de todo tipo,
para mencionar algunos de ellos y su aplicabilidad se muestra
la tabla 2.
TABLA II
CASOS DE ÉXITO SOLAP
Estudio Aplicación Enlace
SDSS de Clasificación
de Imágenes
Evaluación de Superficies de
Arroz
[9]
Sistema de apoyo a
decisiones espaciales
para planificación del
uso de la tierra
Identificación de unidades de
tierra, verificación de
ecosistemas, desarrollo de
software Exgis y ForAndesT
[10]
Evaluar impactos de
deposición atmosférica
de azufre
Sistemas acuáticos en la región
sur de los Apalaches
[11]
SDSS para gestión de
aguas pluviales y
evaluación de calidad
Uso de la tierra en Estados
Unidos, geolocalizar
contaminación en una zona
urbana
[12]
Análisis de indicadores
energéticos agrícolas
Verificación de consumos de
energía en actividades
agropecuarias con reportes de
producción
[13]
3
Estudio Aplicación Enlace
SDSS Web para ruteo de
vehículos utilizando
Google Maps
Generación de rutas optimizadas
y mapas, fue probado en
Coimbra, Portugal
[14]
Minería de datos
espaciales para la
agricultura
Utilización del algoritmo k-means
y métodos de optimización de
refinamiento progresivo
[15]
SDSS de gran escala de
enrutamiento de
vehículos
Mejorar la eficiencia y reducir los
costos de transporte, aplicado en
una compañía China
[16]
Diseño de almacenes de
datos espaciales para la
toma de decisiones en
datos geoespacial
Mejor manejo de información en
instituciones como autoridad y
gobiernos
[17]
Análisis de datos socio-
espaciales con gráficos
interactivos
Provincia de Buenos Aires en
manejo de datos atípicos
espaciales en SIG y sistemas de
ayuda de Decisión espacial
(SADE)
[18]
SDSS para ayuda en el
sector publico
Sistema de información
SIGGESC para apoyo a SDSS en
SIG en Portugal
[19]
Modelos de simulación
demográficos y
económicos
Uso de un modelo de simulación
PRIMA con herramientas SOLAP
[20]
SDSS para el manejo
integrado de la salud y la
educación en
instalaciones a nivel
local
Utilización de SDSS en el manejo
de datos históricos para mejor
organización de servicios de
educación y salud en Brasil
[21]
Fuente. El autor.
III. ANÁLISIS, DISEÑO Y DESARROLLO DE LA BODEGA DE
DATOS ESPACIALES
En el desarrollo del proyecto se utilizaron las bases de datos
del ICFES Pruebas Saber 11 de los años 2005 a 2012 donde se
clasifico información básica de los estudiantes en base
condiciones socioeconómicas, instituciones educativas
organizadas según carácter, naturaleza, calendario, jornada,
idioma y zona, los resultados según pruebas de núcleo común
y componente flexible, así como la clasificación de los
estudiantes e instituciones a nivel nacional según el año y
semestre con su localización geográfica municipal y
departamental [22].
La información anteriormente mencionada se descargó en
formato CSV3 proporcionada por el ICFES4 con los datos
clasificados según año y semestres.
A. Organización y adaptación de la información
El primer paso para poder diseñar la bodega de datos
espaciales consistió en la organización de la información
recibida utilizando el Sistema Gestor de Bases de Datos
POSTGRESQL [23] en su versión 8.4 y su componente
3 Valores separados por comas. 4 Instituto colombiano para la evaluación de la educación.
espacial POSTGIS [24] en su versión 1.5, teniendo estas
herramientas instaladas con su respectiva plantilla espacial se
crea la base de datos y tablas necesarias por año y semestre
para con el comando Copy de POSTGRESQL realizar la
importación de la información en la base de datos, el comando
utilizado se muestra en la figura 1.
Fig. 1. Carga de datos de CSV a PostgreSQL
Después de tener la información cargada en el SGBD5 se
procedió a organizar y seleccionar los datos con el uso de
consultas SQL6 con declaración DDL7 y DML8, esta
organización se definió según el diccionario de datos versión
1.6 ICFES [25] para relacionar las llaves primarias y llaves
foráneas y así obtener el conjunto de tablas, índices y vistas
necesarias para realizar el modelamiento completo de la base
de datos, en la figura 2 se muestra el compilado de tablas
obtenido.
Fig. 2. Objetos base de datos db_saber en PostgreSQL 8.4
Al tener la información organizada y completa se procedió a
realizar la optimización de datos, revisión de campos erróneos
y organización de referencias.
B. Extracción, Transformación y Carga
Para iniciar el proceso de creación del almacén de datos
espaciales se procedió a indagar que factores serian
importantes para realizar el análisis espacial y que permitieran
obtener elementos para poder realizar la toma de decisiones. A
partir de esto se procedió a consultar el documento de
“Informe histórico prueba saber 11” [22] donde se obtuvieron
criterios para el análisis, la tabla 3 muestra estos factores:
5 Sistema gestor de bases de datos. 6 Lenguaje de consulta estructurado. 7 Lenguaje de definición de datos. 8 Lenguaje de manipulación de datos.
4
TABLA III
FACTORES DE ANÁLISIS ICFES PRUEBAS SABER 11 Resultados Nacionales
Población Evaluada --Total de evaluados por periodo según tipo
de inscripción.
--Características de la población evaluada:
Sexo y Edad “menores de 16, menores de
18, entre 17 y 18, entre 18 y <21 y mayores
a 21”.
--Número de estudiantes y establecimientos
educativos evaluados según zona y sector.
--Número de estudiantes y establecimientos
educativos de jornada diurna evaluados.
--Puntajes promedio en núcleo común y en
áreas académicas, según sector y zona.
--Niveles de dominio del inglés según
sector y zona.
--Puntajes en núcleo común y áreas
académicas según género.
--Niveles de dominio del inglés según
género
Establecimientos educativos --Por grupos de clasificación
socioeconómica, según sector y zona
--Por categorías de desempeño en el
examen, según sector y zona
Resultados Territoriales Población Evaluada --Población total evaluada en A-2008 y B-
2009 por tipo de inscripción
--Número de estudiantes y establecimientos
educativos (sedes-jornada), evaluados en
los últimos cinco periodos de calendarios A
y B
Resultados de los estudiantes --Número de estudiantes evaluados de
municipios certificados y no certificados
--Municipios certificados y no certificados
---Media en núcleo común y en las áreas en
los últimos cinco periodos del calendario A
---Media en núcleo común y en las áreas
académicas en los últimos cinco períodos
del calendario B
---Desempeño en inglés. Calendarios A-
2008 y B-2009 Resultados de los
establecimientos educativos --Municipios certificados y no certificados
---Por categorías de desempeño en el
examen por años
---Por grupos de clasificación
socioeconómica (CSE) Fuente. El autor.
Los factores mencionados anteriormente son los elementos
de análisis para la realización del cubo espacial.
A partir de esto se procedió a la realización de la bodega de
datos espaciales con la herramienta libre GEOKETTLE [26], la
cual permite realizar la extracción, transformación y carga de
datos, pero con el adicional que permite utilizar datos de tipo
espacial, también permite extraer datos de 35 tipos de bases de
datos, formato de archivo como XLS, XML, Archivos planos,
entre otros. Además permite realizar transformaciones de
datos con herramientas como mapeo, selección, filtro, unión,
duplicación, análisis espacial, vistas de cartografía y otras,
finalmente permite la salida de estos resultados para
conformar la bodega de datos.
Utilizando la aplicación GEOKETTLE se visualiza el
componente espacial obtenido, en este caso se utilizaron los
polígonos y puntos de los municipios de Colombia, la
visualización de los mismos se observa en la figura 3 con los
municipios de Colombia en Polígono y la figura 4 de los sitios
en puntos.
Fig. 3. Mapa de Colombia - Polígonos
Fig. 4. Sitios de Colombia - Puntos
El diseño de la bodega de datos espaciales se rige según los
factores que se quiere tener respuesta, a partir de ello se
modelo la bodega espacial en el sistema GEOKETTLE, para
ello se utilizaron herramientas de lectura y extracción de
campos como se ve en la figura 5 de forma específica y en la
figura 6 de forma general.
Fig. 5. Carga en Geokettle de forma específica
5
Fig. 6. Diseño de bodega de datos espacial
Después de tener el diseño de la bodega de datos se ejecuta
el procesamiento para almacenar en el sistema gestor de bases
de datos, el resultado obtenido es el insumo para realizar el
cubo de datos espacial, en la figura 7 se muestra el diseño de
la bodega de datos espacial en la que se utilizó el modelo
estrella para mejorar rendimiento tanto en la consulta SQL y
MDX9 como en el procesamiento de la posterior minería
espacial y visualización geográfica.
Fig. 7. Bodega de Datos Espacial
IV. DISEÑO DEL ESQUEMA E IMPLEMENTACIÓN DEL CUBO DE
DATOS ESPACIAL
A. Identificación de dimensiones y medidas
En la identificación de las dimensiones y medidas se
relacionaron los factores de los que se deseó obtener respuesta
para crear el cubo de datos espacial y de esta forma obtener el
soporte de decisiones.
Las dimensiones diseñadas y obtenidas en este ejercicio se
diseñaron primero en forma gráfica, para luego utilizar la
herramienta SCHEMA WORKBECH [27].
9 Expresiones Multidimensionales.
B. Diseño del esquema del cubo espacial
En el diseño del cubo espacial se utilizó la herramienta
SCHEMA WORKBENCH la cual permitió desarrollar el
esquema espacial adaptando las dimensiones necesarias y las
medidas que proporcionarían los resultados de los factores a
evaluar, en la figura 8 se observa la forma en que se construyó
el cubo de datos espaciales y la figura 9 el proceso más
detallado.
Fig. 8. Diseño del cubo de datos espaciales
Fig. 9. Esquema del cubo más detallado
El modelado del cubo espacial de relaciones OLAP
(Procesamiento analítico en línea) tomo la tabla municipios
para la utilización de los campos geométricos y su conexión
con las tablas periodos, estudiantes, instituciones y exámenes
para obtener las medidas de temáticas y resultados.
Además la aplicación de modelado de esquemas válida la
información y forma del cubo para evitar romper restricciones
en la bodega de datos y el mal manejo de la información
ocasionando datos erróneos.
6
C. Importación y adaptación del esquema del cubo espacial
En el momento de guardar el esquema en formato XML10 se
obtiene en detalle la organización del cubo de análisis de
información espacial como se ve en la figura 10.
Fig. 10. Esquema XML del cubo de datos espacial
El archivo XML es el responsable de llamar los datos de la
bodega de datos para que se relacionen con las dimensiones y
medidas, este esquema requiere un sistema servidor donde
pueda realizar las operaciones de consulta de datos utilizando
el lenguaje MDX, el cual es la forma de realizar las sentencias
de selección y manipulación de los datos y el procesamiento
de la información para su manejo espacial y alfanumérico.
Para el procesamiento de información espacial y de la
bodega de datos se utilizó la aplicación GEOMONDRIAN [28]
para de esta manera obtener reportes de datos en tablas y
estadísticos en forma de gráficos, en la figura 11 se puede ver
una vista del servidor de análisis espacial en ejecución.
Fig. 11. Ejecución de GEOMONDRIAN
De esta manera se obtuvo el cubo espacial en ejecución con
los datos proporcionados por el esquema realizado en
SCHEMA WORKBENCH.
10 Lenguaje de marcas extensible.
V. APLICACIÓN DE MINERÍA ESPACIAL
Para el cumplimiento del siguiente objetivo en el desarrollo
de la inteligencia de negocios espacial se procedió a utilizar la
herramienta libre GEOKNIME [29] la cual permite desarrollar
los modelos en entorno visual así como aplicar los diversos
algoritmos de minería de datos espaciales para obtener la
información de soporte a la toma de decisiones.
Al utilizar el dato espacial en la tabla municipios para
obtener geometrías se hace necesario el uso de un algoritmo
de datos espacial, este se decidió según el factor a evaluar para
el manejo de los resultados, la técnica elegida para aplicar la
minería espacial es la de agrupación con los algoritmos k-
Means y k-Medoids.
A. Aplicación de los algoritmos de minería espacial
El algoritmo a utilizar como se mencionó anteriormente se
basó en el factor a evaluar, un ejemplo claro es el número de
estudiantes y establecimientos educativos según zona y sector,
en este factor se tienen en cuenta la dimensión estudiantes,
establecimientos y municipios para lo cual se requeriría un
algoritmo de agrupamiento para poder obtener el valor de
número de estudiantes, además GEOKNIME permitió la
utilización de datos espaciales, en la figura 12 se muestra al
software en el proceso de minería de datos espacial en el
algoritmo k-Means y la figura 13 en el algoritmo k-Medoids.
Fig. 12. Aplicación de algoritmo k-Means
Fig. 13. Aplicación de algoritmo k-Medoids
Los resultados obtenidos se almacenan en una tabla
temporal que tiene los resultados para soportar la toma de
decisiones, para cada factor se realizó un procesamiento de
minería para el manejo de los resultados.
7
VI. IMPLEMENTACIÓN DEL VISOR DE RESULTADOS DE
INFORMACIÓN GEOGRÁFICA
El proceso de visualización de los resultados toma diversas
formas según como se quiera analizar la información, se
pueden utilizar gráficos estadísticos como barras, tortas y
esquemas lineales, también se permiten ver las tablas de datos
con los resultados, sumado a esto se adquiere una nueva forma
de representar la información que permite que los datos se
reflejen en un mapa visualizando los puntos y sitios
(polígonos) de interés de un dato dado, esta información
además permite la manipulación interactiva en el mapa.
A. Incorporación y uso del cubo espacial en el visor de
análisis de negocio SAIKU
Luego de tener los datos en el servidor de análisis espacial
GEOMONDRIAN con el respectivo cubo de información con
los elementos espaciales, se hace necesario la visualización y
manipulación por parte de herramientas software que
interpreten las consultas MDX, los datos, el cubo espacial y
representar espacialmente, por estas razones se utilizó SAIKU
[30], que permite un análisis de la información de forma Drag
and Drop arrastrando los componentes que se requieren en un
área de trabajo, los resultados de la combinación de
dimensiones y medidas son calculadas automáticamente por el
software y se muestran los valores, los gráficos y mapas
relacionados, la visualización de mapas es posible integrando
un componente llamado ChartPlus que nos muestra la
información en un mapa con la ayuda de Google Maps. La
utilización del cubo espacial se puede ver en la figura 14, en
figura 15 las dimensiones y en la figura 16 las medidas.
Fig. 14. Tabla de información analizada en SAIKU
En total el número de dimensiones es de 58 en las que se
evalúan todos los aspectos de los factores inicialmente
planteados, del mismo modo se obtuvieron 38 medidas que
permiten realizar los cálculos de inteligencia de negocios
espaciales, algunos de estos cálculos son sumatorias,
promedios, desviación estándar y contadores.
Fig. 15. Dimensiones del cubo
Fig. 16. Medidas del cubo
Algunos de los resultados mencionados se muestran en
gráficos estadísticos en la figura 17.
8
Fig. 17. Gráficos estadísticos
También se tiene el valor agregado en que la herramienta
soporta plataformas web y móvil lo que permite realizar
análisis desde cualquier sitio que tenga internet y acceso al
servidor.
B. Implementación del visor geográfico SAIKU con
CHARTPLUS y aplicación i3GEO
La visualización espacial toma un nuevo rumbo con el
manejo de datos espaciales, para el proyecto se utilizaron dos
herramientas que permiten utilizar este tipo de información,
una de ellos es CHARTPLUS [31], el cual maneja HTML5
para la carga de información mucho más rápida y con un
detalle grafico completo, la adaptación de CHARTPLUS al
visor SAIKU fue un punto clave en la visualización de la
información de negocio ya que al poder manipularse y verse
en un mapa se hace más clara la toma de decisiones, en la
figura 18 se puede apreciar el mapa de Colombia con
información tomada de SAIKU.
Fig. 18. Carga de mapa con CHARTPLUS
El software libre CHARTPLUS permite la adaptación de
una gran cantidad de plugins que facilita aún más el manejo de
la información.
Por otra parte se utilizó también el software Brasileño
i3GEO [32], que permite también la manipulación de
información espacial, a diferencia de CHARTPLUS, i3GEO
proporciona una mayor cantidad de herramientas pero su
rendimiento es mucho más bajo, aunque este rendimiento es
debido a la manipulación de datos vectoriales y el uso de gran
cantidad de información, i3GEO permite la exploración de
diversas temáticas según se requiera, en la figura 19 se
muestra la caracterización de inscritos al examen ICFES Saber
11 por departamento en Colombia para el año 2012.
Fig. 19. Uso de i3GEO
La implementación de estos visores tuvo que adecuarse a
los lineamientos del servidor de análisis espacial
GEOMONDRIAN.
C. Implementación del visor geográfico SOLAP LAYERS 2.0
Existe otro desarrollo libre llamado SOLAP LAYERS [33]
que permite la visualización de información espacial y que
agrega un componente de consultas MDX para realizar la
operación, este sistema software no es adecuado ya que no es
rápido y consume bastante memoria, en la figura 20 se puede
apreciar la interfaz gráfica de la herramienta y el modo de
operar.
Fig. 20. Interfaz SOLAPLAYERS
VII. CONCLUSIONES
El proyecto realizado logro la implementación de una
inteligencia de negocios espaciales completa, desarrollando
cada una de las fases comprendidas. La utilización del
software libre permitió que los datos fueran tratados y
manejados según los factores de decisión que se establecieron,
en resumen cada fase se completó con la utilización de una
herramienta software para tal fin, en la figura 21 se puede
apreciar un esquema grafico de las herramientas utilizadas y
del paso de cada una para completar el análisis espacial.
9
Fig. 21. Software Spatial BI [34]
Al día de hoy se han desarrollado una cantidad limitada de
proyectos relacionados con la Inteligencia de Negocios
Espaciales, esto por ser una tecnología un tanto nueva ya que
involucra nuevos tipos de datos y un alto manejo de
procesamiento y memoria, por esta razón el almacenamiento
espacial ha evolucionado incorporando nuevas formas de
obtener el tipo de dato espacial y mejorando la distribución de
las tablas e índices para la recuperación de los mismos, a su
vez los modelos y consultas espaciales incrementan el
rendimiento e integridad en la recuperación de la información
teniendo en cuenta que el procesamiento de estas consultas
exige más y mejores procedimientos. En concordancia, el
surgimiento de nuevos algoritmos para extraer la información
espacial hace que la minería de datos espacial adquiera nuevas
técnicas de transformación de los datos para que cumplan con
los requerimientos exigidos.
Como se ha denotado la aplicabilidad de la Inteligencia de
Negocios Espaciales se relaciona en un número amplio de
temáticas, permitiendo que la misma se involucre con áreas
del conocimiento que posibilita obtener resultados más
completos y visibles para la toma de decisiones para presente
y futuro. En orden de uso según las tareas involucradas, las
herramientas utilizadas para la aplicación de inteligencia de
negocios espaciales en las bases de datos del ICFES pruebas
Saber 11 fueron:
TABLA IV
SOFTWARE LIBRE UTILIZADO Tarea Software
Base de datos OLTP Espacial Postgres Postgis
Almacén de datos espacial GeoKettle
Esquema cubo de datos espacial Schema Workbench
Servidor de análisis espacial GeoMondrian
Minería de datos espacial GeoKnime
Visores gráficos de mapas I3Geo, ChartPlus, Solap Layers
Visor de resultados espacial SAIKU
Fuente. El autor.
Actualmente no existe un software que unifique estos pasos
y tengan un análisis espacial de forma directa, razón por la
cual este es un camino viable y completo para la realización de
inteligencia de negocios espaciales, además con este conjunto
de pasos desarrollados se logra obtener respuesta para los
factores de evaluación del soporte para la toma de decisiones
en las bases de datos del ICFES pruebas SABER 11.
REFERENCIAS
[1] Sugumaran, R. and J. Degroote, "Spatial Decision Support Systems -
Principles and Practices", in CRC Press, ed. New York (USA):2011,
pp. 507
[2] Flacke, J., (2012, nov). "Spatial Decision Support Systems –
Introduction to Concepts and Requirements". Web-GIS and Spatial
Data Infrastructure. pp. 30.
[3] Lamas, A., et al., (2013, jul). "Creación de un módulo espacial OLAP
para Saiku". VIII Jornadas de SIG Libre de Girona. pp. 9.
[4] Viswanathan, G. and M. Schneider, (2012, jun). "User-centric spatial
data warehousing: a survey of requirements and approaches".
International Journal of Data Mining, Modelling and Management.
[5] Siqueira, T.L., et al., (2012, jun). "The SB-index and the HSB-index:
efficient indices for spatial data warehouses". Geoinformatica. (ACM),
pp. 165-205
[6] Bimonte, S. and M.-A. Kang, (2010, sep). "Towards a Model for the
Multidimensional Analysis of Field Data ". Proceedings of the 14th east
European conference on Advances in databases and information
systems. (ACM), pp. 58-72.
[7] Vaisman, A. and E. Zimányi, (2009, nov). "A multidimensional model
representing continuous fields in spatial data warehouses".
Proceedings of the 17th ACM SIGSPATIAL International Conference
on Advances in Geographic Information Systems. (ACM), pp. 168-177.
[8] Reyes, M.X.D., (2009, jan). "Minería de datos espaciales en búsqueda
de la verdadera información". Pontificia Universidad Javeriana.
(Scielo), pp. 20.
[9] Wan, S., T.C. Lei, and T.Y. Chou, (2010, apr). "An enhanced
supervised spatial decision support system of image classification:
consideration on the ancillary information of paddy rice area".
International Journal of Geographical Information Science. (Taylor
Francis), pp. 623-642.
[10] Meyer, A.D., et al., (2013, nov). "A conceptual framework and its
software implementation to generate spatial decision support
systems for land use planning". Land Use Policy. (Science Direct),
pp. 271-282.
[11] Reynolds, K.M., et al., (2012, jan). "Spatial Decision Support for
Assessing Impacts of Atmospheric Sulfur Deposition on Aquatic
Ecosystems in the Southern Appalachian Region". Hawaii International
Conference on (IEEE Xplorer), pp. 1197 - 1206.
[12] Kaunda-Bukenya, N., et al., (2012, apr). "Spatial Decision Support
System (SDSS) for Stormwater Management and Water Quality
Assessment ". Water Quality Monitoring and Assessment. (Intech), pp.
22.
[13] Bimonte, S., et al., (2012, jun). "Definition and analysis of new
agricultural farm energetic indicators using spatial OLAP".
Computational Science and Its Applications. (Springer), pp. 373-385
[14] Santos, L., J. Coutinho-Rodrigues, and C.H. Antunes, (2011, apr). "A
web spatial decision support system for vehicle routing using Google
Maps". Decision Support Systems. (Science Direct), pp. 1-9.
[15] D.Rajesh, (2011, feb). "Application of Spatial Data Mining for
Agriculture". International Journal of Computer Applications (0975 –
8887). International Journal of Computer Applications (Springer), pp.
3.
[16] Yu, X. and K. Liu, (2009, apr). "A Spatial Decision Support System for
Large Scale Vehicle Routing". Measuring Technology and
Mechatronics Automation International Conference on (IEEE Xplorer),
pp. 444-449.
10
[17] Kyung, M.-J., J.-H. Yom, and S.-Y. Kim, (2012, sep). "Spatial data
warehouse design and spatial OLAP implementation for decision
making of geospatial data update". KSCE Journal of Civil Engineering.
(Springer), pp. 1023-1031.
[18] Humacata, L.M., (2010, jan). "Análisis exploratorio de datos socio-
espaciales mediante gráficos interactivos". Revista digital del Grupo de
Estudios sobre Geografía y Análisis Espacial con Sistemas de
Información Geográfica (gesig), pp. 135-163.
[19] Oliveira, T.H.M.d., M. Painho, and R. Henriques, (2012, nov). "A
spatial decision support system for the Portuguese public
transportation sector". Proceedings of the Third ACM SIGSPATIAL
International Workshop on GeoStreaming. (ACM), pp. 84-90
[20] Mahboubi, H., S. Bimonte, and G. Deffuant, (2011, jun). "Analyzing
demographic and economic simulation model results: a semi-automatic
spatial OLAP approach". Computational Science and Its Applications.
(Springer), pp. 17-31
[21] LIMA, R.d.S., A.N.R.d. Silva, and J.F.G. Mendes, (2003, may). "A
SDSS For integrated management of health and education facilities at
the local level: Challenges and opportunities in a developing country".
International Conference on Computers in Urban Planning and Urban
Management. (sdum), pp. 15.
[22] ICFES. (2013). "Informe de resultados históricos Saber 11". [online].
Available from: http://www2.icfes.gov.co/resultados/saber-11-
resultados.
[23] Postgresql. (2013). "Postgresql". [online]. Available from:
http://www.postgresql.org.es/.
[24] Postgis. (2013). "Postgis". [online]. Available from: http://postgis.net/.
[25] ICFES. (2014). "Repositorio FTP ICFES". [online]. Available from:
ftp://ftp.icfes.gov.co.
[26] Spatialytics.org. (2008). "Geokettle". [online]. Available from:
http://www.spatialytics.org/projects/geokettle/.
[27] Mondrian. (2013). "Schema Workbench". [online]. Available from:
http://sourceforge.net/projects/mondrian/files/schema%20workbench/.
[28] Spatialytics.org. (2013). "Geomondrian". [online]. Available from:
http://www.spatialytics.org/projects/geomondrian/.
[29] AG. (2013). "Geoknime". [online]. Available from:
http://www.knime.org.
[30] BI, M., (2013). "Saiku". [online]. Available from:
http://meteorite.bi/saiku.
[31] it4biz. (2014). "Saiku ChartPlus". [online]. Available from:
it4biz.github.io/SaikuChartPlus/.
[32] Software, B.P., (2013). "i3GEO". [online]. Available from:
http://www.gvsig.org/web/projects/i3Geo/.
[33] tbadard. (2010). "Solaplayers". [online]. Available from:
http://sourceforge.net/projects/spatialytics/.
[34] Badard, T., (2010). "Open source Geospatial Business Intelligence in
action with GeoMondrian and SOLAPLayers!". [online]. Available
from: http://www.slideshare.net/tbadard/open-source-geospatial-
business-intelligence-geobi-definition-architectures-projects-
challenges-and-outlooks-8810753.
CHRISTIAM ALEJANDRO NIÑO PEÑA
-AUTOR Ingeniero de Sistemas,
Especialista en Gerencia de Sistemas
Informáticos, Especialista en Bases de Datos,
Candidato a Magister en Tecnología
Informática de la Universidad Pedagógica y
Tecnológica de Colombia. Ingeniero de
Sistemas DBA en la Gobernación de Boyacá. Áreas de
Trabajo: Bases de Datos, Ingeniería del Software, Sistemas de
Información Geográfica, Bases de datos espaciales,
Inteligencia de Negocios Espaciales, Programación Web.
GUSTAVO CACERES CASTELLANOS –
DIRECTOR. Magister en Ciencias de la
Información y las Comunicaciones,
Especialista en Diseño de Sistemas de
Auditoría, Cursos de Doctorado en
Informática e Inteligencia Artificial,
Ingeniero de Sistemas. Docente Tiempo
Completo de la Universidad Pedagógica y Tecnológica de
Colombia. Áreas de Trabajo: Bases de Datos, Lenguajes
Formales, Matemáticas Discretas, Sistemas de Información
Geográfica, Bases de datos espaciales, Inteligencia de
Negocios.