Propuesta Metodológica Para La Publicación De Recursos...
Transcript of Propuesta Metodológica Para La Publicación De Recursos...
PROPUESTA METODOLÓGICA PARA LA PUBLICACIÓN DE RECURSOS
DIGITALES EDUCATIVOS BASADO EN LINKED OPEN DATA. CASO DE ESTUDIO:
UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS
Diego Mauricio Cataño Peralta
UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS
FACULTAD DE INGENIERÍA
PROYECTO CURRICULAR DE INGENIERÍA DE SISTEMAS
BOGOTÁ, D.C
2019
II
PROPUESTA METODOLÓGICA PARA LA PUBLICACIÓN DE RECURSOS
DIGITALES EDUCATIVOS BASADO EN LINKED OPEN DATA. CASO DE ESTUDIO:
UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS
Presentado por:
Diego Mauricio Cataño Peralta
Cód. 2001020036
Proyecto de grado para optar por el título de Ingeniero de Sistemas
Modalidad Monografía
Director:
Ing. MSc. Jhon Francined Herrera Cubides
Profesor Facultad de Ingeniería
UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS
FACULTAD DE INGENIERÍA
PROYECTO CURRICULAR DE INGENIERÍA DE SISTEMAS
BOGOTÁ, D.C
2019
III
Tabla de Contenido
INTRODUCCIÓN .................................................................................................................. 11
CAPÍTULO I DESCRIPCIÓN DE LA INVESTIGACIÓN .............................................. 13
PLANTEAMIENTO DEL PROBLEMA ................................................................... 14
FORMULACIÓN DEL PROBLEMA ....................................................................... 15
SISTEMATIZACIÓN DEL PROBLEMA ................................................................. 15
JUSTIFICACIÓN ....................................................................................................... 17
HIPÓTESIS ................................................................................................................ 18
OBJETIVOS ............................................................................................................... 19
1.6.1. Objetivo General .................................................................................................................. 19
1.6.2. Objetivos específicos .......................................................................................................... 19
ALCANCE Y LIMITACIONES ................................................................................ 19
CAPITULO II FUNDAMENTACIÓN Y ESTADO DEL ARTE...................................... 20
MARCO TEÓRICO ................................................................................................... 20
2.1.1. Web semántica ..................................................................................................................... 20
2.1.2. Linked Data ............................................................................................................................ 22
2.1.3. Open Data ............................................................................................................................... 24
2.1.4. Clasificación de los datos abiertos ................................................................................ 25
2.1.5. Linked Open Data ................................................................................................................ 26
2.1.6. Recursos educativos abiertos ......................................................................................... 26
IV
2.1.7. Clasificación de los Recursos Educativos Digitales Abiertos .............................. 27
2.1.8. Metadatos y perfil de aplicación .................................................................................... 31
MARCO CONCEPTUAL .......................................................................................... 38
2.2.1. Semántica ............................................................................................................................... 38
2.2.2. Ontología ................................................................................................................................. 39
2.2.3. Taxonomía .............................................................................................................................. 39
2.2.4. Repositorio de recursos educativos ............................................................................. 39
CAPÍTULO III MARCO METODOLÓGICO ................................................................... 40
METODOLOGÍA DEL PROYECTO ........................................................................ 41
CAPITULO IV DESARROLLO DE LA INVESTIGACIÓN ........................................... 42
LEVANTAMIENTO DE INFORMACIÓN Y CONTEXTUALIZACIÓN DEL
OBJETO DE INVESTIGACIÓN ............................................................................................. 42
4.1.1. Revisión Bibliográfica ........................................................................................................ 43
4.1.2. Contextualización del objeto de investigación ......................................................... 48
COMPARACIÓN DE PROPUESTAS METODOLÓGICAS DE PUBLICACIÓN
DE DATOS ............................................................................................................................... 51
CAPITULO V PLANTEAMIENTO DE LA PROPUESTA METODOLOGICA DE
PUBLICACIÓN DE DATOS VINCULADOS ......................................................................... 56
PROPUESTA METODOLÓGICA PLANTEADA ................................................... 56
V
DESCRIPCIÓN DE CADA UNA DE LAS ETAPAS DE LA PROPUESTA
METODOLÓGICA PLANTEADA .......................................................................................... 57
5.2.1. Etapa 1: Determinar ........................................................................................................... 58
5.2.2. Etapa 2: Limpiar ................................................................................................................... 58
5.2.3. Etapa 3: Modelar .................................................................................................................. 60
5.2.4. Etapa 4: Generar .................................................................................................................. 61
5.2.5. Etapa 5: Enlazar ................................................................................................................... 63
5.2.6. Etapa 6: Publicar .................................................................................................................. 64
DESARROLLO DE ETAPAS DE METODOLOGÍA .............................................. 64
5.3.1. Desarrollo etapa 1: determinar ...................................................................................... 65
5.3.2. Desarrollo etapa 3: limpiar .............................................................................................. 67
5.3.3. Desarrollo etapa 3: modelar ............................................................................................ 68
5.3.4. Desarrollo etapa 4: generar ............................................................................................. 73
5.3.5. Desarrollo etapa 5: enlazar .............................................................................................. 76
5.3.6. Desarrollo etapa 6: publicar ............................................................................................ 80
CAPITULO VI RESULTADOS OBTENIDOS .................................................................. 84
IMPLEMENTACION DE METODOLOGÍA EN CASO DE ESTUDIO ................. 85
6.1.1. Caso de estudio etapa 1: determinar ........................................................................... 85
6.1.2. Caso de estudio etapa 2: limpiar.................................................................................... 87
6.1.3. Caso de estudio etapa 3: modelar ................................................................................. 87
VI
6.1.4. Caso de estudio etapa 4: generar .................................................................................. 87
6.1.5. Caso de estudio etapa 5: enlazar ................................................................................... 95
6.1.6. Caso de estudio etapa 6: Publicar ................................................................................. 97
DISCUSION DE RESULTADOS .............................................................................. 98
CAPITULO VII CONCLUSIONES ..................................................................................... 99
BIBLIOGRAFÍA .................................................................................................................. 101
VII
Lista de figuras
Figura 1: Composición conceptual de un Objeto de aprendizaje. Berlanga, 2005 .................. 17
Figura 2: Las capas de la Web Semántica. W3C, 2001 ........................................................... 21
Figura 3: Ejemplo Linked Data. W3C, 2011 ........................................................................... 23
Figura 4: Nube de Linked Data. W3C, 2011 ........................................................................... 23
Figura 5: Mapa conceptual Recurso Educativo Digital. Elaborado por el autor ..................... 31
Figura 6: Organización categorías LOM. Rob, 2013 ............................................................... 35
Figura 7: Esquema de los estándares LOM, Dublín Core y perfiles de aplicación. Rob, 2013 37
Figura 8: Fases de la metodología del proyecto, Elaborado por el autor ................................. 41
Figura 9: Artículos recuperados durante la búsqueda bibliográfica. Elaborado por autor ....... 45
Figura 10: Framework general para la publicación de recursos educativos en Linked data.
Piedra, 2014 .................................................................................................................................. 51
Figura 11: Tareas para generar el proceso de datos enlazados. Rodulovic, 2018 .................... 53
Figura 12: Tareas del proceso de publicación de datos enlazados. Radulovic, 2015 .............. 53
Figura 13: Vista de componentes de un repositorio de recursos educativos. Konstantinou,
2014............................................................................................................................................... 55
Figura 14: Etapas propuestas para la metodología de publicación de Recursos Educativos.
Elaborado por autor....................................................................................................................... 56
Figura 15: Tipos de recursos educativos digitales. Elaborado por autor ................................. 65
Figura 16: Relación de recursos educativos con metadatos. Elaborado por autor ................... 70
Figura 17: Modelo de datos en protegé. Elaborado por autor .................................................. 70
Figura 18: Representación de estructura de triplete del dataset. Elaborado por autor ............. 74
Figura 20: Pantalla validador RDF. Tomado por autor ............................................................ 74
VIII
Figura 21: Pantalla conversión RDF a Turtle. Tomado por autor ............................................ 75
Figura 22: Pantalla Fuseki consulta. Tomado por autor .......................................................... 76
Figura 23: Pantalla configuración servicio de reconciliación datos en OpenRefine. Tomado
por autor ........................................................................................................................................ 77
Figura 24: Pantalla reconciliación datos OpenRefine por campo. Tomado por autor ............. 77
Figura 25: Pantalla resultado reconciliación campo en OpenRefine. Tomado por autor ........ 78
Figura 26: Pantalla salida url recurso. Tomado por autor ........................................................ 79
Figura 27: Pantalla consulta sparql dataset vinculado. Tomado por autor............................... 80
Figura 28: Pantalla codificador sparql protocolo http. Tomado por autor ............................... 81
Figura 29:Pantalla interfaz Postman. Tomado por autor.......................................................... 82
Figura 30: Pantalla parámetro GET Postman, Tomado por autor ............................................ 82
Figura 31: Pantalla parámetro KEY y VALUE Postman. Tomado por autor ......................... 83
Figura 32: Pantalla resultado consumo Postman. Tomado por autor ....................................... 83
Figura 33: Taxonomía del repositorio. Tomado por autor ....................................................... 85
Figura 34: Pantalla estructura repositorio. Tomado por autor ................................................. 88
Figura 35: Pantalla acceso administrador DSpace. Tomado por autor .................................... 88
Figura 36: Pantalla acceso registro metadatos DSpace. Tomado por autor ............................. 89
Figura 37: Pantalla esquema de metadatos DSpace. Tomado por autor .................................. 89
Figura 38: Pantalla metadatos DSpace. Tomado por autor ...................................................... 89
Figura 39: Pantalla adición de metadatos DSpace. Tomado por autor .................................... 90
Figura 40: Pantalla archivo configuración de formulario DSpace. Tomado por autor ............ 90
Figura 41: Pantalla creación de campos formulario DSpace. Tomado por autor .................... 91
Figura 42: Pantalla archivo mapeo DSpace. Tomado por autor .............................................. 91
IX
Figura 43:Pantalla ejemplo creación de mapeos en DSpace. Tomado por autor ..................... 91
Figura 44: Pantalla inicio de carga de recurso DSpace. Tomado por autor ............................. 92
Figura 45: Pantalla selección colección para carga de recursos en DSpace. Tomado por autor
....................................................................................................................................................... 92
Figura 46: Pantalla ingreso de metadatos del recurso en DSpace. Tomado por autor ............. 93
Figura 47: Pantalla carga de metadatos del recurso satisfactoria en DSpace. Tomado por autor
....................................................................................................................................................... 93
Figura 48: Pantalla verificación de ingreso de información del recurso en DSpace. Tomado
por autor ........................................................................................................................................ 93
Figura 49: Pantalla carga de información del recurso completa en DSpace. Tomado por autor
....................................................................................................................................................... 94
Figura 50: Pantalla ejecución comando RDFIZER. Tomado por autor ................................... 94
Figura 51: Pantalla visualización de grafo en Fuseki. Tomado por autor ................................ 95
Figura 52; Pantalla edición mapeo en archivo metadata-rdf-mapping.ttl. Tomado por autor . 96
Figura 53: Pantalla edición archivo dspace.cfg muestra item como link. Tomado por autor .. 96
Figura 54: Pantalla visualización de datos cargados desde DSpace en fuseki con datos
vinculados. Tomado por autor ...................................................................................................... 97
Figura 55: Pantalla visualización consumo de datos desde herramienta Postman. Tomado por
autor .............................................................................................................................................. 98
X
Lista de Tablas
Tabla 1: Fuentes de datos automáticos consultadas. Elaborada por el Autor .......................... 44
Tabla 2: Número de artículos encontrados Fuente Vs Año de publicación. Elaborado por autor
....................................................................................................................................................... 46
Tabla 3: Instituciones educativas, repositorio y estándar de metadatos. Elaborado por el autor
....................................................................................................................................................... 49
Tabla 4: Atributos definidos para recursos educativos. Elaborado por autor .......................... 67
Tabla 5: Relaciones entre los elementos del dominio. Elaborado por autor ............................ 69
Tabla 6: Atributos candidatos a ser relacionados con otros dataset. Elaborado por autor ....... 73
Tabla 7: Caracterización de metadato. Elaborado por autor .................................................... 86
11
INTRODUCCIÓN
La gran cantidad de recursos digitales disponibles en Internet, podría aprovecharse de una
manera óptima si la ubicuidad se vuelve una de sus principales características, es decir, si se
procede con el enfoque de que los sistemas se intercomuniquen sin importar su campo de
aplicación y con el objetivo de que las tecnologías sean transparentes para los usuarios.
Hacia esto apunta lo que se conoce como la Web Semántica, la cual consiste en adicionar
metadatos a los recursos: esos datos adicionales que describen el contenido, el significado y la
relación de los datos. Los metadatos se deben proporcionar de manera formal, para dejar abierta
la posibilidad de que gestores de búsqueda los localicen, los reúsen y evalúen. El objetivo del uso
de los metadatos es enriquecer los resultados de las búsquedas realizadas, ampliando la
interoperabilidad entre los sistemas de información mediante una infraestructura común y de
cooperación, que permita compartir y reutilizar los datos a través de aplicaciones, empresas y
comunidades. A pesar de estas iniciativas tan amplias, actualmente sucede que cada sector trabaja
en el desarrollo de sus propios estándares de metadatos para la interoperabilidad de sus sistemas.
Este es el caso, por una parte, del sector bibliotecario, que promueve el uso de publicaciones
electrónicas y desarrollo sus bibliotecas digitales, mientras, por otra parte, el sector educativo
desarrolla Objetos de Aprendizaje y promueve la construcción de bancos de recursos; ambos con
el fin de facilitar a sus usuarios el acceso, uso y reutilización de los recursos disponibles.
El concepto de Objeto de Aprendizaje (Wiley, 2000) cuya estructura de información externa es
denominada metadato y describe los aspectos técnicos y educativos del objeto, aplicado a
materiales digitales creados como pequeñas piezas de contenido o de información con la finalidad
de maximizar el número de situaciones educativas en las que el recurso puede ser utilizado; ha
tomado auge, precisamente, bajo el enfoque de compartir recursos reutilizables en el ámbito
12
educativo. Un componente importante para la reutilización de un Objeto es que esté
adecuadamente descrito a través de sus correspondientes metadatos (Sicilia et al., 2003). Si los
metadatos utilizados se ciñen a los estándares propuestos, y se basan en tecnologías abiertas,
también las reutilizaciones de éstos toman un papel de gran valor para compartir información entre
bancos de Objetos. La consistencia semántica en la descripción de los recursos y la normalización
de los metadatos que cada elemento contenga, también son factores que posibilitan la reutilización
a través de sistemas de información.
Al clasificar y agrupar recursos digitales de información se obtienen colecciones digitales.
Internet cuenta con una gran variedad de ellas. Si estas colecciones están constituidas por Objetos
de Aprendizaje o de información y se organizan con un sistema descriptivo a través de metadatos,
es decir, si obedecen a un sistema de catalogación, además de proporcionar algunas estrategias y
mecanismos para la búsqueda y uso de la información (servicios): entonces, estamos ante la
presencia de bancos de Objetos. Los bancos de Objetos basan su acervo en Objetos de aprendizaje
e informativos, pero trascienden el concepto de recurso digital educativo, refiriéndose a todo tipo
de Objeto que provea información, como textos, imágenes, videos y animaciones, entre otros.
Con este proyecto se busca presentar información relevante sobre la Web Semántica,
específicamente sobre el proceso a realizar para llevar a cabo la estructuración de la información
que apoya la publicación de los recursos educativos digitales, entendida esta como los metadatos
que soportan el enriquecimiento de los recursos publicados. Por ende, se plantea el estudio de
estrategias de publicación de recursos, con el fin de plantear un conjunto de buenas prácticas y
recomendaciones para la adecuada estructuración y publicación de recursos educativos, basado en
tecnologías de Web Semántica, cuyo caso de estudio se plantea la Universidad Distrital Francisco
José de Caldas.
13
CAPÍTULO I DESCRIPCIÓN DE LA INVESTIGACIÓN
Las empresas e instituciones se han venido dando cuenta del potencial de los datos abiertos
vinculados (LOD) y comienzan a publicar sus propios datos como LOD. Sin embargo, publicar
LOD sigue siendo una tarea desafiante. Una de las razones principales es la falta de herramientas
fáciles de usar que respalden adecuadamente todo el proceso de publicación de LOD. El proceso
generalmente consiste en la extracción de datos de origen, la transformación a RDF, la alineación
con los vocabularios utilizados comúnmente, la vinculación con otros conjuntos de datos, la
computación de metadatos, la publicación en la web como un volcado, la carga en un almacén
triplico y el registro de la base de datos en un catálogo de datos (Klímek et al., 2017).
En la actualidad existen muchos datos publicados como datos vinculados (abiertos) (LOD /
LD). Al mismo tiempo, también hay una multitud de herramientas para la publicación de LD. Sin
embargo, los consumidores potenciales de LD todavía tienen dificultades para descubrir, acceder
y explotar LD. Esto se debe a que, en comparación con el consumo de formatos de datos
tradicionales, como los archivos XML y CSV, existe una clara falta de herramientas para el
consumo de LD. Los promotores de LD utilizan el conocido esquema de implementación de datos
abiertos de 5 estrellas para sugerir que el consumo de LD es una mejor experiencia una vez que el
consumidor conoce RDF y las tecnologías relacionadas. Esta sugerencia, sin embargo, se queda
corta cuando los consumidores buscan un soporte de herramientas apropiado para el consumo de
LD (Zaveri et al., 2016).
En este proceso de publicación y enriquecimiento, las personas encargadas de dicho proceso
han planteado como dificultades la falta de conocimiento requerido para llevar a cabo esta labor,
además de identificarse diferentes enfoques o estrategias para realizar el enriquecimiento de
publicación de recursos digitales. Aunado a esto, aunque en el mercado existen diferentes
14
herramientas que podrían apoyar el proceso, dichas herramientas ofrecen una curva de aprendizaje
bastante ambiciosa.
Por otro lado, con las diferentes políticas que se han venido gestando desde el Gobierno
Nacional acerca de incursionar en los datos abiertos, por parte de las instituciones públicas, aunado
a la incursión de la Universidad Distrital Francisco José de Caldas en el campo de la formación
virtual, se hace evidente la necesidad de gestar una metodología que le permita a la Universidad
poder llevar a cabo el proceso de enriquecimiento y publicación de los recursos educativos
digitales que ha venido empezando a producir.
Por último, es importante considerar que existen diferentes tipos de recursos educativos, que
varían desde recursos textuales hasta objetos de aprendizaje y aplicaciones para la educación. Para
llevar a cabo la publicación de estos recursos es necesario definir de forma adecuada, la metadata
que acompañará estos tipos de recursos. Lo anterior plantea la problemática de que no todos los
tipos de recursos digitales educativos consideran los mismos tipos de metadatos en su proceso de
publicación.
PLANTEAMIENTO DEL PROBLEMA
El contexto descrito anteriormente, y dada la emergente aparición de recomendaciones y
metodologías para la publicación de recursos digitales, algunas de ellas no tan claras; se plantea la
necesidad establecer un conjunto de recomendaciones y estrategias para llevar a cabo el
enriquecimiento y publicación de los recursos educativos digitales, producidos por la Universidad
Distrital Francisco José de Caldas. En consecuencia, este planteamiento hace necesario llevar a
cabo un proceso de revisión de las diferentes metodologías existentes, con el fin de extraer y
plantear recomendaciones más favorables para llevar a cabo la publicación de recursos digitales
15
educativos, a través de una metodología aplicada a la Universidad Distrital Francisco José de
Caldas.
FORMULACIÓN DEL PROBLEMA
¿Cómo establecer un conjunto de recomendaciones y pasos, para llevar a cabo el
enriquecimiento y publicación de Recursos Educativos Digitales en la Universidad Distrital
Francisco José de Caldas?
SISTEMATIZACIÓN DEL PROBLEMA
● ¿Cuál es la relación entre Linked Data y la Web Semántica?
La Web Semántica se compone de datos enlazados; es decir, la Web Semántica es el
conjunto, mientras Linked Data es las partes. Tim Berners-Lee, inventor de la Web y la
persona le atribuye haber acuñado los términos Web Semántica y Linked Data frecuencia
se ha descrito como Linked Data "la Web Semántica se haga bien".
● ¿Cuál es la relación entre Linked Data y RDFa?
RDFa es una de las varias formas de escribir, o serializar datos RDF. En concreto, RDFa
permite que los datos RDF para ser incorporados en los documentos HTML, lo que hace
que sea muy útil para la publicación de RDF en contextos donde la publicación Web se
limita a HTML, por ejemplo, cuando un sistema de gestión de contenido antiguo evita
publicación en otros formatos. Simplemente como otra serialización de RDF, RDFa es
ideal para la publicación de datos enlazados.
● ¿Necesita Linked Open Data tener todos los datos abiertos?
En una palabra, no, y es probable que no sea así. La etiqueta "Linked Open Data" es
ampliamente utilizado, pero a menudo para referirse a los datos vinculados en general, en
lugar de los datos vinculados de manera explícita que se publica bajo una licencia
16
abierta. No todos los datos vinculados estarán abiertos, y no todos los datos abiertos serán
vinculados.
● ¿Los cuatro principios de diseño en los que se basa el linked data son?
▪ Utilizar URIs (Uniform Resource Identifier) como nombres únicos para los recursos
▪ Utilizar el protocolo HTTP para nombrar y resolver la ubicación de los datos
identificados mediante esas URIs. Si las entidades están identificadas mediante URI’s
pueden buscarse desreferenciando la URI utilizando el protocolo HTTP.
▪ Representar los datos en RDF y utilizar SPARQL como lenguaje de consulta de dichos
datos. Mientras que HTML proporciona un medio para estructurar y enlazar documentos
en la Web, RDF proporciona un modelo de datos genérico, con el que estructurar y
enlazar datos que describen cosas en el mundo en forma de triples sujeto-predicado-
objeto.
▪ Incluir enlaces a otras URIs para permitir la localización de más datos enlazados,
aprovechando que los elementos de un triple RDF pueden ser una URI o una cadena de
literales.
● ¿Cuál es la relación entre los metadatos y los objetos de aprendizaje?
Un objeto de aprendizaje es cualquier recurso que puede ser utilizado para facilitar la
enseñanza y el aprendizaje y que ha sido descrito utilizando metadatos. (Ver figura 1). De
esta manera, nace una relación intrínseca entre un objeto educativo y sus metadatos para
formar, en conjunto, un OA. Es decir, dentro de un entorno de aprendizaje en donde
intervienen las tecnologías, si un recurso digital no tiene metadatos no puede considerarse
OA ya que, en la práctica, los sistemas no pueden interpretarlo (o reconocerlo) y hacerlo
realmente reutilizable. (Berlanga, 2005).
17
Figura 1: Composición conceptual de un Objeto de aprendizaje. Berlanga, 2005
JUSTIFICACIÓN
Actualmente existe un gran interés en las aplicaciones educativas que utilizan internet como
plataforma de distribución (e-learning). como su uso se generaliza para mejorar la eficiencia, se
trata de sistematizar los procesos y especialmente las especificaciones y los estándares educativos
tratan de regular cómo se realizan los procesos de enseñanza de modo que la información del
sistema y los contenidos puedan ser reutilizables, interoperables e intercambiables entre distintas
plataformas de enseñanza. (Fernández, 2006)
El Ministerio de Educación Nacional (MEN) en el documento “Recursos Educativos Digitales
Abiertos Colombia” plantea dentro de los retos y expectativas de la Estrategia Nacional de
Recursos Educativos Digitales Abiertos entre otros:
● Fortalecer el intercambio de experiencias, participación y colaboración entre las
instituciones, docentes y estudiantes en torno a la producción, gestión y uso de los Recursos
Educativos Digitales Abiertos en las actividades y procesos de formación.
18
● Generar procesos que se relacionen con la investigación, desarrollo, innovación y
renovación educativa que respondan a los retos propios del sector de la educación.
● Consolidar una Oferta Nacional de Recursos Educativos Digitales Abiertos de Alta
Calidad, pertinente, arbitrada y certificada que contribuya al fortalecimiento de los
procesos y prácticas educativas.
● Promover el desarrollo de iniciativas, proyectos y procesos de toda índole, relacionados
con la producción, gestión y uso de Recursos Educativos Digitales Abiertos por parte de
las Instituciones de Educación Superior en el ámbito nacional.
Dicho lo anterior, este proyecto contribuye a la estrategia planteada por el MEN, en los cuatro
puntos anteriores a partir de proponer prácticas que conlleven a la mejor utilización de los recursos
y promover la innovación y la investigación.
HIPÓTESIS
El objetivo del uso de metadatos es mejorar internet ampliando la interoperabilidad entre los
sistemas de información. Actualmente cada sector trabaja en el desarrollo de sus propios
estándares de metadatos para la interoperabilidad de sus sistemas. El sector educativo desarrolla
objetos de aprendizaje y promueve la construcción de bancos; ambos con el fin de facilitar a los
usuarios el acceso, uso y reutilización de los recursos disponibles. Publicar en LOD es una tarea
desafiante por la falta de herramientas fáciles de usar que respalden adecuadamente todo el proceso
de publicación. A partir de este panorama se pretende dar respuesta a la siguiente hipótesis.
Ho. La estructuración de un conjunto de recomendaciones y buenas prácticas para el
enriquecimiento y publicación de recursos digitales educativos, basados en tecnologías de Web
19
Semántica, permitirá colaborar y mejorar el proceso de publicación de recursos digitales dentro
del entorno de la Universidad Distrital Francisco José de Caldas.
OBJETIVOS
1.6.1. Objetivo General
Proponer un conjunto pasos y recomendaciones para llevar a cabo el enriquecimiento y
publicación de Recursos Educativos Digitales en la Universidad Distrital Francisco José de Caldas
1.6.2. Objetivos específicos
● Documentar y analizar el estado actual de las metodologías existentes para la publicación
de datos en Linked Open Data.
● Identificar los diferentes componentes requeridos (recursos digitales educativos,
procesos, metadatos, estándares, etc.) para llevar a cabo la publicación de datos en LOD.
● Diseñar un conjunto de recomendaciones para llevar a cabo el enriquecimiento y
publicación de Recursos Digitales Educativos, basado en tecnologías de Web Semántica.
● Plantear un caso de prueba para verificar la aplicación de las recomendaciones
propuestas en esta investigación.
ALCANCE Y LIMITACIONES
Este trabajo no aborta como tal el desarrollo y construcción de Recursos Educativos Digitales
desde un marco pedagógico, por lo tanto, se asume que los recursos ya han sido desarrollados y
plenamente construidos por las personas idóneas en el tema, como lo son los docentes,
investigadores o especialistas y deben ser proporcionados por una unidad o dependencia a cargo
de dicho proceso.
20
Los recursos no serán publicados en el ambiente de producción o repositorio de la universidad,
únicamente se documenta la metodología de publicación basada en ambientes de prueba instalados
en una máquina local.
La metodología y los pasos propuestos en este documento no contemplan herramientas y
recomendaciones para que sean aplicadas por personas en condiciones de discapacidad.
CAPITULO II FUNDAMENTACIÓN Y ESTADO DEL ARTE
En este capítulo se define la teoría base de la investigación y mencionamos los conceptos más
relevantes del objeto de estudio, como son los relacionados con la web semántica, con los recursos
educativos digitales abiertos, la clasificación de estos y los estándares de metadatos más conocidos
para este tipo de recursos.
MARCO TEÓRICO
2.1.1. Web semántica
La Web Semántica es una Web extendida, dotada de mayor significado en la que cualquier
usuario en Internet podrá encontrar respuestas a sus preguntas de forma más rápida y sencilla
gracias a una información mejor definida. Al dotar a la Web de más significado y, por lo tanto, de
más semántica, se pueden obtener soluciones a problemas habituales en la búsqueda de
información gracias a la utilización de una infraestructura común, mediante la cual, es posible
compartir, procesar y transferir información de forma sencilla. Esta Web extendida y basada en el
significado, se apoya en lenguajes universales que resuelven los problemas ocasionados por una
Web carente de semántica en la que, en ocasiones, el acceso a la información se convierte en una
tarea difícil y frustrante.
21
Los principios de la Web semántica se implementan en las capas de tecnologías y estándares
web. Las capas se presentan en la figura 2. Las capas Unicode y URI aseguran que usamos
conjuntos de caracteres internacionales y proporcionamos medios para identificar los objetos en la
Web Semántica. La capa XML con el espacio de nombres y las definiciones de esquema aseguran
que podamos integrar las definiciones de la Web Semántica con los otros estándares basados en
XML. Con RDF [RDF] y RDFSchema [RDFS] es posible hacer declaraciones sobre objetos con
URI y definir vocabularios a los que se puede hacer referencia mediante URI. Esta es la capa donde
podemos dar tipos a los recursos y enlaces. La capa de ontología admite la evolución de los
vocabularios, ya que puede definir las relaciones entre los diferentes conceptos. Con la capa de
firma digital para detectar alteraciones de documentos (W3C, 2001)
https://www.w3.org/2001/12/semweb-fin/w3csw
Figura 2: Las capas de la Web Semántica. W3C, 2001
22
2.1.2. Linked Data
Los Datos Enlazados es la forma que tiene la Web Semántica de vincular los distintos datos que
están distribuidos en la Web, de forma que se referencian de la misma forma que lo hacen los
enlaces de las páginas web.
La Web Semántica no se trata únicamente de la publicación de datos en la Web, sino que éstos
se pueden vincular a otros, de forma que las personas y las máquinas puedan explorar la web de
los datos, pudiendo llegar a información relacionada que se hace referencia desde otros datos
iniciales.
Sin embargo, y a diferencia de la web del hipertexto, donde los enlaces son relaciones entre
puntos de los documentos escritos en HTML, los datos enlazan cosas arbitrarias que se describen
en RDF.
Por ejemplo, suponiendo que un directorio de empresas publica información especializada
relativa a las organizaciones, como su tamaño o área profesional, es posible que desee indicar
también información sobre la localización. Ya que en la web existen sitios con grandes bases de
datos geográficas, con información pormenorizada sobre las localizaciones, el directorio de
empresas puede hacer referencia a los datos geográficos que están dispuestos por esa fuente
externa. De esta forma, los datos iniciales de la organización se enriquecen con información que
ofrecen los expertos en el ámbito geográfico. (Ver figura 3)
Linked Data permite construir la Web de los datos, una gran base de datos interconectados y
distribuidos en la Web. Los datos se vinculan y se exploran de una forma similar a la utilizada para
vincular los documentos HTML. (RDF, 2014)
23
Figura 3: Ejemplo Linked Data. W3C, 2011
El siguiente grafo representa distintos conjuntos de datos de diversos tipos, organizados
mediante colores por dominios. Estos conjuntos de datos están conectados entre sí de forma que
componen la “Nube de Linked Data” (Ver figura 4)
Figura 4: Nube de Linked Data. W3C, 2011
Los Datos Enlazados, como parte de la Web Semántica, se basan en la aplicación de ciertos
principios básicos y necesarios, que fomentarán el crecimiento de la Web, tanto a nivel de los
documentos HTML (vista clásica de la Web), como a nivel de los datos expresados en RDF (vista
de la Web Semántica).
24
Para conseguir tener los datos interconectados, como si la Web fuese una gran base de datos,
se deben respetar los siguientes pasos para conseguir tener los datos interconectados. Gracias a
esta interconexión, se permite reutilizar la información de cualquier manera esperada o inesperada,
lo que ofrece un valor añadido a la Web (RDF, 2014).
1. Utilizar URIs como nombres para objetos
2. Utilizar URIs HTTP para que las personas puedan utilizar esos nombres.
3. Cuando alguien busque un URI, proporcionar información útil utilizando normas. (RDF,
SPARQL)
4. Incluir enlaces a otros URIs para que se puedan descubrir más cosas (Datos enlazados)
2.1.3. Open Data
Hace referencia a los datos e información más allá de las instituciones gubernamentales e
incluye a otros grupos de interés relevantes, tales como empresas, industrias, ciudadanos, las ONL
(organización sin ánimo de lucro), las ONG (organización no gubernamental), y áreas relacionadas
con la ciencia y educación. Open Data se base en que los datos deben ser accesibles para todos, en
forma libre y sin restricciones (Auer et al., 2007).
Según Hernández et al., (2013), no todos los datos que se recopilan o todos los datos que se
pueden descargar de la Web son datos abiertos. Para que estos datos sean realmente abiertos, deben
estar disponibles en Internet preferiblemente para ser descargados, pero también deben poseer
algún tipo de licencia legal para poderlos utilizar, reutilizar y redistribuir, mezclándolos incluso
con otros datos, sujetos como mínimo a la “atribución” (reconocimiento de la autoría, quién lo ha
hecho).
25
2.1.4. Clasificación de los datos abiertos
Tim Berners-Lee propuso una categorización del grado de apertura de los datos basado en
estrellas, respecto a qué tan abiertos y usables son los datos que puede ofrecer una institución.
1 estrella: Los datos deben estar disponibles en la web en cualquier formato y bajo una licencia
abierta, para que sean considerados como datos abiertos.
2 estrellas: Los datos deben estar estructurados y en un formato que pueda ser interpretado o
procesado por maquinas.
3 estrellas: Igual al anterior, pero en un formato no propietario.
4 estrellas: Todo lo anterior más la utilización de estándares recomendados por w3c (RDF –
SPARQL) para identificar cosas.
5 estrellas: Todo lo anterior más el establecimiento de vínculos con los datos de otros y de esa
forma proveerles contexto.
Según la clasificación antes descrita, cualquier dato que esté disponible en la Web en cualquier
formato bajo una licencia abierta, es un dato abierto de categoría 1 estrella.
Entonces, a modo de resumen: Cualquier archivo disponible en sitios Web en formato.PDF,
DOC, ODT, .TXT, entre otros; y que esté bajo una licencia abierta será clasificado como dato
abierto de 1 estrella.
El siguiente nivel de clasificación, es 2 estrellas. Tiene que cumplir todo lo que implica estar
en 1 estrella (publicado y bajo una licencia abierta) y además los datos deben estar estructurados
26
y en un formato que pueda ser interpretado o procesado por maquinas. Por ejemplo, datos que se
encuentren en formato .XLS y organizados en una tabla se podrían clasificar como 2 estrellas.
El siguiente nivel de clasificación, 3 estrellas implican lo mismo que los niveles 1 y 2 pero el
formato debe ser no propietario. Por ejemplo, datos que se encuentren en formato .CSV podrían
clasificar como 3 estrellas. Otro ejemplo es un archivo en formato .XML.
Para que un dato abierto se considere de 4 estrellas debe cumplir con las condiciones anteriores
y además utilizar estándares recomendados por W3C como pueden ser RDF y SPARQL. Los
niveles 4 y 5 son considerados avanzados y se acercan mucho al ideal de publicación de un dato
abierto. Dado que, en la actualidad, en Uruguay se está comenzando con la apertura de datos, se
aspira en estas primeras que todos los conjuntos de datos abiertos de gobierno alcancen como
mínimo el nivel 3. No obstante, se espera ir mejorando de manera gradual y planificada para
alcanzar los niveles máximos en los casos de conjuntos de datos que amerite el esfuerzo.
2.1.5. Linked Open Data
Ofrece un modelo distribuido para la Web Semántica con el propósito de crear conocimiento
mediante la vinculación pública disponible de datos. Indica que son datos abiertos en RDF. Esto
significa que el usuario puede enlazar datos provenientes de diversas fuentes, instituciones u
organizaciones, explorar y combinar estos datos de manera libre y sin restricciones de copyright
para nuevos desarrollos web.
2.1.6. Recursos educativos abiertos
La UNESCO, en su documento A Basic Guide To Open Educational Resources (OER)
(UNESCO, 2011), define los Recursos Educativos Abiertos, como:
27
En su forma más simple, el concepto de Recursos Educativos Abiertos, describe cualquier tipo
de recurso (incluyendo planes curriculares, materiales de los cursos, libros de texto, vídeo,
aplicaciones multimedia, secuencias de audio, y cualquier otro material que se haya diseñado para
su uso en los procesos de enseñanza y aprendizaje) que están plenamente disponibles para ser
utilizados por parte de educadores y estudiantes, sin la necesidad de pago alguno por derechos o
licencias para su uso.
Para el contexto colombiano, se define que:
Recurso Educativo Digital Abierto es todo tipo de material que tiene una intencionalidad y
finalidad enmarcada en una acción Educativa, cuya información es Digital, y se dispone en una
infraestructura de red pública, como internet, bajo un licenciamiento de Acceso Abierto que
permite y promueve su uso, adaptación, modificación y/o personalización. (Ministerio de
Educación Nacional, 2012)
2.1.7. Clasificación de los Recursos Educativos Digitales Abiertos
Dada la heterogeneidad, multiplicidad y complejidad de los Recursos Educativos Digitales
Abiertos, a continuación, se describe, caracteriza y detalla en profundidad cada una de las
condiciones
a) Desde lo educativo
El propósito de la clasificación de los recursos desde lo educativo se basa en características
comunes entre ellos, las cuales pueden definirse desde los objetivos de aprendizaje,
intencionalidades de uso, complejidad, estructura, entre otros. De este modo y de acuerdo con las
características educativas de los recursos, estos pueden ser organizados como Cursos Virtuales,
Aplicaciones para Educación y Objetos de Aprendizaje.
28
Curso Virtual: Un curso es una experiencia educativa que se realiza a través de un recorrido,
donde los participantes del proceso, también llamados estudiantes, interactúan con información,
conocimientos y actividades con las que se busca que desarrollen capacidades, competencias y
adquieran conocimientos, que permitan alcanzar los objetivos formativos propuestos. Para el caso
de un curso virtual, la experiencia educativa es mediada por un entorno tecnológico que es provisto
con las condiciones para desarrollar procesos de enseñanza y de aprendizaje, para alcanzar los
objetivos formativos establecidos (Ministerio de Educación Nacional, 2011b).
Aplicaciones para Educación: Son programas y/o piezas de software diseñados y producidos
para apoyar el desarrollo y cumplimiento de un objetivo, proceso, actividad o situación que implica
una intencionalidad o fin educativo; se caracterizan por brindar a los usuarios una gran
funcionalidad debido a su versatilidad, nivel de interacción, portabilidad y usabilidad.
Objeto de Aprendizaje: Un objeto de aprendizaje es un conjunto de recursos digitales,
autocontenible y reutilizable, con un propósito educativo y constituido por al menos tres
componentes internos: Contenidos, actividades de aprendizaje y elementos de contextualización.
El objeto de aprendizaje debe tener una estructura de información externa (metadatos) que facilite
su almacenamiento, identificación y recuperación (Ministerio de Educación Nacional, 2006b).
Como describe (Willey, 2006a), el término ‘objeto de aprendizaje’ se acuñó en 1994 por Wayne
Hodgins y rápidamente entró en el lenguaje de profesores y diseñadores de enseñanza. En lo que
se refiere a la historia de los Recursos Educativos Abiertos, los objetos de aprendizaje
popularizaron la idea de que los materiales digitales pueden diseñarse y producirse para poder
reutilizarlos fácilmente en una variedad de situaciones pedagógicas. (Para una visión general de la
literatura relevante, véase (Willey, 2006c) La imagen de los bloques de Lego o de los átomos se
29
usa en ocasiones para describir cómo pueden usarse y reutilizarse los objetos de aprendizaje en
diferentes entornos. (Willey, 1998) inventó la expresión “contenido abierto” qué llamó la atención
de los usuarios de Internet y popularizó la idea de que los principios del movimiento de software
de código abierto podrían ser aplicados de manera productiva al contenido. Willey también creó
la primera licencia abierta ampliamente adoptada para los contenidos (la Licencia de Publicación
Abierta) (OCDE, 2007).
b) Desde los formatos de información digital
Para su representación, la información digital utiliza distintos formatos, los cuales pueden ser
manipulados de manera individual o en conjunto durante los procesos de producción de Recursos
Educativos Digitales Abiertos. Los formatos más comunes son:
Textuales: información representada en un sistema de escritura a través de caracteres, que
puede apoyarse en otro tipo de representaciones visuales: esquemas, diagramas, gráficos, tablas,
entre otros, cuyo uso se desarrolla a través de la lectura.
Sonoros: elementos o secuencias de información acústica, cuya oscilación y vibración puede
ser percibida mayormente por el sentido del oído.
Visuales: elementos y/o secuencias de información representada en mayor porcentaje e
importancia a través de imágenes, fotografías, gráficas, ilustraciones, capturas ópticas, entre otras;
y cuyas oscilaciones y vibraciones pueden ser captados mayormente por el sentido de la vista.
Audiovisuales: elementos de información secuenciados sincrónicamente donde convergen,
articulan y se integra lo sonoro, lo textual y lo visual; y cuyas oscilaciones y vibraciones pueden
ser captadas simultáneamente por los sentidos de la vista y el oído.
30
Multimediales: elementos de información secuenciados principalmente de forma asincrónica,
que articula, secuencia e integra múltiples formatos (textuales, sonoros, visuales y audiovisuales);
su potencialidad reside sobre las posibilidades de interacción que ofrece.
c) Desde las condiciones de acceso y los permisos de uso
Los Recursos Educativos Digitales adquieren un carácter de Acceso Público, Acceso Abierto o
Acceso Privado, según los permisos que otorga el autor o el titular del Derecho de Autor, los cuales
quedan expresamente señalados en el sistema o modelo de licencia que se emplee. La cual debe
indicar las propiedades y condiciones de acceso, distribución, uso y adaptación.
Acceso Público: se define como aquello que está disponible sin restricciones ni limitaciones o
costo para su acceso; en algunos casos, permite y promueve su uso de manera completa y gratuita,
para lo cual dicho uso y acceso se disponen bajo la definición de una autorización a través de las
licencias de tipo público, a partir de las referencias establecidas en modelos de licenciamiento
reconocidos como: (Creative Commons, 2009; Free Software Foundation 2012)
Acceso Abierto: se heredan las condiciones de público, con el adicional de que el Recurso
Educativo Digital puede ser modificado o adaptado. Esto se logra gracias a que el titular del
Derecho de Autor, a través de una licencia, otorga permisos para la Derivación (Modificación o
adaptación de la obra o recurso). Las características para que un Recurso Educativo Digital sea
abierto son: su posibilidad para accederlo, compartirlo, copiarlo, distribuirlo, mostrarlo, adaptarlo,
representarlo, modificarlo y mezclarlo.
La apertura de un recurso aumenta por los permisos que se le asocien.
Más permisos = Más abierto (Botero, 2010).
31
Para ello, debe definirse la autorización a través de las licencias de tipo abierto, a partir de las
referencias establecidas en modelos de licenciamiento reconocidos como: (Creative Commons
2009; Free Software Foundation 2012; Ministerio de Educación Nacional, 2012).
A manera de resumen acerca de los conceptos alrededor de un recurso educativo digital y su
clasificación, presentamos el siguiente mapa.
Figura 5: Mapa conceptual Recurso Educativo Digital. Elaborado por el autor
2.1.8. Metadatos y perfil de aplicación
a) Metadatos
Aunque el termino metadato se relacionó inicialmente con el campo de la bibliotecología,
actualmente se ha extendido a los recursos digitales. Fue acuñado por Jack Myers en la década de
los 60 (Caplan, 2003), para describir conjuntos de datos. La primera acepción que se le dio (y
32
actualmente la más extendida) fue la de dato sobre el dato, ya que su intención era proporcionar la
información mínima necesaria para identificar un curso. Teniendo en cuenta esta definición y el
contexto actual, se puede considerar el alcance de la catalogación como un proceso de generación
de metadatos, que convoca no solo a profesionales de la información, sino también, a informáticos,
diseñadores de programas, técnicos de sistemas, etc. hoy, el concepto de metadato debe ser mirado
como un término mucho más amplio, que permite pensar la producción de recursos digitales bajo
un enfoque de trabajo colaborativo y que coloca en una posición participativa a todos los grupos
de profesionales implicados en su desarrollo. Otros autores amplían el concepto de “dato sobre el
dato”, al afirmar que los metadatos también deben incluir información sobre contexto, contenido
y control. de este modo, se alcanzan objetivos como describir, identificar y definir un recurso para
recuperar, filtrar e informar sobre licenciamiento y condiciones de uso, autenticación y evaluación,
preservación e interoperabilidad (Caplan, 1995).
Un registro de metadatos consiste en un conjunto de atributos o elementos necesarios para
describir un recurso determinado, que funciona como identificador de los materiales digitales
diseñados. Para ello, existen estándares que deben seguirse en la descripción de los objetos de
aprendizaje y de información.
b) Tipos de metadatos
De acuerdo a (Daudinot, 2006). Son múltiples los tipos y funciones de los metadatos existentes
actualmente, porque estos dependen de muchos factores, entre los cuales pueden citarse: el tipo de
información que describen, el nivel de estructuración de esta información, el lugar donde se
encuentren los metadatos, su ámbito de aplicación, el tipo de usuarios que los utiliza y sus
finalidades, entre otros. Por tanto, son múltiples también las clasificaciones de metadatos
realizadas hasta ahora por diferentes autores.
33
Con fines prácticos, los tipos y funciones de los metadatos pueden clasificarse en tres amplias
categorías: descriptivos, estructurales y administrativos. Estas categorías no siempre tienen límites
bien definidos y con frecuencia presentan un significativo nivel de superposición. Por ejemplo, los
metadatos administrativos pueden incluir una amplia gama de información que podría considerarse
como metadatos descriptivos y estructurales: (Daudinot, 2006).
Los metadatos descriptivos son aquellos que sirven para la descripción e identificación de los
recursos de información en el nivel local (sistema) para permitir la búsqueda y recuperación de
información.
Los metadatos estructurales facilitan la navegación y presentación de recursos electrónicos,
proporcionan información sobre la estructura interna de los recursos, incluyen página, sección,
capítulo, numeración, índices y tabla de contenidos; describen la relación entre los materiales, por
ejemplo: la fotografía B se incluyó en el manuscrito A; además, unen los archivos y los textos
relacionados.
Los metadatos administrativos facilitan la gestión y procesamiento de las colecciones digitales,
tanto a corto como a largo plazos e incluyen datos técnicos sobre la creación y el control de calidad;
comprenden la gestión de derechos y requisitos de control de acceso y utilización, además de
información sobre la acción de preservación.
A continuación, presentamos la definición de algunos de los estándares de metadatos más
conocidos.
c) IEEE Learning Object Meta-data LOM
34
Uno de los principales contribuidores al proceso de definición de metadatos para recursos
educativos es el IEEE, a través de su grupo de trabajo P1484.12 de metadatos para recursos
educativos, el cual ha definido LOM (learning Object Metadata) (Rob, 2013).
LOM se ha convertido en referencia para la comunidad en el campo de la descripción de
recursos educativos, aunque hay que decir que su creación no se debe solamente a IEEE. Entre las
aportaciones más importantes destacan las realizadas por IMS y el proyecto ARIADNE (Rob,
2013).
LOM especifica la sintaxis y semántica de metadatos para objetos educativos. Su propósito es
buscar la especificación más pequeña posible, pero que la vez resulte útil, factible, viable técnica
y comercialmente, de uso generalizado y que admita la incorporación de extensiones. En la
especificación se incluyen características como el nombre de los elementos, definiciones, tipos de
datos y longitudes de los campos. Se dispone, además, de enunciados de conformidad en los que
se explican cómo deben ser los documentos de metadatos y las aplicaciones para ser consideradas
conformes con LOM. Estabilidad de versiones, almacenamiento (asociando los registros LOM con
el recurso educativo o incorporándola de forma directa en el mismo), recuperación de información
(esto incluye los procesos de buscar, ubicar, iniciar, empaquetar, editar, etc.) e intercambio de
datos entre aplicaciones. En cualquier caso, los desarrolladores de LOM indican que puede
utilizarse para propósitos que no recogen en su especificación como son la gestión de los derechos
de la propiedad intelectual o el comercio electrónico (Rob, 2013).
La información de LOM puede utilizarse para los siguientes propósitos: mantenimiento de
estabilidad de versiones, almacenamiento (asociando registros los registros LOM con el recurso
educativo o incorporándola de forma directa en el mismo), recuperación de información (esto
35
incluye los procesos de buscar, ubicar, iniciar, empaquetar, editar, etc.) e intercambio de datos
entre aplicaciones. En cualquier caso, los desarrolladores de LOM indican que puede utilizarse
para propósitos que no se recogen en su especificación como son la gestión de los derechos de la
propiedad intelectual o el comercio electrónico.
LOM está organizado en nueve categorías:
Figura 6: Organización categorías LOM. Rob, 2013
d) LOM-CO
El Ministerio de Educación Nacional inició un minucioso análisis de las necesidades de
catalogación de los Objetos de Aprendizaje en el contexto nacional, para determinar el estándar
que se debería adoptar. Como resultado se seleccionó el estándar LOM, pero con una adaptación
que permitiera la descripción contextualizada de los objetos, acorde con los lineamientos de
gestión de contenidos educativos existentes a la fecha, en el país. Nace así LOM-CO (CO:
Colombia), y durante este año llega a su versión 0.2. Éste es un proyecto que se extendería a los
años siguientes, hasta consolidarse en su última versión: 1.0, o también llamada LOM-CO. Al
trascender esta definición de perfil de aplicación de metadatos para Colombia, en la iniciativa de
catalogación para Educación Superior se tienen en cuenta cuatro antecedentes o elementos que
36
pudieran incidir en la versión final del perfil de aplicación: (Ministerio de Educación Nacional.
2012).
● Se referencia el perfil de aplicación, creado para Objetos de Aprendizaje en el marco del
proyecto de Catalogación de Objetos de Aprendizaje en Instituciones de Educación
Superior, inmediatamente anterior a esta iniciativa.
● Se referencia el metadato construido con la colaboración de la Fundación Chile, durante la
consolidación del Portal Educativo Colombia Aprende.
● Se consideran las características de los diferentes tipos de contenidos: radio educativa,
televisión educativa, experiencias significativas y proyectos colaborativos, gestionados por
el Portal Educativo Colombia Aprende.
● El intercambio de contenidos con los diferentes portales educativos existentes a nivel
nacional y latinoamericano.
En el anexo X se muestra una plantilla para describir los campos de este perfil y hace parte del
documento. Recursos Educativos Digitales Abiertos Colombia. Un Sistema Nacional de
Innovación Educativa con Uso de TIC del ministerio de educación nacional en el año 2012.
e) Dublín Core educación
Dublín Core es una propuesta para metadatos de Dublín Core Metadata Iniciative (DCMI), una
organización dedicada específicamente a la creación, mantenimiento y gestión de propuestas de
metadatos. El nombre Dublín Core proviene de la ciudad de Estados Unidos (Dublín, estado de
Ohio) donde se produjo en 1995 una reunión de especialistas en la que tuvo lugar el nacimiento de
esta iniciativa. “Core” refleja el hecho de que únicamente se recogieron los elementos más básicos
37
para garantizar su aplicabilidad a un amplio abanico de tipos de recursos, por supuesto también en
el ámbito de la educación (Rob, 2013).
Se trata de una propuesta mucho más reducida a LOM (15 elementos frente a los más de 60 de
LOM). Cada uno de los elementos, con un nombre que pretende ser auto descriptivo, es opcional
y puede repetirse. Los elementos pueden aparecer en cualquier orden.
Los 15 elementos de Dublín Core pretenden describir un recurso desde tres puntos de vista
diferentes.
• Contenido del recurso
• Características y propiedad intelectual
• Propiedades de la instanciación del recurso
En la siguiente figura se muestra el esquema de los estándares LOM, Dublín Core y dos de sus
perfiles de aplicación.
Figura 7: Esquema de los estándares LOM, Dublín Core y perfiles de aplicación. Rob, 2013
38
f) Perfil de aplicación
Un perfil de aplicación es el uso específico que se le da a un esquema de metadatos existente
en una entidad en particular. Incluye las políticas propias y las directrices en el uso de los
elementos. Determina su obligatoriedad y limitaciones, explica cómo deben usarse y da ejemplos
aclaratorios.
Para poder cumplir con sus objetivos, un perfil de aplicación puede integrar elementos
provenientes de más de un esquema de metadatos, con la precaución de que estos no se solapen.
Exige que se realice una documentación adecuada para que el trabajo de los distintos usuarios sea
consistente al momento de realizar la aplicación del perfil.
MARCO CONCEPTUAL
De acuerdo con el enfoque teórico presentado anteriormente, a continuación, relacionamos
algunos conceptos que consideramos, complementan de manera importante el enfoque de la
investigación.
2.2.1. Semántica
Es la ciencia del hombre que estudia el significado que expresamos mediante el lenguaje
natural. Es una parte de la gramática que investiga el modo como se proyectan los objetos y
situaciones del mundo en el código de la lengua. Su objeto primario de estudio es la capacidad
innata de los hablantes, que les permite desplazar los objetos del mundo en expresiones codificadas
en un lenguaje simbólico natural, y que constituye su competencia semántica.
Su objetivo es construir un modelo parcial que abstraiga alguna de las propiedades del objeto.
La explicación semántica podría concebirse como un modelo que simula el saber semántico innato
de los hablantes. Una vez construido y adecuado a los datos empíricos, el modelo nos permitirá
39
experimentar el funcionamiento dinámico de este conocimiento en distintas situaciones de
evaluación y hacer predicciones sobre la conducta potencial de los agentes representados (Palma,
2016).
2.2.2. Ontología
El término ontología proviene de la filosofía; pero en IA, tiene diferentes connotaciones. La
definición declarativa más consolidada es la propuesta por (Gruber, 1993) y extendida por (Studer,
1998) que la describe como “una especificación explicita y formal sobre una conceptualización
compartida”. La interpretación de esta definición es que las ontologías definen conceptos y
relaciones de algún dominio, de forma compartida y consensuada; y que esta conceptualización
debe ser representada de una marera formal, legible y utilizable por los ordenadores. Las ontologías
se componen generalmente de conceptos, relaciones, funciones, instancias, axiomas (Tello, 2014).
2.2.3. Taxonomía
Etimológicamente hablando, taxonomía procede de los términos griegos “taxis”, ordenación y
“nomos” norma. Aplicando el principio etimológico, la taxonomía se ha definido como la ciencia
que trata de los principios, métodos y fines de la clasificación, y procura la organización
jerarquizada y sistemática, dando nombres a grupos de elementos y a los elementos mismos. Una
taxonomía es un tipo de vocabulario controlado en que todos los términos están conectados
mediante algún modelo estructural (jerárquico, arbóreo, facetado, etc.) y especialmente orientado
a los sistemas de navegación, organización y búsqueda de contenidos de los sitios web (Díaz,
2009).
2.2.4. Repositorio de recursos educativos
40
Un repositorio de recursos educativos es un sistema software que almacena recursos educativos
y sus metadatos (o solamente estos últimos), y que proporciona algún tipo de interfaz de búsqueda
de los mismos, bien para interacción con humanos o con otros sistemas software. Los repositorios
proporcionan acceso a colecciones de recursos educativos generalmente en formato electrónico, si
bien la mayoría no almacenan los recursos educativos en sí, sino solamente sus metadatos. Por lo
tanto, es posible encontrar el mismo recurso a través de diferentes repositorios. Se observan dos
grandes tipos de repositorios: (Soto, 2006)
1. Interfaces de búsqueda interactivos, para uso de humanos.
2. Interfaces de consulta que puedan ser utilizados por agentes software, por ejemplo,
mediante Servicios Web.
En ocasiones, la misma forma de búsqueda puede servir para los dos usos. No obstante, hay
que tener en cuenta que la búsqueda mediante los habituales mecanismos de recuperación de
información de propósito general (como los que usan los buscadores de Internet) deben
complementarse con una búsqueda guiada por los metadatos. La forma más sencilla de este tipo
de búsqueda es permitir buscar por campos de metadatos. No obstante, esas interfaces a veces
tampoco resultan satisfactorias, por lo que actualmente se investiga en técnicas avanzadas que
permitan hacer uso de conocimiento sobre el domino de los metadatos, por ejemplo, mediante
ontologías (Soto, 2006).
CAPÍTULO III MARCO METODOLÓGICO
En este capítulo exponemos cual fue la metodología definida para llevar a cabo el desarrollo
del proyecto, así como la descripción de las distintas etapas que la componen.
41
METODOLOGÍA DEL PROYECTO
Se utilizará una metodología cuasiexperimental teniendo en cuanta que el objeto de prueba son
elementos ya formados y que el experimento se realiza en ambientes de prueba como se describe
en el apartado de alcances y limitaciones.
La figura 8 se muestra las fases definidas para llevar a cabo el proyecto:
Figura 8: Fases de la metodología del proyecto, Elaborado por el autor
A continuación, se presenta una descripción de cada fase.
a) Levantamiento de información y contextualización del objeto de investigación
42
En esta fase se realiza una revisión bibliográfica de acuerdo al tema de investigación, donde
se busca establecer el contexto actual de los distintos enfoques, pautas, recomendaciones y
uso de herramientas tecnológicas.
b) Comparación de propuestas metodológicas de publicación de datos
En esta fase se identifican las propuestas metodológicas más relevantes y se establecen
cuáles pueden ser las mejores prácticas para realizar la publicación de datos.
c) Planteamiento de la propuesta metodológica de publicación de datos
En esta fase se define específicamente cuales van a ser los pasos propuestos para la
publicación de datos de acuerdo al resultado de la fase anterior y las pruebas experimentales
realizadas.
d) Descripción de cada una de las etapas de la propuesta metodológica planteada
Por último, se describe el planteamiento paso a paso para realizar la publicación donde se
incluye las condiciones necesarias, recomendación técnica de herramientas y
recomendaciones de buenas prácticas.
CAPITULO IV DESARROLLO DE LA INVESTIGACIÓN
De acuerda a las fases del desarrollo del proyecto descritas en el capítulo anterior a continuación
se presenta la descripción de la implementación de cada fase.
LEVANTAMIENTO DE INFORMACIÓN Y CONTEXTUALIZACIÓN DEL
OBJETO DE INVESTIGACIÓN
43
En esta fase se realiza una revisión bibliográfica de acuerdo al tema de investigación, donde se
busca establecer el contexto actual de los distintos enfoques, pautas, recomendaciones y uso de
herramientas tecnológicas.
4.1.1. Revisión Bibliográfica
Para esta investigación se incluyen los siguientes criterios:
a) Criterios de inclusión
● Estudios publicados entre los años 2010 y 2019.
● Estudios que mencionen la evaluación de la calidad de datos.
● Estudios que mencionen herramientas necesarias para la publicación de datos en LOD.
● Estudios que propusieron y / o implementaron un enfoque para la publicación de datos en
Linked Data o Linked Open Data.
b) Criterio de exclusión
● Trabajos que aborden áreas distintas a las ciencias de la computación, por ejemplo,
ciencias sociales o de salud.
● Se excluyen artículos que no hayan sido revisados por pares como discursos,
conferencias o talleres. Metodologías de evaluación que se publicaron como resumen de
póster.
● Se excluyen trabajos con documentación incompleta, por ejemplo, diapositivas de una
presentación.
● Estudios que no se centran en Linked Data o Linked Open Data ni en otras formas de
datos estructurados.
● Estudios que no propusieron ninguna metodología o marco para la evaluación de la
calidad en Linked Data o Linked Open Data.
44
● Estudios que no tengan citas en otros estudios.
c) Preguntas de investigación para la revisión bibliográfica
¿Cuáles son las características de los datos publicados y consumidos en la web?
¿Qué métodos o procedimientos se han utilizado para publicar y consumir datos en la web?
¿Qué herramientas se han utilizado para publicar y consumir datos en la web?
d) Fuentes de datos y estrategia de búsqueda
Se realizó un proceso de búsqueda automático utilizando siete motores de búsqueda y sistemas
de indexación en la siguiente tabla se especifican las fuentes:
Recurso URL
IEEE Xplore https://ieeexplore.ieee.org/Xplore/home.jsp
Biblioteca digital ACM https://dl.acm.org/
ProQuest https://www.proquest.com/LATAM-ES/
Science Direct https://www.sciencedirect.com/
Scopus https://www.scopus.com/
Springer https://link.springer.com/
Emerald https://www.emeraldinsight.com/
Tabla 1: Fuentes de datos automáticos consultadas. Elaborada por el Autor
La cadena utilizada para la búsqueda automática consistió en la construcción de la frase
“Publishing linked data” OR ¨Publishing Linked open data methodology¨ OR ¨Linked Open data
Publishing Tools¨.
45
e) Selección de estudios
La búsqueda automática permite aplicar en primera instancia el criterio de exclusión de fechas
el cual permite recuperar en primera instancia los artículos publicados entre los años 2010 y 2019,
luego con la herramienta Mendey se procede a eliminar los posibles duplicados. Finalmente se
aplican los demás criterios de inclusión y exclusión sobre los trabajos potencialmente relevantes.
En la siguiente figura se muestra el flujo de este proceso de selección.
Figura 9: Artículos recuperados durante la búsqueda bibliográfica. Elaborado por autor
46
En el anexo 1 se presenta la relación de estudios seleccionados como relevantes para nuestra
investigación junto con un comparativo de las fases y herramientas para la publicación de datos
vinculados.
En cuanto a la extracción y síntesis de los datos, se realizó un análisis por cada artículo con el
fin de responder a las preguntas de investigación definidas anteriormente
f) Resultados de la revisión
Se analizaron en total 40 artículos publicados entre el 2010 y 2019, entre los cuales solo 22
fueron relevantes para el objeto de investigación, en la siguiente tabla 2 se presentan el número de
estudios por fuente Vs Año de publicación.
Fuente 2010 2012 2013 2014 2015 2016 2017 2018 Total general
IEEE Xplore 1 3 2 6
Emerald 3 1 4
ACM 2 1 3
Otras fuentes 1 1 1 3
Springer 1 1 2
ScienceDirect 1 1
Scopus 1 1
ProQuest 1 1
Otras fuentes - EBSCO 1 1
Total general 1 1 2 5 2 4 3 4 22
Tabla 2: Número de artículos encontrados Fuente Vs Año de publicación. Elaborado por autor
47
Se puede observar en la tabla que la fuente con más estudios relevantes sobre el tema de
investigación fue IEEE Xplore y que los años con más producción según esta muestra fueron los
años 2014(5), 2016(4) y 2018(4). No se encontraron estudios relevantes del año en curso.
Dentro de los estudios más citados se encuentran los estudios de (Piedra, 2014) (69),
(Zuiderwijk, 2014) (46), (Knap, 2012) (27), (Southwick, 2015) (23) y (Konstantinou, 2014) (20).
Los demás estudios se encuentran en rangos de menos de 17 citaciones, incluso dos estudios que
solamente presentan una citación.
g) Respuestas a las preguntas de investigación
¿Cuáles son las características de los datos publicados y consumidos en la web?
En (Zhao, 2010) se define que como primera medida se debe definir una estrategia de
transformación, donde se incluye una definición de un esquema de metadatos donde se incluya la
información de procedencia. Definir esquemas de URIS, reutilización de ontologías y
vocabularios. Hacer accesible la información de la estructuración. La evaluación de conjuntos de
datos es un punto crucial para asegurarse de que los datos vinculados se publiquen y cumplan con
los estándares. (Hidalgo-Delgado, 2018). Dentro de la metodología planteada por (Piedra, 2014)
establece que se debe identificar y seleccionar fuentes de datos heterogéneas para determinar el
alcance de los contenidos.
¿Qué métodos o procedimientos se han utilizado para publicar y consumir datos en la web?
Existen varias propuestas metodológicas para la publicación y consumo de datos dentro de las
cuales se destacan las de (Piedra, 2014), propuestas basadas en diseños de principios como en
(Zuiderwijk, 2014), propuestas basadas en tareas como la de (Radulovic, 2015). Básicamente se
siguen las siguientes etapas: Evaluación y selección de tecnologías, limpieza exportación de
48
metadatos para transformación, reconciliación con vocabularios controlados, implementación de
mapeos, generación de archivos RDF, publicación en LOD. Tareas complementarias como la de
definir reglas para los URIs y revisar las ontologías existentes y establecer licenciamiento también
son comunes.
¿Qué herramientas se han utilizado para publicar y consumir datos en la web?
Dentro de cada una de las etapas se ha evidenciado el uso de herramientas, las más comunes
son los repositorios de datos como Virtuoso y DSpace, iniciando el proceso de publicación se
encuentran herramientas como Openrefine para la limpieza, Protégé para la creación de ontologías,
Jena Fuseki para consultas Sparql. Dentro de las herramientas propias encontramos en (Klein,
2016) un framework llamado FusePool para el proceso de publicación de datos enlazados.
4.1.2. Contextualización del objeto de investigación
Para lograr contextualizar el objeto de investigación se proponen dos actividades
complementarias. La primera actividad consistió en acceder los repositorios institucionales donde
se realizó una inspección de diez repositorios de diferentes Instituciones Universitarias Nacionales
incluido el repositorio de la Universidad Distrital Francisco José de Caldas, relacionado en la tabla
3, donde se encontró la predominancia absoluta en el uso de la herramienta DSpace como
repositorio y la implementación del estándar de metadatos Dublín Core.
INSTITUCIÓN Ciudad/sede URL Herramienta Metadatos
UNIVERSIDAD
DISTRITAL BOGOTÁ http://repository.udistrital.edu.co/ DSpace Dublín Core
UNIVERSIDAD
PILOTO BOGOTÁ http://repository.unipiloto.edu.co/ DSpace Dublín Core
49
INSTITUCIÓN Ciudad/sede URL Herramienta Metadatos
PONTIFICIA
UNIVERSIDAD
JAVERIANA
BOGOTÁ https://repository.javeriana.edu.co/ DSpace Dublín Core
PONTIFICIA
UNIVERSIDAD
JAVERIANA
CÁLI http://vitela.javerianacali.edu.co/ DSpace Dublín Core
UNIVERSIDAD
DEL NORTE BARRANQUILLA http://manglar.uninorte.edu.co/ DSpace Dublín Core
UNIVERSIDAD
DE LA SABANA CHÍA https://intellectum.unisabana.edu.co DSpace Dublín Core
UNIVERSIDAD
DE LOS ANDES BOGOTÁ https://repositorio.uniandes.edu.co/ Séneca Dublín Core
UNIVERSIDAD
EAFIT MEDELLÍN https://repository.eafit.edu.co/ DSpace Dublín Core
UNIVERSIDAD
PONTIFICIA
BOLIVARIANA
MEDELLÍN http://repository.upb.edu.co/ DSpace Dublín Core
ESCUELA
COLOMBIANA
DE INGENIERÍA
BOGOTÁ https://repositorio.escuelaing.edu.co/ DSpace Dublín Core
Tabla 3: Instituciones educativas, repositorio y estándar de metadatos. Elaborado por el autor
Adicionalmente al observar la clasificación de comunidades, subcomunidades y colecciones de
los distintos repositorios, no se encuentra una estructuración estándar, solamente los repositorios
de las Universidades, Javeriana sede Cali (Comunidad REDA), La Sabana (Comunidad REDA) y
50
la Pontificia Bolivariana con su (Comunidad Producción docente), indican una comunidad llamada
Recursos Educativos Digitales Abiertos. La Universidad de los Andes define una comunidad
llamada “Recursos de aprendizaje” pero no cuenta con ítems publicados a la fecha, sin embargo,
se encontró que fuera del repositorio institucional si se encuentra recursos educativos publicados
en otras plataformas como Vimeo. La universidad Distrital define la comunidad “Recursos de
enseñanza” con un solo ítem publicado a la fecha.
Para este trabajo resulta importante promover y darle importancia a la comunidad “Recursos
Educativos Digitales Abiertos (REDA)” basando su estructura de subcomunidades y colecciones
de Instituciones Educativas pares que promuevan el desarrollo de este tipo de recursos y de alguna
forma generen estandarización e interoperabilidad entre los distintos repositorios.
La segunda actividad que consistió en realizar una solicitud de información a manera de
entrevista a las siguientes Instituciones de Educación Superior con el objetivo de conocer de
primera mano, las diferentes metodologías y herramientas de implementación en cada uno de sus
repositorios. Las Instituciones fueron seleccionadas de acuerdo a su mención como instituciones
participantes en el desarrollo del Proyecto sobre Recursos Educativos Abiertos liderado por el
Ministerio de Educación Nacional entre los años 2005 y 2011.
Las instituciones contactadas fueron:
• Universidad del Norte (Barranquilla)
• Universidad Pontificia Bolivariana (Medellín)
• Universidad EAFIT (Medellín)
• Pontificia Universidad Javeriana (Cali)
• Universidad de La Sabana (Chía)
51
De las instituciones contactadas solamente la Pontificia Universidad Javeriana sede Bogotá nos
proporcionó respuestas, las preguntas y respuestas de la entrevista se puede consultar como anexo
2.
COMPARACIÓN DE PROPUESTAS METODOLÓGICAS DE
PUBLICACIÓN DE DATOS
Dentro de la revisión encontramos trabajos relacionados como en (Piedra, 2014) donde se
menciona los pasos como selección de fuentes da datos heterogéneos para determinar el alcance
del contenido, modelado de vocabularios para el dominio OCW, Extracción de datos, Generar
datos RDF, publicar datos vinculados, consumir y visualizar datos vinculados. En la figura 10 se
representan los pasos de esta metodología.
Figura 10: Framework general para la publicación de recursos educativos en Linked data. Piedra, 2014
De esta metodología cabe destacar la utilización de herramientas como virtuoso y Jena.
52
En (Zuiderwijk, 2014) encontramos una metodología con el objetivo derivar principios para
diseñar y mejorar los procesos administrativos utilizados para publicar datos abiertos, dentro de
los pasos de esta propuesta se encuentran recomendaciones tales como:
Comenzar pensar en la apertura de datos desde el inicio del proceso;
• Desarrollar directrices, especialmente sobre la privacidad y la sensibilidad de la política
de los datos; proporcionar apoyo a la toma de decisiones mediante la comprensión de
las actividades de otros actores involucrados en el proceso de publicación.
• Convertir la publicación de datos en una parte integral, bien definida y estandarizada de
los procedimientos y rutinas diarias.
• Monitorear cómo se reutilizan los datos publicados. Las conversaciones con los
empleados del WODC demostraron que estos cinco principios podrían mejorar el
proceso de publicación de datos abiertos.
También encontramos otro enfoque metodológico presentado en (Radulovic, 2015) quien
menciona que la generación de Datos Vinculados consta de ocho tareas que comprenden la
selección de una fuente de datos que se transformará a Datos vinculados, el análisis de la licencia
para determinar los términos de uso de cada recurso, análisis en detalle y se especificó de una
estrategia de asignación de nombres de recursos, desarrolla una ontología para describir los datos
y los datos se transforman en el formato RDF. Finalmente, los datos generados se vinculan a los
datos de otros conjuntos de datos vinculados. En la figura 11 se muestra el flujo de dichas tareas.
53
Figura 11: Tareas para generar el proceso de datos enlazados. Rodulovic, 2018
Adicionalmente (Radulovic, 2015) menciona que el proceso de publicación de Datos
Vinculados consta de cuatro tareas (Fig. 12). Las tareas del proceso de publicación de Datos
vinculados incluyen garantizar el cumplimiento legal de los datos que se publicarán, la publicación
del conjunto de datos y la ontología, la publicación de metadatos y la documentación en línea, y
permitir el descubrimiento del conjunto de datos.
De esta metodología se destaca la utilización de herramientas como OpenRefine, Protégé y
Virtuoso.
Figura 12: Tareas del proceso de publicación de datos enlazados. Radulovic, 2015
54
En (Southwick, 2015) menciona como pasos la selección de tecnologías, la limpieza y
exportación de metadatos, preparación de metadatos para transformación, la reconciliación
con vocabularios controlados, implementación de mapeado, generación de archivos RDF
y publicación en LOD. Como recomendación de reutilización agrega la búsqueda de URIS
en datasets externos, establecer reglas para creación de URIS y la revisión de ontologías
existentes.
Las herramientas expuestas en esta metodología incluyen OpenRefine, Mulgara, OpenLink,
Virtuoso y ContentDM para el proceso de limpieza de metadatos.
En (Kučera, 2015) se propone un enfoque metodológico compuesto por 5 bloques de
construcción principales: fases, actividades transversales, artefactos, roles y prácticas. Para llevar
a cabo la publicación se manejan 4 etapas:
• Desarrollo del plan de publicación de datos abiertos.
• Preparación de la publicación.
• Realización de publicación.
• Archivado.
En (Konstantinou, 2014) se muestra una arquitectura interesante sobre la infraestructura de un
repositorio de recursos educativos digitales, en este artículo cabe destacar la utilización del
repositorio DSpace.
55
Figura 13: Vista de componentes de un repositorio de recursos educativos. Konstantinou, 2014
En general podemos sintetizar que las propuestas presentan planteamientos metodológicos muy
similares en tareas como la definición de los recursos, los modelos de datos, el licenciamiento y
las herramientas utilizadas para el proceso de publicación. Cabe destacar que la variación entre las
distintas metodologías se evidencia en el dominio de conocimiento aplicado y a la integración de
este con datos ya publicados, distintos planteamientos se enfocan en la calidad y automatización
de los datos como se evidencia en (Knap, 2012) y (Zhao, 2010) donde encontramos una tendencia
de la metodología hacia la preparación de los datos y su calidad y en la automatización basada en
mapeos utilizando scripts de transformación.
Por otro lado, se encuentra una propuesta en (Senso, 2018) muy completa donde se definen
etapas como identificación y descripción de datos, almacenamiento y corrección, desarrollo de
vocabularios y su descripción en formatos RDF, generación de los recursos en RDF, conexión con
otros dataset incluyendo su validación, conexión son otros datasets incluyendo su verificación y
por último la publicación de este dataset y sus metadatos. También relaciona cada una de las etapas
con la definición de herramientas a utilizar dentro de las que se encuentra, por ejemplo, Apache
Hadoop para el almacenamiento, OpenRefine para la extracción y limpieza de datos, protégé para
la modelización, Silk para enlazado y Virtuoso como repositorio de publicación.
56
De acuerdo a la revisión bibliográfica encontramos la metodología planteada en los estudio de
(Radulovic, 2018) y (Senso, 2018) sintetizan los pasos y tareas de otras metodologías encontrados
y son más que más se adaptan al objetivo de publicación de recursos educativos propuesto,
adicionalmente propone el uso de herramientas libres como Protegé y Open refine, esto
complementado con lo planteado por (Konstantinou, 2014) sobre repositorios nos da una base para
plantear y proponer la metodología objetivo de este trabajo.
CAPITULO V PLANTEAMIENTO DE LA PROPUESTA METODOLOGICA DE
PUBLICACIÓN DE DATOS VINCULADOS
De acuerdo a los resultados expuestos en la sección 4.2, se definieron 6 etapas para el proceso
de publicación de recursos, las cuales se muestran en la figura 14.
PROPUESTA METODOLÓGICA PLANTEADA
Figura 14: Etapas propuestas para la metodología de publicación de Recursos Educativos. Elaborado por autor
Estas etapas se adaptaron a partir de las metodologías estudiadas, pero principalmente de la
propuesta descrita en (Senso, 2018).
57
A continuación, se describe brevemente cada una de las etapas.
Etapa 1 Determinar se refiere principalmente a la identificación del dominio o tema, así como
cada uno de los participantes potenciales que estén dentro del marco de la investigación. En esta
etapa se define que metadatos son relevantes para describir la información del dominio para
finalmente determinar cuál es el esquema que más se adapta a la necesidad.
Etapa 2 Limpiar se refiere a la limpieza de datos provenientes de un modelo de datos distinto
o tags de metadatos diferentes al definido en la metodología. En esta etapa se establece la estrategia
de curación para estos datos.
Etapa 3 Modelar se refiere a la utilización de una herramienta que nos permita estructurar a
través de un modelo, los objetos, las propiedades, los rangos y relaciones existentes en el dominio.
Etapa 4 Generar se refiere a convertir el modelo de datos a una estructura de tipo RDF o
tripletes con relación semántica que pueda ser interpretado tanto por máquinas como por seres
humanos.
Etapa 5 Enlazar se refiere a enriquecer las estructuras de la etapa anterior con otras estructuras
que se relacionen a través de URI.
Etapa 6 Publicar, por último, esta etapa se refiere a la exposición constante y enriquecida del
dataset creado a partir de los recursos que se cargan al repositorio.
DESCRIPCIÓN DE CADA UNA DE LAS ETAPAS DE LA PROPUESTA
METODOLÓGICA PLANTEADA
58
A continuación, se describe el planteamiento paso a paso para realizar la publicación de recursos
donde se incluye las condiciones necesarias, recomendación técnica de herramientas y
recomendaciones de buenas prácticas.
5.2.1. Etapa 1: Determinar
También lo llamamos Identificación del dominio. Para identificar el dominio se debe
comprender, definir cada uno de los elementos que existen dentro del dominio, como las entidades,
sus atributos y relaciones. Se debe definir el tipo de cada uno de los atributos, por ejemplo, para el
atributo nombre se debe definir si es de tipo carácter, entero, cadena de caracteres etc. Se sugiere
representar esta caracterización del dominio en una taxonomía tipo árbol.
Buenas prácticas:
• Se recomienda realizar esta primera etapa utilizando solo lápiz y papel y luego si llevarlo
a un gráfico o tabla.
• Para definir los tipos de atributos, utilice tipos de datos estándar en lenguajes de
programación, int, string, date etc.
Herramientas recomendadas:
• Lápiz y papel
• Word, Excel.
5.2.2. Etapa 2: Limpiar
59
La etapa de limpieza se considera cuando el origen de los datos proviene de distintas fuentes y
es necesario limpiar y curar la información para que se adapte a nuestra estructura. Para esto
establecemos dos vías de acuerdo al origen de los datos.
1. Los datos se deben cargar manualmente en el archivo, este debe irse construyendo
tripleta a tripleta acorde a las restricciones de construcción definidas anteriormente.
2. Los datos provienen de un gestor de recursos, como es el caso de DSpace. Se debe
utilizar herramientas de curación de datos que normalmente tiene el gestor y utilizar las
opciones de importación de metadatos. Después de esto se genera el dataset de acuerdo
a las reglas de mapeo.
Por cualquiera de las dos vías se debe haber publicado los recursos digitales en un gestor de
recursos digitales, y haber alimentado la metadata que tendría cada recurso.
Buenas prácticas:
• Utilice un programa especializado para la curación y limpieza de datos.
• En este punto es importante tener ya definido un esquema del dataset
• Realice equivalencias entre los vocabularios origen y los vocabularios destino.
• Puede usar un validador RDF para verificar que los dataset creados tengan la estructura
adecuada.
Herramientas recomendadas:
• OpenRefine http://openrefine.org/
• Validador RDF https://www.w3.org/RDF/Validator/
• Notepad++ https://notepad-plus-plus.org/download/v7.6.6.html
60
5.2.3. Etapa 3: Modelar
Se define en dos fases
a) Fase 1: Modelo de dominio
Después de haber caracterizado el dominio, se deben definir formalmente las relaciones entre
las entidades de dominio. Para esto siga los siguientes pasos.
• Organice la información en una tabla donde se especifique una a una las relaciones entre
entidades. Las relaciones son de tipo, pertenece a, tiene un, es parte de, etc.
• Represente la información de la tabla en un gráfico donde se puedan apreciar las entidades
y las relaciones del dominio.
Buenas prácticas:
• Apóyese en modelos existentes que muestren las relaciones de entre entidades.
Herramientas recomendadas:
• Excel
• Protegé https://protege.stanford.edu/
• Programas para representar modelos
b) Fase 2: Identificar cuáles de los atributos tienen relaciones con datos externos
Al identificar estos atributos estamos realizando una primera aproximación a los datos que son
candidatos a ser vinculados. Por ejemplo, cuando el dominio de conocimiento no posee una base
de datos de autores y para enriquecer los datos debe recurrir a otros repositorios institucionales.
61
En este caso el autor no es de tipo interno sino externo y esa relación externa hacia otro repositorio
se debe expresar a través de un URL a dichos repositorios.
Buenas prácticas:
• Al identificar los atributos candidatos a ser enlaces con otros dataset, realice una
búsqueda y enliste por atributo mínimo 2 datasets candidatos que contengan la
información requerida.
Herramientas recomendadas:
Silk http://silkframework.org/
5.2.4. Etapa 4: Generar
Esta etapa la dividimos en dos fases:
a) Fase 1. Representación del modelo en un lenguaje
En esta etapa se busca que el modelo descrito se exprese en un lenguaje con el que se construirá
el dataset.
Para esto seguiremos los siguientes pasos.
• Determinar qué tipo de vocabulario tienen las entidades, atributos y relaciones que se
quiere describir.
• Si el vocabulario seleccionado no es suficientemente para describir todas las entidades,
atributos y relaciones debemos crear un perfil de aplicación que consiste básicamente
en una mezcla de vocabularios de acuerdo a nuestra necesidad y que deben cumplir con
62
la condición de ser vocabularios reconocidos para que puedan ser interoperables con
otros recursos.
Finalmente, esta fase también la podríamos definir como fase de mapeo.
Buenas prácticas:
• Preferiblemente utilice vocabularios conocidos como DCTERMS, FOAF, SKOS
• Tener en cuenta que algunos repositorios no admiten grafos multivariados, esta
situación se presenta por ejemplo con la herramienta DSpace cuando se definen
vocabularios con calificadores en un segundo nivel, como por ejemplo en el vocabulario
Dublin Core con el tag contributor y sus calificadores dc:contributor.author y
dc:contributor.uri, estos son interpretados en el momento de la serialización como parte
del mismo contenido.
Herramientas recomendadas:
• Consultar más vocabularios en https://lov.linkeddata.es/dataset/lov/
b) Fase 2: Construcción del dataset
Teniendo ya la información de las entidades, relaciones y atributos procedemos a construir el
dataset en formato RDF. Seguimos los siguientes pasos
• Definir qué tipo de archivo que vamos a construir, RDF/XML es una opción, pero
recomendamos turtle ya que es más sencillo para la interpretación humana.
• Definir los namespace a utilizar de acuerdo a él o los vocabularios seleccionados en la
anterior etapa ya que serán los encabezados de nuestro archivo RDF.
63
• Construir el archivo RDF a partir de los parámetros definidos.
• Validar la construcción del dataset.
• Probar consultas sparql al dataset.
Buenas prácticas:
• Utilice un editor de texto especializado para codificación.
• Utilice el validador para verificar la construcción del dataset.
Herramientas recomendadas:
• Notepad++ https://notepad-plus-plus.org/
• Validador RDF https://www.w3.org/RDF/Validator/
5.2.5. Etapa 5: Enlazar
Esta etapa es complementaria a la fase 2 de la etapa 6, “Identificar cuáles de los atributos tienen
relaciones con datos externos”.
Para esto tomamos el listado generado en dicha etapa y podemos utilizar una herramienta que
nos permita reconciliar nuestro dataset con otros dataset o establecer los URL de forma manual.
Buenas prácticas:
• Utilice un programa que le permita reconciliar la información de su dataset con otros
dataset.
Herramientas recomendadas:
• OpenRefine http://openrefine.org/
64
5.2.6. Etapa 6: Publicar
Debemos hacer ciertas validaciones antes de poder publicar nuestros dataset.
• Seleccionar un gestor de recursos vinculados
• Validar si el gestor de recursos vinculados requiere que el dataset sea adaptado en
formato y si es el caso, adaptarlo.
• Se realizan nuevamente consultas de verificación sobre el dataset.
• Se crea el EndPoint
• Se realiza una prueba de consulta externa al endPoint.
Buenas prácticas:
• Al publicar el dataset pruebe simular la solicitud de consumo externo al dataset con una
herramienta como Postman.
Herramientas recomendadas:
• FUSEKI https://jena.apache.org/documentation/fuseki2/
• Postman https://www.getpostman.com/
Con esto finalizamos la etapa de publicación y la metodología propuesta.
DESARROLLO DE ETAPAS DE METODOLOGÍA
En esta sección presentamos paso a paso el desarrollo de la propuesta metodológica para la
publicación de recursos educativos como linked data, este desarrollo se realiza de forma manual
para comprobar que cada uno de los pasos es viable no solo para nuestro dominio sino también
para otros.
65
5.3.1. Desarrollo etapa 1: determinar
El dominio sobre el cual trabajamos en el caso de estudio es el de los recursos educativos
digitales abiertos o REDA, por lo tanto, definiendo la taxonomía del dominio y de acuerdo con la
clasificación expuesta en (Ministerio de Educación Nacional, 2012). En la figura 15 se muestra los
diferentes tipos de recursos educativos digitales a manera de identificar el dominio.
Figura 15: Tipos de recursos educativos digitales. Elaborado por autor
Hemos definido que los atributos deben aplicar a cualquier REDA independiente del tipo. Para
esto nos hemos basado en la propuesta de metadatos de LOM-CO y DublinCore donde finalmente
hemos seleccionado 25 atributos que consideramos importantes en este dominio. En la siguiente
tabla mostramos dicha selección.
66
Nombre atributo Descripción atributo Tipo de
dato
Titulo Representa el nombre asignado al recurso String
Idioma Representa el lenguaje o los lenguajes utilizados dentro del recurso String
Descripción Una descripción textual del contenido, objetivo y actividades del
recurso. String
Palabras Clave Representa una palabra clave o frase que describe el tema del recurso String
Versión Representa la versión del recurso double
Creador Representa el nombre completo del creador del recurso. String
email Creador Describe el correo electrónico del creador del recurso String
Publicador Representa el nombre completo del publicador del recurso. String
Colaborador Representa el nombre completo del coautor del recurso String
Fecha Representa la fecha de creación del recurso Date
Formato Representa el formato del recurso String
Localización
(URI) identificador Representa la dirección donde se localiza el recurso (URI) String
Tema Representa el tema del recurso. String
Requerimientos Representa la descripción de los requerimientos para acceder al recurso String
Instrucciones
Instalación Representa las instrucciones de instalación del recurso String
Tipo
Interactividad El tipo de aprendizaje predominante soportado por el recurso. String
Nivel
Interactividad
La interactividad en este contexto se refiere al grado en el que el
estudiante puede influir en el aspecto o comportamiento del recurso. String
Tipo Representa el tipo de recurso educativo String
67
Nombre atributo Descripción atributo Tipo de
dato
Audiencia
(Población objetivo) Representa la población objetivo a la que va dirigido el recurso String
Contexto Representa el contexto de aprendizaje del recurso String
Dificultad Representa el nombre de la licencia del recurso String
Derechos
(licencia)
Representa el tipo de licencia del recurso y el vínculo con la descripción
de los términos de la licencia. String
LicenciaUri Representa la descripción o el url de la licencia String
Rango de edad Representa la edad a la que va dirigido el objetivo del recurso String
Frecuencia de
actualización Representa la frecuencia de actualización o revisión del recurso String
Fecha
actualización Representa la fecha de la última actualización del recurso Date
Tipos de
evaluación que
maneja el recurso
Representa el tipo de evaluación del recurso String
Tabla 4: Atributos definidos para recursos educativos. Elaborado por autor
5.3.2. Desarrollo etapa 3: limpiar
Aunque es una parte importante en el desarrollo de la publicación, y está definida dentro de la
metodología, no la abordamos como tal en el desarrollo por considerarla complementaria en
casos donde los datos no son generados desde la estructura de datos propuesta.
68
5.3.3. Desarrollo etapa 3: modelar
Esta etapa se desarrolla en dos fases.
Fase 1: Modelo de dominio
Para iniciar con la fase de modelado inicialmente se recomienda listar las relaciones
encontradas, en la siguiente tabla se presentan dichas relaciones.
ENTIDAD1 RELACIÓN ENTIDAD 2 RELACIÓN2 ENTIDAD 3
REDA Tiene un titulo es título de REDA
REDA Tiene un idioma es idioma de REDA
REDA Tiene un resumen es resumen de REDA
REDA Tiene un tema es tema de REDA
REDA Tiene un versión es versión de REDA
REDA Tiene un autor es autor de REDA
REDA Tiene un email es email de creador
REDA Tiene un coautor es coautor de REDA
REDA Tiene un publicador es publicador de REDA
REDA Tiene un fecha es fecha de REDA
REDA Tiene un frecuencia es frecuencia de
actualización de REDA
REDA Tiene un actualización fecha de actualización de REDA
REDA Tiene un formato es el formato de REDA
REDA Tiene un URI es URI de REDA
REDA Tiene un requerimiento es requerimiento de REDA
REDA Tiene un instrucción es instrucción de
instalación de un REDA
69
ENTIDAD1 RELACIÓN ENTIDAD 2 RELACIÓN2 ENTIDAD 3
REDA Tiene un interactividad es el nivel de
interactividad de un REDA
REDA Tiene un tipo es el tipo de recurso de un REDA
REDA Tiene un nivel
interactividad
es el nivel de
interactividad de un REDA
REDA Tiene un audiencia es la audiencia de un REDA
REDA Tiene un contexto es el contexto de un REDA
REDA Tiene un nivel dificultad es el nivel de dificultad
de un REDA
REDA Tiene un edad es la edad al que va
dirigido un REDA
REDA Tiene un derechos es el tipo de licencia de
un REDA
REDA Tiene un URI derechos es el URI de un tipo de
licencia REDA
Tabla 5: Relaciones entre los elementos del dominio. Elaborado por autor
Presentamos la siguiente figura que muestra la relación de algunos de los atributos con los
recursos con la entidad recursos educativos.
70
Figura 16: Relación de recursos educativos con metadatos. Elaborado por autor
Utilizamos protege para modelar de otra manera relación del recurso con sus atributos
utilizando una herramienta donde se muestra la relación que tienen cada uno de los metadatos
con el recurso.
Figura 17: Modelo de datos en protegé. Elaborado por autor
71
Fase 2: Identificar cuáles de los atributos tienen relaciones con datos externos
De los 25 atributos seleccionados, definimos 11 candidatos a tener relaciones con datos
externos, estos se presentan en la siguiente tabla.
Nombre
atributo
Posible
Enlace
Tipo de
dato Ejemplo Diligenciamiento
Idioma
Se puede
enlazar con
lista de
vocabularios
Iso639-3
String spa Manual
Palabras
Clave
Se puede
enlazar por
tema con
Dbpedia,
Europeana
String
Mercadeo - administración de
empresas - emprendimiento -
administración de mercados
Manual
Creador
Se puede
enlazar con
base de datos
docentes o
redes sociales
String Morales Camacho, Rocío Manual
Publicador
Se puede
enlazar con
base de datos
docentes o
redes sociales
String Pontificia Universidad
Javeriana Manual
72
Nombre
atributo
Posible
Enlace
Tipo de
dato Ejemplo Diligenciamiento
Colaborador
Se puede
enlazar con
base de datos
docentes o
redes sociales
String Valencia, Tatiana Manual
Formato
Se puede
enlazar con
media types
mime
String text/html
Comprimido (zip, rar,
tar, gz) - Página web (Htm,
html) - Documento portable
(pdf) - Película de Flash
(swf) - Imagen (jpg, gif,
png) - Video (wmv, avi,
mov, mpg) - Audio
(wav,mp3) - Ejecutable
(exe) - Otro
Localización
(URI)
identificador
Es un
enlace natural
del recurso
String http://hdl.handle.net/11522/100
34
Manual
Tema
Se puede
enlazar por
tema con
Dbpedia,
Europeana
String Mercadeo Manual
Tipo
Enlazar
con dataset de
recursos
String Objeto de aprendizaje
Textual - sonoro - visual
- Audivisual - Multimedia -
Curso Virtual - Aplicación -
Objeto de Aprendizaje
73
Nombre
atributo
Posible
Enlace
Tipo de
dato Ejemplo Diligenciamiento
educativos en
campo tipo
Audiencia
(Población
objetivo)
Enlace con
dataset de
grupos
poblacionales
String Estudiante de Educación
Superior
Estudiantes Educación
Superior, Docentes,
investigadores
LicenciaUri
Enlace
manual con
tipo de
licencia CC
String
http://creativecommons.org/license
s/by-nc-nd/2.5/co/
Manual
Tabla 6: Atributos candidatos a ser relacionados con otros dataset. Elaborado por autor
5.3.4. Desarrollo etapa 4: generar
Esta etapa la desarrollamos en dos fases:
Fase 1. Representación del modelo en un lenguaje
Basándonos en la definición de vocabularios de distintos repositorios educativos, hemos
definido que el vocabulario candidato para las distintas entidades, atributos y relaciones es
DublinCore por su versatilidad a la hora de poder describir los recursos, en el anexo 3 podrá
encontrar una tabla con una descripción más amplia de los tags seleccionados.
74
Fase 2: Construcción del dataset
Para esto y de acuerdo a los vocabularios seleccionados y las propiedades seleccionadas,
hemos construido un esquema base que describe recursos con propiedades comunes para poder
realizar una prueba de consulta.
El dataset es construido bajo el siguiente concepto de tripleta (sujeto, predicado y objeto).
Figura 18: Representación de estructura de triplete del dataset. Elaborado por autor
Bajo la anterior representación se plantea el esquema RDF por recurso como se muestra en la
siguiente figura donde se describe un recurso con cada uno de sus metadatos y la información
que contienen.
Figura 19: Pantalla validador RDF. Tomado por autor
75
Una vez validado debemos convertirlo a formato RDF/XML a formato turtle (.ttl) por
requerimientos del gestor donde cargaremos el dataset. Para esto podemos utilizar el servicio de
http://www.easyrdf.org/converter o cualquier servicio que permita hacer la conversión.
Figura 20: Pantalla conversión RDF a Turtle. Tomado por autor
Una vez tengamos listo nuestro dataset en formato turtle, se carga en el gestor de datasets el
cual es FUSEKI. Después de realizar la carga del dataset, realizamos la prueba de consultas con
una consulta predeterminada la cual nos muestra las primeras 25 tripletas. Con este paso
confirmamos que los datos quedaron bien cargados en el gestor.
76
Figura 21: Pantalla Fuseki consulta. Tomado por autor
5.3.5. Desarrollo etapa 5: enlazar
En la fase 2 de la etapa 3 se definieron 11 atributos candidatos a vinculación, los demás
atributos son tomados como literales. Para efectos prácticos mostraremos como realizar esta
reconciliación de los atributos con otros datasets a través de los tesauros más conocidos como
son DBpedia y SKOS, la vinculación la podemos hacer apoyándonos en una herramienta de
reconciliación como Openrefine o realizando la búsqueda manual en los tesauros candidatos e
insertando manualmente el URL apropiado.
Enlace apoyado por herramienta de reconciliación:
En esta parte utilizamos la herramienta OpenRefine con su complemento RDF, las
instrucciones de instalación y el paso a paso para la reconciliación se encuentran ejemplificados
en el siguiente enlace https://www.youtube.com/watch?v=SSDndvFkQdY&list=LLX0_eSjui1-
gNImaWAl9Yqw&index=3&t=0s
77
Cargamos el dataset de prueba, creamos un nuevo proyecto y agregamos un servicio de
reconciliación que para efectos prácticos de nuestra metodología será DBpedia.
Figura 22: Pantalla configuración servicio de reconciliación datos en OpenRefine. Tomado por autor
Una vez agregado el servicio procedemos a reconciliar una de las columnas que en este caso
será el atributo de formato, dando click en iniciar como se muestra la imagen.
Figura 23: Pantalla reconciliación datos OpenRefine por campo. Tomado por autor
78
Luego elegimos la opción del tesauro con el cual se va a reconciliar, esperamos el proceso y
en algunos casos tendremos que intervenir para elegir una de las opciones que nos del programa
ya que la coincidencia puede no ser exacta, en los casos exactos se puede observar el vínculo
dando click en el atributo exacto sin listas de chequeo.
Figura 24: Pantalla resultado reconciliación campo en OpenRefine. Tomado por autor
Al dar click por ejemplo en MPEG podemos ver la página de DBpedia donde se define el
concepto de este tipo de formato.
79
Figura 25: Pantalla salida url recurso. Tomado por autor
Finalmente, la herramienta permite generar y exportar el archivo final RDF con los nuevos
datos vinculados.
Enlace manual:
Esta opción la podemos utilizar en caso de que tengamos previamente muy bien definidos los
enlaces. Para nuestro caso tenemos el atributo idioma que se puede expresar en el estándar
Iso639-3 y encontrar los vínculos clave en la siguiente página https://iso639-3.sil.org
Los más utilizados son:
• Español https://iso639-3.sil.org/code/spa
• Ingles https://iso639-3.sil.org/code/eng
• Alemán https://iso639-3.sil.org/code/deu
• Francés https://iso639-3.sil.org/code/fra
• Portugués https://iso639-3.sil.org/code/por
80
• Italiano https://iso639-3.sil.org/code/ita
Estos vínculos deben ser cargados manualmente en el archivo RDF en el atributo idioma.
5.3.6. Desarrollo etapa 6: publicar
Como se mostró en etapas anteriores, hemos seleccionado como gestor de recursos vinculados
el gestor FUSEKI, dicho gestor requiere que el dataset publicado se presente en formato turtle.
Adicionalmente para esto hemos enriquecido los atributos idioma, tema, publicador y formato
con información vinculada a tesauros relacionados.
En la siguiente imagen se puede ver la consulta realizada al nuevo dataset enriquecido.
Figura 26: Pantalla consulta sparql dataset vinculado. Tomado por autor
Para simular la exposición del dataset, vamos a simular una consulta externa a FUSEKI, para
esto vamos a verificar que el gestor que en la pestaña info la información que se muestra sobre
los servicios disponibles, en el parámetro “Graph Store Protocol” se encuentre el método GET.
81
Como las consultas sparql no funcionan muy bien cuando se ejecutan externamente dado que el
query viaja a través del protocolo http, el query debe viajar en un formato que el protocolo pueda
entender, por lo tanto, dicha consulta debe codificarse.
Para codificar la consulta se puede usar un codificador de porcentajes como el que se muestra
en la figura 28 y se encuentra disponible en https://www.url-encode-decode.com/
Figura 27: Pantalla codificador sparql protocolo http. Tomado por autor
Ingresamos la consulta en lenguaje sparql en la ventana izquierda y en la ventana derecha
aparece la consulta codificada, la cual copiamos.
Postman es una herramienta que permite simular consultas de consumo de datos en la web.
Cargamos la herramienta y seleccionamos el tipo de método que para este caso es “GET”.
82
Figura 28:Pantalla interfaz Postman. Tomado por autor
En frente al combo donde se seleccionó el método “Get”, se escribe la url a consultar, que en
este caso es http://localhost:8080/fuseki/Recursos3/query
Figura 29: Pantalla parámetro GET Postman, Tomado por autor
Donde,
• http://localhost:8080/fuseki/ corresponde al servidor fuseki
• http://localhost:8080/fuseki/Recursos3/ corresponde al endpoint a consultar
• http://localhost:8080/fuseki/Recursos3/query corresponde al servicio a realizar
83
En la sección de parámetros se escribe:
• Key -> el nombre del parámetro que obtendrá la respuesta (en minúscula). Para el
ejemplo se usó “query”.
• Value se coloca la consulta codificada que se copió del codificador de sparql
Figura 30: Pantalla parámetro KEY y VALUE Postman. Tomado por autor
Se selecciona el botón “send” y al recibir los resultados en la sección “Body”, éstos se pueden
ver en Pretty (donde se puede escoger entre diferentes formatos de destino), Raw, Preview
Figura 31: Pantalla resultado consumo Postman. Tomado por autor
84
Las aplicaciones externas recibirán un formato Json
Para consumirlos se pueden levantarlos o exponerlo al público a través de una serie de
servicios, donde cada servicio respondería una consulta especifica en sparql
Con esto finalizamos la etapa de publicación y se muestra el uso de la metodología propuesta.
CAPITULO VI RESULTADOS OBTENIDOS
A continuación, mostramos el planteamiento metodológico aplicado al caso de estudio
planteado para el repositorio de recursos educativos de la Universidad Distrital Francisco José de
Caldas.
De acuerdo con nuestra investigación sobre repositorios institucionales y como ya lo
mencionamos anteriormente, DSpace es considerado como una de las mejores opciones pues
permite el desarrollo y definición de estructuras sintácticas y semánticas personalizados.
(Ministerio de Educación Nacional, 2011).
Por tal razón antes de iniciar el proceso es indispensable realizar la instalación de este
repositorio que para nuestro caso se realizará localmente para efectos de simulación de un
repositorio institucional.
La instalación de dicho repositorio puede realizarse con el manual de instalación publicado en
el siguiente enlace https://www.researchgate.net/publication/323203183
El repositorio nos proveerá en primera instancia de una interfaz para estructurar los esquemas
de metadatos definidos, por defecto DSpace trabaja con el esquema de metadatos Dublín Core
85
pero también nos permite mediante configuraciones crear combinaciones de varios esquemas.
También DSpace nos proveerá de direcciones URIs validas sobre los recursos publicados.
A partir de la estructura educativa institucional de la Universidad Distrital, se presentan
nombres de ejemplo para la taxonomía del repositorio simulando la estructura de un repositorio de
recursos educativos (Ver figura 33).
Figura 32: Taxonomía del repositorio. Tomado por autor
IMPLEMENTACION DE METODOLOGÍA EN CASO DE ESTUDIO
6.1.1. Caso de estudio etapa 1: determinar
En esta etapa vamos a iniciar con la información definida en el capítulo anterior sobre la
identificación del dominio y lo complementaremos con la definición de los interesados en el
dominio de la publicación de recursos educativos.
Como interesados se define a todas las instituciones de educación superior que deseen
implementar un método para la publicación de recursos utilizando Linked Data, para este caso al
ser un caso de estudio específico se define como interesado a la Universidad Distrital y como
Facultad
Comunidad
Proyecto curricular
Sub Comunidad
Área
Colección
RecursoItem
86
institución colaboradora o experto en el dominio a la Pontificia Universidad Javeriana con sede en
Bogotá, la cual nos permitió realizar una entrevista sobre la implementación de su repositorio
institucional lo cual nos sirvió como base para implementar el caso de estudio. La entrevista está
disponible en la sección de anexos de este documento como anexo 2.
También como complemento se caracterizaron uno a uno los metadatos seleccionados bajo el
siguiente esquema.
Categoría General
Item 1.4
Descripción Representa una palabra clave o frase que describe el tema del recurso
Nombre DC dc:subject
Obligatoriedad Obligatorio
Diligenciamiento Manual
Mínimo
permitido 4
Máximo
permitido 6
Recomendación
*Primeras letras de las palabras en mayúscula las demás en minúsculas mínimo
cuatro
(4) máximo seis (6) deben aparecer en columna no en fila, si aparecen en fila es
porque el Autor
ingreso todas las palabras clave en una sola casilla. Debe ser una palabra clave por
casilla, Remitirse a temas definidos por UNESCO o definidos en el Pensum
Universitario
Mapeado X
Nombre Mapeado subject
Tabla 7: Caracterización de metadato. Elaborado por autor
87
La lista de metadatos completa se puede consultar en la sección de anexos de este documento
como anexo 4.
6.1.2. Caso de estudio etapa 2: limpiar
La etapa de limpieza se considera como la etapa donde de los datos RDF deben ser construidos
o adaptados. Si los datos se deben cargar manualmente en el archivo, este debe irse construyendo
tripleta a tripleta acorde a las restricciones de construcción definidas anteriormente. Si los datos
vienen de un gestor de recursos, como es el caso de DSpace.
6.1.3. Caso de estudio etapa 3: modelar
La etapa de modelado para recursos educativos también se expone en el capítulo anterior y su
resultado se utiliza como insumo para el caso de estudio. Sin embargo, la herramienta utilizada
para alojar los recursos (DSpace) provee también la información necesaria para definir las
relaciones entre las entidades por medio de la definición de su propia ontología.
6.1.4. Caso de estudio etapa 4: generar
Es desde hasta fase donde realmente la herramienta nos provee una infraestructura para capturar
metadatos, trabajar con vocabularios reconocidos y definir mapeos.
Como se mencionó anteriormente Dspace nos permite definir una estructura taxonómica de los
recursos. Ver figura 15.
88
Figura 33: Pantalla estructura repositorio. Tomado por autor
La herramienta nos permite trabajar con vocabularios predefinidos como DublinCore y crear
calificadores adicionales sobre el vocabulario a través de una serie de accesos a archivos fuente de
configuración.
Al tener definidos los metadatos en las etapas de determinación y modelado, procedemos a
crearlos manualmente en DSpace, para esto, una vez que ingresemos al repositorio con
permisos de administrador vamos al menú “Administer”
Figura 34: Pantalla acceso administrador DSpace. Tomado por autor
89
Luego debemos ir a la opción “General Settings” y seleccionamos la opción “Metadata
Registry”
Figura 35: Pantalla acceso registro metadatos DSpace. Tomado por autor
Una vez esté en el menú de metadatos seleccione la opción 1 dcmi-terms
Figura 36: Pantalla esquema de metadatos DSpace. Tomado por autor
En esta opción, primero va a validar los metadatos útiles (creator) de acuerdo a la definición de
metadatos anterior y después debe definir los metadatos faltantes (creator.email)
Figura 37: Pantalla metadatos DSpace. Tomado por autor
90
Para crear un metadato nuevo basado en el namespace dc vaya hasta la parte final de la página
para definirlo e incluirlo con el botón Add New.
Figura 38: Pantalla adición de metadatos DSpace. Tomado por autor
Una vez validado que todos los metadatos necesarios están definidos en el namespace, vaya al
archivo imput_forms.xml ubicado en X:\dspace\config
Figura 39: Pantalla archivo configuración de formulario DSpace. Tomado por autor
En este archivo podrá definir uno a uno los campos para la captura de información de cada
recurso que se muestra como formulario cada vez que se agrega un recurso en DSpace.
91
Figura 40: Pantalla creación de campos formulario DSpace. Tomado por autor
Para el mapeo DSpace nos proporciona un archivo que define un mapeo a un grafo RDF
preestablecido en el archivo metadata-rdf-mapping.ttl ubicado en D:\dspace\config\modules\rdf
Figura 41: Pantalla archivo mapeo DSpace. Tomado por autor
En dicho archivo definimos la sintaxis de cada una de los metadatos establecidos, en el archivo
existen varios ejemplos para definir además la característica para que dataset se defina con campos
de URL. En esta fase hemos definido y verificado el mapeo de los metadatos establecidos.
Figura 42:Pantalla ejemplo creación de mapeos en DSpace. Tomado por autor
92
En este punto podemos utilizar la herramienta para cargar recursos e ingresar los metadatos.
Para cargar un recurso en el repositorio vamos a la opción “My DSpace” y luego damos click
en el botón “Start a New Submission”
Figura 43: Pantalla inicio de carga de recurso DSpace. Tomado por autor
Una vez entremos seleccionamos la colección de acuerdo a la estructura creada que para este
caso es la colección programación, perteneciente a la subcomunidad Ingeniería de Sistemas
contenida en la comunidad Recursos Educativos Facultad de Ingeniería. Damos click en el botón
next.
Figura 44: Pantalla selección colección para carga de recursos en DSpace. Tomado por autor
Cargamos los metadatos solicitados en el formulario.
93
Figura 45: Pantalla ingreso de metadatos del recurso en DSpace. Tomado por autor
Cargamos el recurso
Figura 46: Pantalla carga de metadatos del recurso satisfactoria en DSpace. Tomado por autor
Verificamos que la información de metadatos esté correcta.
Figura 47: Pantalla verificación de ingreso de información del recurso en DSpace. Tomado por autor
Validamos los términos de licencia y finalizamos la carga del recurso.
94
Figura 48: Pantalla carga de información del recurso completa en DSpace. Tomado por autor
Para construir el dataset DSpace dispone de un comando que genera el archivo RDF necesario
de acuerdo a las reglas definidas en el archivo de mapeo metadata-rdf-mapping.ttl. Una vez
tengamos nuestros recursos educativos cargados procedemos a ejecutar el comando RDFizer como
se muestra en la siguiente imagen donde se puede apreciar cómo va generando cada uno de los
grafos.
Figura 49: Pantalla ejecución comando RDFIZER. Tomado por autor
95
Para validar la correcta construcción del dataset debemos nuevamente recurrir a la herramienta
FUSEKI, solo que en este caso en vez de cargar el dataset de forma manual, lo realizamos
conectando el servicio a la base de datos de DSpace. Como resultado de esta conexión se puede
visualizar en FUSEKI cada uno delos grafos RDF en formato turtte generados al ejecutar el
comando rdfizer.
Figura 50: Pantalla visualización de grafo en Fuseki. Tomado por autor
6.1.5. Caso de estudio etapa 5: enlazar
Como se ha mencionado anteriormente esta etapa es complementaria Esta etapa es complementaria
a la fase 2 de la etapa 6 “Identificar cuáles de los atributos tienen relaciones con datos externos”.
En el archivo de mapeo definimos los campos que son candidatos a ser vinculados.
96
Figura 51; Pantalla edición mapeo en archivo metadata-rdf-mapping.ttl. Tomado por autor
Adicionalmente debemos editar el archivo dspace.cfg ([d]:\dspace\config\dspace.cfg) como se
muestra en la siguiente imagen donde se define el parámetro (link) a los atributos que se deben
mostrar como url.
Figura 52: Pantalla edición archivo dspace.cfg muestra item como link. Tomado por autor
Realizando nuevamente el proceso con el comando rdfizer, visualizando los grafos y ejecutando
una consulta en sparql se debe visualizar lo siguiente.
97
Figura 53: Pantalla visualización de datos cargados desde DSpace en fuseki con datos vinculados. Tomado por autor
Cabe aclarar que esto es solamente para generar las características necesarias para que el campo
se visualice en el dataset como url vinculado. El proceso de enlazado con otros dataset puede
realizarse manualmente al cargar los metadatos del recurso.
6.1.6. Caso de estudio etapa 6: Publicar
Finalmente podemos exponer el dataset y realizar una consulta externa simulada con la
herramienta Postman como se mostró en el capítulo anterior y como se muestra a continuación.
Para consumirlos se pueden levantarlos o exponerlo al público a través de una serie de servicios,
donde cada servicio respondería una consulta especifica en sparql.
98
Figura 54: Pantalla visualización consumo de datos desde herramienta Postman. Tomado por autor
DISCUSION DE RESULTADOS
Esta metodología es una propuesta sencilla para que cualquier usuario con conocimientos
básicos en LOD pueda realizar fácilmente un proceso de publicación de recursos. Algunas
propuestas para publicación como las de (Radulovic, 2015) y (Southwick, 2015) que se enfocan
en el modelo ontológico y en el licenciamiento y aunque plantean etapas similares, al igual que
otras propuestas no detallan un procedimiento fácilmente implementable para un usuario que se
inicie en el mundo de la publicación de recursos. Consideramos que esta propuesta puede guiar
al usuario fácilmente hacia el objetivo de la publicación de recursos a partir de los pasos
definidos.
En (Kučera, 2015) nos parece interesante el enfoque planteado ya que va más allá de la
publicación y presenta una propuesta desde la planeación y la gestión para publicación de
recursos, teniendo en cuenta su mantenimiento y estableciendo roles que se ocupan de cada una
de las tareas propuestas en sus etapas.
99
En nuestra propuesta, no se ha realizado un énfasis especial en la calidad y la confianza de los
datos como si se encuentra en por ejemplo (Knap, 2012) y (Zhao, 2010) ya que es meramente
experimental y aunque su objetivo es precisamente establecer recomendaciones, también lo es el
de evidenciar en primera instancia el proceso neto de publicación. Por ende, la etapa de limpieza
no ha sido tan desarrollada como las demás etapas.
Dentro de las recomendaciones generales hacia el caso de estudio mencionamos las siguientes:
• Es importante que la Universidad cuente con una celda de producción de diseñe y
construya los recursos educativos. Dicha unidad debe definir los metadatos necesarios
y sobre todo documentarlos de forma adecuada y correcta y completa de acuerdo a las
recomendaciones realizadas en cada una de las etapas de nuestra propuesta.
• Por otro lado, se debe establecer una continua capacitación con talleres que aborde
aspectos prácticos de la generación de LOD.
• Incluir en el pensum universitario el desarrollo de trabajos o entregables enfocado a la
producción de estos recursos puede motivar el desarrollo y la expansión del repositorio
institucional, asi como el trabajo colaborativo entre alumnos y docentes.
•
CAPITULO VII CONCLUSIONES
Les falta contenido: se pudo llevar a cabo la aplicación de la metodología? que aportó? Se puede
extrapolar a otros dominios de conocimiento? Se puede aplicar con otras entidades? Qué aporto
de buensa prácticas y recomendaciones?
100
Consideramos que se cumple con los objetivos planteados, los cuales fueron en general, realizar
una exploración sobre las metodologías existentes, identificar los componentes requeridos para la
publicación, proponer un conjunto de recomendaciones que si bien no es amplio cumple con el
propósito de verificación y finalmente implementar un caso de prueba para la Universidad Distrital
Francisco José de Caldas.
El proceso de publicación no es sencillo y requiere de mucha documentación y práctica, sin
embargo, nuestra propuesta puede alentar al estudio de la estructuración no solo de departamentos
que gestionen el proceso sino de promover la investigación y la innovación en este campo.
Como trabajo futuro se propone más desarrollo sobre cada una de las etapas que permita
afianzar aún más el proceso de publicación, realizando un enfoque especial en la calidad y
confianza de los datos.
101
BIBLIOGRAFÍA
Auer, S., Bizer, C., Kobilarov, G., Lehmann, J., Cyganiak, R., & Ives, Z. (2007). DBpedia: A
nucleus for a Web of open data. Lecture Notes in Computer Science (Including Subseries
Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 4825
LNCS, 722–735. Retrieved from: http://doi.org/10.1007/978-3-540-76298-0_52
Bauer, F., & Kaltenböck, M. (2012). Linked Open Data: The Essentials A Quick Start Guide for
Decision Makers. Retrieved from https://www.reeep.org/LOD-the-Essentials.pdf
Berlanga, A. J., López, C., M., & E. y Peñalvo, F. J. (2005). Consideraciones para reforzar el
valor de los metadatos en los objetos de aprendizaje (OA). Salamanca. Universidad de
Salamanca. Depto. de Informática y Automática.
Berners-Lee, T., Fielding, R., & Masinter, L. (2005). Uniform Resource Identifier (URI):
Generic Syntax. https://doi.org/10.17487/rfc3986
Bizer, C., & Heath, T. (2009). Linked Data - The Story So Far. In International Journal on
Semantic Web and Information Systems. Retrieved from http://linkeddata.org/docs/ijswis-
special-issue
Botero Cabrera, C. (2010). Conferencia de la Red Pila en Panamá. Recuperado el 9 de abril de
2019, de Carobotero-co | Fundación Karisma (Diapositiva N° 16):
http://www.slideshare.net/ slideshow/embed_code/8522867 referenciado desde:
http://www.karisma.org.co/carobotero/?s=recurso+e ducativo&submit=Go
102
Caplan, P (2003). Metadata Fundamentals for All Librarians. American Library Association,
Chicago (2003)
Creative Commons. (2009). Licencias (Tipos de). Recuperado el 9 de abril de 2019, de Creative
Commons, Colombia: https://co.creativecommons.org/?page_id=13
Daudinot, I. (2006). Organización y recuperación de información en internet: Teoría de los
metadatos. Revista Cubana de Información En Ciencias de La Salud, 14, 16. Retrieved
from
http://eprints.rclis.org/9246/1/http___bvs.sld.cu_revistas_aci_vol14_5_06_aci06506.htm.
Díaz, F., Joyanes, L., & Medina, V. (2009). Taxonomía, ontología y folksonomía, ¿qué son y qué
beneficios u oportunidades presentan para los usuarios de la web? Universidad Empresa,
(February 2017). Retrieved from
http://www.urosario.edu.co/Administracion/documentos/publicaciones/edicion_16/09Rev
Univer-Empresa16_FDiaz.pdf
Fernández, B. (2006). Especificaciones y estándares en e-learning. Revista de Tecnologías de La
Información y Comunicación Educativas, 6(1696-0823), 32. Retrieved from
http://reddigital.cnice.mec.es/6/Articulos/articulo_resumen.php?articulo=2
Free Software Foundation. (2012). Licencias - Proyecto GNU. Recuperado el 10 de abril de
2019, de GNU Operating System: http://www.gnu.org/licenses/licenses.html
Gruber, T, (1993). Toward Principles for the Design of Ontologies Used for Knowledge Sharing
Technical Report KSL- 93-04, Knowledge Systems Laboratory, Stanford University, CA
103
Hernández-Pérez, T., & García-Moreno, M.-A. (2013). Datos abiertos y repositorios de datos:
nuevo reto para los bibliotecarios. El Profesional de La Informacion, 22(3), 259–263.
https://doi.org/10.3145/epi.2013.may.10
Klímek, J. and Škoda, P. (2017). LinkedPipes ETL in use: practical publication and consumption
of linked data. In Proceedings of the 19th International Conference on Information
Integration and Web-based Applications & Services (iiWAS '17), Maria Indrawan-
Santiago, Matthias Steinbauer, Ivan Luiz Salvadori, Ismail Khalil, and Gabriele Anderst-
Kotsis (Eds.). ACM, New York, NY, USA, 441-445. DOI: https://doi-
org.ezproxy.javeriana.edu.co/10.1145/3151759.3151809
Konstantinou, N., Spanos, D. E., Houssos, N., & Mitrou, N. (2014). Exposing scholarly
information as Linked Open Data: RDFizing DSpace contents. Electronic Library, 32(6),
834–851. https://doi.org/10.1108/EL-12-2012-0156
López, E. (2016). Modelo integral para la construcción de repositorios Institucionales que
alojen Recursos Educativos Abiertos, bajo la metodología de sistemas suaves
(Universidad Autónoma del Estado de México). Retrieved from
http://ri.uaemex.mx/bitstream/handle/20.500.11799/65511/Tesis de Maestría Modelo
integral para la construcción de repositorios institucionales que alojen REA bajo
SSM.pdf?sequence=4&isAllowed=y
Metros, S. E. (2002). Acerca de MERLOT (Autor citado desde: Learning Objects in Higher
Education. Susan E. Metros. EDUCASE, Center for applied Research. Research Bulletin:
Volumen 2002 Issue 19) en: Criterios de Calidad de un Objeto de Aprendizaje.
Recuperado el 12 de abril de 2012, de Colombia Aprende - Docentes de Superior -
104
Objetos Virtuales de Aprendizaje e Informativos: http://www.colombiaaprende.edu.co/
html/directivos/1598/article-99413.html
Ministerio de Educación Nacional. (2012). Recursos Educativos Digitales Abiertos Colombia.
In Sistema Nacional de Innovación Educativa con Uso de TIC.
http://186.113.12.159/Documentacion/LibroREDA.pdf
Ministerio de Educación Nacional. (2006b). ¿Qué es un Objeto Virtual de Aprendizaje?
Recuperado el 12 de abril de 2012, de Colombia Aprende - Docentes de Superior -
Objetos Virtuales de Aprendizaje e Informativos: http://www.
colombiaaprende.edu.co/html/directivos/1598/ article-172369.html
Ministerio de Educación Nacional. (2011). RECURSOS EDUCATIVOS DIGITALES ABIERTOS.
Estado del Arte, Contexto Nacional de Objetos de Aprendizaje. 61. Retrieved from
http://nuestroscursos.net/lms/pluginfile.php/749/mod_resource/content/0/contexto/01_Est
ado_del_Arte_-_Contexto_Nacional.pdf
Ministerio de Educación Nacional. (2011b). Orientaciones para el diseño, producción e
implementación de cursos virtuales. Documento de trabajo, Bogotá D.C.
Open Refine. (2018). Open Refine: a free, open source, powerful tool for working with messy
data. Página web http://openrefine.org/ consultado el 15 de agosto de 2019 obtenido de
https://cr8ive.cf/2018/05/23/open-refine-a-free-open-source-powerful-tool-for-working-
with-messy-data/
Palma, H. L. (2016). La semántica. Enciclopedia de Lingüñistica Hispánica, 1, 1–22. Retrieved
from https://www.udc.es/grupos/ln/investigadores/LopezPalmaPub/hLP-Semantica.pdf
105
Prud, E., Seaborne, A., & Laboratories, H. (2012). SPARQL Lenguaje de consulta para RDF.
Retrieved from SKOS website: http://skos.um.es/TR/rdf-sparql-query/
Radulovic, F., Poveda-Villalón, M., Vila-Suero, D., Rodríguez-Doncel, V., García-Castro, R., &
Gómez-Pérez, A. (2015). Guidelines for Linked Data generation and publication:
An example in building energy consumption. Automation in Construction, 57,
178–187. https://doi.org/10.1016/j.autcon.2015.04.002
RDF, G. d. (2014). W3C Semantic Web. Obtenido de https://www.w3c.org/RDF/
Rob, J. (2013). Encontrar un recurso educativo. Los metadatos. ISSUU. Recuperado de
https://issuu.com/roblamas/docs/tema2encontrar_un_recurso_educativo
Ruiz, J. E. C. (2015). PROTOTIPO ONTOLÓGICO PARA REPRESENTACIÓN DE OBJETOS
DE SIMULACIÓN INTERACTIVA APLICADO A ENTORNOS DIGITALES DE
APRENDIZAJE. (Mm), 41–57. Retrieved from
http://repository.udistrital.edu.co/handle/11349/7133
Senso, J. A., & Arroyo Machado, W. (2018). La publicación en Linked Data de registros
bibliográficos: modelo e implementación. Revista Española de Documentación
Científica, 41(4), 217. https://doi.org/10.3989/redc.2018.4.1535
Sicilia, M. A., & García, E. (2003). On the concepts of usability and reusability of learning
objects. International Review of Research in Open and Distance Learning, 4(2), 26–38.
Retrieved from http://www.irrodl.org/index.php/irrodl/article/viewFile/155/702
106
Sifaqui, C. Cifuentes-Silva, F. Labra-Gayo, J. E. (2011). Towards an Architecture and Adoption
Process for Linked Data Technologies in Open Government Contexts: A Case Study for
the Library of Congress of Chile (pp. 79–86). New York, NY, USA: ACM.
http://doi.org/10.1145/2063518.2063529
Soto, J., Garcia, E., & Sánchez, S. (2006). Repositorios Semánticos para Objetos de Aprendizaje.
Expolearning2006.
Studer S, Benjamins R., and Fensel D., (1998). Knowledge Engineering: Principles and
Methods, Data and Knowledge Engineering, 25, 161-197
Tello, A. (2014). Ontologías en la Web Semántica. I Jornanda de Ingeniería Web ’01, (July), 2–
5. Retrieved from
https://www.researchgate.net/publication/254438615_Ontologias_en_la_Web_Semantica
/download
Terziyan, V., & Kaykova, O. (2011). Towards "Executable Reality”: Business Intelligence on
Top of Linked Data. Cs.Jyu.Fi, 35(November), 26–33. https://doi.org/ISBN: 978-1-
61208-160-
UNESCO. (2011). A Basic Guide to Open Educational Resources: Frequently asked questions.
(A. Kanwar (COL), & S. Uvalic´-Trumbic´ (UNESCO), Edits.) Obtenido de The
Commonwealth of Learning (COL): http:// www.col.org/PublicationDocuments/Basic-
Guide- To-OER.pdf
Valencia, T., & Zapata, S. (2008). Estándar de Metadatos. Factores claves en la producción de
Objetos de Aprendizaje. Cali, Valle, Colombia.
107
W3C. (2011). W3C Guía Breve de Linked Data. Recuperado de
https://www.w3c.es/Divulgacion/GuiasBreves/LinkedData
W3C. (2014). W3C semantic web: Search engines. Retrieved from
http://www.w3.org/2001/sw/wiki/Category:Search_Engine
Wiley, D. A. (2000). Connecting Learning Objects to Instructional Design Theory: A definition,
a metaphor, a taxonomy. In The Instructional Use of Learning Objects: Online Version.
Retrieved from http://www.reusability.org/read/
Zaveri, A., Rula, A., Maurino, A., Pietrobon, R., Lehmann, J., & Auer, S. (2016). Quality
assessment for Linked Data: A Survey. Semantic Web, 7(1), 63–93.
https://doi.org/10.3233/SW-150175