Propuesta Metodológica Para La Publicación De Recursos...

PROPUESTA METODOLÓGICA PARA LA PUBLICACIÓN DE RECURSOS

DIGITALES EDUCATIVOS BASADO EN LINKED OPEN DATA. CASO DE ESTUDIO:

UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS

Diego Mauricio Cataño Peralta


FACULTAD DE INGENIERÍA

PROYECTO CURRICULAR DE INGENIERÍA DE SISTEMAS

BOGOTÁ, D.C

2019

II

PROPUESTA METODOLÓGICA PARA LA PUBLICACIÓN DE RECURSOS

DIGITALES EDUCATIVOS BASADO EN LINKED OPEN DATA. CASO DE ESTUDIO:


Presentado por:

Diego Mauricio Cataño Peralta

Cód. 2001020036

Proyecto de grado para optar por el título de Ingeniero de Sistemas

Modalidad Monografía

Director:

Ing. MSc. Jhon Francined Herrera Cubides

Profesor Facultad de Ingeniería


FACULTAD DE INGENIERÍA

PROYECTO CURRICULAR DE INGENIERÍA DE SISTEMAS

BOGOTÁ, D.C

2019

III

Tabla de Contenido

INTRODUCCIÓN .................................................................................................................. 11

CAPÍTULO I DESCRIPCIÓN DE LA INVESTIGACIÓN .............................................. 13

PLANTEAMIENTO DEL PROBLEMA ................................................................... 14

FORMULACIÓN DEL PROBLEMA ....................................................................... 15

SISTEMATIZACIÓN DEL PROBLEMA ................................................................. 15

JUSTIFICACIÓN ....................................................................................................... 17

HIPÓTESIS ................................................................................................................ 18

OBJETIVOS ............................................................................................................... 19

1.6.1. Objetivo General .................................................................................................................. 19

1.6.2. Objetivos específicos .......................................................................................................... 19

ALCANCE Y LIMITACIONES ................................................................................ 19

CAPITULO II FUNDAMENTACIÓN Y ESTADO DEL ARTE...................................... 20

MARCO TEÓRICO ................................................................................................... 20

2.1.1. Web semántica ..................................................................................................................... 20

2.1.2. Linked Data ............................................................................................................................ 22

2.1.3. Open Data ............................................................................................................................... 24

2.1.4. Clasificación de los datos abiertos ................................................................................ 25

2.1.5. Linked Open Data ................................................................................................................ 26

2.1.6. Recursos educativos abiertos ......................................................................................... 26

IV

2.1.7. Clasificación de los Recursos Educativos Digitales Abiertos .............................. 27

2.1.8. Metadatos y perfil de aplicación .................................................................................... 31

MARCO CONCEPTUAL .......................................................................................... 38

2.2.1. Semántica ............................................................................................................................... 38

2.2.2. Ontología ................................................................................................................................. 39

2.2.3. Taxonomía .............................................................................................................................. 39

2.2.4. Repositorio de recursos educativos ............................................................................. 39

CAPÍTULO III MARCO METODOLÓGICO ................................................................... 40

METODOLOGÍA DEL PROYECTO ........................................................................ 41

CAPITULO IV DESARROLLO DE LA INVESTIGACIÓN ........................................... 42

LEVANTAMIENTO DE INFORMACIÓN Y CONTEXTUALIZACIÓN DEL

OBJETO DE INVESTIGACIÓN ............................................................................................. 42

4.1.1. Revisión Bibliográfica ........................................................................................................ 43

4.1.2. Contextualización del objeto de investigación ......................................................... 48

COMPARACIÓN DE PROPUESTAS METODOLÓGICAS DE PUBLICACIÓN

DE DATOS ............................................................................................................................... 51

CAPITULO V PLANTEAMIENTO DE LA PROPUESTA METODOLOGICA DE

PUBLICACIÓN DE DATOS VINCULADOS ......................................................................... 56

PROPUESTA METODOLÓGICA PLANTEADA ................................................... 56

V

DESCRIPCIÓN DE CADA UNA DE LAS ETAPAS DE LA PROPUESTA

METODOLÓGICA PLANTEADA .......................................................................................... 57

5.2.1. Etapa 1: Determinar ........................................................................................................... 58

5.2.2. Etapa 2: Limpiar ................................................................................................................... 58

5.2.3. Etapa 3: Modelar .................................................................................................................. 60

5.2.4. Etapa 4: Generar .................................................................................................................. 61

5.2.5. Etapa 5: Enlazar ................................................................................................................... 63

5.2.6. Etapa 6: Publicar .................................................................................................................. 64

DESARROLLO DE ETAPAS DE METODOLOGÍA .............................................. 64

5.3.1. Desarrollo etapa 1: determinar ...................................................................................... 65

5.3.2. Desarrollo etapa 3: limpiar .............................................................................................. 67

5.3.3. Desarrollo etapa 3: modelar ............................................................................................ 68

5.3.4. Desarrollo etapa 4: generar ............................................................................................. 73

5.3.5. Desarrollo etapa 5: enlazar .............................................................................................. 76

5.3.6. Desarrollo etapa 6: publicar ............................................................................................ 80

CAPITULO VI RESULTADOS OBTENIDOS .................................................................. 84

IMPLEMENTACION DE METODOLOGÍA EN CASO DE ESTUDIO ................. 85

6.1.1. Caso de estudio etapa 1: determinar ........................................................................... 85

6.1.2. Caso de estudio etapa 2: limpiar.................................................................................... 87

6.1.3. Caso de estudio etapa 3: modelar ................................................................................. 87

VI

6.1.4. Caso de estudio etapa 4: generar .................................................................................. 87

6.1.5. Caso de estudio etapa 5: enlazar ................................................................................... 95

6.1.6. Caso de estudio etapa 6: Publicar ................................................................................. 97

DISCUSION DE RESULTADOS .............................................................................. 98

CAPITULO VII CONCLUSIONES ..................................................................................... 99

BIBLIOGRAFÍA .................................................................................................................. 101

VII

Lista de figuras

Figura 1: Composición conceptual de un Objeto de aprendizaje. Berlanga, 2005 .................. 17

Figura 2: Las capas de la Web Semántica. W3C, 2001 ........................................................... 21

Figura 3: Ejemplo Linked Data. W3C, 2011 ........................................................................... 23

Figura 4: Nube de Linked Data. W3C, 2011 ........................................................................... 23

Figura 5: Mapa conceptual Recurso Educativo Digital. Elaborado por el autor ..................... 31

Figura 6: Organización categorías LOM. Rob, 2013 ............................................................... 35

Figura 7: Esquema de los estándares LOM, Dublín Core y perfiles de aplicación. Rob, 2013 37

Figura 8: Fases de la metodología del proyecto, Elaborado por el autor ................................. 41

Figura 9: Artículos recuperados durante la búsqueda bibliográfica. Elaborado por autor ....... 45

Figura 10: Framework general para la publicación de recursos educativos en Linked data.

Piedra, 2014 .................................................................................................................................. 51

Figura 11: Tareas para generar el proceso de datos enlazados. Rodulovic, 2018 .................... 53

Figura 12: Tareas del proceso de publicación de datos enlazados. Radulovic, 2015 .............. 53

Figura 13: Vista de componentes de un repositorio de recursos educativos. Konstantinou,

2014............................................................................................................................................... 55

Figura 14: Etapas propuestas para la metodología de publicación de Recursos Educativos.

Elaborado por autor....................................................................................................................... 56

Figura 15: Tipos de recursos educativos digitales. Elaborado por autor ................................. 65

Figura 16: Relación de recursos educativos con metadatos. Elaborado por autor ................... 70

Figura 17: Modelo de datos en protegé. Elaborado por autor .................................................. 70

Figura 18: Representación de estructura de triplete del dataset. Elaborado por autor ............. 74

Figura 20: Pantalla validador RDF. Tomado por autor ............................................................ 74

VIII

Figura 21: Pantalla conversión RDF a Turtle. Tomado por autor ............................................ 75

Figura 22: Pantalla Fuseki consulta. Tomado por autor .......................................................... 76

Figura 23: Pantalla configuración servicio de reconciliación datos en OpenRefine. Tomado

por autor ........................................................................................................................................ 77

Figura 24: Pantalla reconciliación datos OpenRefine por campo. Tomado por autor ............. 77

Figura 25: Pantalla resultado reconciliación campo en OpenRefine. Tomado por autor ........ 78

Figura 26: Pantalla salida url recurso. Tomado por autor ........................................................ 79

Figura 27: Pantalla consulta sparql dataset vinculado. Tomado por autor............................... 80

Figura 28: Pantalla codificador sparql protocolo http. Tomado por autor ............................... 81

Figura 29:Pantalla interfaz Postman. Tomado por autor.......................................................... 82

Figura 30: Pantalla parámetro GET Postman, Tomado por autor ............................................ 82

Figura 31: Pantalla parámetro KEY y VALUE Postman. Tomado por autor ......................... 83

Figura 32: Pantalla resultado consumo Postman. Tomado por autor ....................................... 83

Figura 33: Taxonomía del repositorio. Tomado por autor ....................................................... 85

Figura 34: Pantalla estructura repositorio. Tomado por autor ................................................. 88

Figura 35: Pantalla acceso administrador DSpace. Tomado por autor .................................... 88

Figura 36: Pantalla acceso registro metadatos DSpace. Tomado por autor ............................. 89

Figura 37: Pantalla esquema de metadatos DSpace. Tomado por autor .................................. 89

Figura 38: Pantalla metadatos DSpace. Tomado por autor ...................................................... 89

Figura 39: Pantalla adición de metadatos DSpace. Tomado por autor .................................... 90

Figura 40: Pantalla archivo configuración de formulario DSpace. Tomado por autor ............ 90

Figura 41: Pantalla creación de campos formulario DSpace. Tomado por autor .................... 91

Figura 42: Pantalla archivo mapeo DSpace. Tomado por autor .............................................. 91

IX

Figura 43:Pantalla ejemplo creación de mapeos en DSpace. Tomado por autor ..................... 91

Figura 44: Pantalla inicio de carga de recurso DSpace. Tomado por autor ............................. 92

Figura 45: Pantalla selección colección para carga de recursos en DSpace. Tomado por autor

....................................................................................................................................................... 92

Figura 46: Pantalla ingreso de metadatos del recurso en DSpace. Tomado por autor ............. 93

Figura 47: Pantalla carga de metadatos del recurso satisfactoria en DSpace. Tomado por autor

....................................................................................................................................................... 93

Figura 48: Pantalla verificación de ingreso de información del recurso en DSpace. Tomado

por autor ........................................................................................................................................ 93

Figura 49: Pantalla carga de información del recurso completa en DSpace. Tomado por autor

....................................................................................................................................................... 94

Figura 50: Pantalla ejecución comando RDFIZER. Tomado por autor ................................... 94

Figura 51: Pantalla visualización de grafo en Fuseki. Tomado por autor ................................ 95

Figura 52; Pantalla edición mapeo en archivo metadata-rdf-mapping.ttl. Tomado por autor . 96

Figura 53: Pantalla edición archivo dspace.cfg muestra item como link. Tomado por autor .. 96

Figura 54: Pantalla visualización de datos cargados desde DSpace en fuseki con datos

vinculados. Tomado por autor ...................................................................................................... 97

Figura 55: Pantalla visualización consumo de datos desde herramienta Postman. Tomado por

autor .............................................................................................................................................. 98

X

Lista de Tablas

Tabla 1: Fuentes de datos automáticos consultadas. Elaborada por el Autor .......................... 44

Tabla 2: Número de artículos encontrados Fuente Vs Año de publicación. Elaborado por autor

....................................................................................................................................................... 46

Tabla 3: Instituciones educativas, repositorio y estándar de metadatos. Elaborado por el autor

....................................................................................................................................................... 49

Tabla 4: Atributos definidos para recursos educativos. Elaborado por autor .......................... 67

Tabla 5: Relaciones entre los elementos del dominio. Elaborado por autor ............................ 69

Tabla 6: Atributos candidatos a ser relacionados con otros dataset. Elaborado por autor ....... 73

Tabla 7: Caracterización de metadato. Elaborado por autor .................................................... 86

11

INTRODUCCIÓN

La gran cantidad de recursos digitales disponibles en Internet, podría aprovecharse de una

manera óptima si la ubicuidad se vuelve una de sus principales características, es decir, si se

procede con el enfoque de que los sistemas se intercomuniquen sin importar su campo de

aplicación y con el objetivo de que las tecnologías sean transparentes para los usuarios.

Hacia esto apunta lo que se conoce como la Web Semántica, la cual consiste en adicionar

metadatos a los recursos: esos datos adicionales que describen el contenido, el significado y la

relación de los datos. Los metadatos se deben proporcionar de manera formal, para dejar abierta

la posibilidad de que gestores de búsqueda los localicen, los reúsen y evalúen. El objetivo del uso

de los metadatos es enriquecer los resultados de las búsquedas realizadas, ampliando la

interoperabilidad entre los sistemas de información mediante una infraestructura común y de

cooperación, que permita compartir y reutilizar los datos a través de aplicaciones, empresas y

comunidades. A pesar de estas iniciativas tan amplias, actualmente sucede que cada sector trabaja

en el desarrollo de sus propios estándares de metadatos para la interoperabilidad de sus sistemas.

Este es el caso, por una parte, del sector bibliotecario, que promueve el uso de publicaciones

electrónicas y desarrollo sus bibliotecas digitales, mientras, por otra parte, el sector educativo

desarrolla Objetos de Aprendizaje y promueve la construcción de bancos de recursos; ambos con

el fin de facilitar a sus usuarios el acceso, uso y reutilización de los recursos disponibles.

El concepto de Objeto de Aprendizaje (Wiley, 2000) cuya estructura de información externa es

denominada metadato y describe los aspectos técnicos y educativos del objeto, aplicado a

materiales digitales creados como pequeñas piezas de contenido o de información con la finalidad

de maximizar el número de situaciones educativas en las que el recurso puede ser utilizado; ha

tomado auge, precisamente, bajo el enfoque de compartir recursos reutilizables en el ámbito

12

educativo. Un componente importante para la reutilización de un Objeto es que esté

adecuadamente descrito a través de sus correspondientes metadatos (Sicilia et al., 2003). Si los

metadatos utilizados se ciñen a los estándares propuestos, y se basan en tecnologías abiertas,

también las reutilizaciones de éstos toman un papel de gran valor para compartir información entre

bancos de Objetos. La consistencia semántica en la descripción de los recursos y la normalización

de los metadatos que cada elemento contenga, también son factores que posibilitan la reutilización

a través de sistemas de información.

Al clasificar y agrupar recursos digitales de información se obtienen colecciones digitales.

Internet cuenta con una gran variedad de ellas. Si estas colecciones están constituidas por Objetos

de Aprendizaje o de información y se organizan con un sistema descriptivo a través de metadatos,

es decir, si obedecen a un sistema de catalogación, además de proporcionar algunas estrategias y

mecanismos para la búsqueda y uso de la información (servicios): entonces, estamos ante la

presencia de bancos de Objetos. Los bancos de Objetos basan su acervo en Objetos de aprendizaje

e informativos, pero trascienden el concepto de recurso digital educativo, refiriéndose a todo tipo

de Objeto que provea información, como textos, imágenes, videos y animaciones, entre otros.

Con este proyecto se busca presentar información relevante sobre la Web Semántica,

específicamente sobre el proceso a realizar para llevar a cabo la estructuración de la información

que apoya la publicación de los recursos educativos digitales, entendida esta como los metadatos

que soportan el enriquecimiento de los recursos publicados. Por ende, se plantea el estudio de

estrategias de publicación de recursos, con el fin de plantear un conjunto de buenas prácticas y

recomendaciones para la adecuada estructuración y publicación de recursos educativos, basado en

tecnologías de Web Semántica, cuyo caso de estudio se plantea la Universidad Distrital Francisco

José de Caldas.

13

CAPÍTULO I DESCRIPCIÓN DE LA INVESTIGACIÓN

Las empresas e instituciones se han venido dando cuenta del potencial de los datos abiertos

vinculados (LOD) y comienzan a publicar sus propios datos como LOD. Sin embargo, publicar

LOD sigue siendo una tarea desafiante. Una de las razones principales es la falta de herramientas

fáciles de usar que respalden adecuadamente todo el proceso de publicación de LOD. El proceso

generalmente consiste en la extracción de datos de origen, la transformación a RDF, la alineación

con los vocabularios utilizados comúnmente, la vinculación con otros conjuntos de datos, la

computación de metadatos, la publicación en la web como un volcado, la carga en un almacén

triplico y el registro de la base de datos en un catálogo de datos (Klímek et al., 2017).

En la actualidad existen muchos datos publicados como datos vinculados (abiertos) (LOD /

LD). Al mismo tiempo, también hay una multitud de herramientas para la publicación de LD. Sin

embargo, los consumidores potenciales de LD todavía tienen dificultades para descubrir, acceder

y explotar LD. Esto se debe a que, en comparación con el consumo de formatos de datos

tradicionales, como los archivos XML y CSV, existe una clara falta de herramientas para el

consumo de LD. Los promotores de LD utilizan el conocido esquema de implementación de datos

abiertos de 5 estrellas para sugerir que el consumo de LD es una mejor experiencia una vez que el

consumidor conoce RDF y las tecnologías relacionadas. Esta sugerencia, sin embargo, se queda

corta cuando los consumidores buscan un soporte de herramientas apropiado para el consumo de

LD (Zaveri et al., 2016).

En este proceso de publicación y enriquecimiento, las personas encargadas de dicho proceso

han planteado como dificultades la falta de conocimiento requerido para llevar a cabo esta labor,

además de identificarse diferentes enfoques o estrategias para realizar el enriquecimiento de

publicación de recursos digitales. Aunado a esto, aunque en el mercado existen diferentes

14

herramientas que podrían apoyar el proceso, dichas herramientas ofrecen una curva de aprendizaje

bastante ambiciosa.

Por otro lado, con las diferentes políticas que se han venido gestando desde el Gobierno

Nacional acerca de incursionar en los datos abiertos, por parte de las instituciones públicas, aunado

a la incursión de la Universidad Distrital Francisco José de Caldas en el campo de la formación

virtual, se hace evidente la necesidad de gestar una metodología que le permita a la Universidad

poder llevar a cabo el proceso de enriquecimiento y publicación de los recursos educativos

digitales que ha venido empezando a producir.

Por último, es importante considerar que existen diferentes tipos de recursos educativos, que

varían desde recursos textuales hasta objetos de aprendizaje y aplicaciones para la educación. Para

llevar a cabo la publicación de estos recursos es necesario definir de forma adecuada, la metadata

que acompañará estos tipos de recursos. Lo anterior plantea la problemática de que no todos los

tipos de recursos digitales educativos consideran los mismos tipos de metadatos en su proceso de

publicación.

PLANTEAMIENTO DEL PROBLEMA

El contexto descrito anteriormente, y dada la emergente aparición de recomendaciones y

metodologías para la publicación de recursos digitales, algunas de ellas no tan claras; se plantea la

necesidad establecer un conjunto de recomendaciones y estrategias para llevar a cabo el

enriquecimiento y publicación de los recursos educativos digitales, producidos por la Universidad

Distrital Francisco José de Caldas. En consecuencia, este planteamiento hace necesario llevar a

cabo un proceso de revisión de las diferentes metodologías existentes, con el fin de extraer y

plantear recomendaciones más favorables para llevar a cabo la publicación de recursos digitales

15

educativos, a través de una metodología aplicada a la Universidad Distrital Francisco José de

Caldas.

FORMULACIÓN DEL PROBLEMA

¿Cómo establecer un conjunto de recomendaciones y pasos, para llevar a cabo el

enriquecimiento y publicación de Recursos Educativos Digitales en la Universidad Distrital

Francisco José de Caldas?

SISTEMATIZACIÓN DEL PROBLEMA

● ¿Cuál es la relación entre Linked Data y la Web Semántica?

La Web Semántica se compone de datos enlazados; es decir, la Web Semántica es el

conjunto, mientras Linked Data es las partes. Tim Berners-Lee, inventor de la Web y la

persona le atribuye haber acuñado los términos Web Semántica y Linked Data frecuencia

se ha descrito como Linked Data "la Web Semántica se haga bien".

● ¿Cuál es la relación entre Linked Data y RDFa?

RDFa es una de las varias formas de escribir, o serializar datos RDF. En concreto, RDFa

permite que los datos RDF para ser incorporados en los documentos HTML, lo que hace

que sea muy útil para la publicación de RDF en contextos donde la publicación Web se

limita a HTML, por ejemplo, cuando un sistema de gestión de contenido antiguo evita

publicación en otros formatos. Simplemente como otra serialización de RDF, RDFa es

ideal para la publicación de datos enlazados.

● ¿Necesita Linked Open Data tener todos los datos abiertos?

En una palabra, no, y es probable que no sea así. La etiqueta "Linked Open Data" es

ampliamente utilizado, pero a menudo para referirse a los datos vinculados en general, en

lugar de los datos vinculados de manera explícita que se publica bajo una licencia

16

abierta. No todos los datos vinculados estarán abiertos, y no todos los datos abiertos serán

vinculados.

● ¿Los cuatro principios de diseño en los que se basa el linked data son?

▪ Utilizar URIs (Uniform Resource Identifier) como nombres únicos para los recursos

▪ Utilizar el protocolo HTTP para nombrar y resolver la ubicación de los datos

identificados mediante esas URIs. Si las entidades están identificadas mediante URI’s

pueden buscarse desreferenciando la URI utilizando el protocolo HTTP.

▪ Representar los datos en RDF y utilizar SPARQL como lenguaje de consulta de dichos

datos. Mientras que HTML proporciona un medio para estructurar y enlazar documentos

en la Web, RDF proporciona un modelo de datos genérico, con el que estructurar y

enlazar datos que describen cosas en el mundo en forma de triples sujeto-predicado-

objeto.

▪ Incluir enlaces a otras URIs para permitir la localización de más datos enlazados,

aprovechando que los elementos de un triple RDF pueden ser una URI o una cadena de

literales.

● ¿Cuál es la relación entre los metadatos y los objetos de aprendizaje?

Un objeto de aprendizaje es cualquier recurso que puede ser utilizado para facilitar la

enseñanza y el aprendizaje y que ha sido descrito utilizando metadatos. (Ver figura 1). De

esta manera, nace una relación intrínseca entre un objeto educativo y sus metadatos para

formar, en conjunto, un OA. Es decir, dentro de un entorno de aprendizaje en donde

intervienen las tecnologías, si un recurso digital no tiene metadatos no puede considerarse

OA ya que, en la práctica, los sistemas no pueden interpretarlo (o reconocerlo) y hacerlo

realmente reutilizable. (Berlanga, 2005).

17

Figura 1: Composición conceptual de un Objeto de aprendizaje. Berlanga, 2005

JUSTIFICACIÓN

Actualmente existe un gran interés en las aplicaciones educativas que utilizan internet como

plataforma de distribución (e-learning). como su uso se generaliza para mejorar la eficiencia, se

trata de sistematizar los procesos y especialmente las especificaciones y los estándares educativos

tratan de regular cómo se realizan los procesos de enseñanza de modo que la información del

sistema y los contenidos puedan ser reutilizables, interoperables e intercambiables entre distintas

plataformas de enseñanza. (Fernández, 2006)

El Ministerio de Educación Nacional (MEN) en el documento “Recursos Educativos Digitales

Abiertos Colombia” plantea dentro de los retos y expectativas de la Estrategia Nacional de

Recursos Educativos Digitales Abiertos entre otros:

● Fortalecer el intercambio de experiencias, participación y colaboración entre las

instituciones, docentes y estudiantes en torno a la producción, gestión y uso de los Recursos

Educativos Digitales Abiertos en las actividades y procesos de formación.

18

● Generar procesos que se relacionen con la investigación, desarrollo, innovación y

renovación educativa que respondan a los retos propios del sector de la educación.

● Consolidar una Oferta Nacional de Recursos Educativos Digitales Abiertos de Alta

Calidad, pertinente, arbitrada y certificada que contribuya al fortalecimiento de los

procesos y prácticas educativas.

● Promover el desarrollo de iniciativas, proyectos y procesos de toda índole, relacionados

con la producción, gestión y uso de Recursos Educativos Digitales Abiertos por parte de

las Instituciones de Educación Superior en el ámbito nacional.

Dicho lo anterior, este proyecto contribuye a la estrategia planteada por el MEN, en los cuatro

puntos anteriores a partir de proponer prácticas que conlleven a la mejor utilización de los recursos

y promover la innovación y la investigación.

HIPÓTESIS

El objetivo del uso de metadatos es mejorar internet ampliando la interoperabilidad entre los

sistemas de información. Actualmente cada sector trabaja en el desarrollo de sus propios

estándares de metadatos para la interoperabilidad de sus sistemas. El sector educativo desarrolla

objetos de aprendizaje y promueve la construcción de bancos; ambos con el fin de facilitar a los

usuarios el acceso, uso y reutilización de los recursos disponibles. Publicar en LOD es una tarea

desafiante por la falta de herramientas fáciles de usar que respalden adecuadamente todo el proceso

de publicación. A partir de este panorama se pretende dar respuesta a la siguiente hipótesis.

Ho. La estructuración de un conjunto de recomendaciones y buenas prácticas para el

enriquecimiento y publicación de recursos digitales educativos, basados en tecnologías de Web

19

Semántica, permitirá colaborar y mejorar el proceso de publicación de recursos digitales dentro

del entorno de la Universidad Distrital Francisco José de Caldas.

OBJETIVOS

1.6.1. Objetivo General

Proponer un conjunto pasos y recomendaciones para llevar a cabo el enriquecimiento y

publicación de Recursos Educativos Digitales en la Universidad Distrital Francisco José de Caldas

1.6.2. Objetivos específicos

● Documentar y analizar el estado actual de las metodologías existentes para la publicación

de datos en Linked Open Data.

● Identificar los diferentes componentes requeridos (recursos digitales educativos,

procesos, metadatos, estándares, etc.) para llevar a cabo la publicación de datos en LOD.

● Diseñar un conjunto de recomendaciones para llevar a cabo el enriquecimiento y

publicación de Recursos Digitales Educativos, basado en tecnologías de Web Semántica.

● Plantear un caso de prueba para verificar la aplicación de las recomendaciones

propuestas en esta investigación.

ALCANCE Y LIMITACIONES

Este trabajo no aborta como tal el desarrollo y construcción de Recursos Educativos Digitales

desde un marco pedagógico, por lo tanto, se asume que los recursos ya han sido desarrollados y

plenamente construidos por las personas idóneas en el tema, como lo son los docentes,

investigadores o especialistas y deben ser proporcionados por una unidad o dependencia a cargo

de dicho proceso.

20

Los recursos no serán publicados en el ambiente de producción o repositorio de la universidad,

únicamente se documenta la metodología de publicación basada en ambientes de prueba instalados

en una máquina local.

La metodología y los pasos propuestos en este documento no contemplan herramientas y

recomendaciones para que sean aplicadas por personas en condiciones de discapacidad.

CAPITULO II FUNDAMENTACIÓN Y ESTADO DEL ARTE

En este capítulo se define la teoría base de la investigación y mencionamos los conceptos más

relevantes del objeto de estudio, como son los relacionados con la web semántica, con los recursos

educativos digitales abiertos, la clasificación de estos y los estándares de metadatos más conocidos

para este tipo de recursos.

MARCO TEÓRICO

2.1.1. Web semántica

La Web Semántica es una Web extendida, dotada de mayor significado en la que cualquier

usuario en Internet podrá encontrar respuestas a sus preguntas de forma más rápida y sencilla

gracias a una información mejor definida. Al dotar a la Web de más significado y, por lo tanto, de

más semántica, se pueden obtener soluciones a problemas habituales en la búsqueda de

información gracias a la utilización de una infraestructura común, mediante la cual, es posible

compartir, procesar y transferir información de forma sencilla. Esta Web extendida y basada en el

significado, se apoya en lenguajes universales que resuelven los problemas ocasionados por una

Web carente de semántica en la que, en ocasiones, el acceso a la información se convierte en una

tarea difícil y frustrante.

21

Los principios de la Web semántica se implementan en las capas de tecnologías y estándares

web. Las capas se presentan en la figura 2. Las capas Unicode y URI aseguran que usamos

conjuntos de caracteres internacionales y proporcionamos medios para identificar los objetos en la

Web Semántica. La capa XML con el espacio de nombres y las definiciones de esquema aseguran

que podamos integrar las definiciones de la Web Semántica con los otros estándares basados en

XML. Con RDF [RDF] y RDFSchema [RDFS] es posible hacer declaraciones sobre objetos con

URI y definir vocabularios a los que se puede hacer referencia mediante URI. Esta es la capa donde

podemos dar tipos a los recursos y enlaces. La capa de ontología admite la evolución de los

vocabularios, ya que puede definir las relaciones entre los diferentes conceptos. Con la capa de

firma digital para detectar alteraciones de documentos (W3C, 2001)

https://www.w3.org/2001/12/semweb-fin/w3csw

Figura 2: Las capas de la Web Semántica. W3C, 2001

22

2.1.2. Linked Data

Los Datos Enlazados es la forma que tiene la Web Semántica de vincular los distintos datos que

están distribuidos en la Web, de forma que se referencian de la misma forma que lo hacen los

enlaces de las páginas web.

La Web Semántica no se trata únicamente de la publicación de datos en la Web, sino que éstos

se pueden vincular a otros, de forma que las personas y las máquinas puedan explorar la web de

los datos, pudiendo llegar a información relacionada que se hace referencia desde otros datos

iniciales.

Sin embargo, y a diferencia de la web del hipertexto, donde los enlaces son relaciones entre

puntos de los documentos escritos en HTML, los datos enlazan cosas arbitrarias que se describen

en RDF.

Por ejemplo, suponiendo que un directorio de empresas publica información especializada

relativa a las organizaciones, como su tamaño o área profesional, es posible que desee indicar

también información sobre la localización. Ya que en la web existen sitios con grandes bases de

datos geográficas, con información pormenorizada sobre las localizaciones, el directorio de

empresas puede hacer referencia a los datos geográficos que están dispuestos por esa fuente

externa. De esta forma, los datos iniciales de la organización se enriquecen con información que

ofrecen los expertos en el ámbito geográfico. (Ver figura 3)

Linked Data permite construir la Web de los datos, una gran base de datos interconectados y

distribuidos en la Web. Los datos se vinculan y se exploran de una forma similar a la utilizada para

vincular los documentos HTML. (RDF, 2014)

23

Figura 3: Ejemplo Linked Data. W3C, 2011

El siguiente grafo representa distintos conjuntos de datos de diversos tipos, organizados

mediante colores por dominios. Estos conjuntos de datos están conectados entre sí de forma que

componen la “Nube de Linked Data” (Ver figura 4)

Figura 4: Nube de Linked Data. W3C, 2011

Los Datos Enlazados, como parte de la Web Semántica, se basan en la aplicación de ciertos

principios básicos y necesarios, que fomentarán el crecimiento de la Web, tanto a nivel de los

documentos HTML (vista clásica de la Web), como a nivel de los datos expresados en RDF (vista

de la Web Semántica).

24

Para conseguir tener los datos interconectados, como si la Web fuese una gran base de datos,

se deben respetar los siguientes pasos para conseguir tener los datos interconectados. Gracias a

esta interconexión, se permite reutilizar la información de cualquier manera esperada o inesperada,

lo que ofrece un valor añadido a la Web (RDF, 2014).

1. Utilizar URIs como nombres para objetos

2. Utilizar URIs HTTP para que las personas puedan utilizar esos nombres.

3. Cuando alguien busque un URI, proporcionar información útil utilizando normas. (RDF,

SPARQL)

4. Incluir enlaces a otros URIs para que se puedan descubrir más cosas (Datos enlazados)

2.1.3. Open Data

Hace referencia a los datos e información más allá de las instituciones gubernamentales e

incluye a otros grupos de interés relevantes, tales como empresas, industrias, ciudadanos, las ONL

(organización sin ánimo de lucro), las ONG (organización no gubernamental), y áreas relacionadas

con la ciencia y educación. Open Data se base en que los datos deben ser accesibles para todos, en

forma libre y sin restricciones (Auer et al., 2007).

Según Hernández et al., (2013), no todos los datos que se recopilan o todos los datos que se

pueden descargar de la Web son datos abiertos. Para que estos datos sean realmente abiertos, deben

estar disponibles en Internet preferiblemente para ser descargados, pero también deben poseer

algún tipo de licencia legal para poderlos utilizar, reutilizar y redistribuir, mezclándolos incluso

con otros datos, sujetos como mínimo a la “atribución” (reconocimiento de la autoría, quién lo ha

hecho).

25

2.1.4. Clasificación de los datos abiertos

Tim Berners-Lee propuso una categorización del grado de apertura de los datos basado en

estrellas, respecto a qué tan abiertos y usables son los datos que puede ofrecer una institución.

1 estrella: Los datos deben estar disponibles en la web en cualquier formato y bajo una licencia

abierta, para que sean considerados como datos abiertos.

2 estrellas: Los datos deben estar estructurados y en un formato que pueda ser interpretado o

procesado por maquinas.

3 estrellas: Igual al anterior, pero en un formato no propietario.

4 estrellas: Todo lo anterior más la utilización de estándares recomendados por w3c (RDF –

SPARQL) para identificar cosas.

5 estrellas: Todo lo anterior más el establecimiento de vínculos con los datos de otros y de esa

forma proveerles contexto.

Según la clasificación antes descrita, cualquier dato que esté disponible en la Web en cualquier

formato bajo una licencia abierta, es un dato abierto de categoría 1 estrella.

Entonces, a modo de resumen: Cualquier archivo disponible en sitios Web en formato.PDF,

DOC, ODT, .TXT, entre otros; y que esté bajo una licencia abierta será clasificado como dato

abierto de 1 estrella.

El siguiente nivel de clasificación, es 2 estrellas. Tiene que cumplir todo lo que implica estar

en 1 estrella (publicado y bajo una licencia abierta) y además los datos deben estar estructurados

26

y en un formato que pueda ser interpretado o procesado por maquinas. Por ejemplo, datos que se

encuentren en formato .XLS y organizados en una tabla se podrían clasificar como 2 estrellas.

El siguiente nivel de clasificación, 3 estrellas implican lo mismo que los niveles 1 y 2 pero el

formato debe ser no propietario. Por ejemplo, datos que se encuentren en formato .CSV podrían

clasificar como 3 estrellas. Otro ejemplo es un archivo en formato .XML.

Para que un dato abierto se considere de 4 estrellas debe cumplir con las condiciones anteriores

y además utilizar estándares recomendados por W3C como pueden ser RDF y SPARQL. Los

niveles 4 y 5 son considerados avanzados y se acercan mucho al ideal de publicación de un dato

abierto. Dado que, en la actualidad, en Uruguay se está comenzando con la apertura de datos, se

aspira en estas primeras que todos los conjuntos de datos abiertos de gobierno alcancen como

mínimo el nivel 3. No obstante, se espera ir mejorando de manera gradual y planificada para

alcanzar los niveles máximos en los casos de conjuntos de datos que amerite el esfuerzo.

2.1.5. Linked Open Data

Ofrece un modelo distribuido para la Web Semántica con el propósito de crear conocimiento

mediante la vinculación pública disponible de datos. Indica que son datos abiertos en RDF. Esto

significa que el usuario puede enlazar datos provenientes de diversas fuentes, instituciones u

organizaciones, explorar y combinar estos datos de manera libre y sin restricciones de copyright

para nuevos desarrollos web.

2.1.6. Recursos educativos abiertos

La UNESCO, en su documento A Basic Guide To Open Educational Resources (OER)

(UNESCO, 2011), define los Recursos Educativos Abiertos, como:

27

En su forma más simple, el concepto de Recursos Educativos Abiertos, describe cualquier tipo

de recurso (incluyendo planes curriculares, materiales de los cursos, libros de texto, vídeo,

aplicaciones multimedia, secuencias de audio, y cualquier otro material que se haya diseñado para

su uso en los procesos de enseñanza y aprendizaje) que están plenamente disponibles para ser

utilizados por parte de educadores y estudiantes, sin la necesidad de pago alguno por derechos o

licencias para su uso.

Para el contexto colombiano, se define que:

Recurso Educativo Digital Abierto es todo tipo de material que tiene una intencionalidad y

finalidad enmarcada en una acción Educativa, cuya información es Digital, y se dispone en una

infraestructura de red pública, como internet, bajo un licenciamiento de Acceso Abierto que

permite y promueve su uso, adaptación, modificación y/o personalización. (Ministerio de

Educación Nacional, 2012)

2.1.7. Clasificación de los Recursos Educativos Digitales Abiertos

Dada la heterogeneidad, multiplicidad y complejidad de los Recursos Educativos Digitales

Abiertos, a continuación, se describe, caracteriza y detalla en profundidad cada una de las

condiciones

a) Desde lo educativo

El propósito de la clasificación de los recursos desde lo educativo se basa en características

comunes entre ellos, las cuales pueden definirse desde los objetivos de aprendizaje,

intencionalidades de uso, complejidad, estructura, entre otros. De este modo y de acuerdo con las

características educativas de los recursos, estos pueden ser organizados como Cursos Virtuales,

Aplicaciones para Educación y Objetos de Aprendizaje.

28

Curso Virtual: Un curso es una experiencia educativa que se realiza a través de un recorrido,

donde los participantes del proceso, también llamados estudiantes, interactúan con información,

conocimientos y actividades con las que se busca que desarrollen capacidades, competencias y

adquieran conocimientos, que permitan alcanzar los objetivos formativos propuestos. Para el caso

de un curso virtual, la experiencia educativa es mediada por un entorno tecnológico que es provisto

con las condiciones para desarrollar procesos de enseñanza y de aprendizaje, para alcanzar los

objetivos formativos establecidos (Ministerio de Educación Nacional, 2011b).

Aplicaciones para Educación: Son programas y/o piezas de software diseñados y producidos

para apoyar el desarrollo y cumplimiento de un objetivo, proceso, actividad o situación que implica

una intencionalidad o fin educativo; se caracterizan por brindar a los usuarios una gran

funcionalidad debido a su versatilidad, nivel de interacción, portabilidad y usabilidad.

Objeto de Aprendizaje: Un objeto de aprendizaje es un conjunto de recursos digitales,

autocontenible y reutilizable, con un propósito educativo y constituido por al menos tres

componentes internos: Contenidos, actividades de aprendizaje y elementos de contextualización.

El objeto de aprendizaje debe tener una estructura de información externa (metadatos) que facilite

su almacenamiento, identificación y recuperación (Ministerio de Educación Nacional, 2006b).

Como describe (Willey, 2006a), el término ‘objeto de aprendizaje’ se acuñó en 1994 por Wayne

Hodgins y rápidamente entró en el lenguaje de profesores y diseñadores de enseñanza. En lo que

se refiere a la historia de los Recursos Educativos Abiertos, los objetos de aprendizaje

popularizaron la idea de que los materiales digitales pueden diseñarse y producirse para poder

reutilizarlos fácilmente en una variedad de situaciones pedagógicas. (Para una visión general de la

literatura relevante, véase (Willey, 2006c) La imagen de los bloques de Lego o de los átomos se

29

usa en ocasiones para describir cómo pueden usarse y reutilizarse los objetos de aprendizaje en

diferentes entornos. (Willey, 1998) inventó la expresión “contenido abierto” qué llamó la atención

de los usuarios de Internet y popularizó la idea de que los principios del movimiento de software

de código abierto podrían ser aplicados de manera productiva al contenido. Willey también creó

la primera licencia abierta ampliamente adoptada para los contenidos (la Licencia de Publicación

Abierta) (OCDE, 2007).

b) Desde los formatos de información digital

Para su representación, la información digital utiliza distintos formatos, los cuales pueden ser

manipulados de manera individual o en conjunto durante los procesos de producción de Recursos

Educativos Digitales Abiertos. Los formatos más comunes son:

Textuales: información representada en un sistema de escritura a través de caracteres, que

puede apoyarse en otro tipo de representaciones visuales: esquemas, diagramas, gráficos, tablas,

entre otros, cuyo uso se desarrolla a través de la lectura.

Sonoros: elementos o secuencias de información acústica, cuya oscilación y vibración puede

ser percibida mayormente por el sentido del oído.

Visuales: elementos y/o secuencias de información representada en mayor porcentaje e

importancia a través de imágenes, fotografías, gráficas, ilustraciones, capturas ópticas, entre otras;

y cuyas oscilaciones y vibraciones pueden ser captados mayormente por el sentido de la vista.

Audiovisuales: elementos de información secuenciados sincrónicamente donde convergen,

articulan y se integra lo sonoro, lo textual y lo visual; y cuyas oscilaciones y vibraciones pueden

ser captadas simultáneamente por los sentidos de la vista y el oído.

30

Multimediales: elementos de información secuenciados principalmente de forma asincrónica,

que articula, secuencia e integra múltiples formatos (textuales, sonoros, visuales y audiovisuales);

su potencialidad reside sobre las posibilidades de interacción que ofrece.

c) Desde las condiciones de acceso y los permisos de uso

Los Recursos Educativos Digitales adquieren un carácter de Acceso Público, Acceso Abierto o

Acceso Privado, según los permisos que otorga el autor o el titular del Derecho de Autor, los cuales

quedan expresamente señalados en el sistema o modelo de licencia que se emplee. La cual debe

indicar las propiedades y condiciones de acceso, distribución, uso y adaptación.

Acceso Público: se define como aquello que está disponible sin restricciones ni limitaciones o

costo para su acceso; en algunos casos, permite y promueve su uso de manera completa y gratuita,

para lo cual dicho uso y acceso se disponen bajo la definición de una autorización a través de las

licencias de tipo público, a partir de las referencias establecidas en modelos de licenciamiento

reconocidos como: (Creative Commons, 2009; Free Software Foundation 2012)

Acceso Abierto: se heredan las condiciones de público, con el adicional de que el Recurso

Educativo Digital puede ser modificado o adaptado. Esto se logra gracias a que el titular del

Derecho de Autor, a través de una licencia, otorga permisos para la Derivación (Modificación o

adaptación de la obra o recurso). Las características para que un Recurso Educativo Digital sea

abierto son: su posibilidad para accederlo, compartirlo, copiarlo, distribuirlo, mostrarlo, adaptarlo,

representarlo, modificarlo y mezclarlo.

La apertura de un recurso aumenta por los permisos que se le asocien.

Más permisos = Más abierto (Botero, 2010).

31

Para ello, debe definirse la autorización a través de las licencias de tipo abierto, a partir de las

referencias establecidas en modelos de licenciamiento reconocidos como: (Creative Commons

2009; Free Software Foundation 2012; Ministerio de Educación Nacional, 2012).

A manera de resumen acerca de los conceptos alrededor de un recurso educativo digital y su

clasificación, presentamos el siguiente mapa.

Figura 5: Mapa conceptual Recurso Educativo Digital. Elaborado por el autor

2.1.8. Metadatos y perfil de aplicación

a) Metadatos

Aunque el termino metadato se relacionó inicialmente con el campo de la bibliotecología,

actualmente se ha extendido a los recursos digitales. Fue acuñado por Jack Myers en la década de

los 60 (Caplan, 2003), para describir conjuntos de datos. La primera acepción que se le dio (y

32

actualmente la más extendida) fue la de dato sobre el dato, ya que su intención era proporcionar la

información mínima necesaria para identificar un curso. Teniendo en cuenta esta definición y el

contexto actual, se puede considerar el alcance de la catalogación como un proceso de generación

de metadatos, que convoca no solo a profesionales de la información, sino también, a informáticos,

diseñadores de programas, técnicos de sistemas, etc. hoy, el concepto de metadato debe ser mirado

como un término mucho más amplio, que permite pensar la producción de recursos digitales bajo

un enfoque de trabajo colaborativo y que coloca en una posición participativa a todos los grupos

de profesionales implicados en su desarrollo. Otros autores amplían el concepto de “dato sobre el

dato”, al afirmar que los metadatos también deben incluir información sobre contexto, contenido

y control. de este modo, se alcanzan objetivos como describir, identificar y definir un recurso para

recuperar, filtrar e informar sobre licenciamiento y condiciones de uso, autenticación y evaluación,

preservación e interoperabilidad (Caplan, 1995).

Un registro de metadatos consiste en un conjunto de atributos o elementos necesarios para

describir un recurso determinado, que funciona como identificador de los materiales digitales

diseñados. Para ello, existen estándares que deben seguirse en la descripción de los objetos de

aprendizaje y de información.

b) Tipos de metadatos

De acuerdo a (Daudinot, 2006). Son múltiples los tipos y funciones de los metadatos existentes

actualmente, porque estos dependen de muchos factores, entre los cuales pueden citarse: el tipo de

información que describen, el nivel de estructuración de esta información, el lugar donde se

encuentren los metadatos, su ámbito de aplicación, el tipo de usuarios que los utiliza y sus

finalidades, entre otros. Por tanto, son múltiples también las clasificaciones de metadatos

realizadas hasta ahora por diferentes autores.

33

Con fines prácticos, los tipos y funciones de los metadatos pueden clasificarse en tres amplias

categorías: descriptivos, estructurales y administrativos. Estas categorías no siempre tienen límites

bien definidos y con frecuencia presentan un significativo nivel de superposición. Por ejemplo, los

metadatos administrativos pueden incluir una amplia gama de información que podría considerarse

como metadatos descriptivos y estructurales: (Daudinot, 2006).

Los metadatos descriptivos son aquellos que sirven para la descripción e identificación de los

recursos de información en el nivel local (sistema) para permitir la búsqueda y recuperación de

información.

Los metadatos estructurales facilitan la navegación y presentación de recursos electrónicos,

proporcionan información sobre la estructura interna de los recursos, incluyen página, sección,

capítulo, numeración, índices y tabla de contenidos; describen la relación entre los materiales, por

ejemplo: la fotografía B se incluyó en el manuscrito A; además, unen los archivos y los textos

relacionados.

Los metadatos administrativos facilitan la gestión y procesamiento de las colecciones digitales,

tanto a corto como a largo plazos e incluyen datos técnicos sobre la creación y el control de calidad;

comprenden la gestión de derechos y requisitos de control de acceso y utilización, además de

información sobre la acción de preservación.

A continuación, presentamos la definición de algunos de los estándares de metadatos más

conocidos.

c) IEEE Learning Object Meta-data LOM

34

Uno de los principales contribuidores al proceso de definición de metadatos para recursos

educativos es el IEEE, a través de su grupo de trabajo P1484.12 de metadatos para recursos

educativos, el cual ha definido LOM (learning Object Metadata) (Rob, 2013).

LOM se ha convertido en referencia para la comunidad en el campo de la descripción de

recursos educativos, aunque hay que decir que su creación no se debe solamente a IEEE. Entre las

aportaciones más importantes destacan las realizadas por IMS y el proyecto ARIADNE (Rob,

2013).

LOM especifica la sintaxis y semántica de metadatos para objetos educativos. Su propósito es

buscar la especificación más pequeña posible, pero que la vez resulte útil, factible, viable técnica

y comercialmente, de uso generalizado y que admita la incorporación de extensiones. En la

especificación se incluyen características como el nombre de los elementos, definiciones, tipos de

datos y longitudes de los campos. Se dispone, además, de enunciados de conformidad en los que

se explican cómo deben ser los documentos de metadatos y las aplicaciones para ser consideradas

conformes con LOM. Estabilidad de versiones, almacenamiento (asociando los registros LOM con

el recurso educativo o incorporándola de forma directa en el mismo), recuperación de información

(esto incluye los procesos de buscar, ubicar, iniciar, empaquetar, editar, etc.) e intercambio de

datos entre aplicaciones. En cualquier caso, los desarrolladores de LOM indican que puede

utilizarse para propósitos que no recogen en su especificación como son la gestión de los derechos

de la propiedad intelectual o el comercio electrónico (Rob, 2013).

La información de LOM puede utilizarse para los siguientes propósitos: mantenimiento de

estabilidad de versiones, almacenamiento (asociando registros los registros LOM con el recurso

educativo o incorporándola de forma directa en el mismo), recuperación de información (esto

35

incluye los procesos de buscar, ubicar, iniciar, empaquetar, editar, etc.) e intercambio de datos

entre aplicaciones. En cualquier caso, los desarrolladores de LOM indican que puede utilizarse

para propósitos que no se recogen en su especificación como son la gestión de los derechos de la

propiedad intelectual o el comercio electrónico.

LOM está organizado en nueve categorías:

Figura 6: Organización categorías LOM. Rob, 2013

d) LOM-CO

El Ministerio de Educación Nacional inició un minucioso análisis de las necesidades de

catalogación de los Objetos de Aprendizaje en el contexto nacional, para determinar el estándar

que se debería adoptar. Como resultado se seleccionó el estándar LOM, pero con una adaptación

que permitiera la descripción contextualizada de los objetos, acorde con los lineamientos de

gestión de contenidos educativos existentes a la fecha, en el país. Nace así LOM-CO (CO:

Colombia), y durante este año llega a su versión 0.2. Éste es un proyecto que se extendería a los

años siguientes, hasta consolidarse en su última versión: 1.0, o también llamada LOM-CO. Al

trascender esta definición de perfil de aplicación de metadatos para Colombia, en la iniciativa de

catalogación para Educación Superior se tienen en cuenta cuatro antecedentes o elementos que

36

pudieran incidir en la versión final del perfil de aplicación: (Ministerio de Educación Nacional.

2012).

● Se referencia el perfil de aplicación, creado para Objetos de Aprendizaje en el marco del

proyecto de Catalogación de Objetos de Aprendizaje en Instituciones de Educación

Superior, inmediatamente anterior a esta iniciativa.

● Se referencia el metadato construido con la colaboración de la Fundación Chile, durante la

consolidación del Portal Educativo Colombia Aprende.

● Se consideran las características de los diferentes tipos de contenidos: radio educativa,

televisión educativa, experiencias significativas y proyectos colaborativos, gestionados por

el Portal Educativo Colombia Aprende.

● El intercambio de contenidos con los diferentes portales educativos existentes a nivel

nacional y latinoamericano.

En el anexo X se muestra una plantilla para describir los campos de este perfil y hace parte del

documento. Recursos Educativos Digitales Abiertos Colombia. Un Sistema Nacional de

Innovación Educativa con Uso de TIC del ministerio de educación nacional en el año 2012.

e) Dublín Core educación

Dublín Core es una propuesta para metadatos de Dublín Core Metadata Iniciative (DCMI), una

organización dedicada específicamente a la creación, mantenimiento y gestión de propuestas de

metadatos. El nombre Dublín Core proviene de la ciudad de Estados Unidos (Dublín, estado de

Ohio) donde se produjo en 1995 una reunión de especialistas en la que tuvo lugar el nacimiento de

esta iniciativa. “Core” refleja el hecho de que únicamente se recogieron los elementos más básicos

37

para garantizar su aplicabilidad a un amplio abanico de tipos de recursos, por supuesto también en

el ámbito de la educación (Rob, 2013).

Se trata de una propuesta mucho más reducida a LOM (15 elementos frente a los más de 60 de

LOM). Cada uno de los elementos, con un nombre que pretende ser auto descriptivo, es opcional

y puede repetirse. Los elementos pueden aparecer en cualquier orden.

Los 15 elementos de Dublín Core pretenden describir un recurso desde tres puntos de vista

diferentes.

• Contenido del recurso

• Características y propiedad intelectual

• Propiedades de la instanciación del recurso

En la siguiente figura se muestra el esquema de los estándares LOM, Dublín Core y dos de sus

perfiles de aplicación.

Figura 7: Esquema de los estándares LOM, Dublín Core y perfiles de aplicación. Rob, 2013

38

f) Perfil de aplicación

Un perfil de aplicación es el uso específico que se le da a un esquema de metadatos existente

en una entidad en particular. Incluye las políticas propias y las directrices en el uso de los

elementos. Determina su obligatoriedad y limitaciones, explica cómo deben usarse y da ejemplos

aclaratorios.

Para poder cumplir con sus objetivos, un perfil de aplicación puede integrar elementos

provenientes de más de un esquema de metadatos, con la precaución de que estos no se solapen.

Exige que se realice una documentación adecuada para que el trabajo de los distintos usuarios sea

consistente al momento de realizar la aplicación del perfil.

MARCO CONCEPTUAL

De acuerdo con el enfoque teórico presentado anteriormente, a continuación, relacionamos

algunos conceptos que consideramos, complementan de manera importante el enfoque de la

investigación.

2.2.1. Semántica

Es la ciencia del hombre que estudia el significado que expresamos mediante el lenguaje

natural. Es una parte de la gramática que investiga el modo como se proyectan los objetos y

situaciones del mundo en el código de la lengua. Su objeto primario de estudio es la capacidad

innata de los hablantes, que les permite desplazar los objetos del mundo en expresiones codificadas

en un lenguaje simbólico natural, y que constituye su competencia semántica.

Su objetivo es construir un modelo parcial que abstraiga alguna de las propiedades del objeto.

La explicación semántica podría concebirse como un modelo que simula el saber semántico innato

de los hablantes. Una vez construido y adecuado a los datos empíricos, el modelo nos permitirá

39

experimentar el funcionamiento dinámico de este conocimiento en distintas situaciones de

evaluación y hacer predicciones sobre la conducta potencial de los agentes representados (Palma,

2016).

2.2.2. Ontología

El término ontología proviene de la filosofía; pero en IA, tiene diferentes connotaciones. La

definición declarativa más consolidada es la propuesta por (Gruber, 1993) y extendida por (Studer,

1998) que la describe como “una especificación explicita y formal sobre una conceptualización

compartida”. La interpretación de esta definición es que las ontologías definen conceptos y

relaciones de algún dominio, de forma compartida y consensuada; y que esta conceptualización

debe ser representada de una marera formal, legible y utilizable por los ordenadores. Las ontologías

se componen generalmente de conceptos, relaciones, funciones, instancias, axiomas (Tello, 2014).

2.2.3. Taxonomía

Etimológicamente hablando, taxonomía procede de los términos griegos “taxis”, ordenación y

“nomos” norma. Aplicando el principio etimológico, la taxonomía se ha definido como la ciencia

que trata de los principios, métodos y fines de la clasificación, y procura la organización

jerarquizada y sistemática, dando nombres a grupos de elementos y a los elementos mismos. Una

taxonomía es un tipo de vocabulario controlado en que todos los términos están conectados

mediante algún modelo estructural (jerárquico, arbóreo, facetado, etc.) y especialmente orientado

a los sistemas de navegación, organización y búsqueda de contenidos de los sitios web (Díaz,

2009).

2.2.4. Repositorio de recursos educativos

40

Un repositorio de recursos educativos es un sistema software que almacena recursos educativos

y sus metadatos (o solamente estos últimos), y que proporciona algún tipo de interfaz de búsqueda

de los mismos, bien para interacción con humanos o con otros sistemas software. Los repositorios

proporcionan acceso a colecciones de recursos educativos generalmente en formato electrónico, si

bien la mayoría no almacenan los recursos educativos en sí, sino solamente sus metadatos. Por lo

tanto, es posible encontrar el mismo recurso a través de diferentes repositorios. Se observan dos

grandes tipos de repositorios: (Soto, 2006)

1. Interfaces de búsqueda interactivos, para uso de humanos.

2. Interfaces de consulta que puedan ser utilizados por agentes software, por ejemplo,

mediante Servicios Web.

En ocasiones, la misma forma de búsqueda puede servir para los dos usos. No obstante, hay

que tener en cuenta que la búsqueda mediante los habituales mecanismos de recuperación de

información de propósito general (como los que usan los buscadores de Internet) deben

complementarse con una búsqueda guiada por los metadatos. La forma más sencilla de este tipo

de búsqueda es permitir buscar por campos de metadatos. No obstante, esas interfaces a veces

tampoco resultan satisfactorias, por lo que actualmente se investiga en técnicas avanzadas que

permitan hacer uso de conocimiento sobre el domino de los metadatos, por ejemplo, mediante

ontologías (Soto, 2006).

CAPÍTULO III MARCO METODOLÓGICO

En este capítulo exponemos cual fue la metodología definida para llevar a cabo el desarrollo

del proyecto, así como la descripción de las distintas etapas que la componen.

41

METODOLOGÍA DEL PROYECTO

Se utilizará una metodología cuasiexperimental teniendo en cuanta que el objeto de prueba son

elementos ya formados y que el experimento se realiza en ambientes de prueba como se describe

en el apartado de alcances y limitaciones.

La figura 8 se muestra las fases definidas para llevar a cabo el proyecto:

Figura 8: Fases de la metodología del proyecto, Elaborado por el autor

A continuación, se presenta una descripción de cada fase.

a) Levantamiento de información y contextualización del objeto de investigación

42

En esta fase se realiza una revisión bibliográfica de acuerdo al tema de investigación, donde

se busca establecer el contexto actual de los distintos enfoques, pautas, recomendaciones y

uso de herramientas tecnológicas.

b) Comparación de propuestas metodológicas de publicación de datos

En esta fase se identifican las propuestas metodológicas más relevantes y se establecen

cuáles pueden ser las mejores prácticas para realizar la publicación de datos.

c) Planteamiento de la propuesta metodológica de publicación de datos

En esta fase se define específicamente cuales van a ser los pasos propuestos para la

publicación de datos de acuerdo al resultado de la fase anterior y las pruebas experimentales

realizadas.

d) Descripción de cada una de las etapas de la propuesta metodológica planteada

Por último, se describe el planteamiento paso a paso para realizar la publicación donde se

incluye las condiciones necesarias, recomendación técnica de herramientas y

recomendaciones de buenas prácticas.

CAPITULO IV DESARROLLO DE LA INVESTIGACIÓN

De acuerda a las fases del desarrollo del proyecto descritas en el capítulo anterior a continuación

se presenta la descripción de la implementación de cada fase.

LEVANTAMIENTO DE INFORMACIÓN Y CONTEXTUALIZACIÓN DEL

OBJETO DE INVESTIGACIÓN

43

En esta fase se realiza una revisión bibliográfica de acuerdo al tema de investigación, donde se

busca establecer el contexto actual de los distintos enfoques, pautas, recomendaciones y uso de

herramientas tecnológicas.

4.1.1. Revisión Bibliográfica

Para esta investigación se incluyen los siguientes criterios:

a) Criterios de inclusión

● Estudios publicados entre los años 2010 y 2019.

● Estudios que mencionen la evaluación de la calidad de datos.

● Estudios que mencionen herramientas necesarias para la publicación de datos en LOD.

● Estudios que propusieron y / o implementaron un enfoque para la publicación de datos en

Linked Data o Linked Open Data.

b) Criterio de exclusión

● Trabajos que aborden áreas distintas a las ciencias de la computación, por ejemplo,

ciencias sociales o de salud.

● Se excluyen artículos que no hayan sido revisados por pares como discursos,

conferencias o talleres. Metodologías de evaluación que se publicaron como resumen de

póster.

● Se excluyen trabajos con documentación incompleta, por ejemplo, diapositivas de una

presentación.

● Estudios que no se centran en Linked Data o Linked Open Data ni en otras formas de

datos estructurados.

● Estudios que no propusieron ninguna metodología o marco para la evaluación de la

calidad en Linked Data o Linked Open Data.

44

● Estudios que no tengan citas en otros estudios.

c) Preguntas de investigación para la revisión bibliográfica

¿Cuáles son las características de los datos publicados y consumidos en la web?

¿Qué métodos o procedimientos se han utilizado para publicar y consumir datos en la web?

¿Qué herramientas se han utilizado para publicar y consumir datos en la web?

d) Fuentes de datos y estrategia de búsqueda

Se realizó un proceso de búsqueda automático utilizando siete motores de búsqueda y sistemas

de indexación en la siguiente tabla se especifican las fuentes:

Recurso URL

IEEE Xplore https://ieeexplore.ieee.org/Xplore/home.jsp

Biblioteca digital ACM https://dl.acm.org/

ProQuest https://www.proquest.com/LATAM-ES/

Science Direct https://www.sciencedirect.com/

Scopus https://www.scopus.com/

Springer https://link.springer.com/

Emerald https://www.emeraldinsight.com/

Tabla 1: Fuentes de datos automáticos consultadas. Elaborada por el Autor

La cadena utilizada para la búsqueda automática consistió en la construcción de la frase

“Publishing linked data” OR ¨Publishing Linked open data methodology¨ OR ¨Linked Open data

Publishing Tools¨.

45

e) Selección de estudios

La búsqueda automática permite aplicar en primera instancia el criterio de exclusión de fechas

el cual permite recuperar en primera instancia los artículos publicados entre los años 2010 y 2019,

luego con la herramienta Mendey se procede a eliminar los posibles duplicados. Finalmente se

aplican los demás criterios de inclusión y exclusión sobre los trabajos potencialmente relevantes.

En la siguiente figura se muestra el flujo de este proceso de selección.

Figura 9: Artículos recuperados durante la búsqueda bibliográfica. Elaborado por autor

46

En el anexo 1 se presenta la relación de estudios seleccionados como relevantes para nuestra

investigación junto con un comparativo de las fases y herramientas para la publicación de datos

vinculados.

En cuanto a la extracción y síntesis de los datos, se realizó un análisis por cada artículo con el

fin de responder a las preguntas de investigación definidas anteriormente

f) Resultados de la revisión

Se analizaron en total 40 artículos publicados entre el 2010 y 2019, entre los cuales solo 22

fueron relevantes para el objeto de investigación, en la siguiente tabla 2 se presentan el número de

estudios por fuente Vs Año de publicación.

Fuente 2010 2012 2013 2014 2015 2016 2017 2018 Total general

IEEE Xplore 1 3 2 6

Emerald 3 1 4

ACM 2 1 3

Otras fuentes 1 1 1 3

Springer 1 1 2

ScienceDirect 1 1

Scopus 1 1

ProQuest 1 1

Otras fuentes - EBSCO 1 1

Total general 1 1 2 5 2 4 3 4 22

Tabla 2: Número de artículos encontrados Fuente Vs Año de publicación. Elaborado por autor

47

Se puede observar en la tabla que la fuente con más estudios relevantes sobre el tema de

investigación fue IEEE Xplore y que los años con más producción según esta muestra fueron los

años 2014(5), 2016(4) y 2018(4). No se encontraron estudios relevantes del año en curso.

Dentro de los estudios más citados se encuentran los estudios de (Piedra, 2014) (69),

(Zuiderwijk, 2014) (46), (Knap, 2012) (27), (Southwick, 2015) (23) y (Konstantinou, 2014) (20).

Los demás estudios se encuentran en rangos de menos de 17 citaciones, incluso dos estudios que

solamente presentan una citación.

g) Respuestas a las preguntas de investigación

¿Cuáles son las características de los datos publicados y consumidos en la web?

En (Zhao, 2010) se define que como primera medida se debe definir una estrategia de

transformación, donde se incluye una definición de un esquema de metadatos donde se incluya la

información de procedencia. Definir esquemas de URIS, reutilización de ontologías y

vocabularios. Hacer accesible la información de la estructuración. La evaluación de conjuntos de

datos es un punto crucial para asegurarse de que los datos vinculados se publiquen y cumplan con

los estándares. (Hidalgo-Delgado, 2018). Dentro de la metodología planteada por (Piedra, 2014)

establece que se debe identificar y seleccionar fuentes de datos heterogéneas para determinar el

alcance de los contenidos.

¿Qué métodos o procedimientos se han utilizado para publicar y consumir datos en la web?

Existen varias propuestas metodológicas para la publicación y consumo de datos dentro de las

cuales se destacan las de (Piedra, 2014), propuestas basadas en diseños de principios como en

(Zuiderwijk, 2014), propuestas basadas en tareas como la de (Radulovic, 2015). Básicamente se

siguen las siguientes etapas: Evaluación y selección de tecnologías, limpieza exportación de

48

metadatos para transformación, reconciliación con vocabularios controlados, implementación de

mapeos, generación de archivos RDF, publicación en LOD. Tareas complementarias como la de

definir reglas para los URIs y revisar las ontologías existentes y establecer licenciamiento también

son comunes.

¿Qué herramientas se han utilizado para publicar y consumir datos en la web?

Dentro de cada una de las etapas se ha evidenciado el uso de herramientas, las más comunes

son los repositorios de datos como Virtuoso y DSpace, iniciando el proceso de publicación se

encuentran herramientas como Openrefine para la limpieza, Protégé para la creación de ontologías,

Jena Fuseki para consultas Sparql. Dentro de las herramientas propias encontramos en (Klein,

2016) un framework llamado FusePool para el proceso de publicación de datos enlazados.

4.1.2. Contextualización del objeto de investigación

Para lograr contextualizar el objeto de investigación se proponen dos actividades

complementarias. La primera actividad consistió en acceder los repositorios institucionales donde

se realizó una inspección de diez repositorios de diferentes Instituciones Universitarias Nacionales

incluido el repositorio de la Universidad Distrital Francisco José de Caldas, relacionado en la tabla

3, donde se encontró la predominancia absoluta en el uso de la herramienta DSpace como

repositorio y la implementación del estándar de metadatos Dublín Core.

INSTITUCIÓN Ciudad/sede URL Herramienta Metadatos

UNIVERSIDAD

DISTRITAL BOGOTÁ http://repository.udistrital.edu.co/ DSpace Dublín Core

UNIVERSIDAD

PILOTO BOGOTÁ http://repository.unipiloto.edu.co/ DSpace Dublín Core

49

INSTITUCIÓN Ciudad/sede URL Herramienta Metadatos

PONTIFICIA

UNIVERSIDAD

JAVERIANA

BOGOTÁ https://repository.javeriana.edu.co/ DSpace Dublín Core

PONTIFICIA

UNIVERSIDAD

JAVERIANA

CÁLI http://vitela.javerianacali.edu.co/ DSpace Dublín Core

UNIVERSIDAD

DEL NORTE BARRANQUILLA http://manglar.uninorte.edu.co/ DSpace Dublín Core

UNIVERSIDAD

DE LA SABANA CHÍA https://intellectum.unisabana.edu.co DSpace Dublín Core

UNIVERSIDAD

DE LOS ANDES BOGOTÁ https://repositorio.uniandes.edu.co/ Séneca Dublín Core

UNIVERSIDAD

EAFIT MEDELLÍN https://repository.eafit.edu.co/ DSpace Dublín Core

UNIVERSIDAD

PONTIFICIA

BOLIVARIANA

MEDELLÍN http://repository.upb.edu.co/ DSpace Dublín Core

ESCUELA

COLOMBIANA

DE INGENIERÍA

BOGOTÁ https://repositorio.escuelaing.edu.co/ DSpace Dublín Core

Tabla 3: Instituciones educativas, repositorio y estándar de metadatos. Elaborado por el autor

Adicionalmente al observar la clasificación de comunidades, subcomunidades y colecciones de

los distintos repositorios, no se encuentra una estructuración estándar, solamente los repositorios

de las Universidades, Javeriana sede Cali (Comunidad REDA), La Sabana (Comunidad REDA) y

50

la Pontificia Bolivariana con su (Comunidad Producción docente), indican una comunidad llamada

Recursos Educativos Digitales Abiertos. La Universidad de los Andes define una comunidad

llamada “Recursos de aprendizaje” pero no cuenta con ítems publicados a la fecha, sin embargo,

se encontró que fuera del repositorio institucional si se encuentra recursos educativos publicados

en otras plataformas como Vimeo. La universidad Distrital define la comunidad “Recursos de

enseñanza” con un solo ítem publicado a la fecha.

Para este trabajo resulta importante promover y darle importancia a la comunidad “Recursos

Educativos Digitales Abiertos (REDA)” basando su estructura de subcomunidades y colecciones

de Instituciones Educativas pares que promuevan el desarrollo de este tipo de recursos y de alguna

forma generen estandarización e interoperabilidad entre los distintos repositorios.

La segunda actividad que consistió en realizar una solicitud de información a manera de

entrevista a las siguientes Instituciones de Educación Superior con el objetivo de conocer de

primera mano, las diferentes metodologías y herramientas de implementación en cada uno de sus

repositorios. Las Instituciones fueron seleccionadas de acuerdo a su mención como instituciones

participantes en el desarrollo del Proyecto sobre Recursos Educativos Abiertos liderado por el

Ministerio de Educación Nacional entre los años 2005 y 2011.

Las instituciones contactadas fueron:

• Universidad del Norte (Barranquilla)

• Universidad Pontificia Bolivariana (Medellín)

• Universidad EAFIT (Medellín)

• Pontificia Universidad Javeriana (Cali)

• Universidad de La Sabana (Chía)

51

De las instituciones contactadas solamente la Pontificia Universidad Javeriana sede Bogotá nos

proporcionó respuestas, las preguntas y respuestas de la entrevista se puede consultar como anexo

2.

COMPARACIÓN DE PROPUESTAS METODOLÓGICAS DE

PUBLICACIÓN DE DATOS

Dentro de la revisión encontramos trabajos relacionados como en (Piedra, 2014) donde se

menciona los pasos como selección de fuentes da datos heterogéneos para determinar el alcance

del contenido, modelado de vocabularios para el dominio OCW, Extracción de datos, Generar

datos RDF, publicar datos vinculados, consumir y visualizar datos vinculados. En la figura 10 se

representan los pasos de esta metodología.

Figura 10: Framework general para la publicación de recursos educativos en Linked data. Piedra, 2014

De esta metodología cabe destacar la utilización de herramientas como virtuoso y Jena.

52

En (Zuiderwijk, 2014) encontramos una metodología con el objetivo derivar principios para

diseñar y mejorar los procesos administrativos utilizados para publicar datos abiertos, dentro de

los pasos de esta propuesta se encuentran recomendaciones tales como:

Comenzar pensar en la apertura de datos desde el inicio del proceso;

• Desarrollar directrices, especialmente sobre la privacidad y la sensibilidad de la política

de los datos; proporcionar apoyo a la toma de decisiones mediante la comprensión de

las actividades de otros actores involucrados en el proceso de publicación.

• Convertir la publicación de datos en una parte integral, bien definida y estandarizada de

los procedimientos y rutinas diarias.

• Monitorear cómo se reutilizan los datos publicados. Las conversaciones con los

empleados del WODC demostraron que estos cinco principios podrían mejorar el

proceso de publicación de datos abiertos.

También encontramos otro enfoque metodológico presentado en (Radulovic, 2015) quien

menciona que la generación de Datos Vinculados consta de ocho tareas que comprenden la

selección de una fuente de datos que se transformará a Datos vinculados, el análisis de la licencia

para determinar los términos de uso de cada recurso, análisis en detalle y se especificó de una

estrategia de asignación de nombres de recursos, desarrolla una ontología para describir los datos

y los datos se transforman en el formato RDF. Finalmente, los datos generados se vinculan a los

datos de otros conjuntos de datos vinculados. En la figura 11 se muestra el flujo de dichas tareas.

53

Figura 11: Tareas para generar el proceso de datos enlazados. Rodulovic, 2018

Adicionalmente (Radulovic, 2015) menciona que el proceso de publicación de Datos

Vinculados consta de cuatro tareas (Fig. 12). Las tareas del proceso de publicación de Datos

vinculados incluyen garantizar el cumplimiento legal de los datos que se publicarán, la publicación

del conjunto de datos y la ontología, la publicación de metadatos y la documentación en línea, y

permitir el descubrimiento del conjunto de datos.

De esta metodología se destaca la utilización de herramientas como OpenRefine, Protégé y

Virtuoso.

Figura 12: Tareas del proceso de publicación de datos enlazados. Radulovic, 2015

54

En (Southwick, 2015) menciona como pasos la selección de tecnologías, la limpieza y

exportación de metadatos, preparación de metadatos para transformación, la reconciliación

con vocabularios controlados, implementación de mapeado, generación de archivos RDF

y publicación en LOD. Como recomendación de reutilización agrega la búsqueda de URIS

en datasets externos, establecer reglas para creación de URIS y la revisión de ontologías

existentes.

Las herramientas expuestas en esta metodología incluyen OpenRefine, Mulgara, OpenLink,

Virtuoso y ContentDM para el proceso de limpieza de metadatos.

En (Kučera, 2015) se propone un enfoque metodológico compuesto por 5 bloques de

construcción principales: fases, actividades transversales, artefactos, roles y prácticas. Para llevar

a cabo la publicación se manejan 4 etapas:

• Desarrollo del plan de publicación de datos abiertos.

• Preparación de la publicación.

• Realización de publicación.

• Archivado.

En (Konstantinou, 2014) se muestra una arquitectura interesante sobre la infraestructura de un

repositorio de recursos educativos digitales, en este artículo cabe destacar la utilización del

repositorio DSpace.

55

Figura 13: Vista de componentes de un repositorio de recursos educativos. Konstantinou, 2014

En general podemos sintetizar que las propuestas presentan planteamientos metodológicos muy

similares en tareas como la definición de los recursos, los modelos de datos, el licenciamiento y

las herramientas utilizadas para el proceso de publicación. Cabe destacar que la variación entre las

distintas metodologías se evidencia en el dominio de conocimiento aplicado y a la integración de

este con datos ya publicados, distintos planteamientos se enfocan en la calidad y automatización

de los datos como se evidencia en (Knap, 2012) y (Zhao, 2010) donde encontramos una tendencia

de la metodología hacia la preparación de los datos y su calidad y en la automatización basada en

mapeos utilizando scripts de transformación.

Por otro lado, se encuentra una propuesta en (Senso, 2018) muy completa donde se definen

etapas como identificación y descripción de datos, almacenamiento y corrección, desarrollo de

vocabularios y su descripción en formatos RDF, generación de los recursos en RDF, conexión con

otros dataset incluyendo su validación, conexión son otros datasets incluyendo su verificación y

por último la publicación de este dataset y sus metadatos. También relaciona cada una de las etapas

con la definición de herramientas a utilizar dentro de las que se encuentra, por ejemplo, Apache

Hadoop para el almacenamiento, OpenRefine para la extracción y limpieza de datos, protégé para

la modelización, Silk para enlazado y Virtuoso como repositorio de publicación.

56

De acuerdo a la revisión bibliográfica encontramos la metodología planteada en los estudio de

(Radulovic, 2018) y (Senso, 2018) sintetizan los pasos y tareas de otras metodologías encontrados

y son más que más se adaptan al objetivo de publicación de recursos educativos propuesto,

adicionalmente propone el uso de herramientas libres como Protegé y Open refine, esto

complementado con lo planteado por (Konstantinou, 2014) sobre repositorios nos da una base para

plantear y proponer la metodología objetivo de este trabajo.

CAPITULO V PLANTEAMIENTO DE LA PROPUESTA METODOLOGICA DE

PUBLICACIÓN DE DATOS VINCULADOS

De acuerdo a los resultados expuestos en la sección 4.2, se definieron 6 etapas para el proceso

de publicación de recursos, las cuales se muestran en la figura 14.

PROPUESTA METODOLÓGICA PLANTEADA

Figura 14: Etapas propuestas para la metodología de publicación de Recursos Educativos. Elaborado por autor

Estas etapas se adaptaron a partir de las metodologías estudiadas, pero principalmente de la

propuesta descrita en (Senso, 2018).

57

A continuación, se describe brevemente cada una de las etapas.

Etapa 1 Determinar se refiere principalmente a la identificación del dominio o tema, así como

cada uno de los participantes potenciales que estén dentro del marco de la investigación. En esta

etapa se define que metadatos son relevantes para describir la información del dominio para

finalmente determinar cuál es el esquema que más se adapta a la necesidad.

Etapa 2 Limpiar se refiere a la limpieza de datos provenientes de un modelo de datos distinto

o tags de metadatos diferentes al definido en la metodología. En esta etapa se establece la estrategia

de curación para estos datos.

Etapa 3 Modelar se refiere a la utilización de una herramienta que nos permita estructurar a

través de un modelo, los objetos, las propiedades, los rangos y relaciones existentes en el dominio.

Etapa 4 Generar se refiere a convertir el modelo de datos a una estructura de tipo RDF o

tripletes con relación semántica que pueda ser interpretado tanto por máquinas como por seres

humanos.

Etapa 5 Enlazar se refiere a enriquecer las estructuras de la etapa anterior con otras estructuras

que se relacionen a través de URI.

Etapa 6 Publicar, por último, esta etapa se refiere a la exposición constante y enriquecida del

dataset creado a partir de los recursos que se cargan al repositorio.

DESCRIPCIÓN DE CADA UNA DE LAS ETAPAS DE LA PROPUESTA

METODOLÓGICA PLANTEADA

58

A continuación, se describe el planteamiento paso a paso para realizar la publicación de recursos

donde se incluye las condiciones necesarias, recomendación técnica de herramientas y

recomendaciones de buenas prácticas.

5.2.1. Etapa 1: Determinar

También lo llamamos Identificación del dominio. Para identificar el dominio se debe

comprender, definir cada uno de los elementos que existen dentro del dominio, como las entidades,

sus atributos y relaciones. Se debe definir el tipo de cada uno de los atributos, por ejemplo, para el

atributo nombre se debe definir si es de tipo carácter, entero, cadena de caracteres etc. Se sugiere

representar esta caracterización del dominio en una taxonomía tipo árbol.

Buenas prácticas:

• Se recomienda realizar esta primera etapa utilizando solo lápiz y papel y luego si llevarlo

a un gráfico o tabla.

• Para definir los tipos de atributos, utilice tipos de datos estándar en lenguajes de

programación, int, string, date etc.

Herramientas recomendadas:

• Lápiz y papel

• Word, Excel.

5.2.2. Etapa 2: Limpiar

59

La etapa de limpieza se considera cuando el origen de los datos proviene de distintas fuentes y

es necesario limpiar y curar la información para que se adapte a nuestra estructura. Para esto

establecemos dos vías de acuerdo al origen de los datos.

1. Los datos se deben cargar manualmente en el archivo, este debe irse construyendo

tripleta a tripleta acorde a las restricciones de construcción definidas anteriormente.

2. Los datos provienen de un gestor de recursos, como es el caso de DSpace. Se debe

utilizar herramientas de curación de datos que normalmente tiene el gestor y utilizar las

opciones de importación de metadatos. Después de esto se genera el dataset de acuerdo

a las reglas de mapeo.

Por cualquiera de las dos vías se debe haber publicado los recursos digitales en un gestor de

recursos digitales, y haber alimentado la metadata que tendría cada recurso.

Buenas prácticas:

• Utilice un programa especializado para la curación y limpieza de datos.

• En este punto es importante tener ya definido un esquema del dataset

• Realice equivalencias entre los vocabularios origen y los vocabularios destino.

• Puede usar un validador RDF para verificar que los dataset creados tengan la estructura

adecuada.


• OpenRefine http://openrefine.org/

• Validador RDF https://www.w3.org/RDF/Validator/

• Notepad++ https://notepad-plus-plus.org/download/v7.6.6.html

60

5.2.3. Etapa 3: Modelar

Se define en dos fases

a) Fase 1: Modelo de dominio

Después de haber caracterizado el dominio, se deben definir formalmente las relaciones entre

las entidades de dominio. Para esto siga los siguientes pasos.

• Organice la información en una tabla donde se especifique una a una las relaciones entre

entidades. Las relaciones son de tipo, pertenece a, tiene un, es parte de, etc.

• Represente la información de la tabla en un gráfico donde se puedan apreciar las entidades

y las relaciones del dominio.

Buenas prácticas:

• Apóyese en modelos existentes que muestren las relaciones de entre entidades.


• Excel

• Protegé https://protege.stanford.edu/

• Programas para representar modelos

b) Fase 2: Identificar cuáles de los atributos tienen relaciones con datos externos

Al identificar estos atributos estamos realizando una primera aproximación a los datos que son

candidatos a ser vinculados. Por ejemplo, cuando el dominio de conocimiento no posee una base

de datos de autores y para enriquecer los datos debe recurrir a otros repositorios institucionales.

61

En este caso el autor no es de tipo interno sino externo y esa relación externa hacia otro repositorio

se debe expresar a través de un URL a dichos repositorios.

Buenas prácticas:

• Al identificar los atributos candidatos a ser enlaces con otros dataset, realice una

búsqueda y enliste por atributo mínimo 2 datasets candidatos que contengan la

información requerida.


Silk http://silkframework.org/

5.2.4. Etapa 4: Generar

Esta etapa la dividimos en dos fases:

a) Fase 1. Representación del modelo en un lenguaje

En esta etapa se busca que el modelo descrito se exprese en un lenguaje con el que se construirá

el dataset.

Para esto seguiremos los siguientes pasos.

• Determinar qué tipo de vocabulario tienen las entidades, atributos y relaciones que se

quiere describir.

• Si el vocabulario seleccionado no es suficientemente para describir todas las entidades,

atributos y relaciones debemos crear un perfil de aplicación que consiste básicamente

en una mezcla de vocabularios de acuerdo a nuestra necesidad y que deben cumplir con

62

la condición de ser vocabularios reconocidos para que puedan ser interoperables con

otros recursos.

Finalmente, esta fase también la podríamos definir como fase de mapeo.

Buenas prácticas:

• Preferiblemente utilice vocabularios conocidos como DCTERMS, FOAF, SKOS

• Tener en cuenta que algunos repositorios no admiten grafos multivariados, esta

situación se presenta por ejemplo con la herramienta DSpace cuando se definen

vocabularios con calificadores en un segundo nivel, como por ejemplo en el vocabulario

Dublin Core con el tag contributor y sus calificadores dc:contributor.author y

dc:contributor.uri, estos son interpretados en el momento de la serialización como parte

del mismo contenido.


• Consultar más vocabularios en https://lov.linkeddata.es/dataset/lov/

b) Fase 2: Construcción del dataset

Teniendo ya la información de las entidades, relaciones y atributos procedemos a construir el

dataset en formato RDF. Seguimos los siguientes pasos

• Definir qué tipo de archivo que vamos a construir, RDF/XML es una opción, pero

recomendamos turtle ya que es más sencillo para la interpretación humana.

• Definir los namespace a utilizar de acuerdo a él o los vocabularios seleccionados en la

anterior etapa ya que serán los encabezados de nuestro archivo RDF.

63

• Construir el archivo RDF a partir de los parámetros definidos.

• Validar la construcción del dataset.

• Probar consultas sparql al dataset.

Buenas prácticas:

• Utilice un editor de texto especializado para codificación.

• Utilice el validador para verificar la construcción del dataset.


• Notepad++ https://notepad-plus-plus.org/

• Validador RDF https://www.w3.org/RDF/Validator/

5.2.5. Etapa 5: Enlazar

Esta etapa es complementaria a la fase 2 de la etapa 6, “Identificar cuáles de los atributos tienen

relaciones con datos externos”.

Para esto tomamos el listado generado en dicha etapa y podemos utilizar una herramienta que

nos permita reconciliar nuestro dataset con otros dataset o establecer los URL de forma manual.

Buenas prácticas:

• Utilice un programa que le permita reconciliar la información de su dataset con otros

dataset.


• OpenRefine http://openrefine.org/

64

5.2.6. Etapa 6: Publicar

Debemos hacer ciertas validaciones antes de poder publicar nuestros dataset.

• Seleccionar un gestor de recursos vinculados

• Validar si el gestor de recursos vinculados requiere que el dataset sea adaptado en

formato y si es el caso, adaptarlo.

• Se realizan nuevamente consultas de verificación sobre el dataset.

• Se crea el EndPoint

• Se realiza una prueba de consulta externa al endPoint.

Buenas prácticas:

• Al publicar el dataset pruebe simular la solicitud de consumo externo al dataset con una

herramienta como Postman.


• FUSEKI https://jena.apache.org/documentation/fuseki2/

• Postman https://www.getpostman.com/

Con esto finalizamos la etapa de publicación y la metodología propuesta.

DESARROLLO DE ETAPAS DE METODOLOGÍA

En esta sección presentamos paso a paso el desarrollo de la propuesta metodológica para la

publicación de recursos educativos como linked data, este desarrollo se realiza de forma manual

para comprobar que cada uno de los pasos es viable no solo para nuestro dominio sino también

para otros.

65

5.3.1. Desarrollo etapa 1: determinar

El dominio sobre el cual trabajamos en el caso de estudio es el de los recursos educativos

digitales abiertos o REDA, por lo tanto, definiendo la taxonomía del dominio y de acuerdo con la

clasificación expuesta en (Ministerio de Educación Nacional, 2012). En la figura 15 se muestra los

diferentes tipos de recursos educativos digitales a manera de identificar el dominio.

Figura 15: Tipos de recursos educativos digitales. Elaborado por autor

Hemos definido que los atributos deben aplicar a cualquier REDA independiente del tipo. Para

esto nos hemos basado en la propuesta de metadatos de LOM-CO y DublinCore donde finalmente

hemos seleccionado 25 atributos que consideramos importantes en este dominio. En la siguiente

tabla mostramos dicha selección.

66

Nombre atributo Descripción atributo Tipo de

dato

Titulo Representa el nombre asignado al recurso String

Idioma Representa el lenguaje o los lenguajes utilizados dentro del recurso String

Descripción Una descripción textual del contenido, objetivo y actividades del

recurso. String

Palabras Clave Representa una palabra clave o frase que describe el tema del recurso String

Versión Representa la versión del recurso double

Creador Representa el nombre completo del creador del recurso. String

email Creador Describe el correo electrónico del creador del recurso String

Publicador Representa el nombre completo del publicador del recurso. String

Colaborador Representa el nombre completo del coautor del recurso String

Fecha Representa la fecha de creación del recurso Date

Formato Representa el formato del recurso String

Localización

(URI) identificador Representa la dirección donde se localiza el recurso (URI) String

Tema Representa el tema del recurso. String

Requerimientos Representa la descripción de los requerimientos para acceder al recurso String

Instrucciones

Instalación Representa las instrucciones de instalación del recurso String

Tipo

Interactividad El tipo de aprendizaje predominante soportado por el recurso. String

Nivel

Interactividad

La interactividad en este contexto se refiere al grado en el que el

estudiante puede influir en el aspecto o comportamiento del recurso. String

Tipo Representa el tipo de recurso educativo String

67

Nombre atributo Descripción atributo Tipo de

dato

Audiencia

(Población objetivo) Representa la población objetivo a la que va dirigido el recurso String

Contexto Representa el contexto de aprendizaje del recurso String

Dificultad Representa el nombre de la licencia del recurso String

Derechos

(licencia)

Representa el tipo de licencia del recurso y el vínculo con la descripción

de los términos de la licencia. String

LicenciaUri Representa la descripción o el url de la licencia String

Rango de edad Representa la edad a la que va dirigido el objetivo del recurso String

Frecuencia de

actualización Representa la frecuencia de actualización o revisión del recurso String

Fecha

actualización Representa la fecha de la última actualización del recurso Date

Tipos de

evaluación que

maneja el recurso

Representa el tipo de evaluación del recurso String

Tabla 4: Atributos definidos para recursos educativos. Elaborado por autor

5.3.2. Desarrollo etapa 3: limpiar

Aunque es una parte importante en el desarrollo de la publicación, y está definida dentro de la

metodología, no la abordamos como tal en el desarrollo por considerarla complementaria en

casos donde los datos no son generados desde la estructura de datos propuesta.

68

5.3.3. Desarrollo etapa 3: modelar

Esta etapa se desarrolla en dos fases.

Fase 1: Modelo de dominio

Para iniciar con la fase de modelado inicialmente se recomienda listar las relaciones

encontradas, en la siguiente tabla se presentan dichas relaciones.

ENTIDAD1 RELACIÓN ENTIDAD 2 RELACIÓN2 ENTIDAD 3

REDA Tiene un titulo es título de REDA

REDA Tiene un idioma es idioma de REDA

REDA Tiene un resumen es resumen de REDA

REDA Tiene un tema es tema de REDA

REDA Tiene un versión es versión de REDA

REDA Tiene un autor es autor de REDA

REDA Tiene un email es email de creador

REDA Tiene un coautor es coautor de REDA

REDA Tiene un publicador es publicador de REDA

REDA Tiene un fecha es fecha de REDA

REDA Tiene un frecuencia es frecuencia de

actualización de REDA

REDA Tiene un actualización fecha de actualización de REDA

REDA Tiene un formato es el formato de REDA

REDA Tiene un URI es URI de REDA

REDA Tiene un requerimiento es requerimiento de REDA

REDA Tiene un instrucción es instrucción de

instalación de un REDA

69

ENTIDAD1 RELACIÓN ENTIDAD 2 RELACIÓN2 ENTIDAD 3

REDA Tiene un interactividad es el nivel de

interactividad de un REDA

REDA Tiene un tipo es el tipo de recurso de un REDA

REDA Tiene un nivel

interactividad

es el nivel de

interactividad de un REDA

REDA Tiene un audiencia es la audiencia de un REDA

REDA Tiene un contexto es el contexto de un REDA

REDA Tiene un nivel dificultad es el nivel de dificultad

de un REDA

REDA Tiene un edad es la edad al que va

dirigido un REDA

REDA Tiene un derechos es el tipo de licencia de

un REDA

REDA Tiene un URI derechos es el URI de un tipo de

licencia REDA

Tabla 5: Relaciones entre los elementos del dominio. Elaborado por autor

Presentamos la siguiente figura que muestra la relación de algunos de los atributos con los

recursos con la entidad recursos educativos.

70

Figura 16: Relación de recursos educativos con metadatos. Elaborado por autor

Utilizamos protege para modelar de otra manera relación del recurso con sus atributos

utilizando una herramienta donde se muestra la relación que tienen cada uno de los metadatos

con el recurso.

Figura 17: Modelo de datos en protegé. Elaborado por autor

71

Fase 2: Identificar cuáles de los atributos tienen relaciones con datos externos

De los 25 atributos seleccionados, definimos 11 candidatos a tener relaciones con datos

externos, estos se presentan en la siguiente tabla.

Nombre

atributo

Posible

Enlace

Tipo de

dato Ejemplo Diligenciamiento

Idioma

Se puede

enlazar con

lista de

vocabularios

Iso639-3

String spa Manual

Palabras

Clave

Se puede

enlazar por

tema con

Dbpedia,

Europeana

String

Mercadeo - administración de

empresas - emprendimiento -

administración de mercados

Manual

Creador

Se puede

enlazar con

base de datos

docentes o

redes sociales

String Morales Camacho, Rocío Manual

Publicador

Se puede

enlazar con

base de datos

docentes o

redes sociales

String Pontificia Universidad

Javeriana Manual

72

Nombre

atributo

Posible

Enlace

Tipo de


Colaborador

Se puede

enlazar con

base de datos

docentes o

redes sociales

String Valencia, Tatiana Manual

Formato

Se puede

enlazar con

media types

mime

String text/html

Comprimido (zip, rar,

tar, gz) - Página web (Htm,

html) - Documento portable

(pdf) - Película de Flash

(swf) - Imagen (jpg, gif,

png) - Video (wmv, avi,

mov, mpg) - Audio

(wav,mp3) - Ejecutable

(exe) - Otro

Localización

(URI)

identificador

Es un

enlace natural

del recurso

String http://hdl.handle.net/11522/100

34

Manual

Tema

Se puede

enlazar por

tema con

Dbpedia,

Europeana

String Mercadeo Manual

Tipo

Enlazar

con dataset de

recursos

String Objeto de aprendizaje

Textual - sonoro - visual

- Audivisual - Multimedia -

Curso Virtual - Aplicación -

Objeto de Aprendizaje

73

Nombre

atributo

Posible

Enlace

Tipo de


educativos en

campo tipo

Audiencia

(Población

objetivo)

Enlace con

dataset de

grupos

poblacionales

String Estudiante de Educación

Superior

Estudiantes Educación

Superior, Docentes,

investigadores

LicenciaUri

Enlace

manual con

tipo de

licencia CC

String

http://creativecommons.org/license

s/by-nc-nd/2.5/co/

Manual

Tabla 6: Atributos candidatos a ser relacionados con otros dataset. Elaborado por autor

5.3.4. Desarrollo etapa 4: generar

Esta etapa la desarrollamos en dos fases:

Fase 1. Representación del modelo en un lenguaje

Basándonos en la definición de vocabularios de distintos repositorios educativos, hemos

definido que el vocabulario candidato para las distintas entidades, atributos y relaciones es

DublinCore por su versatilidad a la hora de poder describir los recursos, en el anexo 3 podrá

encontrar una tabla con una descripción más amplia de los tags seleccionados.

74

Fase 2: Construcción del dataset

Para esto y de acuerdo a los vocabularios seleccionados y las propiedades seleccionadas,

hemos construido un esquema base que describe recursos con propiedades comunes para poder

realizar una prueba de consulta.

El dataset es construido bajo el siguiente concepto de tripleta (sujeto, predicado y objeto).

Figura 18: Representación de estructura de triplete del dataset. Elaborado por autor

Bajo la anterior representación se plantea el esquema RDF por recurso como se muestra en la

siguiente figura donde se describe un recurso con cada uno de sus metadatos y la información

que contienen.

Figura 19: Pantalla validador RDF. Tomado por autor

75

Una vez validado debemos convertirlo a formato RDF/XML a formato turtle (.ttl) por

requerimientos del gestor donde cargaremos el dataset. Para esto podemos utilizar el servicio de

http://www.easyrdf.org/converter o cualquier servicio que permita hacer la conversión.

Figura 20: Pantalla conversión RDF a Turtle. Tomado por autor

Una vez tengamos listo nuestro dataset en formato turtle, se carga en el gestor de datasets el

cual es FUSEKI. Después de realizar la carga del dataset, realizamos la prueba de consultas con

una consulta predeterminada la cual nos muestra las primeras 25 tripletas. Con este paso

confirmamos que los datos quedaron bien cargados en el gestor.

76

Figura 21: Pantalla Fuseki consulta. Tomado por autor

5.3.5. Desarrollo etapa 5: enlazar

En la fase 2 de la etapa 3 se definieron 11 atributos candidatos a vinculación, los demás

atributos son tomados como literales. Para efectos prácticos mostraremos como realizar esta

reconciliación de los atributos con otros datasets a través de los tesauros más conocidos como

son DBpedia y SKOS, la vinculación la podemos hacer apoyándonos en una herramienta de

reconciliación como Openrefine o realizando la búsqueda manual en los tesauros candidatos e

insertando manualmente el URL apropiado.

Enlace apoyado por herramienta de reconciliación:

En esta parte utilizamos la herramienta OpenRefine con su complemento RDF, las

instrucciones de instalación y el paso a paso para la reconciliación se encuentran ejemplificados

en el siguiente enlace https://www.youtube.com/watch?v=SSDndvFkQdY&list=LLX0_eSjui1-

gNImaWAl9Yqw&index=3&t=0s

77

Cargamos el dataset de prueba, creamos un nuevo proyecto y agregamos un servicio de

reconciliación que para efectos prácticos de nuestra metodología será DBpedia.

Figura 22: Pantalla configuración servicio de reconciliación datos en OpenRefine. Tomado por autor

Una vez agregado el servicio procedemos a reconciliar una de las columnas que en este caso

será el atributo de formato, dando click en iniciar como se muestra la imagen.

Figura 23: Pantalla reconciliación datos OpenRefine por campo. Tomado por autor

78

Luego elegimos la opción del tesauro con el cual se va a reconciliar, esperamos el proceso y

en algunos casos tendremos que intervenir para elegir una de las opciones que nos del programa

ya que la coincidencia puede no ser exacta, en los casos exactos se puede observar el vínculo

dando click en el atributo exacto sin listas de chequeo.

Figura 24: Pantalla resultado reconciliación campo en OpenRefine. Tomado por autor

Al dar click por ejemplo en MPEG podemos ver la página de DBpedia donde se define el

concepto de este tipo de formato.

79

Figura 25: Pantalla salida url recurso. Tomado por autor

Finalmente, la herramienta permite generar y exportar el archivo final RDF con los nuevos

datos vinculados.

Enlace manual:

Esta opción la podemos utilizar en caso de que tengamos previamente muy bien definidos los

enlaces. Para nuestro caso tenemos el atributo idioma que se puede expresar en el estándar

Iso639-3 y encontrar los vínculos clave en la siguiente página https://iso639-3.sil.org

Los más utilizados son:

• Español https://iso639-3.sil.org/code/spa

• Ingles https://iso639-3.sil.org/code/eng

• Alemán https://iso639-3.sil.org/code/deu

• Francés https://iso639-3.sil.org/code/fra

• Portugués https://iso639-3.sil.org/code/por

80

• Italiano https://iso639-3.sil.org/code/ita

Estos vínculos deben ser cargados manualmente en el archivo RDF en el atributo idioma.

5.3.6. Desarrollo etapa 6: publicar

Como se mostró en etapas anteriores, hemos seleccionado como gestor de recursos vinculados

el gestor FUSEKI, dicho gestor requiere que el dataset publicado se presente en formato turtle.

Adicionalmente para esto hemos enriquecido los atributos idioma, tema, publicador y formato

con información vinculada a tesauros relacionados.

En la siguiente imagen se puede ver la consulta realizada al nuevo dataset enriquecido.

Figura 26: Pantalla consulta sparql dataset vinculado. Tomado por autor

Para simular la exposición del dataset, vamos a simular una consulta externa a FUSEKI, para

esto vamos a verificar que el gestor que en la pestaña info la información que se muestra sobre

los servicios disponibles, en el parámetro “Graph Store Protocol” se encuentre el método GET.

81

Como las consultas sparql no funcionan muy bien cuando se ejecutan externamente dado que el

query viaja a través del protocolo http, el query debe viajar en un formato que el protocolo pueda

entender, por lo tanto, dicha consulta debe codificarse.

Para codificar la consulta se puede usar un codificador de porcentajes como el que se muestra

en la figura 28 y se encuentra disponible en https://www.url-encode-decode.com/

Figura 27: Pantalla codificador sparql protocolo http. Tomado por autor

Ingresamos la consulta en lenguaje sparql en la ventana izquierda y en la ventana derecha

aparece la consulta codificada, la cual copiamos.

Postman es una herramienta que permite simular consultas de consumo de datos en la web.

Cargamos la herramienta y seleccionamos el tipo de método que para este caso es “GET”.

82

Figura 28:Pantalla interfaz Postman. Tomado por autor

En frente al combo donde se seleccionó el método “Get”, se escribe la url a consultar, que en

este caso es http://localhost:8080/fuseki/Recursos3/query

Figura 29: Pantalla parámetro GET Postman, Tomado por autor

Donde,

• http://localhost:8080/fuseki/ corresponde al servidor fuseki

• http://localhost:8080/fuseki/Recursos3/ corresponde al endpoint a consultar

• http://localhost:8080/fuseki/Recursos3/query corresponde al servicio a realizar

83

En la sección de parámetros se escribe:

• Key -> el nombre del parámetro que obtendrá la respuesta (en minúscula). Para el

ejemplo se usó “query”.

• Value se coloca la consulta codificada que se copió del codificador de sparql

Figura 30: Pantalla parámetro KEY y VALUE Postman. Tomado por autor

Se selecciona el botón “send” y al recibir los resultados en la sección “Body”, éstos se pueden

ver en Pretty (donde se puede escoger entre diferentes formatos de destino), Raw, Preview

Figura 31: Pantalla resultado consumo Postman. Tomado por autor

84

Las aplicaciones externas recibirán un formato Json

Para consumirlos se pueden levantarlos o exponerlo al público a través de una serie de

servicios, donde cada servicio respondería una consulta especifica en sparql

Con esto finalizamos la etapa de publicación y se muestra el uso de la metodología propuesta.

CAPITULO VI RESULTADOS OBTENIDOS

A continuación, mostramos el planteamiento metodológico aplicado al caso de estudio

planteado para el repositorio de recursos educativos de la Universidad Distrital Francisco José de

Caldas.

De acuerdo con nuestra investigación sobre repositorios institucionales y como ya lo

mencionamos anteriormente, DSpace es considerado como una de las mejores opciones pues

permite el desarrollo y definición de estructuras sintácticas y semánticas personalizados.

(Ministerio de Educación Nacional, 2011).

Por tal razón antes de iniciar el proceso es indispensable realizar la instalación de este

repositorio que para nuestro caso se realizará localmente para efectos de simulación de un

repositorio institucional.

La instalación de dicho repositorio puede realizarse con el manual de instalación publicado en

el siguiente enlace https://www.researchgate.net/publication/323203183

El repositorio nos proveerá en primera instancia de una interfaz para estructurar los esquemas

de metadatos definidos, por defecto DSpace trabaja con el esquema de metadatos Dublín Core

85

pero también nos permite mediante configuraciones crear combinaciones de varios esquemas.

También DSpace nos proveerá de direcciones URIs validas sobre los recursos publicados.

A partir de la estructura educativa institucional de la Universidad Distrital, se presentan

nombres de ejemplo para la taxonomía del repositorio simulando la estructura de un repositorio de

recursos educativos (Ver figura 33).

Figura 32: Taxonomía del repositorio. Tomado por autor

IMPLEMENTACION DE METODOLOGÍA EN CASO DE ESTUDIO

6.1.1. Caso de estudio etapa 1: determinar

En esta etapa vamos a iniciar con la información definida en el capítulo anterior sobre la

identificación del dominio y lo complementaremos con la definición de los interesados en el

dominio de la publicación de recursos educativos.

Como interesados se define a todas las instituciones de educación superior que deseen

implementar un método para la publicación de recursos utilizando Linked Data, para este caso al

ser un caso de estudio específico se define como interesado a la Universidad Distrital y como

Facultad

Comunidad

Proyecto curricular

Sub Comunidad

Área

Colección

RecursoItem

86

institución colaboradora o experto en el dominio a la Pontificia Universidad Javeriana con sede en

Bogotá, la cual nos permitió realizar una entrevista sobre la implementación de su repositorio

institucional lo cual nos sirvió como base para implementar el caso de estudio. La entrevista está

disponible en la sección de anexos de este documento como anexo 2.

También como complemento se caracterizaron uno a uno los metadatos seleccionados bajo el

siguiente esquema.

Categoría General

Item 1.4

Descripción Representa una palabra clave o frase que describe el tema del recurso

Nombre DC dc:subject

Obligatoriedad Obligatorio

Diligenciamiento Manual

Mínimo

permitido 4

Máximo

permitido 6

Recomendación

*Primeras letras de las palabras en mayúscula las demás en minúsculas mínimo

cuatro

(4) máximo seis (6) deben aparecer en columna no en fila, si aparecen en fila es

porque el Autor

ingreso todas las palabras clave en una sola casilla. Debe ser una palabra clave por

casilla, Remitirse a temas definidos por UNESCO o definidos en el Pensum

Universitario

Mapeado X

Nombre Mapeado subject

Tabla 7: Caracterización de metadato. Elaborado por autor

87

La lista de metadatos completa se puede consultar en la sección de anexos de este documento

como anexo 4.

6.1.2. Caso de estudio etapa 2: limpiar

La etapa de limpieza se considera como la etapa donde de los datos RDF deben ser construidos

o adaptados. Si los datos se deben cargar manualmente en el archivo, este debe irse construyendo

tripleta a tripleta acorde a las restricciones de construcción definidas anteriormente. Si los datos

vienen de un gestor de recursos, como es el caso de DSpace.

6.1.3. Caso de estudio etapa 3: modelar

La etapa de modelado para recursos educativos también se expone en el capítulo anterior y su

resultado se utiliza como insumo para el caso de estudio. Sin embargo, la herramienta utilizada

para alojar los recursos (DSpace) provee también la información necesaria para definir las

relaciones entre las entidades por medio de la definición de su propia ontología.

6.1.4. Caso de estudio etapa 4: generar

Es desde hasta fase donde realmente la herramienta nos provee una infraestructura para capturar

metadatos, trabajar con vocabularios reconocidos y definir mapeos.

Como se mencionó anteriormente Dspace nos permite definir una estructura taxonómica de los

recursos. Ver figura 15.

88

Figura 33: Pantalla estructura repositorio. Tomado por autor

La herramienta nos permite trabajar con vocabularios predefinidos como DublinCore y crear

calificadores adicionales sobre el vocabulario a través de una serie de accesos a archivos fuente de

configuración.

Al tener definidos los metadatos en las etapas de determinación y modelado, procedemos a

crearlos manualmente en DSpace, para esto, una vez que ingresemos al repositorio con

permisos de administrador vamos al menú “Administer”

Figura 34: Pantalla acceso administrador DSpace. Tomado por autor

89

Luego debemos ir a la opción “General Settings” y seleccionamos la opción “Metadata

Registry”

Figura 35: Pantalla acceso registro metadatos DSpace. Tomado por autor

Una vez esté en el menú de metadatos seleccione la opción 1 dcmi-terms

Figura 36: Pantalla esquema de metadatos DSpace. Tomado por autor

En esta opción, primero va a validar los metadatos útiles (creator) de acuerdo a la definición de

metadatos anterior y después debe definir los metadatos faltantes (creator.email)

Figura 37: Pantalla metadatos DSpace. Tomado por autor

90

Para crear un metadato nuevo basado en el namespace dc vaya hasta la parte final de la página

para definirlo e incluirlo con el botón Add New.

Figura 38: Pantalla adición de metadatos DSpace. Tomado por autor

Una vez validado que todos los metadatos necesarios están definidos en el namespace, vaya al

archivo imput_forms.xml ubicado en X:\dspace\config

Figura 39: Pantalla archivo configuración de formulario DSpace. Tomado por autor

En este archivo podrá definir uno a uno los campos para la captura de información de cada

recurso que se muestra como formulario cada vez que se agrega un recurso en DSpace.

91

Figura 40: Pantalla creación de campos formulario DSpace. Tomado por autor

Para el mapeo DSpace nos proporciona un archivo que define un mapeo a un grafo RDF

preestablecido en el archivo metadata-rdf-mapping.ttl ubicado en D:\dspace\config\modules\rdf

Figura 41: Pantalla archivo mapeo DSpace. Tomado por autor

En dicho archivo definimos la sintaxis de cada una de los metadatos establecidos, en el archivo

existen varios ejemplos para definir además la característica para que dataset se defina con campos

de URL. En esta fase hemos definido y verificado el mapeo de los metadatos establecidos.

Figura 42:Pantalla ejemplo creación de mapeos en DSpace. Tomado por autor

92

En este punto podemos utilizar la herramienta para cargar recursos e ingresar los metadatos.

Para cargar un recurso en el repositorio vamos a la opción “My DSpace” y luego damos click

en el botón “Start a New Submission”

Figura 43: Pantalla inicio de carga de recurso DSpace. Tomado por autor

Una vez entremos seleccionamos la colección de acuerdo a la estructura creada que para este

caso es la colección programación, perteneciente a la subcomunidad Ingeniería de Sistemas

contenida en la comunidad Recursos Educativos Facultad de Ingeniería. Damos click en el botón

next.

Figura 44: Pantalla selección colección para carga de recursos en DSpace. Tomado por autor

Cargamos los metadatos solicitados en el formulario.

93

Figura 45: Pantalla ingreso de metadatos del recurso en DSpace. Tomado por autor

Cargamos el recurso

Figura 46: Pantalla carga de metadatos del recurso satisfactoria en DSpace. Tomado por autor

Verificamos que la información de metadatos esté correcta.

Figura 47: Pantalla verificación de ingreso de información del recurso en DSpace. Tomado por autor

Validamos los términos de licencia y finalizamos la carga del recurso.

94

Figura 48: Pantalla carga de información del recurso completa en DSpace. Tomado por autor

Para construir el dataset DSpace dispone de un comando que genera el archivo RDF necesario

de acuerdo a las reglas definidas en el archivo de mapeo metadata-rdf-mapping.ttl. Una vez

tengamos nuestros recursos educativos cargados procedemos a ejecutar el comando RDFizer como

se muestra en la siguiente imagen donde se puede apreciar cómo va generando cada uno de los

grafos.

Figura 49: Pantalla ejecución comando RDFIZER. Tomado por autor

95

Para validar la correcta construcción del dataset debemos nuevamente recurrir a la herramienta

FUSEKI, solo que en este caso en vez de cargar el dataset de forma manual, lo realizamos

conectando el servicio a la base de datos de DSpace. Como resultado de esta conexión se puede

visualizar en FUSEKI cada uno delos grafos RDF en formato turtte generados al ejecutar el

comando rdfizer.

Figura 50: Pantalla visualización de grafo en Fuseki. Tomado por autor

6.1.5. Caso de estudio etapa 5: enlazar

Como se ha mencionado anteriormente esta etapa es complementaria Esta etapa es complementaria

a la fase 2 de la etapa 6 “Identificar cuáles de los atributos tienen relaciones con datos externos”.

En el archivo de mapeo definimos los campos que son candidatos a ser vinculados.

96

Figura 51; Pantalla edición mapeo en archivo metadata-rdf-mapping.ttl. Tomado por autor

Adicionalmente debemos editar el archivo dspace.cfg ([d]:\dspace\config\dspace.cfg) como se

muestra en la siguiente imagen donde se define el parámetro (link) a los atributos que se deben

mostrar como url.

Figura 52: Pantalla edición archivo dspace.cfg muestra item como link. Tomado por autor

Realizando nuevamente el proceso con el comando rdfizer, visualizando los grafos y ejecutando

una consulta en sparql se debe visualizar lo siguiente.

97

Figura 53: Pantalla visualización de datos cargados desde DSpace en fuseki con datos vinculados. Tomado por autor

Cabe aclarar que esto es solamente para generar las características necesarias para que el campo

se visualice en el dataset como url vinculado. El proceso de enlazado con otros dataset puede

realizarse manualmente al cargar los metadatos del recurso.

6.1.6. Caso de estudio etapa 6: Publicar

Finalmente podemos exponer el dataset y realizar una consulta externa simulada con la

herramienta Postman como se mostró en el capítulo anterior y como se muestra a continuación.

Para consumirlos se pueden levantarlos o exponerlo al público a través de una serie de servicios,

donde cada servicio respondería una consulta especifica en sparql.

98

Figura 54: Pantalla visualización consumo de datos desde herramienta Postman. Tomado por autor

DISCUSION DE RESULTADOS

Esta metodología es una propuesta sencilla para que cualquier usuario con conocimientos

básicos en LOD pueda realizar fácilmente un proceso de publicación de recursos. Algunas

propuestas para publicación como las de (Radulovic, 2015) y (Southwick, 2015) que se enfocan

en el modelo ontológico y en el licenciamiento y aunque plantean etapas similares, al igual que

otras propuestas no detallan un procedimiento fácilmente implementable para un usuario que se

inicie en el mundo de la publicación de recursos. Consideramos que esta propuesta puede guiar

al usuario fácilmente hacia el objetivo de la publicación de recursos a partir de los pasos

definidos.

En (Kučera, 2015) nos parece interesante el enfoque planteado ya que va más allá de la

publicación y presenta una propuesta desde la planeación y la gestión para publicación de

recursos, teniendo en cuenta su mantenimiento y estableciendo roles que se ocupan de cada una

de las tareas propuestas en sus etapas.

99

En nuestra propuesta, no se ha realizado un énfasis especial en la calidad y la confianza de los

datos como si se encuentra en por ejemplo (Knap, 2012) y (Zhao, 2010) ya que es meramente

experimental y aunque su objetivo es precisamente establecer recomendaciones, también lo es el

de evidenciar en primera instancia el proceso neto de publicación. Por ende, la etapa de limpieza

no ha sido tan desarrollada como las demás etapas.

Dentro de las recomendaciones generales hacia el caso de estudio mencionamos las siguientes:

• Es importante que la Universidad cuente con una celda de producción de diseñe y

construya los recursos educativos. Dicha unidad debe definir los metadatos necesarios

y sobre todo documentarlos de forma adecuada y correcta y completa de acuerdo a las

recomendaciones realizadas en cada una de las etapas de nuestra propuesta.

• Por otro lado, se debe establecer una continua capacitación con talleres que aborde

aspectos prácticos de la generación de LOD.

• Incluir en el pensum universitario el desarrollo de trabajos o entregables enfocado a la

producción de estos recursos puede motivar el desarrollo y la expansión del repositorio

institucional, asi como el trabajo colaborativo entre alumnos y docentes.

•

CAPITULO VII CONCLUSIONES

Les falta contenido: se pudo llevar a cabo la aplicación de la metodología? que aportó? Se puede

extrapolar a otros dominios de conocimiento? Se puede aplicar con otras entidades? Qué aporto

de buensa prácticas y recomendaciones?

100

Consideramos que se cumple con los objetivos planteados, los cuales fueron en general, realizar

una exploración sobre las metodologías existentes, identificar los componentes requeridos para la

publicación, proponer un conjunto de recomendaciones que si bien no es amplio cumple con el

propósito de verificación y finalmente implementar un caso de prueba para la Universidad Distrital

Francisco José de Caldas.

El proceso de publicación no es sencillo y requiere de mucha documentación y práctica, sin

embargo, nuestra propuesta puede alentar al estudio de la estructuración no solo de departamentos

que gestionen el proceso sino de promover la investigación y la innovación en este campo.

Como trabajo futuro se propone más desarrollo sobre cada una de las etapas que permita

afianzar aún más el proceso de publicación, realizando un enfoque especial en la calidad y

confianza de los datos.

101

BIBLIOGRAFÍA

Auer, S., Bizer, C., Kobilarov, G., Lehmann, J., Cyganiak, R., & Ives, Z. (2007). DBpedia: A

nucleus for a Web of open data. Lecture Notes in Computer Science (Including Subseries

Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 4825

LNCS, 722–735. Retrieved from: http://doi.org/10.1007/978-3-540-76298-0_52

Bauer, F., & Kaltenböck, M. (2012). Linked Open Data: The Essentials A Quick Start Guide for

Decision Makers. Retrieved from https://www.reeep.org/LOD-the-Essentials.pdf

Berlanga, A. J., López, C., M., & E. y Peñalvo, F. J. (2005). Consideraciones para reforzar el

valor de los metadatos en los objetos de aprendizaje (OA). Salamanca. Universidad de

Salamanca. Depto. de Informática y Automática.

Berners-Lee, T., Fielding, R., & Masinter, L. (2005). Uniform Resource Identifier (URI):

Generic Syntax. https://doi.org/10.17487/rfc3986

Bizer, C., & Heath, T. (2009). Linked Data - The Story So Far. In International Journal on

Semantic Web and Information Systems. Retrieved from http://linkeddata.org/docs/ijswis-

special-issue

Botero Cabrera, C. (2010). Conferencia de la Red Pila en Panamá. Recuperado el 9 de abril de

2019, de Carobotero-co | Fundación Karisma (Diapositiva N° 16):

http://www.slideshare.net/ slideshow/embed_code/8522867 referenciado desde:

http://www.karisma.org.co/carobotero/?s=recurso+e ducativo&submit=Go

102

Caplan, P (2003). Metadata Fundamentals for All Librarians. American Library Association,

Chicago (2003)

Creative Commons. (2009). Licencias (Tipos de). Recuperado el 9 de abril de 2019, de Creative

Commons, Colombia: https://co.creativecommons.org/?page_id=13

Daudinot, I. (2006). Organización y recuperación de información en internet: Teoría de los

metadatos. Revista Cubana de Información En Ciencias de La Salud, 14, 16. Retrieved

from

http://eprints.rclis.org/9246/1/http___bvs.sld.cu_revistas_aci_vol14_5_06_aci06506.htm.

pdf

Díaz, F., Joyanes, L., & Medina, V. (2009). Taxonomía, ontología y folksonomía, ¿qué son y qué

beneficios u oportunidades presentan para los usuarios de la web? Universidad Empresa,

(February 2017). Retrieved from

http://www.urosario.edu.co/Administracion/documentos/publicaciones/edicion_16/09Rev

Univer-Empresa16_FDiaz.pdf

Fernández, B. (2006). Especificaciones y estándares en e-learning. Revista de Tecnologías de La

Información y Comunicación Educativas, 6(1696-0823), 32. Retrieved from

http://reddigital.cnice.mec.es/6/Articulos/articulo_resumen.php?articulo=2

Free Software Foundation. (2012). Licencias - Proyecto GNU. Recuperado el 10 de abril de

2019, de GNU Operating System: http://www.gnu.org/licenses/licenses.html

Gruber, T, (1993). Toward Principles for the Design of Ontologies Used for Knowledge Sharing

Technical Report KSL- 93-04, Knowledge Systems Laboratory, Stanford University, CA

103

Hernández-Pérez, T., & García-Moreno, M.-A. (2013). Datos abiertos y repositorios de datos:

nuevo reto para los bibliotecarios. El Profesional de La Informacion, 22(3), 259–263.

https://doi.org/10.3145/epi.2013.may.10

Klímek, J. and Škoda, P. (2017). LinkedPipes ETL in use: practical publication and consumption

of linked data. In Proceedings of the 19th International Conference on Information

Integration and Web-based Applications & Services (iiWAS '17), Maria Indrawan-

Santiago, Matthias Steinbauer, Ivan Luiz Salvadori, Ismail Khalil, and Gabriele Anderst-

Kotsis (Eds.). ACM, New York, NY, USA, 441-445. DOI: https://doi-

org.ezproxy.javeriana.edu.co/10.1145/3151759.3151809

Konstantinou, N., Spanos, D. E., Houssos, N., & Mitrou, N. (2014). Exposing scholarly

information as Linked Open Data: RDFizing DSpace contents. Electronic Library, 32(6),

834–851. https://doi.org/10.1108/EL-12-2012-0156

López, E. (2016). Modelo integral para la construcción de repositorios Institucionales que

alojen Recursos Educativos Abiertos, bajo la metodología de sistemas suaves

(Universidad Autónoma del Estado de México). Retrieved from

http://ri.uaemex.mx/bitstream/handle/20.500.11799/65511/Tesis de Maestría Modelo

integral para la construcción de repositorios institucionales que alojen REA bajo

SSM.pdf?sequence=4&isAllowed=y

Metros, S. E. (2002). Acerca de MERLOT (Autor citado desde: Learning Objects in Higher

Education. Susan E. Metros. EDUCASE, Center for applied Research. Research Bulletin:

Volumen 2002 Issue 19) en: Criterios de Calidad de un Objeto de Aprendizaje.

Recuperado el 12 de abril de 2012, de Colombia Aprende - Docentes de Superior -

104

Objetos Virtuales de Aprendizaje e Informativos: http://www.colombiaaprende.edu.co/

html/directivos/1598/article-99413.html

Ministerio de Educación Nacional. (2012). Recursos Educativos Digitales Abiertos Colombia.

In Sistema Nacional de Innovación Educativa con Uso de TIC.

http://186.113.12.159/Documentacion/LibroREDA.pdf

Ministerio de Educación Nacional. (2006b). ¿Qué es un Objeto Virtual de Aprendizaje?

Recuperado el 12 de abril de 2012, de Colombia Aprende - Docentes de Superior -

Objetos Virtuales de Aprendizaje e Informativos: http://www.

colombiaaprende.edu.co/html/directivos/1598/ article-172369.html

Ministerio de Educación Nacional. (2011). RECURSOS EDUCATIVOS DIGITALES ABIERTOS.

Estado del Arte, Contexto Nacional de Objetos de Aprendizaje. 61. Retrieved from

http://nuestroscursos.net/lms/pluginfile.php/749/mod_resource/content/0/contexto/01_Est

ado_del_Arte_-_Contexto_Nacional.pdf

Ministerio de Educación Nacional. (2011b). Orientaciones para el diseño, producción e

implementación de cursos virtuales. Documento de trabajo, Bogotá D.C.

Open Refine. (2018). Open Refine: a free, open source, powerful tool for working with messy

data. Página web http://openrefine.org/ consultado el 15 de agosto de 2019 obtenido de

https://cr8ive.cf/2018/05/23/open-refine-a-free-open-source-powerful-tool-for-working-

with-messy-data/

Palma, H. L. (2016). La semántica. Enciclopedia de Lingüñistica Hispánica, 1, 1–22. Retrieved

from https://www.udc.es/grupos/ln/investigadores/LopezPalmaPub/hLP-Semantica.pdf

105

Prud, E., Seaborne, A., & Laboratories, H. (2012). SPARQL Lenguaje de consulta para RDF.

Retrieved from SKOS website: http://skos.um.es/TR/rdf-sparql-query/

Radulovic, F., Poveda-Villalón, M., Vila-Suero, D., Rodríguez-Doncel, V., García-Castro, R., &

Gómez-Pérez, A. (2015). Guidelines for Linked Data generation and publication:

An example in building energy consumption. Automation in Construction, 57,

178–187. https://doi.org/10.1016/j.autcon.2015.04.002

RDF, G. d. (2014). W3C Semantic Web. Obtenido de https://www.w3c.org/RDF/

Rob, J. (2013). Encontrar un recurso educativo. Los metadatos. ISSUU. Recuperado de

https://issuu.com/roblamas/docs/tema2encontrar_un_recurso_educativo

Ruiz, J. E. C. (2015). PROTOTIPO ONTOLÓGICO PARA REPRESENTACIÓN DE OBJETOS

DE SIMULACIÓN INTERACTIVA APLICADO A ENTORNOS DIGITALES DE

APRENDIZAJE. (Mm), 41–57. Retrieved from

http://repository.udistrital.edu.co/handle/11349/7133

Senso, J. A., & Arroyo Machado, W. (2018). La publicación en Linked Data de registros

bibliográficos: modelo e implementación. Revista Española de Documentación

Científica, 41(4), 217. https://doi.org/10.3989/redc.2018.4.1535

Sicilia, M. A., & García, E. (2003). On the concepts of usability and reusability of learning

objects. International Review of Research in Open and Distance Learning, 4(2), 26–38.

Retrieved from http://www.irrodl.org/index.php/irrodl/article/viewFile/155/702

106

Sifaqui, C. Cifuentes-Silva, F. Labra-Gayo, J. E. (2011). Towards an Architecture and Adoption

Process for Linked Data Technologies in Open Government Contexts: A Case Study for

the Library of Congress of Chile (pp. 79–86). New York, NY, USA: ACM.

http://doi.org/10.1145/2063518.2063529

Soto, J., Garcia, E., & Sánchez, S. (2006). Repositorios Semánticos para Objetos de Aprendizaje.

Expolearning2006.

Studer S, Benjamins R., and Fensel D., (1998). Knowledge Engineering: Principles and

Methods, Data and Knowledge Engineering, 25, 161-197

Tello, A. (2014). Ontologías en la Web Semántica. I Jornanda de Ingeniería Web ’01, (July), 2–

5. Retrieved from

https://www.researchgate.net/publication/254438615_Ontologias_en_la_Web_Semantica

/download

Terziyan, V., & Kaykova, O. (2011). Towards "Executable Reality”: Business Intelligence on

Top of Linked Data. Cs.Jyu.Fi, 35(November), 26–33. https://doi.org/ISBN: 978-1-

61208-160-

UNESCO. (2011). A Basic Guide to Open Educational Resources: Frequently asked questions.

(A. Kanwar (COL), & S. Uvalic´-Trumbic´ (UNESCO), Edits.) Obtenido de The

Commonwealth of Learning (COL): http:// www.col.org/PublicationDocuments/Basic-

Guide- To-OER.pdf

Valencia, T., & Zapata, S. (2008). Estándar de Metadatos. Factores claves en la producción de

Objetos de Aprendizaje. Cali, Valle, Colombia.

107

W3C. (2011). W3C Guía Breve de Linked Data. Recuperado de

https://www.w3c.es/Divulgacion/GuiasBreves/LinkedData

W3C. (2014). W3C semantic web: Search engines. Retrieved from

http://www.w3.org/2001/sw/wiki/Category:Search_Engine

Wiley, D. A. (2000). Connecting Learning Objects to Instructional Design Theory: A definition,

a metaphor, a taxonomy. In The Instructional Use of Learning Objects: Online Version.

Retrieved from http://www.reusability.org/read/

Zaveri, A., Rula, A., Maurino, A., Pietrobon, R., Lehmann, J., & Auer, S. (2016). Quality

assessment for Linked Data: A Survey. Semantic Web, 7(1), 63–93.

https://doi.org/10.3233/SW-150175

Propuesta Metodológica Para La Publicación De Recursos...

Documents

Transcript of Propuesta Metodológica Para La Publicación De Recursos...