Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas...

40
Requisitos funcionales para la creación de repositorios consorciados de datos de investigación Ricard de la Vega Mireia Alcalá XXX Jornadas Técnicas de RedIris Sevilla, 29 de mayo de 2019

Transcript of Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas...

Page 1: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Requisitos funcionales para la creación de repositorios consorciados de datos

de investigación

Ricard de la VegaMireia Alcalá

XXX Jornadas Técnicas de RedIris

Sevilla, 29 de mayo de 2019

Page 2: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Índice

• El CSUC y la ciencia abierta

• El servicio de soporte a la gestión de datos de investigación (RDM)

• Requisitos para la creación de un repositorio consorciado de datos de investigación

– Determinantes de contexto

– Requisitos y buenas prácticas

• Conclusión

Page 3: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Entidades consorciadas:

Entidades asociadas:

El CSUC

Page 4: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

El CSUC

Cálculo

científicoComunicaciones

Infraestructuras

TICContrataciones

Gestión

documentación

científica

Compras

conjuntase-Administración

Page 5: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

El CSUC y la Ciencia Abierta

• Desde 1999 trabaja para la promoción y gestión de diferentes actividades relacionadas con la investigación:

– Creación de repositorios y portales cooperativos • Tesis Doctorales en Red (TDX, 30.000 tesis)

• Revistas Catalanas en Acceso Abierto (RACO, 500 revistas)

• …

– Cumplimiento de mandatos de Acceso Abierto

– Portal de la Investigación de Catalunya

• En 2014 se crea una línea estratégica de actuaciones de apoyo a la investigación

• En 2017 se crea una nueva área organizativa: Ciencia Abierta

Page 6: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Área de Ciencia Abierta del CSUC

• Misión: Colaborar con las universidades para disminuir el

esfuerzo de adaptación a los requerimientos de la Ciencia Abierta

• Principios rectores:– Explorar conjuntamente

– Compartir buenas prácticas

– Construir soluciones conjuntas (si es el caso)

Comisión funcional

Vicerectores

Grupo de trabajo de

Apoyo a la Investigación

Comisión de Trabajo

para el Portal de la

Recerca de Catalunya

Page 7: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

https://portalrecerca.csuc.cat

Page 8: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Índice

• El CSUC y la ciencia abierta

• El servicio de soporte a la gestión de datos de investigación (RDM)

• Requisitos para la creación de un repositorio consorciado de datos de investigación

– Determinantes de contexto

– Requisitos y buenas prácticas

• Conclusión

Page 9: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Servicio de soporte a RDM

• El grupo de trabajo de apoyo a la investigación se creó en 2015 y fruto de diferentes acciones cooperativas, las universidades catalanas iniciaron el servicio de soporte a la gestión de datos en 2016. – Ayuda para la confección de planes de gestión de datos– Recomendaciones para elaborar políticas de gestión de datos en las universidades– Acciones de difusión y formación – …

• Realizadas 2 encuestas a investigadores de las universidades catalanas paraconocer sus necesidades en gestión de datos

• Resumen de la situación– Tenemos más oferta de servicios que no demanda– A nivel mundial hay todavía pocas iniciativas, y las que hay son incipientes– Sin embargo, es necesario y estratégico (pero aún no urgente) un buen

servicio de gestión de datos, probablemente lleguemos por aproximaciones sucesivas

Page 10: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Aproximación asimétrica a RDM

1. Planes de gestión de datos (DMP)

2. Recomendaciones para seleccionar un repositorio existente

3. Ampliación repositorios institucionales

4. Creación de un repositorio FAIR consorciado

5. Ampliación para la gestión de todo el ciclo devida de los datos

Tamaño y

complejidad

Núm.. de proyectos

Page 11: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Aproximación asimétrica a RDM

1. Planes de gestión de datos (DMP)

2. Recomendaciones para seleccionar un repositorio existente

3. Ampliación repositorios institucionales

4. Creación de un repositorio FAIR consorciado

5. Ampliación para la gestión de todo el ciclo devida de los datos

Tamaño y

complejidad

Núm.. de proyectos

Page 12: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

https://dmp.csuc.cat

Page 13: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Aproximación asimétrica a RDM

1. Planes de gestión de datos (DMP)

2. Recomendaciones para seleccionar un repositorio existente

3. Ampliación repositorios institucionales

4. Creación de un repositorio FAIR consorciado

5. Ampliación para la gestión de todo el ciclo devida de los datos

Tamaño y

complejidad

Núm.. de proyectos

Page 14: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

https://recercat.cat//handle/2072/284974 Revisión periódica (v1 Jul’16, v2 Nov’16 i v3 Mai’17)

Page 15: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Aproximación asimétrica a RDM

1. Planes de gestión de datos (DMP)

2. Recomendaciones para seleccionar un repositorio existente

3. Ampliación repositorios institucionales

4. Creación de un repositorio FAIR consorciado

5. Ampliación para la gestión de todo el ciclo devida de los datos

Tamaño y

complejidad

Núm.. de proyectos

Page 16: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Aproximación asimétrica a RDM

1. Planes de gestión de datos (DMP)

2. Recomendaciones para seleccionar un repositorio existente

3. Ampliación repositorios institucionales

4. Creación de un repositorio FAIR consorciado

5. Ampliación para la gestión de todo el ciclo devida de los datos

Tamaño y

complejidad

Núm.. de proyectos

Page 17: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Aproximación asimétrica a RDM

1. Planes de gestión de datos (DMP)

2. Recomendaciones para seleccionar un repositorio existente

3. Ampliación repositorios institucionales

4. Creación de un repositorio FAIR consorciado

5. Ampliación para la gestión de todo el ciclo devida de los datos

Tamaño y

complejidad

Núm.. de proyectos

Page 18: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Índice

• El CSUC y la ciencia abierta

• El servicio de soporte a la gestión de datos de investigación (RDM)

• Requisitos para la creación de un repositorio consorciado de datos de investigación

– Determinantes de contexto

– Requisitos y buenas prácticas

• Conclusión

Page 19: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Requisitos Factibles, Alcanzables e Implementables para un Repositorio FAIR

• Inputs

– Análisis de referentes de otros países

– Estudio de informes técnicos

– 25 entrevistas con expertos

• Outputs

– 25 requisitos mínimos

– 4 buenas prácticas

– 3 recomendaciones

https://recercat.cat//handle/2072/356460

Page 20: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Determinantes del contexto

• Ahora o esperamos

• Definitivo o infraestructura en evolución

• Datos finales o también todo el ciclo de vida

• Aquí o fuera

• Para todas las disciplinas o para aquellas sin repositorios de datos consolidados

• Repositorio o buenas prácticas

Page 21: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Determinantes del contexto

• Ahora o esperamos

• Definitivo o infraestructura en evolución

• Datos finales o también todo el ciclo de vida

• Aquí o fuera

• Para todas las disciplinas o para aquellas sin repositorios de datos consolidados

• Repositorio o buenas prácticas

Page 22: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Determinantes del contexto

• Ahora o esperamos

• Definitivo o infraestructura en evolución

• Datos finales o también todo el ciclo de vida

• Aquí o fuera

• Para todas las disciplinas o para aquellas sin repositorios de datos consolidados

• Repositorio o buenas prácticas

Page 23: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Determinantes del contexto

• Ahora o esperamos

• Definitivo o infraestructura en evolución

• Datos finales o también todo el ciclo de vida

• Aquí o fuera

• Para todas las disciplinas o para aquellas sin repositorios de datos consolidados

• Repositorio o buenas prácticas

Page 24: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Determinantes del contexto

• Ahora o esperamos

• Definitivo o infraestructura en evolución

• Datos finales o también todo el ciclo de vida

• Aquí o fuera

• Para todas las disciplinas o para aquellas sin repositorios de datos consolidados

• Repositorio o buenas prácticas

Page 25: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Determinantes del contexto

• Ahora o esperamos

• Definitivo o infraestructura en evolución

• Datos finales o también todo el ciclo de vida

• Aquí o fuera

• Para todas las disciplinas o para aquellas sin repositorios de datos consolidados

• Repositorio o buenas prácticas

Page 26: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Determinantes del contexto

• Ahora o esperamos

• Definitivo o infraestructura en evolución

• Datos finales o también todo el ciclo de vida

• Aquí o fuera

• Para todas las disciplinas o para aquellas sin repositorios de datos consolidados

• Repositorio i buenas prácticas

Page 27: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Requisitos funcionales mínimos y factibles

Page 28: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Requisitos funcionales mínimos y factibles

1. Identificadores persistentes

2. Capacidad de almacenaje alta

3. Prestaciones medio-altas de preservación

4. Interoperabilidad con otros sistemas

5. Gestión de características especiales

Page 29: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Requisitos funcionales mínimos y factibles

1. Identificadores persistentes– Asignar el DOI como identificador

– Soporte de ORCID

2. Capacidad de almacenaje alta

3. Prestaciones medio-altas de preservación

4. Interoperabilidad con otros sistemas

5. Gestión de características especiales

Page 30: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Requisitos funcionales mínimos y factibles

1. Identificadores persistentes

2. Capacidad de almacenaje alta– Ficheros de hasta 10 GB por defecto

– Espacio elástico para crecimiento

3. Prestaciones medio-altas de preservación

4. Interoperabilidad con otros sistemas

5. Gestión de características especiales

Page 31: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Requisitos funcionales mínimos y factibles

1. Identificadores persistentes

2. Capacidad de almacenaje alta

3. Prestaciones medio-altas de preservación– Disponibilidad del fichero un mínimo de 10 años

– Dos copias geográficamente distribuidas como mínimo

– Comprobar la integridad de los datos periódicamente

– Seguir el modelo de preservación OAIS

4. Interoperabilidad con otros sistemas

5. Gestión de características especiales

Page 32: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Requisitos funcionales mínimos y factibles

1. Identificadores persistentes2. Capacidad de almacenaje alta3. Prestaciones medio-altas de preservación4. Interoperabilidad con otros sistemas– Repositorios (institucionales, temáticos…)– Almacenamiento en la nube (Unidisc, Dropbox…)– Discovery tools (EOSC, PRC, OpenAire…)– Protocolos comunicación estándar (OAI-PMH, API…)– Formatos estándar de datos (XML, JSON)

5. Gestión de características especiales

Page 33: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Requisitos funcionales mínimos y factibles

1. Identificadores persistentes

2. Capacidad de almacenaje alta

3. Prestaciones medio-altas de preservación

4. Interoperabilidad con otros sistemas

5. Gestión de características especiales– Diferentes versiones de un dataset

– Gestión de diferentes esquemas de metadatos

– Diferentes tipos de accesos

Page 34: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Requisitos funcionales mínimos y factibles

– Aceptación de cualquier tipo de formato

– Diferentes tipos de submit

– Citación recomendada

– Difusión de datasets a través de redes sociales

– Gestión de distintos tipos de licencias

– Datos analíticos de uso de la plataforma

– Suministrar metadatos para su reutilización

– Fácilmente usable

– Cumplimiento de la legislación vigente

Page 35: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Buenas prácticas

1. Realizar una curación de los datos

2. Seleccionar los conjuntos de datos

3. Fomentar el uso de formatos abiertos

4. Usar estándares i protocolos i vocabularios controlados ampliamente aceptados

Page 36: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Resumen de otros paísesPaís Liderazgo Infraestructura Estadio

Bélgica flamencaVLIR (órgano consultivo representante de 5 universidades)

• Elaborada una propuesta En estudio

FinlandiaFinnish Ministry ofEducation and Culture y producción de l’CSC-IT

• Centralizada• Servei segons el cicle de vida de les dades:

• Descobrir (Etsin)• Almacenar (IDA)• Describir (Qvain)• Preservar (Fairdata-PAS)

Inicial

Países Bajos DANS

• Centralizada• Servei segons el cicle de vida de les dades:

• Descubrir (NARCIS)• Publicar i gestionar (DataverseNL)• Preservar (EASY)

Consolidado

PortugalFundação para a Ciênciae a Tecnologia

• Elaborada una propuesta pero paralizada por falta de financiación

En estudio

Suecia

Swedish ResearchCouncil y consorcio de 7 universidades y centrosde investigación

• Híbrida (repositori central SND + repositorisinstitucionales)

• Servicio de preservación en desarrolloConsolidado

Page 37: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Índice

• El CSUC y la ciencia abierta

• El servicio de soporte a la gestión de datos de investigación (RDM)

• Requisitos para la creación de un repositorio consorciado de datos de investigación

– Determinantes de contexto

– Requisitos y buenas prácticas

• Conclusión

Page 38: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Conclusión

Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

• Existe distancia entre la oferta i la demanda, quizá por:– El mandato europeo aún no se ha hecho efectivo– Desconexión entre las OTT y el servicio de soporte a la investigación en

las universidades– Novedad del tema

• No tenemos (aún) la infraestructura que la CE pide para publicar losdatos en forma FAIR• Algunas universidades usan sus repositorios institucionales. Bueno mientras no

exista una solución de más recorrido.• La creación de un repositorio de datos es más importante ahora para generar

experiencia y buenas practicas que por su operatividad inmediata

Page 39: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Conclusión

• Se creará de manera inmediata en el marco del CSUC y con software libre existente un repositorio cooperativo de datos de investigación que gradualmente adopte los requisitos presentados.

• El diseño de esta infraestructura ha de considerarse no definitivo y en evolución ya que ha de tener características aún no definidas (como la compatibilidad con EOSC)

Page 40: Presentación de PowerPoint - RedIRISConclusión Actualmente todas las universidades catalanas disponen de un servicio de gestión de datos de investigación, con las siguientes debilidades:

Muchas gracias por su atención

Ricard de la Vega

[email protected]

@rdelavega

Mireia Alcalá

[email protected]

@apmireia