1 3TU.Datacentrum 16-09-’09 | 12 Jeroen Rombouts 1. Achtergrond… 2. Project 3TU.Datacentrum 3....

12
1 3TU.Datacentrum 16-09-’09 | 12 Jeroen Rombouts 1. Achtergrond… 2. Project 3TU.Datacentrum 3. Belang! This work is licensed under a Creative Commons Attribution-NonCommerc ial-ShareAlike 2.5 License . Mini seminar Mini seminar Waardevolle Data & Diensten Waardevolle Data & Diensten

Transcript of 1 3TU.Datacentrum 16-09-’09 | 12 Jeroen Rombouts 1. Achtergrond… 2. Project 3TU.Datacentrum 3....

13TU.Datacentrum 16-09-’09 | 12

Jeroen Rombouts

1. Achtergrond…

2. Project 3TU.Datacentrum3. Belang!

This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 2.5 License.

Mini seminarMini seminarWaardevolle Data & DienstenWaardevolle Data & Diensten

23TU.Datacentrum 16-09-’09 | 12

Toelichting

• SURF Share project WP6 Datacuratielooptijd december ’08 – juni ’09.

• “Motiveren door ondersteunen van dataproducenten en onderzoeken van voordelen van data publicatie”.

• Toetsing generaliseerbaarheid van opgestelde functionele eisen en identificeren van factoren die de generaliseerbaarheid bepalen.(welke eisen afhankelijk van vakgebied, ‘onderzoekstype’, …).

33TU.Datacentrum 16-09-’09 | 12

Achtergrond

Onderzoek

Manuscript Publicatie

Data Metadata

Repository Bibliotheek

43TU.Datacentrum 16-09-’09 | 12

Motivatie

• Fysiek verval opslag media;

• Verlies van de beschrijvende (meta) data;

• Niet meer kunnen ‘draaien’ van software om datasets te kunnen visualiseren/bewerken.

Risico’s huidig onderzoeksdata ‘beheer’

Belangen lange termijn toegankelijkheid• Waarde van data (kostenintensief, valorisatie,

longitudinaal);

• Kwaliteit van onderzoek (verificatie, overdracht, kennisdelen).

53TU.Datacentrum 16-09-’09 | 12

Omgeving

• Plan van de National Science Foundation voor betrouwbare opslag van digitale wetenschappelijke output (2006);

• In Nederland voor alfa- en gamma wetenschappen: DANS (Data Archiving and Networked Services) (2005);

• Voor bètawetenschappen nog geen initiatieven.

63TU.Datacentrum 16-09-’09 | 12

Het 3TU.DatacentrumProject

• Bouwt voort op twee eerdere projecten;• E-Archiving – digitaal depot• Darelux – Data Archiving River Environment

Luxemburg

• Looptijd 3 jaar 2008-2010; Pilot en financiering via Centres of Excellence (CoE);• Pilot TUD, daarna ook datasets TU/e en UT

• Doel: langdurige toegang tot technisch- wetenschappelijke datasets.

73TU.Datacentrum 16-09-’09 | 12

Het 3TU.Datacentrum

• Exploiteren ‘data-archief’ (faciliteren van dataproducenten);

• Adviseren van dataproducenten;

• Kennis over lange termijn toegankelijkheid ontwikkelen en verspreiden.

Taken

Onderdelen• Data repository (archief voor statische data);

• Samenwerkingsomgeving (voor lopend onderzoek);

• Diensten en toegang tot andere ‘archieven’.

83TU.Datacentrum 16-09-’09 | 12

Activiteiten• Verzamelen data samenwerken met onderzoekers tijdens het onderzoek (o.a. DARELUX). Datamodel, metadata, ingest, access, …• Publiceren van data faciliteren van zelfstandig publiceren of in relatie met een publicatie). Citeerbaar (doi), vindbaar, versiebeheer, …• Preserveren van data verzorgen van lange termijn opslag van digitale datasets en zorgdragen voor ‘leesbaarheid’. Multiple backups, normalisatie, refreshing, migratie, audit trail, …• Toegankelijk maken van datasets. User agreement, interface, …

93TU.Datacentrum 16-09-’09 | 12

(Overige) resultaten/activiteiten• Website datacentrum.3tu.nl;

• Samenwerking met SURF, DANS (www.dans.knaw.nl) en KB o.a. in Nationale Coalitie Digitale Duurzaamheid (www.ncdd.nl) en Onderzoeksdata forum (press release);

• Samenwerking met o.a. TIB, ETH Zurich, INIST, BL, DTU in DataCite (DOI) consortium (press release);

• DRIVER-II (EU-7FP)Demonstrator voor Enhanced Publications CoE MSP;

• Waardevolle Data & Diensten project (SURF)Onderzoek naar gebruikers behoeften en positieve effecten.

103TU.Datacentrum 16-09-’09 | 12

Belang!

• Borging wetenschappelijk niveauVerificatie (en replicatie), nieuw (multi-disciplinair) onderzoek, discussie, …

• Efficiëntie (ondersteuning) van onderzoekKosten dataverzameling = ‘sunk costs’, veiligstellen van data en ‘leesbaarheid’, centraal beheer & ontwikkeling, standaarden, …

• Communicatie (zichtbaarheid, imago en concurrentie positie)Datasets, publicaties, wetenschapper, instelling, Nederland, EU

• Bewaren ‘wetenschappelijk erfgoed’Longitudinaal onderzoek, historisch onderzoek, …

113TU.Datacentrum 16-09-’09 | 12

Welke data en waarom ‘deponeren’?

• Data die openbaar kan/moet zijn en interessant is voor de samenleving (verificatie, nieuw onderzoek);

• Toename van publicatie ‘waarde’ (onderbouwd, meer citaties, …);

• Data gegenereerd door ‘moeilijk’ herhaalbare processen(kosten, observaties, complexiteit, longitudinaal, …);

• Voorwaarden van onderzoeksfinanciers en uitgevers(Nature Publishing Group, NWO, Overheden, …);

• Eenvoudig veiligstellen en delen van data;

Anderen doen het!

123TU.Datacentrum 16-09-’09 | 12

Vragen ?