UGent Datacenter of waarom we 140TB kopen

Post on 12-Jan-2015

682 views 0 download

Tags:

description

VLENGEL meeting

Transcript of UGent Datacenter of waarom we 140TB kopen

UGent Datacenterof waarom we 140TB kopen...

300.000 volumes...

140.000 volumes...

70.000 objects...

12.500 full-text documenten

Storage requirements

Storage requirements

Ideaal Model

Ideaal Model

Observaties

Ideaal Model

Observaties Ruwe Data

Ideaal Model

Observaties Ruwe Data

Hypothese

Ideaal Model

Observaties Ruwe Data

Hypothese

Test

Ideaal Model

Observaties Ruwe Data

Hypothese

Test

Ideaal Model

Observaties Ruwe Data

Hypothese

Test

Paper

Annex

Ideaal Model

Observaties Ruwe Data

Hypothese

Test

Paper

AnnexBibliotheek

Ideaal Model

Observaties Ruwe Data

Hypothese

Test

Paper

AnnexBibliotheek

Ideaal Model

Observaties

Hypothese

Paper

Ruwe DataTest

AnnexBibliotheek

Praktijk

Observaties

Hypothese

Paper

Ruwe DataTest

AnnexBibliotheek

Praktijk

Observaties

Hypothese

PaperBibliotheek

Praktijk

Karen Van Godtsenhoven, Mikael Karstensen Elbæk, Gert Schmeltz Pedersen, Barbara Sierman, Magchiel Bijsterbosch, Patrick Hochstenbach, Rosemary Russell, Maurice Vanderfeesten

Emerging standards for enhanced publications and repository technology : survey on technology

Amsterdam University Press 2009 ISBN 9789089641892

(Meta)datastandaarden voor digitale archieven

UGent MMLab & Universiteitsbibliotheek Gent 2009 ISBN 9789052230009

Paul Bastijns, Sam Coppens, Siska Corneillie, Patrick Hochstenbach, Erik Mannens, Liesbeth Van Melle

Institutional Repository

• 150.530 bibliografische beschrijvingen

• 12.413 flagged full-text available

• 50 bestandtypes

• 94.3% .PDF , 2.7% .DOC

• 3% .ZIP .JPG .TEX + 46 others

• 1-2 bestanden per beschrijving

ETD’s

• 6.336 bibliografische beschrijvingen

• 1.370 flagged full-text available

• 1.180 bestandtypes

• PDF , DOC, TXT, XLS, ACC, TIF, JPG, EXE, CLASS,...

• 1 - 10.000 bestanden per beschrijving

Bit$Errors/Bugs$File$Formaat$Wijzigingen$

Tijd$

Technologie$Shi:$

Organisatorische$wijzigingen$

Formaat$Interpreta?es$

1980% 1990% 2000%

Risico’s

Repository

Lib Catalog

Aleph

Archive System

?ICA-Atom?

Discovery

Meercat

Preservation

Waalse K

rook

IngestWorkflow

???

IR

Biblio

LMS

Minerva

Scanning

Digital LibrarySources LTP

Catmandu [Gent|Lund|Bielefeld Perl Framework]

FedoraCommons

SOLR ActiveMQ

NetAppAmazon.com

S3

GREP

• Sinds Mei 2010 operationeel

• ~ 200.000 objecten

• ~ 50.000.000 bestanden

• 1.200 bestandtypes

• Kleinste object: 10 KB

• Grootste object: 250GB

• 8.3 TB in ingested

• 2.0 TB in queue + ( >> TB Google Books)

• 100.000 paginaviews per jaar (via Meercat)

Demo

Ingest

Automatic Aleph Import

Access

OAI-PMHSPARQL

RESTSOAP