Post on 16-Oct-2019
Discovery-Serviceder Verbundzentrale des GBV
Gerald SteilenLukida AnwendertreffenGö>ngen, 30.10.2018
Gliederung1. K10plus-Zentral
1.1 Facetten1.1.1 Sprachcode1.1.2 Normdaten
1.2 Technik1.2.1 Antwortverhalten1.2.2 Suchmaschinen-Hosting
2. Kooperation2.1 Lukida2.2 AG Discovery
Discovery-Service
1
3. Ausblick3.1 Global Open Knowledge
base (GOKb)3.2 ERMS
3.2.1 LAS:eR3.2.2 folio ERM-Modul
4. Kontakt
1. K10plus-Zentral
Discovery-Service
2
Discovery-Service
3
Frits Ahlefeldt:h6ps://hikingar=st.files.wordpress.com/2013/09/talented-youth-michelangelo.jpg
• Suchmaschine für bibliographische Daten
• Nutzung kostenfrei
• 212 Mio. Datensätze(Stand 27.10.2018)
• keine eigene Oberfläche
• Backend für ...
– TouchPoint (z. B.: BSB)
– DigiBib (z. B.: hbz)
– VuFind (z. B.: Beluga)
– Lukida (z. B.: UB Weimar)
– ...
Discovery-Service
4
Frits Ahlefeldt:
hKps://www.flickr.com/photos/hikingarPst/5726853059/
Discovery-Service
5
Die Nutzung von K10plus-Zentral ist kostenfrei!
• 90 ins;tu;onelle Nutzer– MPI Recht der GemeinschaEsgüter (207 Mio. Suchen / Jahr)
– UB Ilmenau (157 Mio. Suchen / Jahr)
– SUB Hamburg (40 Mio. Suchen / Jahr)
• Alle Lukida Anwender nutzen K10plus-Zentral
Discovery-Service
6
1.1 Facetten
Discovery-Service
7
• Facetten– jedes durchsuchbare Feld– über 151 verschiedene Facetten möglich
• öffentliche Dokumentation– Schema
https://github.com/gbv/findex-config/blob/master/SolrCloud/solr_config/schema.xml
– Verarbeitungsvorschriften von marc21https://github.com/gbv/findex-config/tree/master/SolrCloud/solrmarc_config
Discovery-Service
8
• sinnvolle Facette(= Statistik über ein Feld)
– überschaubare Varianz– zielgruppengerechte Konzepte– geeignete bibliographische Felder– hoher Abdeckungsgrad
Discovery-Service
9Frits Ahlefeldt:https://www.flickr.com/photos/hikingartist/5726853059/
1.1.1 Sprachcode
Discovery-Service
10
• in 64,5 % aller Datensätze enthalten
• 342 verschiedene Codes
Discovery-Service
11
16.99 15.7612.38
6.723.48 3.14 2.42 1.82 1.77
0.01
35.51
0
25
50
75
100
GVK
medline NL
JSTO
R
sprin
ger
WTIOLC
DOAJ
elsevi
erÖVK NA
SammlungG
esam
tant
eil [
%]
K10plus−Zentral: 27.10.2018Sprachcode Gesamtquote
1.1.2 Normdaten
Discovery-Service
12
• Beispiel Normdaten:– zusammen in 14,19 %
aller Datensätze enthalten
Discovery-Service
13
14.19
0 0 0
85.81
0
25
50
75
100
GVKOLC ÖVK NL NA
Sammlung
Ges
amta
ntei
l [%
]
K10plus−Zentral: 27.10.2018Normdaten: Gesamtanteil pro Sammlung
UB Weimar
34,8 % aller Datensätze mit Besitznachweis
Discovery-Service
14
34.8
0
100
0
25
50
75
100
GVKOLC ÖVK
Sammlung
Ante
il [%
]
K10plus−Zentral: 27.10.2018Anteil der UB Weimar an Normdaten pro Sammlung
UB Weimar
86,97 % aller Datensätze mit Besitznachweis bei gedruckten Büchern
Discovery-Service
15
86.97
13.03
0
25
50
75
100
GVK NA
Sammlung
Ges
amta
ntei
l [%
]
K10plus−Zentral: 26.10.2018Normdaten: Gesamtanteil UB Weimar bei gedr. Büchern pro Sammlung
2. Technik
Discovery-Service
16
• Technik– hochverfügbar– hochperformant– SolrCloud– über 5 Mio. Suchen / Tag– tägliche Updates– Datenformat marc21
Discovery-Service
17
2.1 Antwortverhalten
Discovery-Service
18
Zeitraum27.9. – 27.10.18• 17 – 48 Mio.
Request / Tag• 196 – 451 Request /
Sek.
Discovery-Service
19
Zeitraum30 Min.• automatische
Lastverteilung• automatische
Datensynchro-nisation
Discovery-Service
20
Zeitraum27.9. – 27.10.18ø Antwortzeit46ms – 118 ms
Discovery-Service
21
2.2 Suchmaschinen-Hosting
Discovery-Service
22
Discovery-Service
23
Eigene Suchmaschine-Infrastruktur• 13 institutionelle Nutzer
• beliebige Daten(MPG.PuRe, MPG.eBooks, ...)
• beliebiges Schema
• Kombination mit K10plus-Zentral möglich(ein “Suchschlitz“, gemeinsames Ranking, keine zusätzlichen Reiter)
• gleicher techn. Standard wie K10plus-Zentral
Discovery-Service
24
3. Kooperation
Discovery-Service
25
Discovery-Service
26
Open Source + Dokumentation + Transparenz = Unabhängigkeit
• Lukidahttps://github.com/gbv/Lukida
• SolrCloudhttps://lucene.apache.org/solr
• „Ranking-Formel“https://en.wikipedia.org/wiki/Okapi_BM25
• Konfigurationhttps://github.com/gbv/findex-config/tree/master/SolrCloud
• Verarbeitung der Metadatenhttps://github.com/gbv/findex-config/tree/master/SolrCloud/solrmarc_config
• Standardisiertes bibliographisches Formathttp://www.loc.gov/marc/bibliographic
• ZLV 2014: Verfügbarkeit einer Discovery-Lösung durch die Verbundzentrale
• Bibliotheken mit Lukida-Verträgen
• 2017: GBV / AG Discovery – Aufgaben: hJps://verbundwiki.gbv.de/display/GAD/Mitglieder+der++AG+Discovery
– OrganisaQon und AuRau eines gemeinsamen offenen ArQkelmetadatenindex - DefiniQon der Qualitätsstandards für den gemeinsamen Index
– Angabe der korrekten Zugriffsmodalitäten (open/closed access, CC-Lizenzen) - Standards der Basisinfrastruktur
– Indexanreicherung um Volltexte
Discovery-Service
27
3.1 Lukida
Discovery-Service
28
Discovery-Service
29
• GBV Community– op.miert für den GBV Bibliotheken und VZG
– keine Abhängigkeiten außerhalb des GBV
– Feature-Planung
• Abrechnung nach Aufwand– Kosten können geteilt werden.
– Alle profi.eren von EntwicklungsauJrägen, die einzelne Bibliotheken bezahlen.
Discovery-Service
30
3.2 AG Discovery
Discovery-Service
31
• soll die bestehende Facharbeitsgruppen-Struktur im Verbund zunächst temporär ergänzen
• parallel eingerichtete AG Electronic ResourceManagement
• „interdisziplinär“• primärer Fokus auf Metadaten– Qualität– neue KollekDonen (Mustervertrag, Prioritäten)
Discovery-Service
32
3.2.1 Zusammensetzung
Discovery-Service
33
• Anne Christensen - VorsitzFAG Lokale Geschäftsgänge (UB Lüneburg: Beluga)
• Dr. Martin BlenkleFAG Technische Infrastruktur (SuUB Bremen: E-LIB)
• Volker Conradt(Bibliotheksservice-Zentrum Baden-Württemberg: BOSS)
• Berrit GenatFAG Erschließung und Informationsvermittlung (TIB Hannover: GetInfo)
• Oliver Goldschmidt(UB TU Harburg: TUBFind)
Discovery-Service
34
• Matthias Kaun(Staatsbibliothek zu Berlin: EDS)
• Dr. Jan Frederik Maas (SUB Hamburg: Beluga)
• Dr. Tamara Pianos(ZBW Kiel: EconBiz - Econis)
• Reiner Diedrichs(Verbundzentrale des GBV)
• Gerald Steilen(Verbundzentrale des GBV)
Discovery-Service
35
3. Ausblick
Discovery-Service
36
3.1. Global Open Knowledge base (GOKb)
Discovery-Service
37
Knowledge base (KB)„For things to func9on properly—acquisi9ons and circula9onand discovery and linking and usage and all of those pieces—you need to be consistent in how you talk about the resourcesthat are in your collec9on. And the best way of doing that is tohave some fairly rich central knowledge base in the middlethat, if nothing else, is ac9ng as an iden9ty broker.“
Oliver Pesch, chief product strategist at EBSCOIn: Library Technology Reports. Aug./Sept. 2016, Vol. 52, No. 6, S. 13
Discovery-Service
38
Ursprung: LinkresolverApril 1999 mehrere Artikel von Patrick Hochstenbach und Herbert Van de Sompel: • Reference Linking in a Hybrid Library Environment.
Part 1: Frameworks for Linkinghttp://www.dlib.org/dlib/april99/van_de_sompel/04van_de_sompel-pt1.html
• Reference Linking in a Hybrid Library EnvironmentPart 2.SFX, a Generic Linking Solutionhttp://www.dlib.org/dlib/april99/van_de_sompel/04van_de_sompel-pt2.htmlÜbrigens:SFX steht für Special Effects, der Prototyp wurde im Jahr 2000 von ExLibris gekauft.
Discovery-Service
39
Verwaltung von eRessourcen – Fragen
Discovery-Service
40
▪ Welche Titel und Pakete gibt es?▪ Wie kann ich Titel eindeutig
nachweisen?▪ Welche Jahrgänge sind
abgedeckt?
▪ Was habe ich lizenziert?▪ Bei wem habe ich lizenziert?▪ Unter welchen rechtlichen
Bedingungen habe ich Zugriff?
Knowledge Base Electronic Ressource Management System (ERMS)
Global Open Knowledge base (GOKb)• Austausch- und Referenzdatenbank für Metadaten von
elektronischen Ressourcen• Verwaltung von InformaDonen zu
– Paketen (Inhalt, Beschränkungen)– Titeln (IdenDfikatoren, Zugriff, Verlauf)– Anbietern (PlaMormen, Adressen)
• Daten für maschinelle Prozesse opDmiert• Daten frei und für jeden verwendbar
Discovery-Service
41
Qualitätskriterien
Fokus Zugangsteuerung:
• Eignung der Daten für automatische Prozesse
• Genauigkeit
• Vollständigkeit der KB
Discovery-Service
42Frits Ahlefeldt:http://landscapesofunderstanding.com/photo/47/Refining-knowledge-color-illustration.html
ZwischenfazitEine Knowledge base verwaltet:• Inventar elektronischer Ressourcen• normiertes Anbieterverzeichnis• Holding relevante Informa?onen• Grundlage für Automa1smen:
– Linkresolver– ERMS– Zugangssteuerungen– ...
Discovery-Service
43
Frits Ahlefeldt:https://www.flickr.com/photos/hikingartist/5019944289/
Ziele
• Arbeitsersparnis durch:– Koopera5on
– Skalierung
• Definierte Prozesse für Qualitätssicherung
Discovery-Service
44
Frits Ahlefeldt:hFps://www.flickr.com/photos/hikingar5st/5726853059/
• Optimierung für automatische Prozesse
• Datengrundlage für nachgelagerte Prozesse
• effektivere und effizientere Verwaltung
Discovery-Service
45
Ziele
• freie Metadaten (Lizenz: CC0)
• freie Schni5stellen• koopera;ver Ansatz• nicht kommerziell• Open Source
Discovery-Service
46
GOKb
Frits Ahlefeldt:https://www.flickr.com/photos/hikingartist/6087916767/
• manueller Import• automatisierter Import über CrossReferencing-
Schnittstelle– integrierte Routinen für Match & Merge– Generierung von Konfliktreports (Review Requests)
Discovery-Service
47
RedakHon
2012 - • Förderantrag bei der Mellon-Foundation durch die
North Carolina State University (NCSU)
- 2014 • erste Entwicklungsphase (gokb-phase1)
• Entwicklung des Prototyps
- 2016 • zweite Entwicklungsphase (gokb-phase2)
• Ausweitung von Kernkomponenten
2017 - • Beitritt zur Open Library Foundation (OLF)
• neues Leitungsgremium u.a. mit ZDB, hbz und VZG
Discovery-Service
48
Historie
Neue Struktur seit dem 1.9.2017:
• ZDB (Zeitschriftendatenbank)
Vorsitz + Redaktion
• OLE (Open Library Environment )
• NCSU (North Carolina State University )
• CalTech (California Institute of Technology )
• hbz (Hochschulbibliothekszentrum)
• VZG (Verbunzentrale des GBV)
technische Leitung + Betrieb
Discovery-Service
49
Leitungsgremium
Frits Ahlefeldt:
hVps://www.flickr.com/photos/hikingarZst/6172356234/
1. Neues, verbessertes Oberflächenkonzept (Finanzierung BMBF)
2. GOKb als neuer ZDB Dienst3. Basis für– Electronic Resources Management (ERM)– Open Access-Monitor– Recherchesysteme– ...
Discovery-Service
50
Die nächsten Wochen...
3.2. ERMS
Discovery-Service
51
3.2.1 LAS:eR
Discovery-Service
52
Discovery-Service
53
Paket- und Titeldaten
Weitere Systeme
frei & offen
• Ein herstellerunabhängiges ERMS auf Open-Source-
Basis zur
• Organisa4on und Verwaltung von E-Ressourcen– Lokale Lizenzen (Datenbanken / Journals / eBooks)
– Konsor=ale Lizenzen (auch Na=onal- und Allianzlizenzen) unter
• Verwendung der GOKb als allgemeiner und offener Knowledge Base inklusive einheitlicher Iden4fikatorenund Nutzung
• standardisierter SchniEstellen zum Datenaustausch mit
DriEsystemen (Bestandsdaten, Lizenzdaten)
Discovery-Service
54
Enthaltene Daten• Paket- und Titeldaten (GOKb) • Lizenzdaten (Lizenzinhalte)• Organisationsdaten zu Anbietern und Bibliotheken• Bestandsdaten lizenzierter Pakete (konsortial, bilateral)• Statistikdaten (Statistikserver)• Zugangsinformationen
Discovery-Service
55
Enthaltene Daten• Paket- und Titeldaten (GOKb) • Lizenzdaten (Lizenzinhalte)• Organisationsdaten zu Anbietern und Bibliotheken• Bestandsdaten lizenzierter Pakete (konsortial, bilateral)• Statistikdaten (Statistikserver)• Zugangsinformationen
Discovery-Service
55
3.2.2 folio ERM-Modul
Discovery-Service
56
Discovery-Service
57
Paket- und Titeldaten
Weitere Systeme
frei & offen
folio
22. Verbundkonferenz am 29. / 30. 8. 2018
• Kirstin Kemner-Heek:VZG Göttingen: Entwicklungsstand des FOLIO-Projekts und der integrierten ERM-Lösung
• Jarmo Schrader:UB Hildesheim: Kooperation konkret – Erfahrungsberichte aus den FOLIO Special Interest Groups
Headline
58
4. Kontakt
Discovery-Service
59
Frits Ahlefeldt:https://hikingorg.files.wordpress.com/2015/12/electrical-hiking-color-illustration-by-frits-ahlefeldt.jpg
Gerald Steilensteilen@gbv.de0551 39-31401
Hinweis: Für diese Präsentation ist das gesprochene Wort maßgeblich.