Universitt zu Kln WS 11/12 Digitale Langzeitarchivierung
17.11.2011 Christina Vollmert Library of Congress Collections
Content Categories
Folie 2
Bilder
Folie 3
Anwendungsbereiche: Fotografien, Plakate, Grafiken, Diagramme,
dokumentarische Bauzeichnungen Aufteilung in Raster- und
Vektorgrafik
Folie 4
Bestimmung der Formatprferenzen Analyse der signifikanten
Charakteristika der Formate
Folie 5
Bestimmung der Formatprferenzen Auflsung - nicht relevant fr
Vektorgrafiken - bestimmende Gre fr die Qualitt von Rastergrafiken
- zwei Varianten Gesamtzahl der Bildpunkte (z.B. 7 Megapixel)
Anzahl der Bildpunkte pro Zeile (z.B. 2400 x 3000) - zwei Einheiten
ppi bezieht sich auf die Lichtpunkte dpi bezieht sich auf die
Bildpunkte
Folie 6
Bestimmung der Formatprferenzen Farbverwaltung - hohe
hnlichkeit der Farben zwischen der Ein- und Ausgabe eines
Bildes
Folie 7
Bestimmung der Formatprferenzen Wiedergabe - Bildschirm oder
Papier? - Fr welchen Gebrauch?
Folie 8
Bestimmung der Formatprferenzen Ergebnisse der Analyse mit
technischen Informationen der verschiedensten Formate
verbinden
Bevorzugte Formate - Vektor Grafiken nicht erwnschte
Dateiformate AI (Adobe Illustrator) CDR (Corel Draw) CMX (Corel
Exchange) DRW (Micrografx Draw) WMF (Windows Metafile) STEP
(Standard for the Exchange of Product Model Data)
Folie 17
Bestimmung der Formatprferenzen Beispiel 1: Arbeiten von
Fotografen und Werbedesignern - dokumentarische Fotografien von
Tieren & Natur - Modefotografien - Architekturfotografien Farbe
& Tonalitt ist von besonderer Wichtigkeit Auflsung ist wichtig,
um feine Details sichtbar zu machen Archivierung sollte diese
Punkte nicht beeinflussen Typ: Rastergrafik, unkomprimiert Datei
Format: TIFF_UNC (RGB color, 24 bit oder grer)
Folie 18
Audio
Folie 19
Anwendungsbereiche: Kategorie 1: Aufnahmen (Musik CDs, Hrbcher,
etc.) waveform Kategorie 2: Formate der Produktion solcher
Aufnahmen note-based
Folie 20
Bestimmung der Formatprferenzen Wiedergabe - mono oder stereo?
- Lautsprecher oder Kopfhrer? - Software ntig, um Nutzer die
Kontrolle ber Lautstrke, Balance etc. zu gewhren
Folie 21
Bestimmung der Formatprferenzen Fidelity - das aufgenommene
Klangbild so reproduzieren knnen, dass zwischen Original und
Wiedergabe kein hrbarer Unterschied besteht High Fidelity -
Abtastfrequenz & Bittiefe
Folie 22
Bestimmung der Formatprferenzen Mehrkanal-System - Ziel:
mglichst realistisches rumliches Klangerlebnis zu ermglichen
mehrere Klangkanle: z.B. durch Surround Sound mehrere Inhaltskanle:
z.B. Deutsch oder Englischer Ton
Folie 23
Bestimmung der Formatprferenzen Downloads - usergeneriete
Sounds, Samples & Patches
Folie 24
Bevorzugte Formate Waveform Generell bevorzugt werden - Formate
mit hohe Abtastrate - unkromprimierte Formate - nicht
schreibgeschtzte Formate
Bestimmung der Formatprferenzen Beispiel 1: CD mit klassischer
Musik Wiedergabe eines originalgetreuen Klangbilds sehr wichtig
Wiedergabe durch Lautsprecher oder Kopfhrer sollte mglich sein
Datei Format: AAC_ADIF
Folie 30
Text
Folie 31
Anwendungsbereiche: Verschiedene Arbeiten, die hauptschlich aus
Text bestehen Schwerpunkt aber auf Arbeiten, die vorranging
physisch existieren. Nicht bercksichtigt werden eBooks oder
Formate, die z.B. nur fr einen eBook Reader geeignet sind
Folie 32
Bestimmung der Formatprferenzen Charakteristika, die fr die
Hersteller von Texten wichtig sind - Verstndlichkeit fr die
Endnutzer - Qualitt des Designs/ Layouts - erfolgreiche Verbindung
von Anwendungsbereich und Absicht - Integritt des Textes,
dazugehrigen Diagrammen, Illustrationen, Formeln etc.
Folie 33
Bestimmung der Formatprferenzen Charakteristika, die fr die
Leser heute wichtig sind - Lesbarkeit - Lese- Komfort (visuell
ansprechend? Seiten gut umbltterbar/ Scrollen mglich?) - Qualitt
von Design und Layout - Verstndnis von Inhalt und Kontext -
Integritt der Inhalten - Navigation (z.B. durch verschiedene
Kapitel oder Links) - Volltextsuche - Mglichkeit des Zitierens -
Mglichkeit, bestimmte Teile auszudrucken
Folie 34
Bestimmung der Formatprferenzen Charakteristika, die fr die
Leser in Zukunft wichtig sind - Verstndnis fr den zeitlichen
Kontext, in der das Dokument verfasst wurde - Verstndnis dafr, in
wie fern technische Vernderungen die Struktur der Navigation/
Prsentation verndert haben - Mglichkeit, den Wert des Dokuments als
historischen Beweis zu berprfen
Bevorzugte Formate Texte mit Seiten-Layout PDF/A HTML
Folie 37
Bestimmung der Formatprferenzen Beispiel 1: Poster, Broschren,
Werbeanzeigen Layout & Design ist sehr wichtig Volltextsuche
z.B. nicht primr wichtig Lsung: Datei Format: HTML oder PDF
Folie 38
Bewegte Bilder
Folie 39
Anwendungsbereiche: Kategorie 1: Animationen, Filme, Videos
Kategorie 2: Formate, die fr die Produktion solcher Inhalte genutzt
werden Physische Datentrge wie DVDs und Videos werden nicht
bercksichtigt
Folie 40
Bestimmung der Formatprferenzen Wiedergabe - Ausgabe am
Bildschirm/ Leinwand - falls Ton vorhanden: mono oder stereo/
Lautsprecher oder Kopfhrer - Einstellungsmglichkeiten im Bezug auf
Kontraste, Helligkeit usw. - Mglichkeiten der Navigation
(vorspulen, etc.)
Folie 41
Bestimmung der Formatprferenzen Auflsung - nicht relevant fr
Vektorbasierte Animationen wie Flash- Dateien - Bildgre (z.B. TV-
Standard 4:3) - geht einher mit der Frame-Anzahl (Standard Video:
30 Frames pro Sekunde; Film 24 Frames pro Sekunde)
Folie 42
Bestimmung der Formatprferenzen Fidelity - das aufgenommene
Klangbild so reproduzieren knnen, dass zwischen Original und
Wiedergabe kein hrbarer Unterschied besteht High Fidelity
Folie 43
Bestimmung der Formatprferenzen Mehrkanal-System - Ziel:
mglichst realistisches rumliches Klangerlebnis zu ermglichen
mehrere Klangkanle: z.B. durch Surround Sound mehrere Inhaltskanle:
z.B. Deutsch oder Englischer Ton, Kommentare des Regisseurs, Sound
Effekte usw
Folie 44
Bevorzugte Formate Filme/ Videos Generell werden Formate
bevorzugt, die - eine hohe Bitrate - High Definition anstatt
Standard Definition - hohe Bildgren vorweisen
Folie 45
Bevorzugte Formate Filme /Videos Akzeptierte Formate MPEG-2
MPEG-4_AVC MPEG-4_V MPEG-1 Komprimierte Formate wie AVI, QuickTime,
WMV, etc.
Bestimmung der Formatprferenzen Beispiel 1: Kinofilm Auflsung
und Sound sehr wichtig, ebenso Farbwiedergabe Lsung: Datei Format:
DPX_2
Folie 50
Internet Archive
Folie 51
Anwendungsbereiche: Internetauftritte aller Art
Folie 52
Internet Archive Unterscheidung in Web page : a page is a set
of one or more Web resources expected to be rendered
simultaneously, which can be identified by the URI of the item that
embeds the other resources in the set. Web site: an intellectually
related set of resources often (but not always) bounded by
technical division, such as content from a domain, which may
include several related domains, or a subset of content from a host
(Web Archive Metrics: Definitions and Framework, December
2005)
Folie 53
Internet Archive Unterscheidung in Makro- Archivierung: meist
ausgehend von groen Institutionen; das gesamte Spektrum des
kulturellen Erbes archivieren Mikro- Archivierung: nur ein kleiner
Einblick in eine bestimmte Seite um einen bestimmten Aspekt zu
archivieren
Folie 54
Internet Archive Dokumentation - Warum wurde eine bestimme
Seite verfasst? Kontext und Umstnde mssen dokumentiert werden z.B.
fr zuknftige Analysen
Folie 55
Bevorzugte Formate Zwei hnliche Formate, die fr Archivierung
von Webseiten vom Internet Archive erstellt worden sind ARC
(Archive File Format) WARC (Web Archive File Format) speichern
mehrere Ressourcen von Webseiten in einer Datei
Folie 56
Datenstze
Folie 57
Anwendungsbereiche: standardisierte Datenwerte Fokus: Daten,
bei denen die Werte fr ein Element auf eine bestimmte Art beschrnkt
sind, z.B. integer
Folie 58
Bestimmung der Formatprferenzen Struktur - Datenstze werden
immer in einer Struktur dargestellt, die die Eigenschaften der
einzelnen Daten und die Beziehungen unter ihnen zeigt Syntaktische
Integritt und Struktur der Werte muss erhalten bleiben
Folie 59
Bestimmung der Formatprferenzen Verstndnis - wichtig fr eine
Nutzbarkeit in der Zukunft ist ein Verstndnis der Semantik der
verschiedenen Elemente Semantik sollte explizit beschrieben werden,
z.B. in einem expliziten Dokument (das vorzugsweise maschinenlesbar
ist)
Folie 60
Bevorzugte Formate Fr Datentypen (CSV) VOT (Format der Virtual
Observatories) DBF (Format der dBASE Datenbank)
Folie 61
Bevorzugte Formate Fr Reprsentation von Datenstrukturen CDF
(Common Data Format) HDF (Hierarchical Data Format)