Universität zu Köln WS 11/12 Digitale Langzeitarchivierung 17.11.2011 Christina Vollmert Library...
Preview:
Citation preview
- Folie 1
- Universitt zu Kln WS 11/12 Digitale Langzeitarchivierung
17.11.2011 Christina Vollmert Library of Congress Collections
Content Categories
- Folie 2
- Bilder
- Folie 3
- Anwendungsbereiche: Fotografien, Plakate, Grafiken, Diagramme,
dokumentarische Bauzeichnungen Aufteilung in Raster- und
Vektorgrafik
- Folie 4
- Bestimmung der Formatprferenzen Analyse der signifikanten
Charakteristika der Formate
- Folie 5
- Bestimmung der Formatprferenzen Auflsung - nicht relevant fr
Vektorgrafiken - bestimmende Gre fr die Qualitt von Rastergrafiken
- zwei Varianten Gesamtzahl der Bildpunkte (z.B. 7 Megapixel)
Anzahl der Bildpunkte pro Zeile (z.B. 2400 x 3000) - zwei Einheiten
ppi bezieht sich auf die Lichtpunkte dpi bezieht sich auf die
Bildpunkte
- Folie 6
- Bestimmung der Formatprferenzen Farbverwaltung - hohe
hnlichkeit der Farben zwischen der Ein- und Ausgabe eines
Bildes
- Folie 7
- Bestimmung der Formatprferenzen Wiedergabe - Bildschirm oder
Papier? - Fr welchen Gebrauch?
- Folie 8
- Bestimmung der Formatprferenzen Ergebnisse der Analyse mit
technischen Informationen der verschiedensten Formate
verbinden
- Folie 9
- Bevorzugte Formate Rastergrafiken akzeptierte Dateiformate fr
Farb- oder Graustufen Bilder: Prioritt 1 TIFF_UNC (Uncompressed
Bitmap) TIFF_UNC_EXIF (Umcompressed File with Exif metadata)
TIFF/EP (Electronic Photography) JP2_J2L_C_LL (JPEG 2000 Part 1
Core Coding, Lossless Compression) TIFF/IT (Image Technology)
- Folie 10
- Bevorzugte Formate Rastergrafiken akzeptierte Dateiformate fr
Farb- oder Graustufen Bilder: Prioritt 2 JP2_J2K_C_LSY (JPEG
2000)
- Folie 11
- Bevorzugte Formate Rastergrafiken akzeptierte Dateiformate fr
Farb- oder Graustufen Bilder: Prioritt 3 PDF/A (PDF for Long-term
Preservation) PDF/X (PDF for Graphic Exchange) JPEG_DCT_BL (JPEG,
DCT Encoding, Baseline)
- Folie 12
- Bevorzugte Formate Rastergrafiken akzeptierte Dateiformate fr
Farb- oder Graustufen Bilder: Prioritt 4 PNG (Portable Network
Graphics Format) Prioritt 5 GIF (Graphics Interchange Format)
Prioritt 6 BMP (Microsoft Windows Bitmap Format9
- Folie 13
- Bevorzugte Formate Rastergrafiken akzeptierte Dateiformate fr
schwarzwei Bilder TIFF_G4 (Group 4 Compression) J2L_COMP (Compound
Images)
- Folie 14
- Bevorzugte Formate Rastergrafiken nicht erwnschte Dateiformate
RAW PSD PCD EPS FlashPix
- Folie 15
- Bevorzugte Formate - Vektor Grafiken akzeptierte Dateiformate
SVG_1_1 (Scalable Vector Graphics Ver. 1.1) SVG_1_2 (Scalable
Vector Graphics Ver. 1.2) DXF (AutoCad Drawing Interchange
Format)
- Folie 16
- Bevorzugte Formate - Vektor Grafiken nicht erwnschte
Dateiformate AI (Adobe Illustrator) CDR (Corel Draw) CMX (Corel
Exchange) DRW (Micrografx Draw) WMF (Windows Metafile) STEP
(Standard for the Exchange of Product Model Data)
- Folie 17
- Bestimmung der Formatprferenzen Beispiel 1: Arbeiten von
Fotografen und Werbedesignern - dokumentarische Fotografien von
Tieren & Natur - Modefotografien - Architekturfotografien Farbe
& Tonalitt ist von besonderer Wichtigkeit Auflsung ist wichtig,
um feine Details sichtbar zu machen Archivierung sollte diese
Punkte nicht beeinflussen Typ: Rastergrafik, unkomprimiert Datei
Format: TIFF_UNC (RGB color, 24 bit oder grer)
- Folie 18
- Audio
- Folie 19
- Anwendungsbereiche: Kategorie 1: Aufnahmen (Musik CDs, Hrbcher,
etc.) waveform Kategorie 2: Formate der Produktion solcher
Aufnahmen note-based
- Folie 20
- Bestimmung der Formatprferenzen Wiedergabe - mono oder stereo?
- Lautsprecher oder Kopfhrer? - Software ntig, um Nutzer die
Kontrolle ber Lautstrke, Balance etc. zu gewhren
- Folie 21
- Bestimmung der Formatprferenzen Fidelity - das aufgenommene
Klangbild so reproduzieren knnen, dass zwischen Original und
Wiedergabe kein hrbarer Unterschied besteht High Fidelity -
Abtastfrequenz & Bittiefe
- Folie 22
- Bestimmung der Formatprferenzen Mehrkanal-System - Ziel:
mglichst realistisches rumliches Klangerlebnis zu ermglichen
mehrere Klangkanle: z.B. durch Surround Sound mehrere Inhaltskanle:
z.B. Deutsch oder Englischer Ton
- Folie 23
- Bestimmung der Formatprferenzen Downloads - usergeneriete
Sounds, Samples & Patches
- Folie 24
- Bevorzugte Formate Waveform Generell bevorzugt werden - Formate
mit hohe Abtastrate - unkromprimierte Formate - nicht
schreibgeschtzte Formate
- Folie 25
- Bevorzugte Formate Waveform Akzeptierte Formate fr Mono/Stereo
WAVE-LPCM-BWF WAVE-LPCM AIFF-LPCM MP3_FF AAC_ADIF AAC_M4A QTA_AAC
WMA_WMA9_PRO WMA_WMA9
- Folie 26
- Bevorzugte Formate Waveform Akzeptierte Formate fr Surround
Sound AAC_ADIF AAC_M4A QTA_AAC WMA_WMA9_PRO
- Folie 27
- Bevorzugte Formate Note-based Generell bevorzugt werden - MIDI
Encodings MIDI Level 1 wird gegenber Level 2 bevorzugt
- Folie 28
- Bevorzugte Formate Note-based Akzeptierte Formte XMF
(eXtensible Music Format) SMF (Standard MIDI File) RMID (RIFF-based
MIDI File)
- Folie 29
- Bestimmung der Formatprferenzen Beispiel 1: CD mit klassischer
Musik Wiedergabe eines originalgetreuen Klangbilds sehr wichtig
Wiedergabe durch Lautsprecher oder Kopfhrer sollte mglich sein
Datei Format: AAC_ADIF
- Folie 30
- Text
- Folie 31
- Anwendungsbereiche: Verschiedene Arbeiten, die hauptschlich aus
Text bestehen Schwerpunkt aber auf Arbeiten, die vorranging
physisch existieren. Nicht bercksichtigt werden eBooks oder
Formate, die z.B. nur fr einen eBook Reader geeignet sind
- Folie 32
- Bestimmung der Formatprferenzen Charakteristika, die fr die
Hersteller von Texten wichtig sind - Verstndlichkeit fr die
Endnutzer - Qualitt des Designs/ Layouts - erfolgreiche Verbindung
von Anwendungsbereich und Absicht - Integritt des Textes,
dazugehrigen Diagrammen, Illustrationen, Formeln etc.
- Folie 33
- Bestimmung der Formatprferenzen Charakteristika, die fr die
Leser heute wichtig sind - Lesbarkeit - Lese- Komfort (visuell
ansprechend? Seiten gut umbltterbar/ Scrollen mglich?) - Qualitt
von Design und Layout - Verstndnis von Inhalt und Kontext -
Integritt der Inhalten - Navigation (z.B. durch verschiedene
Kapitel oder Links) - Volltextsuche - Mglichkeit des Zitierens -
Mglichkeit, bestimmte Teile auszudrucken
- Folie 34
- Bestimmung der Formatprferenzen Charakteristika, die fr die
Leser in Zukunft wichtig sind - Verstndnis fr den zeitlichen
Kontext, in der das Dokument verfasst wurde - Verstndnis dafr, in
wie fern technische Vernderungen die Struktur der Navigation/
Prsentation verndert haben - Mglichkeit, den Wert des Dokuments als
historischen Beweis zu berprfen
- Folie 35
- Bevorzugte Formate Texte mit strukturiertem Markup (z.B. XML)
OEBPS_1_2 (Open eBook Publication Structure) DTB (Digital Talking
Book)
- Folie 36
- Bevorzugte Formate Texte mit Seiten-Layout PDF/A HTML
- Folie 37
- Bestimmung der Formatprferenzen Beispiel 1: Poster, Broschren,
Werbeanzeigen Layout & Design ist sehr wichtig Volltextsuche
z.B. nicht primr wichtig Lsung: Datei Format: HTML oder PDF
- Folie 38
- Bewegte Bilder
- Folie 39
- Anwendungsbereiche: Kategorie 1: Animationen, Filme, Videos
Kategorie 2: Formate, die fr die Produktion solcher Inhalte genutzt
werden Physische Datentrge wie DVDs und Videos werden nicht
bercksichtigt
- Folie 40
- Bestimmung der Formatprferenzen Wiedergabe - Ausgabe am
Bildschirm/ Leinwand - falls Ton vorhanden: mono oder stereo/
Lautsprecher oder Kopfhrer - Einstellungsmglichkeiten im Bezug auf
Kontraste, Helligkeit usw. - Mglichkeiten der Navigation
(vorspulen, etc.)
- Folie 41
- Bestimmung der Formatprferenzen Auflsung - nicht relevant fr
Vektorbasierte Animationen wie Flash- Dateien - Bildgre (z.B. TV-
Standard 4:3) - geht einher mit der Frame-Anzahl (Standard Video:
30 Frames pro Sekunde; Film 24 Frames pro Sekunde)
- Folie 42
- Bestimmung der Formatprferenzen Fidelity - das aufgenommene
Klangbild so reproduzieren knnen, dass zwischen Original und
Wiedergabe kein hrbarer Unterschied besteht High Fidelity
- Folie 43
- Bestimmung der Formatprferenzen Mehrkanal-System - Ziel:
mglichst realistisches rumliches Klangerlebnis zu ermglichen
mehrere Klangkanle: z.B. durch Surround Sound mehrere Inhaltskanle:
z.B. Deutsch oder Englischer Ton, Kommentare des Regisseurs, Sound
Effekte usw
- Folie 44
- Bevorzugte Formate Filme/ Videos Generell werden Formate
bevorzugt, die - eine hohe Bitrate - High Definition anstatt
Standard Definition - hohe Bildgren vorweisen
- Folie 45
- Bevorzugte Formate Filme /Videos Akzeptierte Formate MPEG-2
MPEG-4_AVC MPEG-4_V MPEG-1 Komprimierte Formate wie AVI, QuickTime,
WMV, etc.
- Folie 46
- Bevorzugte Formate Animationen Akzeptierte Formate FLA
(Macromedia Flash Project File) SWF (Macromedia Flash SWF File)
SVG_1_1 (Scalable Vector Graphics Vers. 1.1) SVG_1_2 (Scalable
Vector Graphics Vers. 1.2)
- Folie 47
- Bevorzugte Formate Produktion Akzeptierte Formate fr nicht
komprimierte Daten DPX_2 DCDM_1_0 MXF_GC_UNC MJP2_FF_LL AVI
QuickTime WMV
- Folie 48
- Bevorzugte Formate Produktion Akzeptierte Formate fr
komprimierte Daten MXF_GC_MPEG-2 (MXF File with MPEG2 VideoStream)
MPEG-2 MPEG-4_AVC MPEG-4_V MPEG-1 AVI QuickTime WMV
- Folie 49
- Bestimmung der Formatprferenzen Beispiel 1: Kinofilm Auflsung
und Sound sehr wichtig, ebenso Farbwiedergabe Lsung: Datei Format:
DPX_2
- Folie 50
- Internet Archive
- Folie 51
- Anwendungsbereiche: Internetauftritte aller Art
- Folie 52
- Internet Archive Unterscheidung in Web page : a page is a set
of one or more Web resources expected to be rendered
simultaneously, which can be identified by the URI of the item that
embeds the other resources in the set. Web site: an intellectually
related set of resources often (but not always) bounded by
technical division, such as content from a domain, which may
include several related domains, or a subset of content from a host
(Web Archive Metrics: Definitions and Framework, December
2005)
- Folie 53
- Internet Archive Unterscheidung in Makro- Archivierung: meist
ausgehend von groen Institutionen; das gesamte Spektrum des
kulturellen Erbes archivieren Mikro- Archivierung: nur ein kleiner
Einblick in eine bestimmte Seite um einen bestimmten Aspekt zu
archivieren
- Folie 54
- Internet Archive Dokumentation - Warum wurde eine bestimme
Seite verfasst? Kontext und Umstnde mssen dokumentiert werden z.B.
fr zuknftige Analysen
- Folie 55
- Bevorzugte Formate Zwei hnliche Formate, die fr Archivierung
von Webseiten vom Internet Archive erstellt worden sind ARC
(Archive File Format) WARC (Web Archive File Format) speichern
mehrere Ressourcen von Webseiten in einer Datei
- Folie 56
- Datenstze
- Folie 57
- Anwendungsbereiche: standardisierte Datenwerte Fokus: Daten,
bei denen die Werte fr ein Element auf eine bestimmte Art beschrnkt
sind, z.B. integer
- Folie 58
- Bestimmung der Formatprferenzen Struktur - Datenstze werden
immer in einer Struktur dargestellt, die die Eigenschaften der
einzelnen Daten und die Beziehungen unter ihnen zeigt Syntaktische
Integritt und Struktur der Werte muss erhalten bleiben
- Folie 59
- Bestimmung der Formatprferenzen Verstndnis - wichtig fr eine
Nutzbarkeit in der Zukunft ist ein Verstndnis der Semantik der
verschiedenen Elemente Semantik sollte explizit beschrieben werden,
z.B. in einem expliziten Dokument (das vorzugsweise maschinenlesbar
ist)
- Folie 60
- Bevorzugte Formate Fr Datentypen (CSV) VOT (Format der Virtual
Observatories) DBF (Format der dBASE Datenbank)
- Folie 61
- Bevorzugte Formate Fr Reprsentation von Datenstrukturen CDF
(Common Data Format) HDF (Hierarchical Data Format)
- Folie 62
- Bevorzugte Formate Standards fr Dokumentationen DDI (Data
Documentation Initiative) ISO 19115
- Folie 63
- Zusammenfassung
- Folie 64
- InhaltEmpfohlenes Format Bilder (Rastergrafik, farbig)TIFF (und
div. Untertypen) Bilder (Rastergrafik, s/w)TIFF_G4 Bilder
(Vektorgrafiken)SVG Audio (mono/stereo)WAVE Audio
(surround)AAC_ADIF Audio (notebased)SMF TextePDF Film/ VideoMPEG
AnimationenFLA Film/ Video Produktion (unkompr.)DPX_2 Film/ Video
Produktion (kompr.)MXF