Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
ECM – Enterprise Content ManagementKonzepte und Techniken rund um Dokumente2009 / 1. AuflageKapitel 2 / Capture - XML
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Gliederung
XML- Historie, Ziel, Position zu HTML Struktur und Syntax XPath, XQuery, Ablage
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Warum XML ?
XML ist die einzige Möglichkeit,die Vielzahl der Daten, Anwendungen und Geräte
des E-Business zu verwalten
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Historische Entwicklung
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Entwicklungsmotive
Zwei Motive haben die Entwicklung von XML ausgelöst: Die seit 1969 für die Beschreibung von
Dokumentenstrukturen verwendete Standard Generalized Markup Language SGML war zu komplex.
HTML als die einflussreichste aus SGML abgeleitete Auszeichnungssprache erwies sich wegen des weitgehend fixierten Satzes von Elementtypen als zu starr
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
XML-Beispiel
Quelle: GS1 Germany
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
XML-Merkmale
XML ist ein offener Standard XML basiert auf selbstbeschreibenden Merkmalen
(Kontext als auch Inhalt) XML ist leicht erlernbar XML ist leicht sowohl von Rechnern als auch von
Menschen zu lesen XML Dokumente sind leicht erweiterbar XML ist plattform- und anwendungsunabhängig
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
XML als Integrationswerkzeug
Business-to-Consumer
Transaktion
Kommunikation zwischenAnwendungen
VS.
EDI
Inhaltsverteilung Quelle : Hochberg, SAG-Symposium, 2000
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
XML-Dokumententypen
Briefekj flsjd kjs lskjlkj lskjd lksjl fslk jdlksj fksjdlkjlkjf lskjdlkjf slkjkj flskdjljdkfj s lkjlkjlsd s dfl skjd f slkdjflskdj lslkjdflk lskjd lfksjdlk lskdjfl aölskjdfölskdjf söldkfjlskdj föaslkdjlskdjf ösldkfjlskd föalskdj
ksjdlfkjslkjd
existierendeDatenbanken
FaxEdmund BoisterMinimillennium
MingaKunden# 08/15-4711
Sehr geehrte Damen und Herren!Bitte fakturieren Sie folgenden Auftrag:# Beschreibung
Listenasdas ddas(asdsad) asdasddasda asdasdsd asdasdsdasdsdasdas sdassdsdasdsdas
sdasds dassdasdsdasd(werwe) sdasdaskjl lkjf ölkjglkdf jgs kjlkfjgölkfjg lkdfjg ldkfjglödkfjlgdkk
E-Mailskjfskdjfl asdasdasdasdlkjfkjdflks fa sdf asdfsdf askjlfkjslkjkjl df asdf sdfsd
sdksldjfslkdf laskjdkdjf lskdj sd hflaksjdhfskk fksjdlfj öalsjdlfksjdf slkdlksdjf slkdfjlkdj aölskdjf skdjf slkjlj öa södlfjlkd föjkalslkdf lkjflksjdföa ljls df lskjd flkjllksd fjlakkjshd fkahlkh kshd flakshkj flkahksjd flkajkjsh flkajsh dfkj hksj fksjdhf la
Projekt-daten
Prozess-beschreibungen
Bilder
Video
Audio
zentralesDatenmanagement
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
XML für verschiedene Layouts und Geräte
Bild
Drucker
Internet
CD
Bericht
Frankfurt: Wind 4 WNW / Rain / 22°C
News Ticker
Wetter-daten
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
XML - Überblick
Einordnung – Demo-Video
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
XML: Trennung von Content und Layout
Darstellung der logischen Struktur von Dokumenten Layoutinformationen davon separat
Quelle: Roland Boendgen
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
XML-Strukturphilosophie
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
XML-Nutzen
XML Tags erlaubt selbstbeschreibende Daten
XML Programming Interface arbeitet mit jedem Programmiermodell zusammen
XML Style Sheets erleichtert die Personalisierung von Informationen
XML Document Type Definitions gestattet eine Dokumentenbeschreibung für
unterschiedlichste Belange
Quelle : Viljoen, SAG-Symposium, 2000
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Struktur von XML
Im Mittelpunkt stehen Dokumente
Inhalt
Inhalt
- Überschrift - Einleitung - Text = Struktur
Formatierung des Textes = Darstellung
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
HTML vs. XML
HTML XML
Struktur Festgelegt durch Struktur-Tags.Dokumentstruktur bestimmt Anordnung der Tags.Nicht erweiterbar.
Festlegung einer eigenen Struktur durch selbstdefinierte Tags. Anordnung der Tags bestimmt Struktur des Dokuments.Beliebig erweiterbar.
Inhalt Wird vom Autor festgelegt. Tags dienen der Formatierung des Textes zwischen den Tags. Dynamischer Zugriff auf den Text ohne Hilfsmittel nicht möglich.
Wird vom Autor festgelegt. Tags beinhalten den Text des Dokuments. Dynamischer Zugriff durch spezielle Zugriffsmethoden auf den Inhalt der Tags möglich.
Darstellung Zentral im HTML Dokument durch Tags, die Formatanweisungen enthalten
Formatanweisungen sind ausgelagert in externe Datei
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Darstellung von XML-Dokumenten
HMTL Seiten nutzen vordefinierte Tags für die Formatierung – der Browser interpretiert diese
XML zeichnet sich durch eine unendliche Menge möglicher Tags aus – daher ist es unmöglich ein definiertes Layout für diese Tags im Browser festzulegen
XSL (Extensible Stylesheet Language) ist ein Zusatzstandard, der XML-Dokumente formatiert und mit bedingten Anweisungen ausgeben kann
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Gliederung
XML- Historie, Ziel, Position zu HTML Struktur und Syntax XPath, XQuery, Ablage
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Besonderheiten
Anwender definieren ihre eigenen Tags oder greifen auf öffentlich verfügbare Tagmengen zurück, die für verschiedene Anwendungsbereiche angeboten werden.
Inhaltliche Strukturen lassen sich in beliebiger Tiefe schachteln Die verwendeten Tagnamen lassen einen Rückschluss auf die
Bedeutung der Daten zu. Dagegen wird die Darstellung nicht explizit festgelegt.
XML erlaubt die Festlegung externer Bezüge für ein Dokument. Derartige Referenzen werden aufgelöst und durch die entsprechende Entität ersetzt. Mittels Referenzen werden Entitäten in einem Dokument bei Bedarf mehrfach verwendet. Auf diese Weise lässt sich ein XML-Dokument aus vorgefertigten Teilen zusammensetzen.
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Informationseinheiten
Elf Typen von Informationseinheiten werden unterschieden: Dokument Element Attribut Verarbeitungsanweisung Entitätsreferenz Zeichen Kommentar Dokumenttyp-Deklaration Ungeparste Entität Notation Namensraum
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Bedeutung der Informationseinheiten
Die wichtigsten Komponenten in der sich der Inhalt widerspiegelt, sind Elemente und Attribute.
Das XML-Dokument ist als Baum strukturiert mit einer Wurzel, die alle Elemente umschließt
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
XML-Syntax
Um wohlgeformt zu sein, muss ein Dokument syntaktische Regeln der XML-Grammatik erfüllen.
Dabei gilt: Jedes wohlgeformte Dokument beginnt mit einem Prolog, dem
mindestens ein Element folgt. Danach sind Kommentare oder Verarbeitungsanweisungen
erlaubt. Hinter dem Prolog beginnen die XML-Daten in Form eines
Baumes aus Elementen und Attributen. Das erste Element ist das Wurzelelement, das alle anderen
Elemente einschließt
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
XML-Deklaration - Video
XML-Deklaration
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
XML - Baum
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Aufbau eines XML-Dokumentes
Bestandteile eines XML-Dokumentes
Vorspann
DTD (intern oder extern)
XML
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
XML-Dokumentenstruktur
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
XML-Dokumentenbeispiel
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
XML-Dokument - Baum
XML definiert Baumstruktur! Wurzel heißt Dokumentelement Blattelemente enthalten Werte Einziger Datentyp: Zeichenkette
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
XML - Objekte
XML nennt seine Objekte Elemente Elemente sind begrenzt durch Tags
Tagnamen sind "case-sensitive" Jedes geöffnete Tag muss auch wieder geschlossen
werden Tags dürfen einander nicht überlappen; nicht erlaubt z.
B.: <A> <B> </A> </B> Tags leerer Elemente haben besondere Syntax: <A/>
(Shortcut für <A> </A>) Tags können Attribute enthalten: <A
Attributname="Wert" ...> </A> Eine korrekte Schachtelung ist notwendig (anders als in
HTML). XML-Elemente dürfen nicht überlappen.
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Vorspann eines XML-Dokumentes
version gegenwärtig nur 1.0, 1.1 falls zukünftig weitere Versionen als Empfehlung vom W3C
verabschiedet werden, dann ermöglicht der Parameter die Verarbeitung verschiedener Versionen.
encoding (optional) Kodierung des Dokuments, Beispiele (UTF-8 – auch Defaultwert,
UTF-16 - müssen ebenfalls alle XML-Prozessoren unterstützen). standalone (optional)
'yes' - spezifiziert, dass dem Dokument eine externe Markup-Deklaration (DTD oder XML-Schema) zugeordnet wird, sonst 'no'
Defaultwert 'no'‚ wenn externe Deklaration definiert ist und standalone nicht angegeben ist
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Beispiele - Vorspann
<?XML version="1.0" encoding="UTF-8" standalone="yes"> <?XML version="1.0" encoding="UTF-16" standalone="no">
<!DOCTYPE tourismus-infos SYSTEM "tourismus.dtd">
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
XML - Grammatik
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Grammatik - Besonderheiten
Anders als bei HTML ist auf Groß- und Kleinschreibung zu achten. Ein Name muss mit einem Buchstaben, einem Unterstrich oder einem Doppelpunkt beginnen
Elemente sind mit beliebig vielen Attributen definierbar, mit Paaren von Attributname und Attributwert
Jedes angegebene Attribut muss einen Wert haben, der in Hochkommata oder Anführungszeichen eingeschlossen ist. Mehrere Attribute werden durch Leerzeichen getrennt.
Ob in einer Dokumentenstruktur ein Objekt besser als Element oder Attribut behandelt wird, obliegt dem Anwender
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Grammatik - Namensräume
Die freie Namenswahl bei Elementen und Attributen wirft Probleme auf, wenn die gleichen Namen mit unterschiedlicher Bedeutung verwendet werden.
<beitrag> kann Mitgliedsbeiträge oder Artikel für eine Zeitschrift bedeuten.
Um Mehrdeutigkeiten zu vermeiden, ordnet man Namen Namensräumen zu. Diese werden durch eine eindeutige URI-Referenz identifiziert.
Der URI wird über ein xmlns-Attribut ein Präfix zugeordnet: <mitglieder xmlns:mtg=„http://mitglieder.de/organisation“> Ein Element dieses Namensraums wird wie folgt angesprochen: <mtg:beitrag>100</mtg:beitrag>
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Aufbau von XML-Dokumenten 1
Titel : „Linux“
Autor : „Michael Kofler“
ISBN : 3-8273-1475-5
<Buch> <Titel>Linux</Titel> <Autor>Michael Kofler</Autor> <ISBN>3-8273-1475-5</ISBN>
</Buch>
Komponenten eines Buchs
Elemente eines XML Dokuments
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Aufbau von XML-Dokumenten 2
<content>XML builds on the principles of two existing languages, <emph>HTML</emph> and <emph>SGML</emph> to create a simple mechanism .. The generalized markup concept .. </content>
<order> <customer>Meyer</customer> <position> <isbn>1-234-56789-0</isbn> <number>2</number> <price currency=´Euro´>30.00</price> </position></order>
Elemente und Attributehierarchische SchachtelungSequenz
Markup in VolltextenMixed Content Elemente
Quelle: Viele der folgenden Folien basieren aufMeike Klettke, UNI Rostock
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Syntax von Elementen /1
Ein Element besteht aus:• Start-Tag• Ende-Tag und• Elementinhalt
Beispiel: <vortragender> Ronald Bourret </vortragender>
Start-Tag Ende-TagElementinhalt
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Syntax von Elementen /2
Leere Elemente sind möglich:Beispiel:
<koordinaten/>
Elemente können verschachtelt werden:<vortragender>
<name>Bourret</name> <vorname>Ronald</vorname>
</vortragender>
Start-Tag
Ende-TagElementinhalt
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Graphische Darstellung von XML-Dokumenten
• XML-Dokumente sind Bäume!• Beispiel: <vortragender> <name>Bourret</name> <vorname>Ronald</vorname>
</vortragender>
• korrekte Schachtelung der Elemente notwendig
name vorname
BourretRonald
vortragender
ElementknotenTextknoten
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Document Type Definition
Einordnung von Dokumenten in Kategorien, macht Dokumente unterscheidbar
Entscheidend dafür sind die Elemente, die das jeweilige Dokument enthält
Um Elemente, die zu einem Dokument gehören zu definieren, verwendet man in XML die DTD
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Schemabeschreibung - DTD
Darstellung, welche Elemente auftreten können und wie sie geschachtelt werden
Deklaration von Strukturinformationen
Vorteile einer DTD: Entspricht einer Dokumentation für die XML-Dokumente Anwendungen können darauf reagieren Fehler in XML-Dokumenten können erkannt werden Oft: bessere Qualität der XML-Dokumente, weil
durchdachteres Vorgehen PCDATA = Parsed Character Data
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Definition von Elementen in einer DTD
XML-Dokument:<vortragender> Ronald Bourret </vortragender>
Zugehörige DTD:<!ELEMENT vortragender (#PCDATA)>
XML-Dokument:<vortragender>
<name> Bourret </name> <vorname> Ronald </vorname>
</vortragender>Zugehörige DTD:
<!ELEMENT vortragender (name, vorname)><!ELEMENT name (#PCDATA)><!ELEMENT vorname (#PCDATA)>
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Definition von Elementen in einer DTD (Inhaltsmodelle)
• Sequenz (A , B) A und B müssen in der angegebenen
Reihenfolge im Dokument auftreten• Alternative (A | B) entweder A oder B treten im
Dokumente auf• Wiederholung A? - 0..1 Mal A+ - 1..n Mal A* - 0..n Mal• Mixed Content (#PCDATA | A | B)* A, B oder beliebiger Text treten im Dokument auf
<!ELEMENT hotel (name, adresse)><!ELEMENT name (#PCDATA)><!ELEMENT adresse (plz, ort, ((strasse, nummer?) | postfach))><!ELEMENT beschreibung (#PCDATA | ausstattung | gastronomie)*>
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Beispiele zur Definition von Elementen in einer DTD /1
<!ELEMENT hotel (name, adresse)>
<hotel> <name>Hotel am Leuchtturm</name><adresse>...</adresse>
</hotel>
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Beispiele zur Definition von Elementen in einer DTD /2
<!ELEMENT adresse (plz, ort, ((strasse, nummer?) | postfach))>
<adresse><plz>18119</plz><ort>Warnemuende</ort>
<strasse>Seestrasse</strasse><nummer>12</nummer>
</adresse>
<adresse><plz>18051</plz><ort>Rostock</ort>
<postfach>12345</postfach></adresse>
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Beispiele zur Definition von Elementen in einer DTD /3
<!ELEMENT beschreibung (# PCDATA | ausstattung | gastronomie)*>
<beschreibung>Das Hotel am Leuchtturm befindet sich direkt am Alten Strom, mit Blick auf die Hafeneinfahrt, die Mole und den Strand.</beschreibung>
<beschreibung>Unser Hotel verfügt über eine <ausstattung> Sauna </ausstattung> und eine <ausstattung> Meerwasserschwimmhalle </ausstattung>. Das
<gastronomie> Hotelrestaurant</gastronomie> bietet regionale Küche und Fischspezialitäten. </beschreibung>
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Syntax von Attributen /1
Attribute werden einem Element des XML-Dokumentes zugeordnet:
<vortragender tutorial=´T1´> Ronald Bourret </vortragender>
Zugehörige DTD:<!ELEMENT vortragender (#PCDATA)><!ATTLIST vortragender tutorial CDATA #REQUIRED>
Start-Tag Ende-TagElementinhalt
AttributnameAttributwert
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Syntax von Attributen / 2
XML-Dokument<koordinaten x=´200´ y=´300´ z=´150´ />
DTD<!ELEMENT koordinaten (EMPTY)><!ATTLIST koordinaten x CDATA #REQUIRED y CDATA #REQUIRED z CDATA #IMPLIED >
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Darstellung von XML-Dokumenten
• XML-Dokumente sind Bäume!
Beispiel:<vortragender tutorial=´T1´> <name>Bourret</name> <vorname>Ronald</vorname></vortragender>
ElementknotenTextknotenAttributknoten
T1
tutorial name vorname
BourretRonald
vortragender
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Deklaration von Attributen in einer DTD
Attribute haben einen Namen einen Typ (CDATA, ID, IDREF/IDREFs, ENTITY/ENTITYS, NMTOKEN/NMTOKENS oder (wert1|wert2|...) Aufzählung möglicher Werte eine Angabe, ob das Attribut auftreten muss (#REQUIRED, #IMPLIED oder #FIXED) oder einen optionalen Defaultwert (bei #FIXED ist dieser auch erforderlich)
<!ATTLIST preis waehrung
CDATA #REQUIRED>
<!ATTLIST projekt id
ID #REQUIRED>
<!ATTLIST person projekt
IDREF #REQUIRED>
<!ATTLIST plz xml-sqltype
CDATA#FIXED ´INTEGER´>
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Zusammenfassung der DTD-Deklarationen
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
DTD-Elementdeklaration
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
DTD-Attributdeklaration
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
DTD-Attributdeklaration - Beispiel
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Beispiel: Bookstore
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
DTD-Deklarationsformen
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Beispiel – externe Deklaration
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Kommentare
können in DTDs und in XML-Dokumenten auftreten
Kommentare lassen sich durch Applikationen auswerten (z.B. mit XML-Prozessoren, XSLT)
Syntax: <!-- Dies ist ein Beispielkommentar -->
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
XML-Editoren - Video
XML-Editoren
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Gliederung
XML- Historie, Ziel, Position zu HTML Struktur und Syntax XPath, XQuery, Ablage
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
XML-Zugriff
Quelle: Gorke, 2006
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
XPath
Quelle: Gorke, 2006
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
XQuery
Quelle: Gorke, 2006
Vieweg+Teubner Verlag | Wiesbaden 2009 www.viewegteubner.de
© Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags
Materialien
Den Ablauf einer Bestellung unter Verwendung von XMLzeigt eine Simulation
IBM stellt unterschiedliche Tutorials bereit (in englisch)
XML-Tutorial (in deutsch) und ein zweites XML-Tutorial (in deutsch)
Die UNI Rostock bietet einen Foliensatz zum Thema
Videos und Tutorials bietet Stylusstudio
Empfehlenswertes Online-Buch
Tutorials zu XML-Begleitstandards