Transcript
Page 1: Universität Dortmund Proseminar: Auszeichnungssprachen

Universität Dortmund

Proseminar: Auszeichnungssprachen

Page 2: Universität Dortmund Proseminar: Auszeichnungssprachen

Universität Dortmund

Lehrstuhl für künstliche

Intelligenz

Auszeichnungssprachen

• Inhalte• Lernziele• Vorgehen

Einführung in die Bibliothek:

Dienstag, 22.5.2007

14-16 Uhr

Schulungsraum der Bibliothek (Campus Nord)

Page 3: Universität Dortmund Proseminar: Auszeichnungssprachen

Universität Dortmund

Lehrstuhl für künstliche

Intelligenz

Inhalte

• Der Austausch von Daten, • das verteilte Arbeiten an einem gemeinsamen Werk, • der Zugriff vieler unterschiedlicher Systeme auf eine

Anwendung

kann prinzipiell auf zwei Arten erfolgen: • alle befolgen ein und das selbe Format oder • alle entwickeln Übersetzungsprogramme, die das

eigene in jedes andere Format überführen.

Page 4: Universität Dortmund Proseminar: Auszeichnungssprachen

Universität Dortmund

Lehrstuhl für künstliche

Intelligenz

Abstraktion

• Auf ein Format einigen, in dem man beliebige Formate definieren kann!

• Sprache für die Deklaration von Formaten• Der Parser kann die Deklaration eines Formats lesen

und damit jede Datei dieses Formats analysieren.• Derselbe Parser kann auch die Deklaration eines

anderen Formats lesen und damit Dateien dieses anderen Formats analysieren.

Page 5: Universität Dortmund Proseminar: Auszeichnungssprachen

Universität Dortmund

Lehrstuhl für künstliche

Intelligenz

Auszeichnungssprache (Def.)

Eine Auszeichnungssprache ist eine (meist reguläre) Grammatik, die die Form von Daten deklariert.

Die Deklaration legt die Reihenfolge von Elementen fest und ob sie notwendigerweise vorkommen müssen, wobei für jedes Element seinerseits eine Form deklariert wird.

Daten werden zu einer Deklaration passend annotiert, indem Teile der Daten als Element der Deklaration markiert werden. Die annotierten Daten werden dann auch als Instanz der Deklaration bezeichnet.

Page 6: Universität Dortmund Proseminar: Auszeichnungssprachen

Universität Dortmund

Lehrstuhl für künstliche

Intelligenz

XML Schema: einfach.xsd<xsd:schema>

<xsd:element name="einfach">

<xsd:complexType>

<xsd:sequence>

<xsd:element ref="titel"/>

<xsd:element maxOccurs="unbounded" ref="autor"/>

<xsd:element maxOccurs="unbounded" ref="abschnitt"/>

</xsd:sequence>

</xsd:complexType>

</xsd:element>

</xsd:schema>

<xsd:element name="titel" type="xsd:string"/>

<xsd:element name="autor">

<xsd:complexType>

<xsd:sequence>

<xsd:element maxOccurs="unbounded" ref="vorname"/>

<xsd:element ref="nachname"/>

</xsd:sequence>

</xsd:complexType>

</xsd:element>

Page 7: Universität Dortmund Proseminar: Auszeichnungssprachen

Universität Dortmund

Lehrstuhl für künstliche

Intelligenz

Beispiel cont’ed<xsd:element name="abschnitt">

<xsd:complexType mixed="true">

<xsd:sequence>

<xsd:element minOccurs="0" maxOccurs="unbounded" ref="ueberschrift"/>

<xsd:element minOccurs="0" maxOccurs="unbounded" ref="text"/>

</xsd:sequence>

</xsd:complexType>

</xsd:element>

<xsd:element name="ueberschrift" type="xsd:string"/>

<xsd:element name="text" type="xsd:string"/>

Page 8: Universität Dortmund Proseminar: Auszeichnungssprachen

Universität Dortmund

Lehrstuhl für künstliche

Intelligenz

Instanz flyer.xml

<einfach>

<titel> Informatik kompakt </titel>

<autor> <vorname> Katharina </vorname> <vorname> J. </vorname>

<nachname> Morik </nachname>

</autor>

<autor>

<vorname> Volker </vorname>

<nachname> Klingspor </nachname>

</autor>

Page 9: Universität Dortmund Proseminar: Auszeichnungssprachen

Universität Dortmund

Lehrstuhl für künstliche

Intelligenz

Instanz flyer.xml cont’ed<abschnitt> <text> Um eine Grundlage zu schaffen für die Vertiefung in mehrere Teilgebiete der Informatik, haben wir ein Buch geschrieben. </text> </abschnitt> <abschnitt> <ueberschrift> Jetzt neu! </ueberschrift> <text> Das Buch wird zum Wintersemester 2005 erscheinen! </text> </abschnitt></einfach>

Page 10: Universität Dortmund Proseminar: Auszeichnungssprachen

Universität Dortmund

Lehrstuhl für künstliche

Intelligenz

einfach.xsl<xsl:template match="einfach"><html><body>

<xsl:apply-templates select="titel"/><xsl:apply-templates select="autor"/><xsl:apply-templates select="abschnitt"/>

</body></html></xsl:template>

<xsl:template match="titel">

<div align="center"><h1><xsl:value-of select="."/></h1></div>

</xsl:template>

<xsl:template match="autor">

<div align="center"><h3><xsl:value-of select="."/></h3></div>

</xsl:template>

Page 11: Universität Dortmund Proseminar: Auszeichnungssprachen

Universität Dortmund

Lehrstuhl für künstliche

Intelligenz

einfach.xsl cont’ed

<xsl:template match="ueberschrift">

<h2><xsl:value-of select="."/></h2>

</xsl:template>

<xsl:template match="text">

<p><xsl:value-of select="."/></p>

</xsl:template>

</xsl:stylesheet>

Page 12: Universität Dortmund Proseminar: Auszeichnungssprachen

Universität Dortmund

Lehrstuhl für künstliche

Intelligenz

flyer.html<html> <body> <div align="center"><h1> Informatik kompakt </h1></div> <div align="center"> <h3> Katharina J. Morik </h3> </div> <div align="center"> <h3>Volker Klingspor </h3> </div> <p> Um eine Grundlage zu schaffen f&uuml;r die Vertiefung in mehrere

Teilgebiete der Informatik, haben wir ein Buch geschrieben. </p> <h2> Jetzt neu! </h2> <p> Das Buch wird zum Wintersemester 2005 erscheinen! </p> </body></html>

Page 13: Universität Dortmund Proseminar: Auszeichnungssprachen

Universität Dortmund

Lehrstuhl für künstliche

Intelligenz

flyer im Browser

Page 14: Universität Dortmund Proseminar: Auszeichnungssprachen

Universität Dortmund

Lehrstuhl für künstliche

Intelligenz

Auszeichnungssprachen

• ermöglichen maschinelle Verarbeitung und Austausch von Dokumenten anhand der logischen Struktur,

• trennen die logische Struktur von dem Aussehen. – Metadaten deklarieren das Format (Document Type

Definition DTD, XML Schema)– Vorgegebene feste Formate für bestimmte Anwendungen

(Dublin Core, Ontologien) – Stilangaben (Style Sheets, DSSL) bereiten für den Druck

oder die Internetpräsentation auf.

Page 15: Universität Dortmund Proseminar: Auszeichnungssprachen

Universität Dortmund

Lehrstuhl für künstliche

Intelligenz

Anwendungen

• Bibliotheken• Semantic Web• eCommerce (Produktkataloge)• Nachrichtenagenturen• Wissensmanagement• eLearning• Verteiltes, mobiles Informieren

Page 16: Universität Dortmund Proseminar: Auszeichnungssprachen

Universität Dortmund

Lehrstuhl für künstliche

Intelligenz

Werkzeuge

• Erstellung und Bearbeitung des Schemas– Browser– Editoren (z.B. XMLmind)– Navigation innerhalb des Schemas (XPath, XLink)

• Ausnutzung des Schemas für die Suche– Information Retrieval (Suchmaschinen)– Information Extraction

Page 17: Universität Dortmund Proseminar: Auszeichnungssprachen

Universität Dortmund

Lehrstuhl für künstliche

Intelligenz

Lernziele

• Bibliographieren:– Welche Literatur ist relevant für mein Thema?– Wie finde ich sie?– Welche Literatur ist gut? – Welche Gütekriterien gibt es und wie wendet man sie an?

• Thema strukturieren und in einen Zusammenhang einbetten:– Was ist die Fragestellung, das Ziel des Bereichs?– Welche Ansätze werden verfolgt?– Welche einzelnen Fragen ergeben sich?

Page 18: Universität Dortmund Proseminar: Auszeichnungssprachen

Universität Dortmund

Lehrstuhl für künstliche

Intelligenz

Vorgehen: learning by doing

1. Aufgaben von einer Woche zur nächsten!

2. Thema für Referat aussuchen

3. Zum Thema Literatur heraussuchen und gemäß Gütekriterien bewerten

4. Schema, stylesheet entwickeln, XPath anwenden.

5. Präsentation des Themas im Seminar

6. Referat schreiben über das Seminar (nicht nur über das eigene Thema!)

7. Das Referat selbst soll „ausgezeichnet“ sein

Page 19: Universität Dortmund Proseminar: Auszeichnungssprachen

Universität Dortmund

Lehrstuhl für künstliche

Intelligenz

Referat

• Definitionen angeben mit ihren Quellen.• Ansätze beschreiben und richtig zitieren.• Eigenes Thema in Bezug zu allen anderen

Referaten des Seminars setzen.• Eigene Stellungnahme zu den Ansätzen

abgeben.• Auszeichnung gemäß XML-Schema, Druck

gemäß style sheet.

Page 20: Universität Dortmund Proseminar: Auszeichnungssprachen

Universität Dortmund

Lehrstuhl für künstliche

Intelligenz

Zitieren

• Im Text wird ein Literaturhinweis bei jedem Gedanken angegeben, der nicht von einem selbst stammt.– \cite{Joachims/2002b}– (Joachims 2002)– [1]

• Am Ende wird das Literaturverzeichnis aufgelistet.– [1] Joachims, Thorsten (2002) Learning to Classify Text

Using Support Vector Machines – Methods, Theory, and Algorithms. Kluwer Academic Publishers

Page 21: Universität Dortmund Proseminar: Auszeichnungssprachen

Universität Dortmund

Lehrstuhl für künstliche

Intelligenz

Seminarschein

• Jede Sitzung erscheinen, mitschreiben und mitdenken.

• Referat abgeben: so viele Werktage nach Seminarende wie das Referat abgegeben wird, so viele Werktage nach Abgabe nehme ich mir Zeit für die Begutachtung.

• Alle Kriterien (s. Referat) eingehalten ergibt einen Schein.

Page 22: Universität Dortmund Proseminar: Auszeichnungssprachen

Universität Dortmund

Lehrstuhl für künstliche

Intelligenz

Aufgabe zum nächsten Mal

1. Editoren für XML – suchen,– angucken,– Kriterien zur Bewertung überlegen,– einen Editor aussuchen und ggf. herunterladen.

2. Einführungsbuch oder –artikel – suchen,– Kriterien zur Bewertung überlegen,– auswählen.

• In der nächsten Sitzung Ergebnisse präsentieren!

Page 23: Universität Dortmund Proseminar: Auszeichnungssprachen

Universität Dortmund

Lehrstuhl für künstliche

Intelligenz

“Projekt”

• Eigenes Schema, Stylesheet für Referat und Präsentation entwickeln.

• Verlinken der Referate für Portal zu Auszeichnungssprachen.

Page 24: Universität Dortmund Proseminar: Auszeichnungssprachen

Universität Dortmund

Lehrstuhl für künstliche

Intelligenz

Termine

• 17.4. Einführung in XML-Schema• 24.4. Fachschaftswahl• 8.5.Einführung in Style Sheets,

XpathEigene XML Schemata für das Referat -- Problemsammlung

• 15.5. DocBook: Tobias Heidelmann Antworten für das eigene Referatsschema?Eigene style sheets

• 22.5. Einführung in die Literatursuche in der Bibliothek

• 29.5. Ajax: Ahmed-Anis Kerkeni, Ayse G. Kilic Semantic Web: Fabian Schlenz, Felix Schäfer

• 5.6. Projektdiskussion

• 12.6. SOA: Torben MerhofeBusiness Process Execution Language: Christian Vollmer, Oliver Garbe

• 19.6. Web 2.0: Jiong ZouMobile Anwendungen: Fabian Wollnowski, Jens Beckmann, Torben Kohlmeier

• 26.6. Anwendungen für Nachrichten (RSS): Olivier Dounla, Jan Knipp

• 3.7. Projektdiskussion

• 10.7. Letzte Sitzung


Recommended