18
Aspekte der Wissensrepräsentation für die Computerlinguistik Überblick Kai-Uwe Carstensen Uni Zürich, 4.4.2002

Aspekte der Wissensrepräsentation für die Computerlinguistik

  • Upload
    stu

  • View
    26

  • Download
    1

Embed Size (px)

DESCRIPTION

Aspekte der Wissensrepräsentation für die Computerlinguistik. Überblick Kai-Uwe Carstensen Uni Zürich, 4.4.2002. Inhalt. Wofür braucht die CL Wissensrepräsentation? Was ist Wissen, Repräsentation, Wissensrepräsentation? Aspekte Semantischer Netzwerke Ziele, Referate, Infos. - PowerPoint PPT Presentation

Citation preview

Page 1: Aspekte der Wissensrepräsentation für die Computerlinguistik

Aspekte der Wissensrepräsentation für die

Computerlinguistik

Überblick

Kai-Uwe Carstensen

Uni Zürich, 4.4.2002

Page 2: Aspekte der Wissensrepräsentation für die Computerlinguistik

Inhalt

Wofür braucht die CL Wissensrepräsentation?

Was ist Wissen, Repräsentation, Wissensrepräsentation?

Aspekte Semantischer Netzwerke

Ziele, Referate, Infos

Page 3: Aspekte der Wissensrepräsentation für die Computerlinguistik

Wofür braucht die CL Wissensrepräsentation?

Pragmatische Antwort:• Fürs adäquate Verstehen, Generieren, Übersetzen sprachlicher

Ausdrücke

Kognitionswissenschaftliche Antwort:• Weil die sprachlichen Komponenten unseres kognitiven Systems

grundsätzlich in einer systematischen Beziehung zu nicht-sprachlichen Komponenten stehen (insbesondere dem konzeptuellen System der Repräsentation der Welt)

Page 4: Aspekte der Wissensrepräsentation für die Computerlinguistik

Wissen, klassisch

X weiss p gdw.:– X glaubt p– X hat gute Gründe, p zu glauben– P ist wahr

viel zu speziell!

Page 5: Aspekte der Wissensrepräsentation für die Computerlinguistik

Wissen à la Newell

Alan Newell: – Annahme eines „knowledge level“

• „Wissen“ ist Medium

• „Prinzip der Rationalität“ ist Verhaltensgesetz:– Wenn ein Agent Wissen darüber hat, dass eine seiner Aktionen

zu einem seiner Ziele führt, wird er es auswählen

– Wissen:– Was immer einem Agenten zugeschrieben werden kann, so daß

sein Verhalten anhand des Rationalitätsprinzips berechnet werden kann

Page 6: Aspekte der Wissensrepräsentation für die Computerlinguistik

Wissen ist also

abstrakt!!!

wird realisiert (->repräsentiert) durch– Strukturen und

– Prozesse,

– unabhängig, ob symbolisch oder subsymbolisch

Page 7: Aspekte der Wissensrepräsentation für die Computerlinguistik

Repräsentation

= Wissen + Zugriff (als Slogan)

= Strukturen + (Inferenz-)Prozesse

Soviel zur Wissensrepräsentation

Page 8: Aspekte der Wissensrepräsentation für die Computerlinguistik

Um welche Typen von Wissen geht es (uns)?

Lexikalisches Wissen• Antonymie, Hypernymie etc. (->WordNet)

Terminologisches Wissen?• Was ist X? (-> KL-One, Classic)

Enzyklopädisches Wissen (-> Cyc) Konzeptuelles Wissen (vulgo Weltwissen)

• ->Interlingua (-> z.B. Conceptual Dependency, MÜ)

Semantisches Wissen• Sprachspezifischer Bezug auf konzeptuelles Wissen (-> Helbig)

Page 9: Aspekte der Wissensrepräsentation für die Computerlinguistik

Die Frage

Wie sehen die Strukturen und Prozesse aus, durch die Wissen repräsentiert wird?

Page 10: Aspekte der Wissensrepräsentation für die Computerlinguistik

Die Idee

Knoten als Repräsentanten für Konzepte Kanten als Repräsentanten für die Beziehungen zwischen

Konzepten Dies ergibt Semantische Netzwerke

– Z.T. hierarchisch organisiert• -> Vererbung von Eigenschaften

– Kodieren angeblich die Distanz zwischen Konzepten• -> Aktivationsausbreitung

– S. Quillian

Page 11: Aspekte der Wissensrepräsentation für die Computerlinguistik

Das Problem

Beantwortung der folgenden Fragen unklar:– Welche Typen von Knoten und Kanten gibt es?

– Was sind die Struktur- und Verarbeitungsprinzipien?

Frühe Ansätze waren sehr heterogen und unklar bzgl. der Semantik der jeweils postulierten Netzwerke– Netzwerke waren nur RepräsentationsSPRACHEN, keine

LOGIKEN• Kritik von Woods, Brachman u.a.

• McDermott: „No notation without denotation!“

Page 12: Aspekte der Wissensrepräsentation für die Computerlinguistik

Abhilfe durch

Einführung der epistemologischen Ebene– Befasst sich ausschliesslich mit diesen Fragen

– -> Brachman: KL-One, Classic

Entwicklung spezieller Logiken zur Beschreibung von Konzepten– Beschreibungslogiken bzw. Terminologische Logiken

• Basieren auf Konzepten und Rollen (aka Kanten)

• Konzepte werden als Mengen von Objekten interpretiert

• Rollen werden als binäre Relationen über Objekten interpretiert

Page 13: Aspekte der Wissensrepräsentation für die Computerlinguistik

Wissenstypen

Definitorisches (terminologisches)Wissen (T-Box)– DREI-BEINIGER-ELEFANT

Typisches Wissen– Typischerweise hat ein Elefant vier Beine

Assertorisches (situationsspezifisches) Wissen (A-Box)– Clyde ist ein DREI-BEINIGER-ELEFANT

Page 14: Aspekte der Wissensrepräsentation für die Computerlinguistik

Ontologien

Sind Strukturierungen des Wissens über alle existierenden Entitäten

Praktisch relevant insbesondere durch den Aspekt der Wiederverwendbarkeit von Wissensbasen

Upper-level-ontology: Oberste Ebene der Klassifizierung mithilfe von Sorten

Page 15: Aspekte der Wissensrepräsentation für die Computerlinguistik

Ziele des Seminars

Einblick in und Überblick über den Bereich Wissensrepräsentation– Fokus auf strukturelle Aspekte

Kenntnis von– inhaltlichen und strukturellen Anforderungen an

Wissensrepräsentationsformalismen,

– vor allem aus Sicht der Sprachverarbeitung

– als Grundlage für aktuelle Entwicklungen (Ontologien, Topic Maps, Semantic Web)

Page 16: Aspekte der Wissensrepräsentation für die Computerlinguistik

Referate

Die Referate des Helbig-Buchs• Hermann Helbig: Die semantische Struktur natürlicher Sprache. Springer, Heidelberg 2001

• dienen dem in-depth understanding (eines aktuellen Ansatzes) der sprachbezogenen Wissensrepräsentation

– http://pi7.fernuni-hagen.de/helbig/multinet.html

– http://pi7.fernuni-hagen.de/veroeffentlichungen/inhaltsverz.pdf

• ~3/4-stündige interaktive Besprechungen der jeweiligen Kapitel

Die Ko-Referate• dienen dem Einblick in ausgewählte Themen

• ~halbstündige Präsentationen der Kernaussagen des jeweiligen Ansatzes

Page 17: Aspekte der Wissensrepräsentation für die Computerlinguistik

Ko-Referate

Quillian (einer) der Urva(e)ter der semantischen Netzwerke

Frühe Netze: Fehler, Gefahren, Kritik Was man auf jeden Fall wissen sollte

Schank: Conceptual Dependency Konzeptuelle Strukturen: die Interlingua-Idee

Psychologische Aspekte der Wissensrepräsentation Wissenswertes zu kognitiven Strukturen

Brachman: CLASSIC, ein KL-ONE-ähnliches Frame-basiertes Repräsentationssystem Moderner Klassiker

CYC + Kritik Das Mega-Projekt und seine (Nicht-)Relevanz für die CL

Bateman: Generalized Upper Model Sprachgenerierung mithilfe sprachrelevanter Ontologien

SENSUS Wissensrepräsentation und MÜ

Mikrokosmos dasselbe, etwas detaillierter

Guarino: „Ontologie-Kritik" Was sagt ein Ontologie-Forscher zu den Vorschlägen aus KI+CL?

Semantic Web Wissensrepräsentation für das WWW

Page 18: Aspekte der Wissensrepräsentation für die Computerlinguistik

Infos

Literatur: s. Helbig-Buch WWW-Adressen:

– Z.B. über John Sowa:– http://mondeca-publishing.com/s/anonymous/title10506.html

– http://users.bestweb.net/~sowa/direct/index.htm

– Über Nicola Guarinos Gruppe:– http://www.ladseb.pd.cnr.it/infor/Ontology/ontology.html

– U.a. ein Review von Sowa´s neuem Buch:• http://www.ladseb.pd.cnr.it/infor/Ontology/Papers/SowaReview.pdf