Upload
kaethe-boleman
View
104
Download
0
Tags:
Embed Size (px)
Citation preview
1
Resource-Bounded Reasoning about Knowledge
On Epistemic
Foundations of Intelligent Agents
Ho Ngoc Duc
2
Überblick
• Intelligente Agenten• Wissen und Handlung• Explizites Wissen• Algorithmisches Wissen• Ausblick
3
Intelligente Agenten
• „Agent“: nützliche Abstraktion für Konzeptualisierung verschiedener Bereiche
• Agenten als intentionale Systeme• Modellierung mit Hilfe mentalistischer Begriffe:
Belief, Desire, Intention, Obligation• Zusammenspiel zwischen Handlung und
Wissen/Ziel/Intention
• Am wichtigsten: epistemische Begriffe
4
Agententheorien
• In allen wichtigen Ansätzen in der (D)AI Forschung: Wissen als Grundbegriff
• In der Regel: Modalsysteme• Moore, Cohen & Levesque, Rao & Georgeff,
Shoham, Singh, Meyer et.al.: KD45, S4, S5• Andere Begriffe reduzierbar / gleiche Logik• Logische Allwissenheit (Logical omniscience
problem, LOP), Seiteneffekt-Problem
5
Probleme des Modalansatzes
• Modallogik nicht geeignet: nur implizites Wissen. Nur explizites Wissen kann Handlung begründen:
• Deduktive Wissensbasen• Optimale Tour (TSP)• Primzahl-Faktorisierung• Optimale (Gewinn-)Strategie in Schach• Ressourcenbeschränkte Agenten (resource-
bounded agents): Agenten verfügen grundsätzlich nur über begrenzte Ressourcen
6
Alternativen zu modalen Systemen
• Schwächere Kalküle als normale Modallogiken, schwächere Abgeschlossenheitsbedingungen (sonst keine Logik!)
• Semantisch: Montague-Sem., unmögliche Welten• Syntaktisch: unvollständige Deduktionssysteme• Wann ist ein Schluß plausible?• Kein Nutzen für Agententheorien: entweder
immer noch zu stark, also nicht explizites Wissen, oder zu schwach, dann irrationale Agenten
7
Was läuft schief?
• Lösung des LOP liefert nicht automatisch ein Modell für expilizites Wissen
• Ressourcenbeschränktheit: nicht Ungültigkeit bestimmter logischer Schlußregeln, sondern: die Häufigkeit ihrer Anwendung ist beschränkt
• Nichtwissen nicht wegen Unkenntnis der Logik, sondern wegen fehlender Ressourcen (wenn er genug Zeit hätte...)
8
Meine Ziele
• Framework für ressourcenbeschränktes Schliessen• Beziehung Wissen / Ressourcen• Primär: Solide epistemische Grundlage für
Theorien rationaler Agenten.• Nebenergebnis: intuitive Lösung des LOP:
Nichtwissen von logischen Konsequenzen wegen fehlender Ressourcen, trotzdem rational
9
Explizites Wissen
• Explizite Modellierung des Schliessens• Idee: alle Prämissen einer Schlußregel und
Anwendung der Regel, dann Konklusion
• Annahme: (R) p1... pn q
• Modalansatz: Kp1... Kpn Kq
• Realistisch: Kp1... Kpn <R>Kq
• Bsp. Modus ponens: Kp K(p q) <MP>Kq• Bsp. Axiom: <Ax>K(~(p ~p))
10
Dynamische epistemische Logik
• Gültige Regel – Atomare Aktion• Komplexe Aktionen der dynamischen Logik:
R1;R2, R1R2, R*
• Formeln: [R]Kp, <R>Kp (der Agent weiß p in allen/in einigen Zuständen nach der Ausführung der Aktion R)
• Höhere Abstraktion: Hilfsaktion F=(R1 ... Rn)+
(ein „Denkvorgang“) – „ Agent weiß nach einigen Denkschriten, daß p“: <F>Kp
11
Dynamisch-epistemische Axiome
• Kp K(p q) <F>Kq• <F>Kp, wobei p Tautologie• Nicht-Vergessen: Kp [F]Kp, p persistent• Ferner: K4 für <F> (S4: unechte Denkhandlung)• Intendierte Semantik: Baumstruktur. Übergang
zwischen 2 Informationszuständen (Knoten) durch Denkhandlung.
• <F>[F]p [F]<F>p interessant (Konfluenz)
12
Eigenschaften der D-E Systeme
• Konsistenz• Adäquate Respräsentation vom expliziten Wissen• Alle Formen des LOP gelöst. Unter keiner
logischen Schlußregel ist Wissen abgeschlossen.• Agenten trotzdem rational: wenn p q gültig,
dann auch Kp <F>Kq• Mit Konfluenz: Eingeschränkte Korrespondenz:
<F>Kp is D-E-Theorem gdw Kp ist M-E-Theorem
13
Explizites Wissen nicht genug
• Quantitative Constraints: keine WANN Angabe• Unterscheidung einfache / komplexe Folgerung• Zu restriktiv: Wissen, das innerhalb von 1 h
gewonnen werden kann, kann auch Handlungen begründen
• Stärkere Beziehungen zwischen epist. Aussagen: wenn q aus p folgt, kann aus Kp nur <F>Kq gewonnen werden (in irgendeiner Historie...). Wir brauchen: in der realen Historie, 1 h von nun
14
Quantifizierung von Ressourcen
• Naheliegend: Ktp Kt+1q, wenn q in einem Schritt aus p herleitbar
• Schwachpunkt: unendlich viele Konsequenzen in einem einzigen Schritt, sehr lange Iteration, q nicht zuverlässig herleitbar wenn nötig
• Andere Möglichkeit: nicht spezifizierte Quantität von Ressourcen angenommen. Wissen = positive Antwort, bevor alles verbraucht
• Zu vage, kein objektives Kriterium
15
Algorithmisches Wissen: Motivation
• Schachspieler hat noch keine Gewinnstrategie, kann sie innerhalb von 5 min berechnen, hat 10 min für nächsten Zug
• Internet-Einkauf: verschlüsselte Nummer, mit Privatschlüssel: 1 s, Abhörer mit öffentlichem Schlüssel: Millionen Jahre
• Was kann ich zuverlässig innerhalb 1h berechnen?• K50p: „Wenn mit Frage p? konfrontiert, liefert
zuverlässig Anwort innerhalb von 50 s“
16
Beispiel
• Abkürzung: Dnp := (p Knp)&(~p Kn~p)
• Atomare Aussagen: Pn, n natürliche Zahl
• Axiome: AL, {Pn|n Primzahl},{~Pn|n keine Primzahl}. Also: Theorie d. Primzahlen
• Komplexität: f(n)=n½*||n||2
• Interessante epistemische Aussagen: Df(n)Pn, Df(i)q, Kb
||n||Da||n||Pn, Ka
||n||Kb||n||Da
f(n)Pn
17
Sprache für Algorithmisches Wissen
• Zunächst die Ressource Zeit• Syntax: Basissprache, erweitert um Operatoren Kn
• Knp besagt: (1) p folgt aus der Gesamtheit dessen was Agent weiß; (2) Agent hat einen Algorithmus, um diese Beziehung herzustellen und kann diesen bei Anfrage p wählen; (3) Stop nach n Schritten
• Es gibt Algorithmen mit unbekannter Komplexität und Aufzählungsalgorithmen. Deshalb: K. Bedeutung: (3‘) Stop irgendwann
18
Axiome für Algorithmisches Wissen
• System K für K (gleiche Logik wie Modalsystem. Interpretation anders, andere Begründung)
• Einbettungsresultat• Knp Kp, Knp Kmp, wenn n<m
• Df(p)p, Kb||p||Da
f(p)p, (Kx||p||)*Da
f(p)p wenn p zu einer Teilsprache gehört, die entscheidbar ist mit Komplexität f
• Wenn untere Grenze bekannt: negatives Wissen ~Kg(p)p (erst recht wenn p kein implizites Wissen)
19
Logik des Algorithmischen Wissens
• Es gibt nicht „die“ Logik des algorithm. Wissens• Meta-Regel zur Modellierung des Wissens über
bestimmte Weltausschnitte• Wenn Algorithmen für Teilbereich anwendbar,
dann können epistemische Aussagen angenommen werden
• Neutral gegenüber Komplexitätsmaßen
20
Anwendungsbeispiel
• RSA Public-Key Kryptographie• Grundlage: Wissen über Primzahlen. Großer
Unterschied zwischen dem Wissen, daß p (k)eine Primzahl ist und der Kenntnis einer Faktorisierung
• Kpt(n)x,y(n=x*y & x>1 & y>1) x,yKfr(n)(n=x*y & x>1 & y>1)• ~x,yK100...00(n=x*y & x>1 & y>1) (100...00:
Ablauf d. Gültigkeit / Nützlichkeit d. Information)
21
Semantik
• Evaluierung von Wissensaussagen nur mit Hilfe algebraischer Eigentschaften der Modelle à la Mögliche-Welten kaum möglich.
• Computationale Semantik: Abbildung Formeln der Sprache auf Algorithmen, Knp wahr gdw ein Algorithmus für p existiert und n Schritte verlangt
• Scheint viel versprechender. Verlangt mehr Verständnis der Algorithmen
22
Ausblick
• Wissen & probabilistische Algorithmen: n ist „probably prime“ mit Wahrscheinlichkeit 1-2-20 wenn n den Rabin-Test 10 mal besteht. Nicht: Pn ist zu 99,99...% wahr, sondern epistemische Aussage (p ist entweder eine Primzahl oder nicht)
• Wie ändern sich Denkkapazitäten über Zeit? Kann aus Kt
np auf Kt+1np geschlossen werden?
• Anwendung in der Spieltheorie
23
Weitere Beispiele
• AL-Sprache mit Operator T und zus. Axiomen: {Tp|p Tautologie}, {~Tp|p keine Tautologie}
• Alle Queries Tp entscheidbar in Zeit 2||p||
• TSP: n Punkte aus einer Menge. 2 Prädikate (oder Operatoren) Opt und NearOpt. Epistem. Axiome: Kn!Opt(...), Kn*||n||NearOpt(...)
24
Ausblick 2
• Technische Untersuchung: kein Schwerpunkt. Zuerst: Begriffe einführen, Intuitionen erläutern, Anwendungsbeispiele (warum nicht vorhandene?)
• Vollständigkeit nur mit formaler Semantik• Komplexität: abhängig von Algorithmen zur
Berechnung des Wissens. Verhältnis offen.
25
Ressource-Boundedness
• Allgemein: Problemlösung mit begrenzten Mitteln• Speziell: Denkprobleme. Was kann man wissen?
Was folgt aus vorhandenem Wissen unter R-B?• Bisherige Ansätze: Regeln unzulässig; Beweise
der Länge <5; endliche Automaten. Alle: willkürliche Einschränkung der Rationalität
• Mein Ansatz: Ressourcenraum (Nk,). Jede Dimension ein Typ von relevanten Ressourcen (Zeit, Gedächnis, Bandbreite)
26
Prädikatenlogik
• Straightforward: ganz allgemein logische Folgebeziehung. Was sind die stärksten epist. Aussagen über log. Konsequenzen d. Wissens?
• Keine wesentl. Einsichten zum Wissensbegriff• Viel stärkere Ausdruckfähigkeit: Wissen-was• Kpt(n)x,y(n=x*y & x>1 & y>1) (...dass n prim) x,yKfr(n)(n=x*y & x>1 & y>1) (eine Faktorisierg)• pt(n)<<fr(n): Public-Key Kryptographie