1 Resource-Bounded Reasoning about Knowledge On Epistemic Foundations of Intelligent Agents Ho Ngoc Duc

1

Resource-Bounded Reasoning about Knowledge

On Epistemic

Foundations of Intelligent Agents

Ho Ngoc Duc

2

Überblick

• Intelligente Agenten• Wissen und Handlung• Explizites Wissen• Algorithmisches Wissen• Ausblick

3

Intelligente Agenten

• „Agent“: nützliche Abstraktion für Konzeptualisierung verschiedener Bereiche

• Agenten als intentionale Systeme• Modellierung mit Hilfe mentalistischer Begriffe:

Belief, Desire, Intention, Obligation• Zusammenspiel zwischen Handlung und

Wissen/Ziel/Intention

• Am wichtigsten: epistemische Begriffe

4

Agententheorien

• In allen wichtigen Ansätzen in der (D)AI Forschung: Wissen als Grundbegriff

• In der Regel: Modalsysteme• Moore, Cohen & Levesque, Rao & Georgeff,

Shoham, Singh, Meyer et.al.: KD45, S4, S5• Andere Begriffe reduzierbar / gleiche Logik• Logische Allwissenheit (Logical omniscience

problem, LOP), Seiteneffekt-Problem

5

Probleme des Modalansatzes

• Modallogik nicht geeignet: nur implizites Wissen. Nur explizites Wissen kann Handlung begründen:

• Deduktive Wissensbasen• Optimale Tour (TSP)• Primzahl-Faktorisierung• Optimale (Gewinn-)Strategie in Schach• Ressourcenbeschränkte Agenten (resource-

bounded agents): Agenten verfügen grundsätzlich nur über begrenzte Ressourcen

6

Alternativen zu modalen Systemen

• Schwächere Kalküle als normale Modallogiken, schwächere Abgeschlossenheitsbedingungen (sonst keine Logik!)

• Semantisch: Montague-Sem., unmögliche Welten• Syntaktisch: unvollständige Deduktionssysteme• Wann ist ein Schluß plausible?• Kein Nutzen für Agententheorien: entweder

immer noch zu stark, also nicht explizites Wissen, oder zu schwach, dann irrationale Agenten

7

Was läuft schief?

• Lösung des LOP liefert nicht automatisch ein Modell für expilizites Wissen

• Ressourcenbeschränktheit: nicht Ungültigkeit bestimmter logischer Schlußregeln, sondern: die Häufigkeit ihrer Anwendung ist beschränkt

• Nichtwissen nicht wegen Unkenntnis der Logik, sondern wegen fehlender Ressourcen (wenn er genug Zeit hätte...)

8

Meine Ziele

• Framework für ressourcenbeschränktes Schliessen• Beziehung Wissen / Ressourcen• Primär: Solide epistemische Grundlage für

Theorien rationaler Agenten.• Nebenergebnis: intuitive Lösung des LOP:

Nichtwissen von logischen Konsequenzen wegen fehlender Ressourcen, trotzdem rational

9

Explizites Wissen

• Explizite Modellierung des Schliessens• Idee: alle Prämissen einer Schlußregel und

Anwendung der Regel, dann Konklusion

• Annahme: (R) p1... pn q

• Modalansatz: Kp1... Kpn Kq

• Realistisch: Kp1... Kpn <R>Kq

• Bsp. Modus ponens: Kp K(p q) <MP>Kq• Bsp. Axiom: <Ax>K(~(p ~p))

10

Dynamische epistemische Logik

• Gültige Regel – Atomare Aktion• Komplexe Aktionen der dynamischen Logik:

R1;R2, R1R2, R*

• Formeln: [R]Kp, <R>Kp (der Agent weiß p in allen/in einigen Zuständen nach der Ausführung der Aktion R)

• Höhere Abstraktion: Hilfsaktion F=(R1 ... Rn)+

(ein „Denkvorgang“) – „ Agent weiß nach einigen Denkschriten, daß p“: <F>Kp

11

Dynamisch-epistemische Axiome

• Kp K(p q) <F>Kq• <F>Kp, wobei p Tautologie• Nicht-Vergessen: Kp [F]Kp, p persistent• Ferner: K4 für <F> (S4: unechte Denkhandlung)• Intendierte Semantik: Baumstruktur. Übergang

zwischen 2 Informationszuständen (Knoten) durch Denkhandlung.

• <F>[F]p [F]<F>p interessant (Konfluenz)

12

Eigenschaften der D-E Systeme

• Konsistenz• Adäquate Respräsentation vom expliziten Wissen• Alle Formen des LOP gelöst. Unter keiner

logischen Schlußregel ist Wissen abgeschlossen.• Agenten trotzdem rational: wenn p q gültig,

dann auch Kp <F>Kq• Mit Konfluenz: Eingeschränkte Korrespondenz:

<F>Kp is D-E-Theorem gdw Kp ist M-E-Theorem

13

Explizites Wissen nicht genug

• Quantitative Constraints: keine WANN Angabe• Unterscheidung einfache / komplexe Folgerung• Zu restriktiv: Wissen, das innerhalb von 1 h

gewonnen werden kann, kann auch Handlungen begründen

• Stärkere Beziehungen zwischen epist. Aussagen: wenn q aus p folgt, kann aus Kp nur <F>Kq gewonnen werden (in irgendeiner Historie...). Wir brauchen: in der realen Historie, 1 h von nun

14

Quantifizierung von Ressourcen

• Naheliegend: Ktp Kt+1q, wenn q in einem Schritt aus p herleitbar

• Schwachpunkt: unendlich viele Konsequenzen in einem einzigen Schritt, sehr lange Iteration, q nicht zuverlässig herleitbar wenn nötig

• Andere Möglichkeit: nicht spezifizierte Quantität von Ressourcen angenommen. Wissen = positive Antwort, bevor alles verbraucht

• Zu vage, kein objektives Kriterium

15

Algorithmisches Wissen: Motivation

• Schachspieler hat noch keine Gewinnstrategie, kann sie innerhalb von 5 min berechnen, hat 10 min für nächsten Zug

• Internet-Einkauf: verschlüsselte Nummer, mit Privatschlüssel: 1 s, Abhörer mit öffentlichem Schlüssel: Millionen Jahre

• Was kann ich zuverlässig innerhalb 1h berechnen?• K50p: „Wenn mit Frage p? konfrontiert, liefert

zuverlässig Anwort innerhalb von 50 s“

16

Beispiel

• Abkürzung: Dnp := (p Knp)&(~p Kn~p)

• Atomare Aussagen: Pn, n natürliche Zahl

• Axiome: AL, {Pn|n Primzahl},{~Pn|n keine Primzahl}. Also: Theorie d. Primzahlen

• Komplexität: f(n)=n½*||n||2

• Interessante epistemische Aussagen: Df(n)Pn, Df(i)q, Kb

||n||Da||n||Pn, Ka

||n||Kb||n||Da

f(n)Pn

17

Sprache für Algorithmisches Wissen

• Zunächst die Ressource Zeit• Syntax: Basissprache, erweitert um Operatoren Kn

• Knp besagt: (1) p folgt aus der Gesamtheit dessen was Agent weiß; (2) Agent hat einen Algorithmus, um diese Beziehung herzustellen und kann diesen bei Anfrage p wählen; (3) Stop nach n Schritten

• Es gibt Algorithmen mit unbekannter Komplexität und Aufzählungsalgorithmen. Deshalb: K. Bedeutung: (3‘) Stop irgendwann

18

Axiome für Algorithmisches Wissen

• System K für K (gleiche Logik wie Modalsystem. Interpretation anders, andere Begründung)

• Einbettungsresultat• Knp Kp, Knp Kmp, wenn n<m

• Df(p)p, Kb||p||Da

f(p)p, (Kx||p||)*Da

f(p)p wenn p zu einer Teilsprache gehört, die entscheidbar ist mit Komplexität f

• Wenn untere Grenze bekannt: negatives Wissen ~Kg(p)p (erst recht wenn p kein implizites Wissen)

19

Logik des Algorithmischen Wissens

• Es gibt nicht „die“ Logik des algorithm. Wissens• Meta-Regel zur Modellierung des Wissens über

bestimmte Weltausschnitte• Wenn Algorithmen für Teilbereich anwendbar,

dann können epistemische Aussagen angenommen werden

• Neutral gegenüber Komplexitätsmaßen

20

Anwendungsbeispiel

• RSA Public-Key Kryptographie• Grundlage: Wissen über Primzahlen. Großer

Unterschied zwischen dem Wissen, daß p (k)eine Primzahl ist und der Kenntnis einer Faktorisierung

• Kpt(n)x,y(n=x*y & x>1 & y>1) x,yKfr(n)(n=x*y & x>1 & y>1)• ~x,yK100...00(n=x*y & x>1 & y>1) (100...00:

Ablauf d. Gültigkeit / Nützlichkeit d. Information)

21

Semantik

• Evaluierung von Wissensaussagen nur mit Hilfe algebraischer Eigentschaften der Modelle à la Mögliche-Welten kaum möglich.

• Computationale Semantik: Abbildung Formeln der Sprache auf Algorithmen, Knp wahr gdw ein Algorithmus für p existiert und n Schritte verlangt

• Scheint viel versprechender. Verlangt mehr Verständnis der Algorithmen

22

Ausblick

• Wissen & probabilistische Algorithmen: n ist „probably prime“ mit Wahrscheinlichkeit 1-2-20 wenn n den Rabin-Test 10 mal besteht. Nicht: Pn ist zu 99,99...% wahr, sondern epistemische Aussage (p ist entweder eine Primzahl oder nicht)

• Wie ändern sich Denkkapazitäten über Zeit? Kann aus Kt

np auf Kt+1np geschlossen werden?

• Anwendung in der Spieltheorie

23

Weitere Beispiele

• AL-Sprache mit Operator T und zus. Axiomen: {Tp|p Tautologie}, {~Tp|p keine Tautologie}

• Alle Queries Tp entscheidbar in Zeit 2||p||

• TSP: n Punkte aus einer Menge. 2 Prädikate (oder Operatoren) Opt und NearOpt. Epistem. Axiome: Kn!Opt(...), Kn*||n||NearOpt(...)

24

Ausblick 2

• Technische Untersuchung: kein Schwerpunkt. Zuerst: Begriffe einführen, Intuitionen erläutern, Anwendungsbeispiele (warum nicht vorhandene?)

• Vollständigkeit nur mit formaler Semantik• Komplexität: abhängig von Algorithmen zur

Berechnung des Wissens. Verhältnis offen.

25

Ressource-Boundedness

• Allgemein: Problemlösung mit begrenzten Mitteln• Speziell: Denkprobleme. Was kann man wissen?

Was folgt aus vorhandenem Wissen unter R-B?• Bisherige Ansätze: Regeln unzulässig; Beweise

der Länge <5; endliche Automaten. Alle: willkürliche Einschränkung der Rationalität

• Mein Ansatz: Ressourcenraum (Nk,). Jede Dimension ein Typ von relevanten Ressourcen (Zeit, Gedächnis, Bandbreite)

26

Prädikatenlogik

• Straightforward: ganz allgemein logische Folgebeziehung. Was sind die stärksten epist. Aussagen über log. Konsequenzen d. Wissens?

• Keine wesentl. Einsichten zum Wissensbegriff• Viel stärkere Ausdruckfähigkeit: Wissen-was• Kpt(n)x,y(n=x*y & x>1 & y>1) (...dass n prim) x,yKfr(n)(n=x*y & x>1 & y>1) (eine Faktorisierg)• pt(n)<<fr(n): Public-Key Kryptographie

Documents

1 Resource-Bounded Reasoning about Knowledge On Epistemic Foundations of Intelligent Agents Ho Ngoc Duc