Logische Grundlagen der Informatik · Logische Grundlagen der Informatik Skript zur Vorlesung Theoretische Informatik I c Prof. Peter H. Starke Lehrstuhl fur Automaten- und Systemtheorie¨

Logische Grundlagen der Informatik

Skript zur Vorlesung Theoretische Informatik I

c© Prof. Peter H. StarkeLehrstuhl fur Automaten- und Systemtheorie

Oktober 2000

Dies ist die gedruckte Version des Wintersemesters 2000/2001. Fast alle bekanntenFehler sind beseitigt. Eine Fehlerliste befindet sich im World Wide Web (WWW)unter

http://www.informatik.hu-berlin.de/lehrstuehle/automaten/logik/errata.html

Zur weiteren Korrektur bitte Hinweise auf bestehende Fehler, moglichst mit genau-er Lokalisierung (Seite, Zeile und Absatz, . . . ) und Verbesserungsvorschlag an dieUbungsleiter.

Vorwort

Warum und zu welchem Ende studieren wir Theoretische Informatik?

Informatik–Studenten in den ersten Semestern empfinden haufig die Vorlesungen zurTheoretischen Informatik als lastige Zumutung. Sie verstehen die Informatik als ei-ne Wissenschaft des Handelns und Gestaltens und sehen die Theorie als ein Gebirgevon Abstraktionen. Sie vergessen dabei, daß mit sinnvollem Handeln und effizien-tem Gestalten untrennbar das Planen und Entwerfen verbunden sind. Planen undEntwerfen geschieht aber auf der Basis von Modellen, man macht sich ein Modellund spielt seinen Plan daran durch. Geht es um ein großeres Projekt, so muß diesesModell mitteilbar sein, damit Zusammenarbeit moglich ist. Mitteilbar sein bedeutetaber, daß ein allen Mitarbeitern gemeinsames Netz von Abstraktionen, d. h. ein ge-meinsames Begriffssystem, vorhanden ist und ausschließlich genutzt werden muß. Umdie angestrebten Ziele des Projektes zu erreichen, muß dieses Begriffssystem praziseFormulierungen ermoglichen. Das einzige Begriffssystem, das diese Forderung erfullt,ist die abstrakte Begriffswelt der Mathematik. Wie die Physik nutzt die Informatikdas mathematische Begriffssystem zur Formulierung ihrer Modelle und der Semantikdieser Modelle.

Deshalb fuhrt diese Vorlesung zunachst in die Mengenlehre als Grundlage der Ma-thematik ein. Hier geht es auch darum, intuitiv vorhandene Begriffe (wie z. B. demder Relation) scharf zu prazisieren, d. h. eine Sprachregelung zu treffen, genau zudefinieren.

Der Informatiker unterscheidet sich vom Programmierer nicht nur darin, daß er ge-fundene Losungen bewerten und gegebenfalls verbessern kann. Zur Bewertung gehortneben dem Beweis, daß das geplante System die gestellte Aufgabe auch wirklich lost,auch der Vergleich der theoretisch erreichbaren mit der praktisch realisierten Effizi-enz. Wir studieren also in dieser Vorlesung, wie Modelle gebildet werden (wie dieserAbstraktionsprozeß verlauft) und welche Fragen bei der Modellbildung beantwortetwerden mussen, welche Hilfe uns die Theorie bei der Anwendung dieser Modelle gebenkann. Das geschieht an (im wesentlichen) drei Beispielen.

In der Aussagenlogik geht es um die Wahrheit bzw. Falschheit von Aussagen undAussagenverbindungen. Unser Modell, der Aussagenkalkul, stellt unsere Vorstellungenauf eine berechenbare Grundlage: Wir konnen mit Aussagen rechnen, ihre Wahrheitbeweisen. Als Hauptaufgabe der Logik betrachten wir dabei, semantische (d.h. inhalt-liche) Beziehungen und Begriffe syntaktisch zu charakterisieren.

In der Berechnungstheorie geht es darum, was Computer eigentlich konnen, alsoauch darum, was sie nicht konnen. Wir geben in dieser Vorlesung einen Abschnittder Berechnungstheorie wieder, der uns beweist, daß es fur Computer unlosbare (ab-strakte) Probleme gibt. Zu diesen Problemen gehort das Entscheidungsproblem derPradikatenlogik, d. h. die Frage nach einem Verfahren, mit dessen Hilfe von jederAussage uber die Elemente einer gewissen Menge festgestellt werden kann, ob diese

Aussage richtig ist. Wenn auch ein solches Verfahren (ein Algorithmus) nicht existiert,so kann doch ein Verfahren gefunden werden, das die Richtigkeit richtiger Aussagenbestatigt (fur falsche Aussagen aber keine Information liefert).

Spatestens an dieser Stelle bemerkt der Leser, wie ungenaue Formulierungen Ver-wirrung erzeugen, wie notwendig also ein scharf definiertes Begriffssystem ist. Auchdazu dient uns die Logik (gibt es z. B. einen Unterschied zwischen Wahrheit undBeweisbarkeit?).

Inhaltsverzeichnis

1 Mengen 1

1.1 Mengenbegriff und Elementbeziehung . . . . . . . . . . . . . . . . . . 1

1.1.1 Arten von Definitionen . . . . . . . . . . . . . . . . . . . . . . . 1

1.1.2 Die Cantorschen ”Definitionen“ . . . . . . . . . . . . . . . . . . 2

1.1.3 Die Russellsche Antinomie . . . . . . . . . . . . . . . . . . . . . 3

1.1.4 Axiomatische Mengenlehre . . . . . . . . . . . . . . . . . . . . 3

1.1.5 Spezielle Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.2 Mengenalgebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.2.1 Mengenbeziehungen . . . . . . . . . . . . . . . . . . . . . . . . 7

1.2.2 Durchschnitt, Vereinigung und Komplement . . . . . . . . . . . 10

1.2.3 Differenzen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

1.2.4 Allgem. Durchschnitt/Vereinigung und Potenzmengenbildung . 17

1.3 Korrespondenzen, Relationen, Abbildungen . . . . . . . . . . . . . . . 18

1.3.1 Geordnetes Paar und Cartesisches Produkt . . . . . . . . . . . 19

1.3.2 Korrespondenzen . . . . . . . . . . . . . . . . . . . . . . . . . . 20

1.3.3 Relationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

1.3.4 Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

1.4 Aquivalenzrelationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

1.4.1 Aquivalenzrelationen und Zerlegungen . . . . . . . . . . . . . . 26

1.4.2 Feinheit von Aquivalenzrelationen . . . . . . . . . . . . . . . . 28

1.4.3 Kongruenzrelationen . . . . . . . . . . . . . . . . . . . . . . . . 29

1.5 Naturliche Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

1.5.1 Gleichmachtigkeit . . . . . . . . . . . . . . . . . . . . . . . . . 31

1.5.2 Der Endlichkeitsbegriff . . . . . . . . . . . . . . . . . . . . . . . 31

1.5.3 Die Menge der naturlichen Zahlen . . . . . . . . . . . . . . . . 34

1.6 Worter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

1.6.1 Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

1.6.2 Induktive Beweise in freien Worthalbgruppen . . . . . . . . . . 42

1.6.3 Induktionsbeweise in Algebren . . . . . . . . . . . . . . . . . . 43

1.6.4 Induktive Definitionen . . . . . . . . . . . . . . . . . . . . . . . 44

vi INHALTSVERZEICHNIS

1.7 Sprachen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

1.7.1 Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

1.7.2 Beispiel: Sprache der Mengengleichungen . . . . . . . . . . . . 47

1.7.3 Weitere Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . 48

2 Aussagenlogik 49

2.1 Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

2.2 Syntax und Semantik des Aussagenkalkuls . . . . . . . . . . . . . . . . 51

2.2.1 Aufbau des Kalkuls — Syntax . . . . . . . . . . . . . . . . . . 51

2.2.2 Semantik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

2.2.3 Weitere semantische Begriffe . . . . . . . . . . . . . . . . . . . 54

2.3 Anwendung in der Schaltalgebra . . . . . . . . . . . . . . . . . . . . . 56

2.3.1 Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

2.3.2 Optimierte Schaltungen . . . . . . . . . . . . . . . . . . . . . . 58

2.4 Folgern . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

2.4.1 Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

2.4.2 Beweis des Endlichkeitssatzes fur das Folgern . . . . . . . . . . 64

2.4.3 Ableitbarkeits- und Deduktionstheorem . . . . . . . . . . . . . 66

2.4.4 Der Kalkulbegriff . . . . . . . . . . . . . . . . . . . . . . . . . . 67

2.5 Aussagenlogisches Schließen . . . . . . . . . . . . . . . . . . . . . . . . 68

2.5.1 Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

2.5.2 Nutzliche aussagenlogische Schlußweisen . . . . . . . . . . . . . 69

2.5.3 Das Haubersche Theorem . . . . . . . . . . . . . . . . . . . . . 71

2.6 Ableitbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

2.6.1 Ableiten mit Abtrennungs- und Einsetzungsregel . . . . . . . . 71

2.6.2 Syntaktische Charakterisierung von ag . . . . . . . . . . . . . . 77

2.6.3 Cut–Ableitbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . 80

2.6.4 Syntaktisches Entscheidungsverfahren fur ag . . . . . . . . . . 87

2.7 Widerspruchsfreiheit, Vollstandigkeit, . . . . . . . . . . . . . . . . . . . 87

2.7.1 Widerspruchsfreiheit . . . . . . . . . . . . . . . . . . . . . . . . 87

2.7.2 Vollstandigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

2.7.3 Nichtableitbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . 91

2.8 Dualitatstheoreme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

3 Berechnungstheorie 97

3.1 Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

3.2 Axiomatische Charakterisierung . . . . . . . . . . . . . . . . . . . . . . 99

3.2.1 Anfangsfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . 99

3.2.2 Substitution und primitive Rekursion . . . . . . . . . . . . . . 100

3.2.3 Beispiele fur primitiv–rekursive Funktionen . . . . . . . . . . . 101

INHALTSVERZEICHNIS vii

3.2.4 Die Peterfunktion . . . . . . . . . . . . . . . . . . . . . . . . . 103

3.2.5 Minimum-Operator und partiell-rekursive Funktionen . . . . . 104

3.3 Der Maschinen–Ansatz . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

3.3.1 Die Turing–Maschine . . . . . . . . . . . . . . . . . . . . . . . . 106

3.3.2 Bausteine fur Turing–Maschinen . . . . . . . . . . . . . . . . . 107

3.4 Aquivalenz der Berechenbarkeitsbegriffe . . . . . . . . . . . . . . . . . 110

3.4.1 Partiell–rekursive Funktionen sind Turing–berechenbar . . . . . 110

3.4.2 Turing–berechenbare Funktionen sind partiell–rekursiv . . . . . 113

3.5 Folgerungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120

4 Pradikatenlogik 123

4.1 Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

4.2 Syntax und Semantik des Pradikatenkalkuls . . . . . . . . . . . . . . . 126

4.2.1 Die Sprache des Pradikatenkalkuls der ersten Stufe . . . . . . . 126

4.2.2 Einige syntaktische Eigenschaften . . . . . . . . . . . . . . . . . 127

4.2.3 Semantik elementarer Sprachen . . . . . . . . . . . . . . . . . . 129

4.2.4 Weitere semantische Begriffe . . . . . . . . . . . . . . . . . . . 131

4.3 Die Unentscheidbarkeit des Pradikatenkalkuls . . . . . . . . . . . . . . 133

4.4 Losbare Falle des Entscheidungsproblems . . . . . . . . . . . . . . . . 137

4.4.1 Klassenkalkul . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137

4.4.2 Aussagenlogische Erfullbarkeit und Gultigkeit . . . . . . . . . . 140

4.5 Folgern und Ableiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141

4.5.1 Folgern . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141

4.5.2 Ableiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142

4.6 Pradikatenlogisches Schließen . . . . . . . . . . . . . . . . . . . . . . . 145

4.7 Widerlegen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146

4.7.1 Klauselbildung . . . . . . . . . . . . . . . . . . . . . . . . . . . 147

4.7.2 Herbrand–Modell . . . . . . . . . . . . . . . . . . . . . . . . . . 149

4.8 Unifikation und Resolution . . . . . . . . . . . . . . . . . . . . . . . . 151

4.8.1 Substitution und Unifikation . . . . . . . . . . . . . . . . . . . 152

4.8.2 Berechnung eines allgemeinsten Unifikators . . . . . . . . . . . 152

4.8.3 Resolution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154

4.9 Logische Programmierung . . . . . . . . . . . . . . . . . . . . . . . . . 156

4.9.1 Prolog . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156

4.9.2 Ein abstrakter Interpreter . . . . . . . . . . . . . . . . . . . . . 159

4.9.3 Die Auswertungsstrategie von Prolog . . . . . . . . . . . . . . . 160

Literaturverzeichnis 161

Symbolverzeichnis 162

Kapitel 1

Mengen

Die Mengenlehre gilt als Fundament der Mathematik, weil sich alle mathematischenBegriffe, wie z. B. der Zahlenbegriff, der Funktionsbegriff und der Relationsbegriff,auf mengentheoretische Begriffe zuruckfuhren lassen. Dabei bedeutet ”zuruckfuhren“dasselbe wie definieren. In die Denk- und Vorgehensweise der theoretischen Informatikeinzudringen ist daher unmoglich, ohne sich mit der Begriffswelt der Mathematik undinsbesondere ihres Fundaments, der Mengenlehre, vertraut zu machen. Insofern gehortdie Mengenlehre zu den logischen Grundlagen der Informatik.

1.1 Mengenbegriff und Elementbeziehung

In diesem Abschnitt verfolgen wir das Ziel, den Mengenbegriff zu definieren. Dazumussen wir uns zunachst Rechenschaft daruber ablegen, was wir unter einer Definitionverstehen wollen.

1.1.1 Arten von Definitionen

1. explizite DefinitionenDas zu definierende Objekt kommt im definierenden Ausdruck nicht vor.

(a) Definition durch AufzahlungBeispiel

• Die Menge der Ziffern besteht aus den Elementen 0, 1, . . . , 9

(b) Definition durch Angabe einer charakteristischen EigenschaftBeispiele

• Die Menge aller Quadratzahlen ist die Menge aller x mit:x ist ganze Zahl und es gibt eine ganze Zahl y mit: y · y = x

• Die Menge aller Primzahlen ist die Menge aller n mit:n besitzt genau zwei Teiler (1 und n)

Nachteile:

• Aufzahlung ist unmoglich bei unendlichen Mengen

• charakteristische Eigenschaft setzt andere Begriffe voraus

2. implizite DefinitionenDas zu definierende Objekt kommt im definierenden Ausdruck vor.

2 KAPITEL 1. MENGEN

(a) rekursive (induktive) DefinitionBeispiele• Die Fakultatsfunktion n! ist induktiv definiert

– 0! = 1– (n+ 1)! = (n+ 1)n!

• Die Folge (ai)i=0,1,... von naturlichen Zahlen wird definiert durch– a0 = 0– ai+1 = ai + 2i+ 1 = ai + i+ i+ 1

⇒ eine induktive Definition beschreibt den Aufbau aus (elementaren) Ob-jekten mittels (elementarer) Operationen.

(b) Axiomatische CharakterisierungAngabe eines Systems von Aussagen, welche die zu charakterisierendenGrundbegriffe in Beziehung setzen.Beispiele• Hilberts Axiomatisierung der Geometrie• Definition der naturlichen Zahlen nach Peano

Definitionen sind nicht wahr oder falsch (hochstens unzweckmaßig), bedurfen abereiner Rechtfertigung hinsichtlich der Frage, ob wenigstens ein Objekt der definiertenArt uberhaupt existiert.

Bei expliziten Definitionen ist dies i. a. klar: wenn die Elemente 0, 1, . . . , 9 existieren,so existiert die Menge der Ziffern. Ganz offen ist dieses Problem bei der axiomatischenCharakterisierung; hierbei geht es doch um die Frage, ob es ein Modell des Axiomen-systems gibt, d. h. Objekte, bei denen alle Aussagen dieses Systems wahr sind. (Dannnennt man dieses System widerspruchsfrei.)

1.1.2 Die Cantorschen”Definitionen“:

Der naive Mengenbegriff

Der Mengenbegriff gilt als der Grundbegriff der Mathematik in dem Sinne, daß sichalle ubrigen mathematischen Begriffe auf der Basis der Begriffe der Menge und derElementbeziehung exakt begrunden lassen. Dementsprechend ist eine explizite Defini-tion des Begriffs ”Menge“ nicht moglich, denn eine explizite Definition eines Begriffesbedeutet immer, daß dieser Begriff auf andere (grundlegendere) Begriffe zuruckgefuhrtwird.

Die Mengenbildung hat zwei Aspekte:

• operativ-praktischer Aspekt:Apfel in den Korb legen, Perlen auffadeln ⇒ Zusammenfassen

• Abstraktionsaspekt:Schaffung eines neuen Objektes, Absehen von der Individualitat der Elemente,gemeinsame Eigenschaft.

Georg Cantor begrundete gegen Ende des vorigen Jahrhunderts die Theorie be-liebiger Mengen von Dingen, die Mengenlehre, mit der folgenden intuitiven (naiven)Umschreibung:

Erklarung 1 (G. Cantor)Eine Menge M ist eine Zusammenfassung von bestimmten wohlunterschiede-nen Objekten unserer Anschauung oder unseres Denkens, welche Elemente derMenge M genannt werden, zu einem Ganzen.

1.1. MENGENBEGRIFF UND ELEMENTBEZIEHUNG 3

Wenn wir den Abstraktionsaspekt starker betonen wollen, konnen wir diese Erklarungwie folgt prazisieren:

Erklarung 2Zu jeder Eigenschaft H der wohlunterschiedenen Objekte unserer Anschauungund unseres Denkens existiert eine Menge M derart, daß fur jedes Objekt x gilt:

x ist Element von M︸︷︷︸x∈M

genau dann, wennx die Eigenschaft H hat︸︷︷︸H(x)

Als abkurzende Schreibweisen benutzen wir kunftig:

• x ∈M fur ”x ist ein Element von M“

• x /∈M fur ”x ist kein Element von M“

• H (x) fur ”x hat die Eigenschaft H“

• x|H(x) fur ”die Menge aller x mit H(x)“

Die geschweiften Klammern werden zur Bezeichnung von Mengen reserviert.

1.1.3 Die Russellsche Antinomie

Wenn wir die Erklarung 1 (oder 2) zur Grundlage eines Aufbaus der Mengenlehre(bzw. der Mathematik) verwenden wollen, mussen wir uns nach der Widerspruchs-freiheit dieser Erklarung (dieses Axioms) fragen. Russell, ein englischer Philosophund Mathematiker, zeigte uns um die Jahrhundertwende mit folgender Uberlegung,daß es damit schlecht bestellt ist.

Wir betrachten die Eigenschaft H∗, die durch die Formel x /∈ x bestimmt ist, d. h. einObjekt x unserer Anschauung oder unseres Denkens hat die Eigenschaft H∗ genaudann, wenn es nicht Element von x ist. Nach der Erklarung 2 existiert dann die MengeM∗ ≡ x|x /∈ x.Nun ist M∗ selbst ein Objekt unseres Denkens, wir konnen also fragen, ob M∗ ∈M∗ist. Es ist M∗ ∈M∗ genau dann, wenn M∗ die Eigenschaft H∗ hat, also genau dann,wenn M∗ /∈M∗ ist. Das ist ein (logischer) Widerspruch, die sogenannte RussellscheAntinomie.

1.1.4 Axiomatische Mengenlehre

Wir haben gesehen, daß die Erklarungen 1 und 2 zum Aufbau der Mengenlehre nichtbrauchbar sind, andererseits kommen die Erklarungen unseren anschaulichen Vorstel-lungen von der Mengenbildung entgegen. Was haben wir also bei der Prazisierungbzw. Formulierung unserer Vorstellungen vergessen? Es ist anschaulich klar, daß eineMenge gegenuber den Elementen eine neue Qualitat darstellt, etwas durch Abstrak-tion gewonnenes, das nicht ohne weiteres mit seinen Elementen auf die gleiche Stufegestellt werden darf.

Eine Losung, die Mengenbildung soweit einzuschranken, daß keine Mengen mehr ge-bildet werden konnen, die zu Antinomien fuhren (die Russellsche Antinomie ist nurein Beispiel), besteht darin, Mengen verschiedener Stufen (0., 1., . . .) zu betrachtenund die Mengenbildung nur von Stufe zu Stufe zuzulassen.

Eine andere Losungsmoglichkeit bietet das sogenannte Klassenkalkul, auf dessenEinfuhrung wir hier verzichten wollen. Der interessierte Leser findet bei [2]1 eine

1Dies ist ein Verweis auf das Literaturverzeichnis am Ende des Skriptes

4 KAPITEL 1. MENGEN

Darstellung dieses Ansatzes.

Im folgenden werden wir den axiomatischen Ansatz des Stufenkalkuls vorstellen:Wir legen dazu einen Objektbereich E von Elementen, auch Mengen nullter Stufegenannt, zugrunde. Durch Zusammenfassung von Elementen bilden wir die Mengenerster Stufe, solche Mengen bilden die Elemente von Mengen zweiter Stufe und sofort.

Wir bezeichnen im folgenden:

• Elemente von E (Mengen nullter Stufe) durch kleine lateinische Buchstabena, b, c, . . .

• Mengen von Elementen von E (Mengen erster Stufe) durch große lateinischeBuchstaben A,B, . . . ,M, . . .

• Mengen zweiter Stufe (Mengensysteme) durch große deutsche BuchstabenM,N, . . .

• allgemein: Mengen n-ter Stufe (n = 0, 1, . . .) durch große lateinische Buchstabenmit dem oberen Index n : M (n), N (n), . . .

MengenbildungsaxiomeZu jeder Eigenschaft H von Mengen n-ter Stufe (n = 0, 1, 2, . . .) gibt es eine MengeM (n+1) n+ 1-ter Stufe derart, daß fur alle Mengen N (n) n-ter Stufe gilt:

N (n) ∈M (n+1)genau dann, wenn H(N (n)

).

Aus diesem Mengenbildungsprinzip kann die Russelsche Antinomie nicht hergeleitetwerden, weil da die Eigenschaft H∗, d. h. x /∈ x, keine zur Mengenbildung zugelasseneEigenschaft ist.

Zum Aufbau der Mengenlehre reichen die Mengenbildungsaxiome allein nicht aus,wie wir sofort sehen, wenn wir uns mit der Frage beschaftigen, wann Mengen gleichsind, wobei wir voraussetzen, daß uns das fur Elemente von E bekannt ist, handelt essich doch gemaß unserer Anschauung dabei um ”wohlunterschiedene“ Objekte. Zweiunterschiedliche Definitionen der Gleichheit bieten sich an:

Definition 1.1.1 (Umfangsgleichheit, extensionale Gleichheit)Mengen M (n+1) N (n+1) (n+ 1)-ter Stufe heißen umfangsgleich (notiert als Gleichungdurch M (n+1) =u N

(n+1)), wenn sie dieselben Elemente haben.

Definition 1.1.2 (Eigenschaftsgleichheit)Mengen M (n+1), N (n+1) (n+ 1)-ter Stufe heißen eigenschaftsgleich (M (n+1) =e

N (n+1)), wenn sie dieselben mengentheoretischen Eigenschaften haben, d.h. fur je-de Eigenschaft H von Mengen (n+ 1)-ter Stufe gilt

H(M (n+1)

)genau dann, wenn H

(N (n+1)

)Mit der Definition der Umfangsgleichheit prasentieren wir unsere Vorstellung, daß eineMenge durch ihre Elemente bereits eindeutig bestimmt ist, wahrend die Eigenschafts-gleichheit besagt, daß Gleichheit die Gemeinsamkeit in allen Eigenschaften impliziert.Naheliegend ist es daher, nach der Beziehung zwischen diesen beiden Begriffen zufragen.

1.1. MENGENBEGRIFF UND ELEMENTBEZIEHUNG 5

Satz 1.1.3Wenn Mengen (n+ 1)-ter Stufe eigenschaftsgleich sind, dann sind sie auch umfangs-gleich,d.h. wenn M (n+1) =e N

(n+1), so M (n+1) =u N(n+1) (n = 0, 1, . . .).

BeweisWir haben zu zeigen, daß (unter der Voraussetzung M (n+1) =e N (n+1)) fur alleMengen X(n) n-ter Stufe gilt

X(n) ∈M (n+1)genau dann ,wenn X(n) ∈ N (n+1),

denn dann und nur dann haben M (n+1) und N (n+1) dieselben Elemente.

Es sei nun X(n) eine beliebige Menge n-ter Stufe. Wir betrachten die EigenschaftHX(n)

von Mengen (n+ 1)-ter Stufe, mit:

HX(n)(Y (n+1)

)genau dann, wenn X(n) ∈ Y (n+1).

Weil M (n+1) =e N(n+1) ist, gilt

X(n) ∈M (n+1) gdw. HX(n)(M(n+1)) (nach Def. von HX(n))

gdw. HX(n)(N(n+1)) (wegen M (n+1) =e N(n+1))

gdw. X(n) ∈ N (n+1) (nach Def. von HX(n)),

also gilt, was zu zeigen war, und der Satz 1.1.3 ist bewiesen. 22

Die Umkehrung des Satzes 1.1.3, d. h. die Aussage:

Wenn M (n+1) =u N(n+1), so M (n+1) =e N

(n+1)

kann dagegen aus den Mengenbildungsaxiomen nicht abgeleitet werden. Wir forderndaher die

ExtensionalitatsaxiomeWenn Mengen (n+ 1)-ter Stufe umfangsgleich (extensional gleich) sind, so sind sieeigenschaftsgleich.

Nach dieser Forderung sind Umfangsgleichheit und Eigenschaftsgleichheit identisch,wir sprechen daher nur noch von Gleichheit schlechthin und schreiben M = N , wennMengen M , N gleich sind.

Um genugend ”Material“ fur die Mengenbildung zu haben, fordern wir ferner das

UnendlichkeitsaxiomEs gibt eine unendliche Menge erster Stufe.

Anschaulich bedeutet das, daß unser Objektbereich E unendlich viele Elemente hat,was aber ”unendlich“ im Sinne der Mengenlehre bedeutet, kann an dieser Stelle nochnicht prazisiert werden. Ein weiteres Axiomenschema, das aus den bereits angege-benen Axiomen nicht bewiesen werden kann (von diesen unabhangig ist), bilden diesogenannten

2Mit diesem Symbol bezeichnen wir das Ende eines Beweises

6 KAPITEL 1. MENGEN

AuswahlaxiomeZu jeder nichtleeren Menge M (n+2) (n+ 2)-ter Stufe (zu jedem Mengensystem)mit paarweise disjunkten nichtleeren Mengen N (n+1) als Elementen gibt es eineAuswahlmenge A(n+1), die mit jedem N (n+1) aus M (n+2) genau ein Element X(n)

gemeinsam hat.

Dabei heißt eine Menge nichtleer, wenn sie (wenigstens) ein Element besitzt undMengen (gleicher Stufe) heißen disjunkt, wenn sie kein Element gemeinsam haben.

Mit den bisher angegebenen Axiomen kommt man nun tatsachlich beim Aufbau derMengenlehre aus. Dabei muß an dieser Stelle die Rolle der Auswahlaxiome unklarbleiben; ihre Bedeutung kann erst eine ihrer Anwendungen beim Beweis tiefliegenderSatze der Mengenlehre klar machen.

Bevor wir uns mit dem Rechnen mit Mengen (der sogenannten Mengenalgebra)beschaftigen, wollen wir noch einige wichtige Mengen definieren und benennen.

1.1.5 Spezielle Mengen

Leere Menge und Allmenge

Betrachten wir die durch x 6= x gegebene Eigenschaft H 6= von Mengen 0-ter Stufe(Elementen). Nach dem Mengenbildungsaxiom gibt es eine Menge M0 mit

x ∈M0 gdw. x 6= x

fur alle Elemente x aus dem Objektbereich E. Weil jedes Element x zu sich selbstgleich ist, enthalt M0 kein Element. Ist andererseits M ′ eine Menge erster Stufe, diekein Element enthalt, so enthalt M ′ offenbar dieselben Elemente wie M0 (namlichkeine), nach dem Extensionalitatsaxiom gilt also M ′ = M0.

Dieselbe Uberlegung fur hohere Stufen n = 1, 2, . . . beweist den

Satz 1.1.4Zu jeder Stufe n + 1 gibt es genau eine Menge M0 (n+ 1)-ter Stufe derart, daß furalle Mengen N n-ter Stufe gilt N /∈M0.

Nachdem wir gezeigt haben, daß es eine, aber auch nur eine solche Menge gibt, durfenwir von der Menge M0 (n+ 1)-ter Stufe sprechen.

Definition 1.1.5 (Leere Menge)Die nach Satz 1.1.4 bestimmte Menge M (n+1)

0 =N (n)|N (n) 6= N (n)

heißt die leere

Menge (n+ 1)-ter Stufe und wird durch ∅(n+1) notiert. Fur ∅(1) schreiben wir auch ∅.

In analoger Weise zeigt man mittels der Eigenschaft x = x, daß es zu jeder Stufe(n+ 1) (n = 0, 1, . . .) genau eine Allmenge E(n+1) (n+ 1)-ter Stufe gibt, die genaudie Mengen n-ter Stufe als Elemente hat. Dabei ist E(1) gerade der Objektbereich E,d. h. E(1) = E. Die Allmenge E(2) zweiter Stufe bezeichnen wir mit E.

Einer- und Zweiermengen

Zu jedem Element a ∈ E existiert nach dem Mengenbildungsaxiom die Menge M furdie gilt:

1.2. MENGENALGEBRA 7

• a ∈M

• Fur jedes b gilt: Wenn b ∈M , so b = a.

Wir schreiben M als a und bezeichnen sie als Einermenge.

Fur Elemente a, b ist dementsprechend a, b die Menge M , fur die gilt:

• a ∈M , b ∈M

• Fur jedes c gilt: Wenn c ∈M , so c = a oder c = b.

Ist dabei a 6= b, so wird a, b als Zweiermenge bezeichnet.

1.2 Mengenalgebra

In diesem Abschnitt beschaftigen wir uns mit den wichtigsten Beziehungen und Ope-rationen zwischen Mengen. Da es sich dabei (bis auf die Potenzmengenbildung) umBeziehungen und Operationen fur Mengen gleicher Stufe handelt, lassen wir die Stu-fenindizes weg bzw. definieren die Beziehungen und Operationen fur Mengen ersterStufe.

1.2.1 Mengenbeziehungen

Definition 1.2.1 (Inklusion, Teilmengenbeziehung)Die Menge M heißt Teilmenge der Menge N oder in N enthalten (notiert durchM ⊆ N), wenn fur alle Elemente x gilt:

wenn x ∈M , so x ∈ N

Die grundlegenden Eigenschaften der Inklusion vermittelt der

Satz 1.2.2Fur beliebige Mengen M,N,L gilt:

1. M ⊆M (Reflexivitat)(d. h. die Inklusion ist eine reflexive Relation)

2. Wenn M ⊆ N und N ⊆ L, so M ⊆ L (Transitivitat)(d. h. die Inklusion ist eine transitive Relation)

3. Wenn M ⊆ N und N ⊆M , so M = N (Antisymmetrie)(d. h. die Inklusion ist eine antisymmetrische Relation).

BeweisDieser Satz wird durch Ruckgang auf die Definition der Inklusion bewiesen, d. h.man geht zuruck auf die Stufe der Elemente und nimmt logische Umformungen derAussagen auf dieser Stufe vor. Als Beispiel fuhren wir den Beweis der zweiten Aussagevor.

Aus der Voraussetzung M ⊆ N und N ⊆ L ist M ⊆ L zu beweisen. Wenn wir verein-baren, daß x ein beliebiges Element ist, so ergibt sich nach Einsetzen der Definitionder Inklusion, daß folgendes zu beweisen ist:

8 KAPITEL 1. MENGEN

Wenn: wenn x ∈M , so x ∈ N (a)und: wenn x ∈ N , so x ∈ L (b)so: wenn x ∈M , so x ∈ L (c)

Es sei nun x ∈M . Dann haben wir

x ∈Mund (wenn x ∈M , so x ∈ N),

folglich haben wir x ∈ N , zusammen mit (b) folgt x ∈ L; wir haben

wenn x ∈M , so x ∈ L,

d. h. (c).

Die zweite Aussage des Satzes 1.2.2 ist damit bewiesen. 2

Ubung 1Man beweise die restlichen Aussagen von Satz 1.2.2 sowie

Satz 1.2.3Fur alle Mengen M gilt ∅ ⊆M .

Wir fuhren jetzt einen Abstraktionsschritt durch:

Reflexive HalbordnungBei der Betrachtung des Systems E aller Mengen (erster Stufe) und der Relationder Inklusion (als Beziehung zwischen den Elementen von E) abstrahieren wir vonder Natur dieser Elemente (daß es sich um Mengen handelt). Die Struktur des be-trachteten Objekts [E,⊆] stellt sich damit dar, als eine Menge M von irgendwelchenElementen, zwischen denen eine Relation v gegeben ist, die folgende Eigenschaftenhat:

1. v ist reflexiv uber Mfur alle a ∈M gilt a v a

2. v ist transitivfur alle a, b, c ∈M gilt: Wenn a v b und b v c, so a v c

3. v ist antisymmetrischfur alle a, b ∈M gilt: Wenn a v b und b v a, so a = b

Eine solche Struktur [M,v] wird reflexive Halbordnung genannt. Die Ordnung istnicht total, weil es Elemente a, b ∈ M geben kann, fur die weder a v b noch b v agilt.

BeispielDie Teilbarkeitsbeziehung in der Menge der naturlichen Zahlen

n | m gdw. es ein k ∈ N mit n · k = m gibtist eine reflexive Halbordnung, aber keine Ordnung, d. h. nicht fur alle n,m ∈ N gilt:Entweder n | m oder m | n.

Folgerung 1.2.4[E,⊆] ist eine reflexive Halbordnung.


Definition 1.2.5 (echte Inklusion, echte Teilmenge)Die Menge M wird echte Teilmenge von N oder in N echt enthalten (notiert durchM ⊂ N) genannt, wenn M ⊆ N und M 6= N ist.

Man zeigt nun

Satz 1.2.6Fur beliebige Mengen M,N,L gilt

1. M 6⊂M (Irreflexivitat)

2. Wenn M ⊂ N und N ⊂ L, so M ⊂ L (Transitivitat)

3. Wenn M ⊂ N , so N 6⊂M (Asymmetrie)

Man sieht hier, daß die Asymmetrie der echten Inklusion aus der Irreflexivitat undder Transitivitat folgt:Ware die Asymmetrie fur M,N verletzt, d.h.

M ⊂ N und N ⊂M

so ergabe sich aus der Transitivitat (fur L = M)

M ⊂M

also ein Widerspruch zur Irreflexivitat.

Wir machen nun den gleichen Abstraktionsschritt wie oben und erhalten

Irreflexive HalbordnungEine Struktur [M,<], bei der die Relation < irreflexiv (fur alle a ∈ M gilt nichta < a) und transitiv ist, wird irreflexive Halbordnung genannt. Eine solche Relationist immer asymmetrisch.

Folgerung 1.2.7[E,⊂] ist eine irreflexive Halbordnung.

BemerkungWir sehen an der Definition der echten Inklusion, daß in jeder reflexiven Halbordnung[M,v] eine irreflexive Halbordnung < durch die Definition

a < b gdw. a v b und a 6= b

eingefuhrt werden kann. Umgekehrt kann in jeder irreflexiven Halbordnung [M,<]eine reflexive Halbordnung v durch

a v b gdw. a < b oder a = b

definiert werden.

Fur die Teilmengenbeziehungen ergibt sich daher

Satz 1.2.8Fur beliebige Mengen M,N,L gilt

1. Wenn M ⊂ N , so M ⊆ N

10 KAPITEL 1. MENGEN

2. M ⊆ N genau dann, wenn M = N oder M ⊂ N

3. Wenn M ⊆ N und N ⊂ L, so M ⊂ L

4. Wenn M ⊆ N , so N 6⊂M .

Ubung 2Man formuliere die Beweise der Satze 1.2.6 und 1.2.8 und eine Definition der echtenInklusion, in der die Relationen ⊆, 6= (fur Mengen) nicht verwendet werden, d. h. inder nur die Elementbeziehung vorkommt.

1.2.2 Durchschnitt, Vereinigung und Komplement

Definition 1.2.9 (Durchschnitt, Vereinigung und Komplement)Es seien M,N beliebige Mengen. Dann ist

1. der Durchschnitt M ∩N von M und N die Menge

M ∩N =Def x|x ∈M und x ∈ N

2. die Vereinigung M ∪N von M und N die Menge

M ∪N =Def x|x ∈M oder x ∈ N

3. das Komplement M von M die Menge

M =Def x|x /∈M .

In der Definition der Vereinigung (=Def bedeutet, daß die Mengen nach Definitiongleich sind) ist das ”oder“ im nicht ausschließenden Sinn zu verstehen (d. h. nicht als

”entweder-oder“); zur Vereinigung von M und N gehoren also auch die Elemente x,die in beiden Mengen Element sind. Zur Veranschaulichung der Wirkungsweise derOperatoren ∪, ∩ und beschaut man sich oft Zeichnungen der folgenden Art:

Veranschaulichung

Wenn M die Menge der Punkte innerhalb des linken und N entsprechend die Mengeder Punkte innerhalb des rechten Kreises ist, so gibt die schraffierte Flache geradeden Durchschnitt M ∩N wieder.

Die entsprechenden Bilder der Vereinigung und des Komplements sehen so aus:


Wir formulieren nun eine Reihe von Satzen uber das Rechnen mit den in 1.2.9 defi-nierten sogenannten Booleschen Operationen, deren Beweis wir abermals dem Leseruberlassen.


1. M ∩N = N ∩M , M ∪N = N ∪M (Kommutativitat)

2. (M ∩N) ∩ L = M ∩ (N ∩ L), (M ∪N) ∪ L = M ∪ (N ∪ L) (Assoziativitat)

3. M ∩ (M ∪N) = M , M ∪ (M ∩N) = M (Absorptionsgesetze)

BemerkungEine Menge V , in der zweistellige Operationen u und t definiert sind, die beidekommutativ und assoziativ sind und die Absorptionsgesetze erfullen, wird Verbandgenannt, d. h. wir definieren

VerbandV = [V,u,t] heißt Verband, wenn V eine Menge ist und:

1. u, t zweistellige Operationen uber V sind; u und t ordnen alsojedem a, b ∈ V je (genau) ein Element a u b, a t b ∈ V zu;

2. u, t sind kommutativ

3. u, t sind assoziativ

4. u, t erfullen die Absorptionsgesetze, d. h. fur alle a, b,∈ V gilt

a u (a t b) = a und a t (a u b) = a.

Bezeichnen wir mit E das System aller Mengen erster Stufe, so gilt also

Folgerung 1.2.11[E,∩,∪] ist ein Verband.

Der Verbandsbegriff ist ein wichtiger algebraischer Grundbegriff. Sein wesentlicherInhalt besteht in einer Verallgemeinerung der Struktur des Rechnens mit Mengen aufandere Bereiche. Wir werden z. B. sehen, daß auch die Menge der Aquivalenzrelationen(uber einer gegebenen Menge) einen Verband bildet, so daß man gewisse Rechnungenmit Aquivalenzrelationen so durchfuhren kann (d. h. nach den gleichen Rechenregelndurchfuhren kann) als hatte man Mengen vor sich.

Satz 1.2.12Fur Mengen M,N gilt offenbar

M ∩N = M gdw. M ⊆ N (1) undM ∪N = N gdw. M ⊆ N (2)

Was passiert, wenn wir einen Verband [V,u,t] hernehmen und (1) oder (2) als Defi-nition fur eine Relation in V nehmen:

a v b gdw. a u b = a

Dann gilt


Satz 1.2.13[V,v] ist eine reflexive Halbordung.

Beweis

1. v ist reflexiv: Fur alle a ∈ V gilt a v a, d. h. a u a = a.

Das sieht man wie folgt:Nach Absorptionsgesetz ist a = a t (a u b) (fur beliebiges b ∈ V )also

a u a = a u (a t (a u b))= a u (a t c) (fur c = a u b )= a (wegen Absorption)

2. v ist transitiv: Wenn a v b und b v c, so a v c.Unsere Voraussetzungen sind also: a u b = a und b u c = bund zu zeigen ist: a u c = a

Es ist b u c = b, also a u (b u c) = a u b = aund daher a u c = (a u b) u c = a u (b u c) = a

3. v ist antisymmetrisch: Wenn a v b und b v a, so a = b.

namlich: a u b = a und b u a = b

also wegen Kommutativitat: a = a u b = b u a = b

2

In der Halbordnung [V,v] gilt uberdies stets

a v a t b (d. h. a u (a t b) = a) unda u b v a (d. h. a u b u a = a u b)

wie sich aus den Absorptionsgesetzen ergibt.

Folglich besitzen je zwei Elemente a, b bezuglich v eine obere Schranke, namlich atb,und eine untere Schranke, namlich a u b und es gilt:

Wenn x v a und x v b, so x v a u b undWenn a v x und b v x, so a t b v x

d. h. a u b ist die bezuglich v großte untere Schranke von a,b und a t b ist bezuglichv die kleinste obere Schranke von a,b.

Ist umgekehrt [V,v] eine reflexive Halbordnung derart, daß zu beliebigen Elementena,b stets die bezuglich v großte untere und die kleinste obere Schranke existieren, soist V mit den Operationen

a u b = die großte untere Schranke von a, ba t b = die kleinste obere Schranke von a, b

ein Verband.

Ubung 3Man weise nach, daß [N+, ggT, kgV ] ein Verband ist.


Satz 1.2.14 (Fortsetzung von Satz 1.2.10)

1.(M ∩N) ∪ L = (M ∪ L) ∩ (N ∪ L)(M ∪N) ∩ L = (M ∩ L) ∪ (N ∩ L) (Rechtsdistributivitat)

2. ∅ ∩M = ∅ , ∅ ∪M = M ( ∅ ist Nullelement)

3. E ∩M = M , E ∪M = E (E ist Einselement)

4. M ∩M = ∅ , M ∪M = E

BemerkungAus der Kommutativitat und der Rechtsdistributivitat folgt unmittelbar die Links-distributivitat, d. h. es gilt

L ∪ (M ∩N) = (M ∪ L) ∩ (N ∪ L)L ∩ (M ∪N) = (M ∩ L) ∪ (N ∩ L)

Wir sprechen daher kunftig nur von der Distributivitat.

Ein Verband V = [V,u,t], bei dem die Operationen u und t die distributiven Ge-setze erfullen, wird distributiver Verband genannt; [E,∩,∪] ist also ein distributiverVerband.

Die Bezeichnung ”Nullelement“ bzw. ”Einselement“ werden klar, wenn man eine Ana-logie zwischen dem Durchschnitt von Mengen und der Addition von Zahlen herstellt.Diese Analogie geht aber nicht so weit, daß etwa die Menge der naturlichen ZahlenN mit Multiplikation und Addition einen Verband bildet, offenbar sind die Absorpti-onsgesetze nicht erfullt (jedoch ist [N,min,max] ein Verband).

Ein Verband [V,u,t], in dem es Elemente 0, 1 ∈ V gibt, so daß (1.2.14.2) und(1.2.14.3) erfullt sind, wird Verband mit Null und Eins genannt.

In jedem Verband gibt es hochstens ein Nullelement und hochstens ein Einselement,so daß bei einem Verband mit Null und Eins von dem Nullelement und dem Einsele-ment gesprochen werden kann. Man beweist die Einzigkeit des Nullelements wie folgt(analog fuhrt man den Beweis fur das Einselement):

Es seien 0, 0′ ∈ V mit (5) 0 u a = 0 und (5′) 0′ u a = 0′ fur alle a ∈ V . Dann gilt:

0 = 0 u 0′ (wegen (5) und a = 0′ ∈ V )= 0′ u 0 (wegen der Kommutativitat von u)= 0′ (wegen (5′) und a = 0 ∈ V )

also ist 0 = 0′, was zu zeigen war.

Ubung 4Gibt es fur [N+, ggT, kgV ] ein Null- und Einselement?Ist es ein distributiver Verband?

Ein Verband V = [V,u,t, 0, 1], in dem eine dritte einstellige Operation definiert ist,die jedem a ∈ V ein solches Element a ∈ V zuordnet, daß stets a u a = 0, a t a = 1heißt komplementarer Verband. Ein distributiver komplementarer Verband (mit Nullund Eins) wird Boolesche Algebra genannt.

Folgerung 1.2.15[E,∩,∪, , ∅, E] ist eine Boolesche Algebra.


Wir konnen bereits an dieser Stelle eine Folgerung aus unseren verbandstheoretischenUberlegungen ziehen. Aus dem Beweis der Einzigkeit des Nullelements ergibt sichnamlich:

Folgerung 1.2.16Ist M0 eine Menge derart, daß fur alle Mengen N gilt M0 ∩N = ∅, dann ist M0 = ∅.

Ubung 5Wie lautet das Analogon dieser Aussage fur die Allmenge E ?

Dualitatstheorem

Sieht man sich die Form der bisher aufgefuhrten Rechenregeln an, so fallt auf, daßman aus jeder Gleichung durch Vertauschen von ∩ und ∪ wieder gultige Gleichungenerhalt. In der Tat gilt das

DualitatstheoremEs seiG eine gultige Gleichung, in der nur Variablen fur Mengen, Klammern und dieZeichen ∩, ∪ vorkommen und G′ entsteht aus G, indem an allen Stellen gleichzeitigdas Zeichen ∩ durch das Zeichen ∪ und das Zeichen ∪ durch das Zeichen ∩ ersetztwird. Dann ist G′ eine gultige Geichung.

Der Beweis fur das Dualitatstheorem fuhren wir im Kapitel Aussagenlogik ab Seite93 mit den dort entwickelten Hilfsmitteln.

Weitere Satze


1. M ∩M = M , M ∪M = M

2. M ∩N ⊆M , M ⊆M ∪N

3. M ⊆ N und M ⊆ K gdw. M ⊆ N ∩K, M ⊆ K und N ⊆ K gdw. M ∪N ⊆ K

4. Wenn M ⊆ N , so M ∩ L ⊆ N ∩ L und M ∪ L ⊆ N ∪ L (Monotonie)

5.Wenn M ⊇ K, so M ∩ (N ∪K) = (M ∩N) ∪KWenn M ⊆ K, so M ∪ (N ∩K) = (M ∪N) ∩K (Modularitat)

6. M = M

7.M ∩N = M ∪NM ∪N = M ∩N (De Morgansche Formeln)

8. M ⊆ N gdw. M ∩N = ∅ M ⊆ N gdw. M ∪N = E

Die Aussagen dieses Satzes gelten in beliebigen Booleschen Algebren, sofern dortdurch Verwendung des Satzes 1.2.12 als Definition eine ”Inklusion“ zwischen denVerbandselementen definiert ist. Einige dieser Beweise geben wir im folgenden an.


Beweis der ersten AussageAus (1.2.10.3) folgt

M ∩M = M ∩ [M ∪ (M ∩N)] (wegenM = M ∪ (M ∩N) , (1.2.10.3))= M ∩ [M ∪K] (furK = M ∩N )= M (wegen (1.2.10.3))

2

Beweis der zweiten AussageWegen Satz 1.2.12 giltM ∩N ⊆M gdw. (M ∩N) ∪M = M

gdw M ∪ (M ∩N) = M (wegen (1.2.10.1))

und M = M ∪ (M ∩N) ist nach (1.2.10.3) wahr. 2

Beweis der dritten AussageWir zeigen zuerst:

wenn M ⊆ N und M ⊆ K, so M ⊆ N ∩K.

Aus M ⊆ N , M ⊆ K ergibt sich mit Satz 1.2.12

M ∩N = M und M ∩K = M ,

woraus nach Aussage eins folgt

M = M ∩M = (M ∩N) ∩ (M ∩K)= (M ∩M) ∩ (N ∩K) (wegen (1.2.10.2) und (1.2.10.1))= M ∩ (N ∩K) (wegen Aussage zwei)

also gilt nach Satz 1.2.12 auch M ⊆ N ∩K.

Ist umgekehrt M ⊆ N ∩K, d. h. M = M ∩ (N ∩K), so gilt nach Aussage zwei und(1.2.10.2)

M = (M ∩N) ∩K ⊆M ∩N

Andererseits ist nach Aussage zwei M ∩N ⊆M , folglich gilt bei L = M ∩N

L ⊆M und M ⊆ L.

Aus Satz 1.2.12 ergibt sich nun mit (1.2.10.1) L = L ∩ M = M ∩ L = M d. h.M = M ∩N , folglich M ⊆ N . Analog zeigt man M ⊆ K. 2

Ubung 6Man fuhre die Beweise fur die vierte und funfte Aussage.

Beweis der sechsten AussageWegen (1.2.14.4) gilt

M ∩M = ∅

folglich ist M = M ∪ ∅ = M ∪(M ∩M

)nach (1.2.14.2).

Mit (1.2.14.1) erhalten wir

M =(M ∪M

)∩(M ∪M

)d. h. uber (1.2.14.3)

M = E ∩(M ∪M

)= M ∪M


Auf die gleiche Weise leitet man aus M ∪M = E her, daß

M = M ∩M

ist, worausM = M ∪

(M ∩M

)= M ∪M = M ,

d. h. Aussage sechs folgt. 2

Ubung 7Man beweise die siebte und achte Aussage.

1.2.3 Differenzen

Definition 1.2.18 (Differenz und symmetrische Differenz)Die Differenz M \N der Mengen M,N ist die Menge

M \N =Def x|x ∈M und x /∈ N

Die symmetrische Differenz M 4N der Mengen M,N ist die Menge

M 4N =Def x| entweder x ∈M oder x ∈ N

Veranschaulichung

Folgende Bilder geben die Differenz M \ N (links) und die symmetrischen DifferenzM 4N (rechts) wieder:

Einige Regeln fur das Rechnen mit Differenz bzw. symmetrischer Differenz geben diebeiden folgenden Satze wider:

Satz 1.2.19Fur beliebige Mengen M,N gilt

1. M \N = M ∩N

2. E \M = M

3. M \ ∅ = M

4. M ⊆ N gdw. M \N = ∅

5. Wenn M ∩N = ∅, so M \N = M und N \M = N .

Satz 1.2.20Fur beliebige Mengen M,N gilt:


1. M 4N =(M ∩N

)∪(M ∩N

)2. M 4N = (M ∪N) ∩ (M ∩N) = (M ∪N) \ (M ∩N)

3. M 4N = N 4M (Kommutativitat)

4. (M 4N)4K = M 4 (N 4K) (Assoziativitat)

5. M 4 ∅ = M (∅ ist Nullelement)

6. M 4N = ∅ gdw. M = N

7. M ∩ (N 4K) = (M ∩N)4 (M ∩K)

Ubung 8Man beweise die Aussagen der vorstehenden Satze.

Halbgruppe, Gruppe, Abelsche GruppeIst in einer Menge G eine zweistellige assoziative Operation 2 definiert, so nenntman [G,2] eine Halbgruppe. Ist die Operation zudem kommutativ, wird die Halb-gruppe ebenso bezeichnet. Eine kommutative Halbgruppe [G,2, 0] mit Nullelementwird Abelsche oder kommutative Gruppe genannt, wenn zu jedem g ∈ G (genau)ein inverses Element g′ ∈ G mit g2g′ = 0 existiert.

Folgerung 1.2.21Die Aussage 4 des Satzes 1.2.20 besagt also, daß [E,4] eine Halbgruppe ist, wegenAussage 3 handelt es sich sogar um eine kommutative Halbgruppe. In dieser Halbgrup-pe ist ∅ das Nullelement. Wegen 6 ist also [E,4, ∅] eine Abelsche Gruppe.

Ebenso wie der Verbandbegriff spielt der Gruppenbegriff eine bedeutende Rolle in derMathematik und ihren Anwendungen.

1.2.4 Allgemeiner Durchschnitt, Allgemeine Vereinigungund Potenzmengenbildung

Definition 1.2.22 (Allgemeiner Durchschnitt und Vereinigung)Es sei M ⊆ E ein beliebiges Mengensystem. Der allgemeine Durchschnitt von M istdie Menge ⋂

M =Def x| fur alle M ∈M ist x ∈M .

Die allgemeine Vereinigung von M ist die Menge

⋃M =Def x| es gibt ein M ∈M mit x ∈M .

Die Operationen ”allgemeiner Durchschnitt“ und ” allgemeine Vereinigung“ fuhrenalso von Mengensystemen zu Mengen, verringern also die Stufe.

Satz 1.2.23Es sei M,N ⊆ E

1.⋂∅(2) = E


2.⋃∅(2) = ∅

3. (⋃M) ∩N =

⋃M ∩N |M ∈M

4. (⋂M) ∪N =

⋂M ∪N |M ∈M

5.⋂M ∩

⋂N =

⋂(M ∪N)

6.⋃M ∪

⋃N =

⋃(M ∪N)

7.⋂M =

⋃M |M ∈M

Ubung 9Man beweise die Aussagen des vorstehenden Satzes.

Definition 1.2.24 (Potenzmenge)Die Potenzmenge P (M) der Menge M ist das System aller Teilmengen von M , d. h.

P (M) =Def N |N ⊆M

Die Potenzmengenbildung fuhrt also von einer Menge zu einem Mengensystem, siehebt die Stufe an. Es gilt der

Satz 1.2.25Fur beliebige Mengen M,N gilt:

1. P (∅) = ∅

2. P (E) = E

3. M ⊆ N gdw. P (M) ⊆ P (N)

4. P (M ∪N) ⊇ P (M) ∪P (N)

5. P (M ∩N) = P (M) ∩P (N)

6. P(M)⊆ ∅ ∪P (M)


1.3 Korrespondenzen, Relationen, Abbildungen

Unser nachstes Ziel besteht darin, den Begriff der Zuordnung mathematisch, d. h.mengentheoretisch, zu prazisieren. Wenn wir davon gesprochen haben, daß eine zwei-stellige Operation 2 je zwei Elementen a, b einer Menge G ein Element a2b aus Geindeutig zuordnet, so haben wir dabei an die Anschauung appelliert, aber nicht ge-sagt, was Zuordnen eigentlich ist.

1.3. KORRESPONDENZEN, RELATIONEN, ABBILDUNGEN 19

1.3.1 Geordnetes Paar und Cartesisches Produkt

Der einfachste Fall einer Zuordnung liegt vor, wenn einem einzigen Element a ein Ele-ment b zugeordnet ist, was man z. B. durch [a, b] notieren kann. Die erste Komponentedieses sogenannten geordneten Paares, das Element a, wird in einen Zusammenhanggesetzt mit der zweiten Komponente, dem Element b; dem a wird das b zugeordnet undnicht umgekehrt — es kommt also auf die Reihenfolge der Komponenten (Elemente)an. Fur geordnete Paare [a, b], [c, d] muß also gelten

[a, b] = [c, d] gdw. a = c und b = d

Diese Eigenschaft ist die grundlegende Eigenschaft geordneter Paare, sie kann zuraxiomatischen Charakterisierung dieses Begriffs verwendet werden. Wir konnen aberdiesen Begriff mengentheoretisch wie folgt definieren:

Definition 1.3.1 (Geordnetes Paar)Es seien a, b beliebige Elemente. Dann ist das geordnete Paar [a, b] das Mengensystem

[a, b] =Def a , a, b .

Man kann nun beweisen

Satz 1.3.2Fur beliebige Elemente a, b, c, d gilt

[a, b] = [c, d] gdw. a = c und b = d.

Durch wiederholte Paarbildung kann man nun den Begriff des geordneten Tripels,Quadrupels, . . . (allgemein:) den des n-Tupels einfuhren. Dazu ubertragt man die De-finition 1.3.1 von Elementen a, b auf beliebige Mengen a, b gleicher Stufe und definiertdann:

Definition 1.3.3Es seien a, b, c, d, a1, a2, · · · beliebige Elemente.

• [a, b, c] =Def [[a, b] , c] (Tripel)

• [a, b, c, d] =Def [[a, b, c] , d] (Quadrupel)...

...

• [a1, . . . , an] =Def [[a1, . . . , an−1] , · · · ︸︷︷︸2(n−2)

an · · ·︸︷︷︸2(n−2)

] (n-Tupel)

Man zeigt durch Induktion uber n ≥ 2:

Satz 1.3.4[a1, . . . , an] = [b1, . . . , bn] gdw. a1 = b1 und . . . und an = bn.

Einfachste Zuordnungen der Form ”a geht uber in b“ konnen wir also durch das geord-nete Paar [a, b] beschreiben, kompliziertere Zuordnungen werden wir durch Mengengeordneter Paare beschreiben.


Definition 1.3.5 (Cartesisches Produkt)Es seien M1,M2, . . . ,Mn Mengen (gleicher Stufe). Das Cartesische Produkt (di-rektes Produkt, Kreuzprodukt) von M1, . . . ,Mn in dieser Reihenfolgen) ist die Menge

M1 ×M2 =Def [a, b] | a ∈M1 und b ∈M2 .

bzw.M1 × · · · ×Mn =Def [a1, . . . , an] | a1 ∈M1 und . . . und an ∈Mn .

Nach dieser Definition kann das Cartesische Produkt nur zwischen Mengen gleicherStufe gebildet werden. Man braucht aber auch Produkte zwischen Mengen verschiede-ner Stufen, z. B. wenn man eine Zuordnung beschreiben will, die jedem Element einegewisse Menge zuordnet. Eine Definition laßt sich ebenfalls angeben, wir verzichtenhier darauf und gehen im folgenden davon aus, daß fur beliebige Mengen N , K dasKreuzprodukt definiert ist. Wichtige Eigenschaften des Produkts formulieren wir als

Satz 1.3.6

1. M ×N = ∅ gdw. M = ∅ oder N = ∅

2. Wenn M ⊆ N , so M ×K ⊆ N ×K und K ×M ⊆ K ×N .

3. M × (N ∪K) = (M ×N) ∪ (M ×K)

4. M × (N ∩K) = (M ×N) ∩ (M ×K)

1.3.2 Korrespondenzen

Wir sind nun in der Lage, den Begriff der Zuordnung, wir sagen ”Korrespondenz“mengentheoretisch zu definieren:

Definition 1.3.7 (Korrespondenz)Es seien M , N Mengen. Dann wird K eine Korrespondenz aus M in N (bzw. zwischenM und N) genannt, wenn K ⊆M ×N ist.

Beispiele

• Es sei M = N = N (die Menge der naturlichen Zahlen) und

≤ = [a, b] |a, b ∈ N und a kleiner oder gleich b ⊆ N × N

• Es sei M = N, N = wahr, falsch (die Menge der Wahrheitswerte) und

P2 = [a, α] |a ∈ N und entweder [a ist keine Primzahl und α = falsch]oder [a ist Primzahl und α = wahr]

• Es sei M = 1, . . . , 99, N die Menge aller Straßennamen in Berlin und

F = [a, x] |a ∈ M und x ∈ N und die Straßenbahnlinie Nr.a fuhrtdurch die Straße x

• Es sei A eine Menge, dann bezeichnet IA die Identitat uber A mit

IA =Def [a, a] | a ∈ A


Ist K eine Korrespondenz, so schreiben wir fur [a, b] ∈ K auch aKb und sagen dafur

”a steht zu b in Korrespondenz K“ oder ”b ist ein K-Bild von a“ oder ”a ist ein K-Urbild von b“. Unser erstes Beispiel zeigt, daß ein Element im allgemeinen mehrereBilder oder Urbilder haben kann; das dritte Beispiel zeigt, daß ein Element kein Bildbzw. Urbild haben muß.

Definition 1.3.8 (Benennungen von Korrespondenzen)Es sei K ⊆M ×N eine Korrespondenz zwischen M und N .

1. Der Definitionsbereich (Argumentenbereich, Vorbereich) von K ist die MengeDK der Elemente von M , die K-Urbilder eines Elementes von N sind, d. h.

DK =Def a| Es gibt ein b mit [a, b] ∈ K

2. Der Bildbereich (Wertebereich, Nachbereich) von K ist die Menge BK der Ele-mente von N , die K-Bild eines Elementes von M sind, d. h.

BK =Def b| Es gibt ein a mit [a, b] ∈ K

3. K heißt Korrespondenz von M in N , wenn DK = M ist

4. K heißt Korrespondenz aus M auf N , wenn BK = N ist

5. K heißt Korrespondenz von M auf N , wenn DK = M ist und BK = N ist.

6. Die Korrespondenz K wird eindeutig genannt, wenn zu jedem a ∈M hochstensein b ∈ N (eventuell keines) mit [a, b] ∈ K existiert.

7. Die Korrespondenz K wird eindeutig umkehrbar genannt, wenn es zu jedemb ∈ N hochstens ein a ∈M mit [a, b] ∈ K gibt

BeispieleDie Korrespondenzen ≤, P2 und IA sind Korrespondenzen von–auf, bei F ist dasnicht der Fall; ferner ist P2 eindeutig, aber nicht eindeutig umkehrbar; IA ist dagegeneindeutig umkehrbar.

Definition 1.3.9 (Verkettung und Inversion)Es seien K und L Korrespondenzen, K ⊆ A×B, L ⊆ C ×D.

1. Die Verkettung K L von K mit L ist die Menge

K L =Def [a, d] | Es gibt ein b mit [a, b] ∈ K und [b, d] ∈ L

2. Die Inversion K−1 von K ist die Menge

K−1 =Def [b, a] | [a, b] ∈ K

Man zeigt nun:

Satz 1.3.10Es seien K ⊆ A×B, L ⊆ C ×D Korrespondenzen.

1. K L ist eine Korrespondenz zwischen A und D

2. Die Verkettung ist eine assoziative Operation


3. Die Identitat IE uber dem Objektbereich E ist neutrales Element, d. h.K IE = IE K = K

4. K L = ∅ genau dann, wenn BK ∩DL = ∅.

5. K−1 ist eine Korrespondenz zwischen B und A

6.(K−1

)−1 = K

7. (K L)−1 = L−1 K−1.


1.3.3 Relationen

Korrespondenzen aus einer Menge A in diese Menge selbst, werden als Relationenbezeichnet:

Definition 1.3.11 (Relation)R wird binare (zweistellige) Relation in A genannt, wenn R ⊆ A × A ist. Ist dabeiDR ∪BR = A, so heißt R Relation uber A.

Beispiele

• ≤ ist eine Relation uber N

• IE ist eine Relation uber E

• die leere Menge ∅(3) dritter Stufe ist eine Relation in jeder Menge erster Stufe

• A×A ist eine Relation uber A (die Allrelation uber A).

BemerkungIst R eine binare Relation, d. h. R ⊆ A × A, so schreiben wir statt [a, b] ∈ R haufigaRb.

Fur Relationen werden wir einige Begriffe, die wir weiter oben schon benutzt haben,allgemein zusammenfassen mit folgender

Definition 1.3.12Sei R eine Relation in der Menge A. R heißt

1. reflexiv wenn fur alle a ∈ A gilt: aRa

2. irreflexiv wenn fur kein a ∈ A gilt: aRa

3. transitiv wenn fur alle a, b, c ∈ A gilt: wenn aRb und bRc, so aRc

4. antisymmetrisch wenn fur alle a, b ∈ A gilt: wenn aRb und bRa, so a = b

5. asymmetrisch wenn fur alle a, b ∈ A gilt: wenn aRb, so nicht bRa

6. symmetrisch wenn fur alle a, b ∈ A gilt: wenn aRb, so bRa

Eine Relation R heißt


1. reflexive Halbordnungwenn R reflexiv, transitiv und antisymmetrisch ist

2. irreflexive Halbordnungwenn R irreflexiv, transitiv und asymmetrisch ist

3. Aquivalenzrelationwenn R reflexiv, transitiv und symmetrisch ist

Der Vollstandigkeit halber haben wir hier schon den Begriff der Aquivalenzrelationgenannt, der weiter unten ausfuhrlicher behandelt wird.

Wie wir spater sehen werden, spielen reflexive und transitive Relationen in der Ma-thematik eine große Rolle — Aquivalenzrelationen und reflexive Ordnungsrelationenhaben diese Eigenschaften. Deshalb interessiert eine Operation, die (ausgehend voneiner Relation ohne diese Eigenschaften) die bezuglich ⊆ kleinste reflexive und tran-sitive Relation R′ mit R ⊆ R′ als Resultat liefert.

Definition 1.3.13 (reflexiv-transitive Hulle)Es sei R eine Relation uber A. Wir setzen

• R0 = IA

• Ri+1 = Ri R

• 〈R〉 =Def⋃

R0, R1, . . .

=⋃i∈N Ri

Die Menge 〈R〉 wird als reflexiv-transitive Hulle von R bezeichnet.

Man uberlegt sich sofort

Satz 1.3.14Es sei R Relation uber A

1. 〈R〉 ist eine Relation uber A

2. 〈R〉 ist reflexiv uber A, d. h. fur alle a ∈ A gilt: a 〈R〉 a

3. 〈R〉 ist transitiv uber A, d. h. fur alle a, b, c ∈ A gilt:wenn a 〈R〉 b, b 〈R〉 c, so a 〈R〉 c

Beweisder einzelnen Aussagen:

1. es ist zu zeigen: 〈R〉 ⊆ A×A und D〈R〉 = A, woraus D〈R〉 ∪B〈R〉 = A folgt.

2. gilt offensichtlich, weil IA ⊆ 〈R〉 ist.

3. Wegen a 〈R〉 b, b 〈R〉 c gibt es Zahlen i, j ≥ 0 mit aRib, bRjc. Bei i = 0 folgta = b, also aRjc, d. h. a 〈R〉 c. Analog schließt man bei j = 0.

Sei i > 0. Man uberlegt sich (durch Induktion uber i) daß in diesem Fall Elemen-te a1, . . . , ai+1 ∈ A existieren mit a1 = a, ai+1 = b und alRal+1 fur l = 1, . . . , i.

Analog existieren Elemente b1, . . . , bj+1 mit b1 = b, bj+1 = c und bkRbk+1 furk = 1, . . . , j.

Daraus folgt [a, c] ∈ Ri+j ⊆ 〈R〉, d. h. a 〈R〉 c.


2

Der Gebrauch der Bezeichnung ”Hulle“ ist in der Mathematik fur solche Operationenreserviert, die die sogenannten Hulleneigenschaften haben:

HullenoperationEine Operation Op : P(A) → P(A) heißt Hullenoperation, wenn folgende Eigen-schaften gelten:

1. M ⊆ Op(M) (Satz der Einbettung)

2. Wenn M ⊆ N , so Op(M) ⊆ Op(N) (Satz der Monotonie)

3. Op(Op(M)) = Op(M) (Satz der Abgeschlossenheit)

Op erfullt den Endlichkeitssatz, wenn fur alle a ∈ A,M ⊆ A gilt:Wenn a ∈ Op(M), so existiert eine endliche Teilmenge M∗ ⊆M mit a ∈ Op(M∗).

Satz 1.3.15Die Operation 〈〉 hat die Hulleneigenschaften, d. h. es gilt

1. R ⊆ 〈R〉

2. Wenn R1 ⊆ R2, so 〈R1〉 ⊆ 〈R2〉

3. 〈〈R〉〉 = 〈R〉

Uberdies erfullt die Operation 〈〉 den Endlichkeitssatz:

[a, b] ∈ 〈R〉, so existiert eine endliche Teilmenge R′ ⊆ R mit [a, b] ∈ 〈R′〉

Ubung 12Man beweise den vorstehenden Satz.

Ferner gilt der bereits oben erwahnte

Satz 1.3.16Es sei R eine Relation uber A. Dann ist 〈R〉 die bezuglich ⊆ kleinste reflexive undtransitive Relation R′ mit R ⊆ R′, d. h. fur alle Relationen R′ uber A gilt: WennR ⊆ R′ und R′ ist reflexiv und transitiv, so ist 〈R〉 ⊆ R′.

BeweisDaß 〈R〉 reflexiv und transitiv ist, sagt Satz 1.3.14. Aus dem Satz der Einbettunghaben wir R ⊆ 〈R〉. Ist R ⊆ R′, so ist 〈R〉 ⊆ 〈R′〉 wegen der Monotonie. Fur reflexiveund transitive Relationen R′ gilt aber R′ = 〈R′〉, denn aus der Reflexivitat von R′

uber A folgt R0 = IA ⊆ R′ und aus der Transitivitat von R′ folgt R′ R′ = R′, d. h.(R′)i ⊆ R′. Also ist 〈R〉 ⊆ 〈R′〉 = R′. 2

In analoger Weise wie zweistellige Korrespondenzen definiert man n-stellige Korre-spondenzen zwischen Mengen M1, . . . ,Mn und n-stellige Relationen R in A als

R ⊆ A× · · · ×A =×nA.


1.3.4 Abbildungen

Wir wenden uns nun dem Begriff der Abbildung zu.

Definition 1.3.17 (Abbildung und deren Benennung)Es seien A,B Mengen

1. f heißt Abbildung von A in B, wenn

(a) f eine Korrespondenz von A in B und

(b) f eindeutig ist.

2. Eine Abbildung f wird surjektiv genannt (oder Abbildung auf B), wenn Bf = Bist.

3. Eine Abbildung f heißt injektiv (oder umkehrbar eindeutig), wenn f eindeutigumkehrbar ist.

4. Eine Abbildung f heißt bijektiv, wenn f surjektiv und injektiv ist.

BeispielDie oben angegebene Korrespondenz P2 ist eine surjektive Abbildung von N aufwahr, falsch.

BemerkungDie Aussage ”f ist eine Abbildung von A in B“ notieren wir kunftig durch

”f : A→ B“ und statt ”[a, b] ∈ f“ schreiben wir ”b = f (a)“.

Zum Abschluß dieses Abschnittes machen wir eine Bemerkung uber die Beschreibungvon Korrespondenzen durch Abbildungen. Dabei verwenden wir, daß das Kreuzproduktauch zwischen Mengen unterschiedlicher Stufen definiert ist.

Es seiK ⊆ A×B eine Korrespondenz zwischen A und B. Die zuK gehorige AbbildungfK ist definiert durch

fK : A→ P (B)

mit

fK (a) =Def b| [a, b] ∈ K

fur alle a ∈ A.

Offenbar kann K aus einer Kenntnis von fK gewonnen werden (ist durch fK eindeutigbestimmt), denn es gilt:

K =⋃a∈Aa × fK (a) =

⋃a × fK (a) |a ∈ A

Da die Beziehung zwischen K undfK also eineindeutig ist, kann man wirklich voneiner Beschreibung sprechen; Beschreibung (fK) und Beschriebenes (K) entsprecheneinander eineindeutig.


1.4 Aquivalenzrelationen

1.4.1 Aquivalenzrelationen und Zerlegungen

Definition 1.4.1 (Aquivalenzrelation)Eine Relation R ⊆ A×A in A heißt Aquivalenzrelation uber A, wenn

1. R eine reflexive Relation uber A ist

2. R symmetrisch ist, d. h. [a, b] ∈ R stets [b, a] ∈ R impliziert (mit anderenWorten ist R = R−1)

3. R transitiv ist.

BemerkungVon der Forderung (1.4.1.1) ist nur wesentlich, daß R eine Relation uber A ist, dennaus der Symmetrie folgt DR = BR, d. h. wir haben A = DR ∪ BR = DR = BR. Istnun a ∈ A, so gibt es ein b ∈ A mit [a, b] ∈ R (wegen a ∈ DR) und [b, a] ∈ R (wegen(1.2)) woraus mit der Transitivitat [a, a] ∈ R folgt, d. h. R ist reflexiv.

Fur jede Menge A ist offenbar IA eine Aquivalenzrelation uber A, und zwar ist IAin dem Sinne die scharfste (bzw. feinste) Aquivalenzrelation uber A, daß IA die mei-sten Unterschiede zwischen Elementen von A macht. Im allgemeinen nennt man jaElemente aquivalent bzw. gleichwertig in gewisser Hinsicht, wenn sie sich in dieserHinsicht nicht unterscheiden, z. B. gleich verhalten. Wenn es z. B. auf Zeit, Kosten,Bequemlichkeit usw. bei einer beabsichtigten Reise nicht ankommt, sondern nur aufden Ortswechsel, so ist es gleichwertig, aquivalent, ob dazu das Flugzeug oder dieBahn benutzt wird. Objekte in Aquivalenz zu setzen, bedeutet also, von gewissenihrer Eigenschaften abzusehen (zu abstrahieren) und andere gemeinsame Eigenschaf-ten hervorzuheben. Aus dieser Rolle bei der Abstraktion, der Bildung neuer Begriffe,leitet sich die Bedeutung des Begriffs der Aquivalenzrelation ab.

Wir betrachten nun die oben definierte Abbildung fR fur den Fall, daß R eine Aqui-valenzrelation uber A ist. Man zeigt leicht:

Satz 1.4.2Es sei R eine Aquivalenzrelation uber A und a, b ∈ A. Dann gilt:

1. a ∈ fR (a) 6= ∅

2. a ∈ fR (b) genau dann, wenn b ∈ fR (a)

3. Wenn fR (a) ∩ fR (b) 6= ∅, so fR (a) = fR (b).

Definition 1.4.3 (Zerlegung)Es sei A eine Menge, A 6= ∅, M ⊆ P (A). M heißt Zerlegung von A (Klasseneinteilungoder Partition von A), wenn gilt

1. ∅ /∈M

2. A =⋃M

3. M ist disjunkt, d. h. fur alle M,M ′ ∈M gilt: wenn M ∩M ′ 6= ∅, so M = M ′.

Mit Hilfe des Begriffes der Zerlegung konnen wir den Satz 1.4.2 wie folgt formulieren:

1.4. AQUIVALENZRELATIONEN 27

Satz 1.4.4Ist R eine Aquivalenzrelation uber A 6= ∅, so ist

MR =Def fR (a) |a ∈ A = BfR

eine Zerlegung von A.

Wir wissen bereits, daß wir eine Relation R durch die Abbildung fR beschreibenkonnen. Es stellt sich die Frage, ob bei AquivalenzrelationenR dazu bereitsMR = BfRgenugt. Es zeigt sich zunachst:

Satz 1.4.5Ist R eine Aquivalenzrelation uber A, so gilt fur a, b ∈ A: aRb genau dann, wenn esein M ∈MR mit a, b ∈M gibt.

Diese Aussage weist den Weg, wie zu einer Zerlegung M eine Aquivalenzrelation RMzu definieren ist; wir setzen fur a, b ∈ A =

⋃M

aRMb gdw. es ein M ∈M mit a, b ∈M gibt.

Man zeigt ohne Schwierigkeiten:

Satz 1.4.6Ist M eine Zerlegung von A, so ist RM Aquivalenzrelation uber A.

Die Bildung von RM zu einer Zerlegung M erweist sich nun gerade als Umkehrungder Bildung der Zerlegung MR zu einer Aquivalenzrelation R.

Satz 1.4.7Es sei A 6= ∅

1. Ist R eine Aquivalenzrelation uber A, so ist

R = R(MR)

2. Ist M eine Zerlegung von A, so ist

M = M(RM)

Aquivalenzrelationen und Zerlegungen sind einander auf diese Weise eineindeutig zu-geordnet. Man bezeichnet fR (a) als

die Aquivalenzklasse nach R, in der a liegt (die Aquivalenzklasse von a)

und notiert MR auch als A/R (A zerlegt nach R, A faktorisiert nach R).


1.4.2 Feinheit von Aquivalenzrelationen

Definition 1.4.8 (Feinerrelation)Es seien M1, M2 Zerlegungen. M1 ist feiner als M2 (M1 M2), wenn zu jederKlasse K1 ∈M1 eine Klasse K2 ∈M2 existiert mit K1 ⊆ K2.

Satz 1.4.9Seien R1, R2 Aquivalenzrelationen. Dann gilt:

MR1 MR2 gdw. R1 ⊆ R2

Folgerung 1.4.10Wenn ZA die Menge aller Zerlegungen der Menge A bezeichnet, dann ist [ZA,] einereflexive Halbordnung.

Definition 1.4.11 (Durchschnitt von Aquivalenzrelationen)Seien R1 und R2 Aquivalenzrelationen. Dann bezeichnet R1 uR2 die grobste Aquiva-lenzrelation R mit R ⊆ R1 und R ⊆ R2. Fur die Zerlegungen M1 und M2 bezeichnetanalog M1 uM2 die grobste Zerlegung M mit M M1 und M M2.

Satz 1.4.12Es gilt: R1 uR2 = R1 ∩R2

BeweisZu zeigen: R1 ∩R2 ist Aquivalenzrelation.

1. reflexiv: IA ⊆ R1 ∩R2

2. symmetrisch: klar

3. transitiv: a(R1 ∩R2)b︸︷︷︸aR1baR2b

und b(R1 ∩R2)c︸︷︷︸bR1cbR2c

⇒ a(R1 ∩R2)c︸︷︷︸aR1caR2c

2

Fur die Zerlegungen gilt M1 uM2 = N1 ∩N2 | N1 ∈ M1, N2 ∈ M2, N1 ∩N2 6= ∅.MIA ist die feinste und MA×A die grobste Zerlegung von A.

Wir fragen uns nun, ob R1 ∪ R2 auch eine Aquivalenzrelation ist. An einem Beispielkann man sich sofort klar machen, daß das i. a. nicht gilt. Wir definieren deshalb:

Definition 1.4.13R1 tR2 =Def < R1 ∪R2 > ist die bezuglich Inklusion kleinste (feinste) Aquivalenz-relation die R1 und R2 umfaßt.

Folgerung 1.4.14Wenn R die Menge aller Aquivalenzrelationen uber A bezeichnet, dann ist [R,u,t]ein Verband mit Nullelement IA und Einselement A×A.

1.4. AQUIVALENZRELATIONEN 29

1.4.3 Kongruenzrelationen

Wenn in der Menge A neben der Aquivalenzrelation R noch weitere Relationen undOperationen, d. h. Abbildungen definiert sind, die mit R ”vertraglich“ sind, nenntman R eine Kongruenzrelation bzgl. diesen Operationen und Relationen.

Dieser Fall ist deshalb wichtig, weil sich dann Relationen bzw. Operationen auf A aufdem einfacheren Bereich A/R nachbilden lassen.

Wir fuhren das genauer aus fur den Fall einer n-stelligen Operation uber A.

Definition 1.4.15Es sei A eine nichtleere Menge , n ≥ 1.

1. heißt n-stellige Operation uber A, wenn

: Xn A→ A

2. Eine Aquivalenzrelation R uber A heißt vertraglich (invariant) bzgl. der n-stelligen Operation uber A (oder Kongruenzrelation bzgl. ), wenn fur allea1, . . . , an, b1, . . . , bn ∈ A gilt:

Wenn a1Rb1 und . . . und anRbn, so (a1, . . . , an)R (b1, . . . , bn)

Ist nun R eine Kongruenzrelation uber A bzgl. der Operation , so konnen wir furM1, . . . ,Mn ∈ A/R definieren

′ (M1, · · ·Mn) =Def fR ( (a1, . . . , an))

fur beliebiges a1, . . . an mit a1 ∈M1 und . . . und an ∈Mn.

Diese Definition muß gerechtfertigt werden, d. h. es ist zu zeigen:

Wenn [a1, . . . , an] ∈M1 × · · · ×Mn und [b1, . . . bn] ∈M1 × · · · ×Mn, so

fR ( (a1, . . . , an)) = fR ( (b1, . . . , bn)) .

Das ergibt sich daraus, daß R Kongruenz bzgl. ist, denn aus ai, bi ∈ Mi ∈A/R folgt aiRbi, also (a1, . . . an)R (b1, . . . , bn), folglich fR ( (a1, . . . , an)) =fR ( (b1, . . . , bn)). Es ergibt sich also, daß folgendes Diagramm ”kommutativ“ ist:

A × · · ·× A→ A

fR

y fR

y fR

y(A/R) × · · ·× (A/R) ′→ A/R

Das Diagramm ist insofern ”kommutativ“, daß man ausgehend von einem Element[a1, . . . , an] ∈ ×

nA das gleiche Element von A/R erhalt, unabhangig davon, ob man

zuerst mittels das Element (a1, . . . , an) bildet und dann fR anwendet oder zuerstmittels fR das Element [fR (a1) , . . . , fR (an)] ∈×

n(A/R) bildet und dann ′ anwen-

det. Die ”abstrahierende“ Abbildung fR einer Kongruenz R liefert also zugleich eine


Vereinfachung A/R des Bereichs A (z. B. kann A/R endlich sein wahrend A unendlichist) und eine Vereinfachung der Operation .BemerkungSei M eine Menge und R eine Relation uber M , die reflexiv und transitiv ist. Dann istR im allgemeinen keine Halbordnung in M , weil R nicht antisymmetrisch sein muß.

BeispielDefiniert man ”besser“ auf der Menge M der Studenten durch

S1 besser S2 gdw. Notendurchschnitt(S1) ≤ Notendurchschnitt(S2)

so folgt aus S1 besser S2 und S2 besser S1 nicht S1 = S2.

Wir konnen aber auf M die Relation ∼ definieren durch

a ∼ b gdw. aRb und bRa

Offenbar ist ∼ eine Aquivalenzrelation und es gilt

Wenn aRb, a ∼ c und b ∼ d, so cRd

d. h. ∼ und R sind vertraglich.

Folglich konnen wir die Relation R auf die Aquivalenzklassen ubertragen:

[a], [b] ∈M/∼ : [a]R [b] gdw. aRb

Man zeigt, daß [M/∼ , R ] eine Halbordnung ist.

1.5 Naturliche Zahlen

In diesem Abschnitt beschaftigen wir uns mit der mengentheoretischen Begrundungder naturlichen Zahlen. Wir haben diesen Begriff bisher im wesentlichen nur in Bei-spielen benutzen konnen (nicht z. B. in Definitionen), denn wir haben ihn bishernicht definiert. Insbesondere ist noch nicht klar, ob die Menge der naturlichen Zahlenuberhaupt existiert, oder ob sie vielleicht sogar zu einer Antinomie fuhrt.

Wir geben zunachst (als weiteres Beispiel einer axiomatische Charakterisierung) eineaxiomatische Charakterisierung der naturlichen Zahlen an:

Peanosches Axiomensystem der naturlichen ZahlenDie Grundbegriffe ”Null“, ”Menge aller naturlichen Zahlen“ und ”die naturlicheZahl b ist unmittelbarer Nachfolger der naturlichen Zahl a“, formal durch x0, X,aNfb notiert, werden wie folgt zueinander in Beziehung gesetzt:

1. x0 ∈ X (lies: Null ist eine naturliche Zahl)

2. Zu jedem a ∈ X gibt es genau ein b ∈ X mit aNfb

3. Es gibt kein a ∈ X mit aNfx0

4. Fur alle a, b, c ∈ X gilt: Wenn aNfc und bNfc, so a = b

5. Fur alle M ⊆ X gilt:Wenn x0 ∈ M und (fur alle a ∈ M und jedes b mit aNfb gilt b ∈ M), so istX ⊆M .

1.5. NATURLICHE ZAHLEN 31

Ein Modell dieses Axiomensystems P ist ein Tripel [α,A,R], bestehend aus einem kon-kreten mathematischen Objekt α, einer Menge A von Objekten und einer Relation Ruber A, derart daß diese funf Axiome erfullt sind.

Das Tripel [0,N, R?] mit aR?b gdw. b = a+1 erfullt offenbar das Peanosche Axiomen-system; man kann sogar zeigen, daß jedes Modell von P zu diesem Tripel isomorphist.

Wenn wir gesagt haben, daß [0,N, R?] P erfullt, so setzt daß naturlich voraus, daßsich die in diesem Tripel vorkommenden Objekte 0, N , R? mathematisch (mengen-theoretisch) als existent begrunden lassen.

1.5.1 Gleichmachtigkeit

Den Zugang zur Einfuhrung des Zahlenbegriffs bildet der Begriff der Gleichzahligkeit,der Gleichmachtigkeit. Das Gemeinsame einer Menge von drei Apfeln, einer Menge vondrei Stuhlen oder drei Flaschen ist die Gleichmachtigkeit, so daß man sagen kann dieDrei, das ist das Mengensystem, in dem genau alle Mengen mit genau drei Elementenvorkommen. Nun kann man aber von einer Menge schwer feststellen, ob sie genaudrei Elemente hat, ohne die drei Elemente zu zahlen, es sei denn, es ist einem schoneine Menge bekannt, die genau drei Elemente enthalt. Dann ist es auch anschaulichklar, daß zwei Mengen dann und nur dann gleich viele Elemente besitzen, wenn eseine Bijektion (eine eineindeutige Abbildung von-auf ) zwischen diesen Mengen gibt.

Definition 1.5.1 (Gleichmachtigkeit)Mengen A,B heißen gleichmachtig (oder aquivalent, notiert durch A ∼ B), wenn eseine Bijektion Φ : A→ B gibt.

Man uberlegt sich leicht:

Satz 1.5.2∼ ist eine Aquivalenzrelation uber E

Definition 1.5.3 (Kardinalzahlen)Die Aquivalenzklassen von E nach ∼, d. h. die Elemente von E/ ∼ heißen Kardinal-zahlen (von Mengen erster Stufe). Es ist fur M ∈ E

card (M) = N |N ∈ E und N ∼M

Eine Kardinalzahl ist also ein nichtleeres Mengensystem, das alle Mengen enthalt, diezu einer Menge dieses Systems gleichmachtig sind. Unserer Anschauung entspricht es,die naturlichen Zahlen als Kardinalzahlen der endlichen Mengen einzufuhren.

Wir mussen also dazu den Begriff der endlichen Menge klaren, ohne dabei den Zah-lenbegriff zu benutzen. Die Erklarung ”M ist genau dann endlich, wenn es Elementea1, a2, . . . , an so gibt, daß M = a1, . . . , an ist“, ist also als Endlichkeitsdefinitionnicht brauchbar.

1.5.2 Der Endlichkeitsbegriff

Eine auf Russel zuruckzufuhrende Definition des Endlichkeitsbegriffes lautet:

Definition 1.5.4 (Russel)


1. Das System Mfin der endlichen Mengen ist das kleinste Mengensystem M wel-ches induktiv wie folgt definiert wird

(a) ∅ ∈M (Anfangsschritt)

(b) Ist M ∈M und a ∈ E, so (M ∪ a) ∈M (Induktionschritt)

2. M heißt endlich, wenn M ∈Mfin ist (sonst unendlich)

Folgerung 1.5.5Das Unendlichkeitsaxiom sagt also: E /∈Mfin.

Eine weitere Endlichkeits- bzw. Unendlichkeitsdefinition wurde von Dedekind ange-geben:

Definition 1.5.6 (Dedekind)

1. Eine Menge M heißt ”unendlich“, wenn es eine echte Teilmenge M ′ ⊂ M mitM ′ ∼M gibt.

2. Eine Menge M heißt ”endlich“, wenn M keine echte Teilmenge M ′ ⊂ M mitM ′ ∼M besitzt.

Diese Definition beruht auf der Beobachtung, daß nur unendliche Mengen zu einerihrer echten Teilmengen aquivalent sind. So ist z. B. die Menge N aquivalent mit derMenge der geraden naturlichen Zahlen, eine Bijektion Φ : N → 0, 2, 4, . . . ist gegebendurch die Gleichung Φ (x) = 2x. Wir beweisen, daß beide Definitionen gleichwertigsind. Dabei bezeichnet endlich die Russelsche und ”endlich“ die Dedekindsche Auf-fassung.

Satz 1.5.7 (Gleichwertigkeit der Endlichkeitsbegriffe)Eine Menge M ist endlich nach Russel genau dann, wenn sie ”endlich“ nach De-

dekind ist.

Beweis =⇒Jede endliche Menge ist ”endlich“, d. h. wenn M ∈ Mfin, so gilt fur jede echte Teil-menge M ′ ⊂M : M ′ 6∼M .

Wir beweisen diese Behauptung durch Induktion uber M

Anfangsschritt: M = ∅Die Behauptung ist trivial, weil die leere Menge keine echten Teilmengen besitzt.

Induktionsschritt:

Induktionsvoraussetzung:Fur jede echte Teilmenge M ′ von M ist M ′ 6∼M

Induktionsbehauptung:Fur jede echte Teilmenge N ′ von M ∪ a ist N ′ 6∼M ∪ a

Wenn a ∈M ist, so gilt M∪a = M , die Behauptung ist mit der Voraussetzungidentisch. Es sei also a /∈M .

Wir schließen indirekt, und nehmen an, daß

N ′ ⊂M ∪ a , N ′ ∼M ∪ a .


Es sei Φ : N ′ →M ∪ a bijektiv. Wir setzen

N ′′ =Def N′ \

Φ−1 (a)

, Φ′ =Def Φ \[

Φ−1 (a) , a]

und erhaltenΦ′ : N ′′ →M ist bijektiv

also N ′′ ∼M .

An dieser Stelle mussen wir eine Fallunterscheidung vornehmen:

Fall 1: a /∈ N ′′Wegen

N ′′ = N ′ \

Φ−1 (a)⊂ N ′ ⊂M ∪ a ,

gilt die Inklusion N ′′ ⊆ M , aus N ′′ ∼ M folgt nach Induktionsvorausset-zung N ′′ = M , folglich Φ−1 (a) = a, d. h. N ′ = M ∪ a im Widerspruchzu N ′ ⊂M ∪ a.

Fall 2: a ∈ N ′′Es sei b =Def Φ′ (a) ∈M und c =Def Φ−1 (a), sowie

Ψ (x) =Def

a fur x = ab fur x = c

Φ (x) fur x ∈ N ′ \ a, c

ferner N ′′′ = (N ′′ \ a ∪ c).Dabei ist N ′′′ ∼ N ′′ ∼ M und a /∈ N ′′′ ⊂ N ′ ⊂ M ∪ a, also N ′′′ ⊆ M ,woraus nach Induktionsvoraussetzung N ′′′ = M folgt. Wegen N ′ = N ′′′ ∪a = M∪a erhalten wir abermals einem Widerspruch zu N ′ ⊂M∪a.

2

Damit ist Richtung =⇒ bewiesen. Noch zu zeigen:

Beweis ⇐=Jede ”endliche“ Menge M ist endlich, d. h. M ∈Mfin.

Wir fuhren den Beweis indirekt und nehmen an, daß M0 eine Menge ist, mit

1. Wenn M ′ ⊂M0, so M ′ 6∼M0

2. M0 /∈Mfin.

Dann gibt es zu jedem N ∈Mfin mit N ⊆M0 ein a ∈M0 mit a /∈ N , d. h. M0\N 6= ∅fur alle N ∈Mfin mit N ⊆M0. Wir setzen

M? =Def M0 \N |N ⊆M0und N ∈Mfin

Es ist ∅ /∈M? weil M0 /∈Mfin und M? 6= ∅ weil M0 = M0 \ ∅ ∈M?.

Eine gleichwertige Formulierung des Auswahlaxioms lautet:

Zu jedem nichtleeren Mengensystem M nichtleerer Mengen existiert eineAuswahlfunktion, d. h. eine Abbildung ρ : M→

⋃M mit ρ (M) ∈M fur

alle M ∈M.


Es sei ρ eine Auswahlfunktion fur M?, wir setzen

a0 = ρ (M0)ai+1 = ρ (M0 \ a0, a1, . . . , ai) i = 0, 1, 2, . . .

Offenbar ist a0, . . . , ai ∈ Mfin, also M0 \ a0, . . . ai ∈ M?. Dabei sind fur jedes idie Elemente a0, . . . ai offenbar paarweise verschieden. Es sei schließlich

M? = a0, a1, . . .M?? = a1, a2, . . .

Offenbar ist M? ∼ M??. Ferner ist M0 = M? ∪ (M0 \M?) und fur M ′ =Def M?? ∪

(M0 \M?) gilt M ′ ⊂ M0, aber es ist M ′ ∼ M0, wie man leicht sieht. Das ist einWiderspruch zur Voraussetzung 1. 2

Folgerung 1.5.8Eine Menge ist ”unendlich“ genau dann, wenn sie unendlich ist.

1.5.3 Die Menge der naturlichen Zahlen

Definition 1.5.9 (Naturliche Zahlen, Null und Nachfolger)

1. n ist eine naturliche Zahl, wenn n die Kardinalzahl einer endlichen Menge ist.

2. 0 = card (∅) = ∅

3. N := Mfin/ ∼, wobei ∼ die Gleichmachtigkeitsrelation ist.

4. Fur naturliche Zahlen n,m definieren wir die Nachfolgerelation Nf

nNf m :↔ Es gibt ein N ∈ n und a ∈ E mit a /∈ N und N ∪ a ∈ m.

Satz 1.5.10Das Tripel [0,N,Nf] ist ein Modell des Peanoschen Axiomensystems.

Wir fuhren den Beweis nicht aus, merken lediglich an, daß man zum Nachweis derExistenz des Nachfolgers einer naturlichen Zahl das Unendlichkeitaxiom braucht.

Ist namlich n ∈ N, etwa n = card (N) wobei N ∈Mfin, so ist zu zeigen, daß ein a ∈ Emit a /∈ N existiert.

Gabe es ein solches a nicht, so hatte man E ⊆ N , also E = M , d. h. E = N ∈Mfin,im Widerspruch zum Unendlichkeitsaxiom.

Definition 1.5.11Es seien m, n beliebige Kardinalzahlen. Wir setzen m ≤ n gdw. es Mengen M ∈ m,N ∈ n und eine Injektion Φ : M → Ngibt.

Satz 1.5.12[E/ ∼,≤] ist eine reflexive Ordnung, d. h. fur beliebige Kardinalzahlen m,n, k gilt:

1. m ≤ m (Reflexivitat)

2. Wenn m ≤ n und n ≤ k, so m ≤ k (Transitivitat)

3. Wenn m ≤ n und n ≤ m, so m = n (Antisymmetrie)


4. m ≤ n oder n ≤ m (Vergleichbarkeit)

BemerkungDie ersten drei Behauptungen entsprechen den Halbordnungsaxiomen.

Die erste und zweite Behauptung ist leicht einzusehen. Wir beweisen hier nur dieAntisymmetrie von ≤ in Form des

Satz 1.5.13 (Bernsteinscher Aquivalenzsatz)Sind M,N Mengen und ist Φ : M → N injektiv, sowie Ψ : N → M injektiv, so istM ∼ N .

Zur Vorbereitung zeigen wir folgenden

Hilfssatz (Fixpunktsatz)Es sei M eine beliebige Menge und f : P (M) → P (M) mit: Wenn A,B ⊆ M undA ⊆ B, so f (A) ⊆ f (B). Dann hat f einen Fixpunkt C, d. h. es gibt eine MengeC ⊆M mit

f (C) = C

Beweis des HilfssatzesEs sei

A =Def A|A ⊆Mund A ⊆ f (A)C =Def

⋃A.

Zum Beweis von C = f (C) zeigen wir zuerst

C ⊆ f (C) .

Es sei x ∈ C beliebig. Dann gibt es ein A ∈ A mit x ∈ A. Wegen A ⊆ f (A) istx ∈ f (A), ferner ist A ⊆ C. Aus der Monotonie von f ergibt sich X ∈ f (A) ⊆ f (C),also x ∈ f (C).

Aus C ⊆ f (C) folgt f (C) ⊆ f (f (C)), also ist f (C) ∈ A, d. h. f (C) ⊆⋃A = C.

Damit ist der Hilfssatz bewiesen. 2

Beweis des Bernsteinschen AquivalenzsatzesEs seien nun M,N,Φ,Ψ mit den angegebenen Eigenschaften gegeben. Wir betrachtendie Abbildung f : P (M)→ P (M) mit:

f (X) =Def M \Ψ(N \ Φ (X)

)fur X ⊆M , wobei

Φ (X) = Φ (x) |x ∈ X fur X ⊆MΨ (Y ) = Ψ (y) |y ∈ Y fur Y ⊆ N

gesetzt ist.

Wir zeigen zunachst, daß f monoton ist. Ist A ⊆ B ⊆ M , so Φ (A) ⊆ Φ (B) ⊆Φ (M) ⊆ N , folglich N \ Φ (A) ⊇ N \ Φ (B) und also

M ⊇ Ψ(N \ Φ (A)

)⊇ Ψ

(N \ Φ (B)

),

so daßf (A) = M \Ψ

(N \ Φ (A)

)⊆M \Ψ

(N \ Φ (B)

)= f (B)


folgt.

Nach unserem Hilfssatz besitzt f einen Fixpunkt C. Wir setzen nun fur x ∈M

τ (x) =Def

Φ (x) , falls x ∈ C

Ψ−1 (x) , falls x /∈ C

und zeigen, daß τ : M → N bijektiv ist.

1. τ ist injektiv (eineindeutig)

Die Eindeutigkeit von τ ist offensichtlich, es genugt also zu zeigen:

Wenn τ (x1) = τ (x2) , so x1 = x2

In den Fallen, daß x1, x2 ∈ C oder x1, x2 ∈M \C ist, folgt das unmittelbar ausder Eineindeutigkeit von Φ bzw. Ψ−1 Es sei o.B.d.A. x1 ∈ C, x2 /∈ C. Dann ist

y =Def τ (x1) = Φ (x1) ∈ Nund y = τ (x2) = Ψ−1 (x2)

Wegen x1 ∈ C ist y = Φ (x1) ∈ Φ (C). Andererseits ist Ψ (y) = x2 /∈ C, alsox2 /∈ f (C) = M \Ψ

(N \ Φ (C)

), folglich x2 ∈ Ψ

(N \ Φ (C)

)wegen x2 ∈M .

Es gibt also ein y′ ∈ N \ Φ (C) mit x2 = Ψ (y′). Weil Ψ eineindeutig ist, folgtaus Ψ (y) = x2 = Ψ (y′), daß y = y′ ist. Das steht im Widerspruch zu y ∈ Φ (C),y′ /∈ Φ (C). Der Fall x1 ∈ C, x2 /∈ C kann also nicht eintreten.

2. τ ist Abbildung auf N .

Es sei y ∈ N beliebig. Wenn x =Def Ψ (y) /∈ C, so ist τ (x) = Ψ−1 (x) = y, esist also y ein Wert von τ . Andernfalls ist x ∈ C = f (C) = M \Ψ

(N \ Φ (C)

).

Folglich ist x ∈ M und x 6∈ Ψ(N \ Φ (C)

). Wir zeigen, daß in diesem Fall y ∈

Φ (C) ist. Sonst wahre namlich y ∈ N \ Φ (C), also x = Ψ (y) ∈ Ψ(N \ Φ (C)

).

Widerspruch. Aus y ∈ Φ (C) ergibt sich die Existenz eines x′ ∈ C mit y = Φ (x′).Nun ist wegen x′ ∈ C

τ (x′) = Φ (x′) = y,

also triff y auch in diesem Fall als Wert von τ auf.

Damit ist der Bernsteinsche Aquivalenzsatz bewiesen. 2

Man kann zeigen:

Satz 1.5.14Fur beliebige Kardinalzahlen m,n gilt: m ≤ n genau dann, wenn es Mengen M ∈M,N ∈ N und eine surjektive Abbildung Φ : N →M gibt.

Definition 1.5.15 (Abzahlbarkeit, Uberabzahlbarkeit)Eine Menge M heißt abzahlbar unendlich, wenn sie gleichmachtig mit N ist. Ist Munendlich und M 6∼ N, so wird M uberabzahlbar genannt.

Die Kardinalzahl der Menge N wird mit ℵ0 (Aleph Null) bezeichnet, dies ist diekleinste unendliche Kardinalzahl. Uberabzahlbar ist z. B. die Menge aller Folgen vonNullen und Einsen, d. h. die Menge M1 = Φ|Φ : N → 0, 1, diese Menge hat diegleiche Machtigkeit wie die Menge der reellen Zahlen im Intervall [0, 1] bzw. wiedie Menge aller reellen Zahlen. Die Kardinalzahl dieser Menge wird mit ℵ (Aleph)bezeichnet, es ist also ℵ0 < ℵ.

Nun konnen wir gewohnte Operationen auf der Menge der naturlichen Zahlen mittelsKardinalzahlen definieren:


Definition 1.5.16 (Addition, Multiplikation)Fur Kardinalzahlen m,n sei

m+ n =Def card (M ∪N)

fur beliebiges M ∈ m,N ∈ n mit M ∩N = ∅ und

m · n =Def card (M ×N)

fur beliebiges M ∈ m,N ∈ n.

Man zeigt ohne Schwierigkeiten, daß diese Definitionen vom Reprasentanten un-abhangig sind, d. h. daß gilt:

1. Wenn M ∼M ′, N ∼ N ′, M ∩N = ∅, M ′ ∩N ′ = ∅,so card (M ∪N) = card (M ′ ∪N ′).

2. Wenn M ∼M ′, N ∼ N ′, so card (M ×N) = card (M ′ ×N ′).

Fur naturliche Zahlen gelten dabei naturlich die ublichen Rechenregeln, das ist beiunendlichen Kardinalzahlen nicht der Fall, man verifiziert z. B. leicht, daß ℵ0+ℵ0 = ℵ0

ist. Es gilt aber z. B.

Satz 1.5.17Es ist fur beliebige Kardinalzahlen m,n: m ≤ n genau dann, wenn es eine Kardinalzahlk mit m+ k = n gibt.

Ubung 13Man fuhre die offen gebliebenen Beweise und außerdem:

1. A ∪ (B \ C) = ((A ∪B) \ C) ∪ (A ∩ C)

2. A ∩B = A \ (A \B)

3. (A \B)× C = (A× C) \ (B × C)

4. (A×B) \ (C ×D) = ((A \ C)×B) ∪ (A× (B \D))

5. Es sei f : R1 × R2 → R1 × R2 (R1 = die Menge der reellen Zahlen) mitf (x, y) = [x+ y, x− y]. Man untersuche, ob f surjektiv, injektiv bzw. bijektivist.

6. Es seien f : X → Y , g1, g2 : Y → X mit

f g1 = f g2 = IX , g1 f = IY .

man beweise: g1 = g2.

7. Es sei Z die Menge der ganzen Zahlen und

R = [[a, b] , [c, d]] |a, b, c, d ∈ Z, b · d 6= 0, ad = bc

Man zeige, daß R eine Aquivalenzrelation ist und charakterisiere die Aquiva-lenzklassen.


1.6 Worter

In diesem Abschnitt beschaftigen wir uns mit einer Verallgemeinerung der naturlichenZahlen — den Wortern. Worter spielen in der Informatik eine große Rolle, sie bildendie Grundlage fur den Begriff der Sprache, also fur den Kalkulbegriff einerseits undfur Programmiersprachen andererseits. Die rechentechnische Realisierung erfolgt jenach Anwendungsbereich durch die Datentypen String (Zeichenkette) als array of

character oder durch den Datentyp Liste (wenn die Lange der betrachteten Kettenunbeschrankt ist). Worter werden als endliche Folgen von Buchstaben (= Elementeneines endlichen Alphabets) verstanden.

1.6.1 Grundbegriffe

Definition 1.6.1 (Alphabet, Wort)Zuerst definieren wir

1. Ein Alphabet X ist eine endliche, nichtleere Menge (die Elemente nennt manBuchstaben).

2. p ist ein Wort uber X, wenn p eine endliche Folge von Elementen von X ist,d. h. es gibt eine naturliche Zahl n, so daß p : 0, . . . , n− 1 → X.

3. Das Wort e : ∅ → X heißt das leere Wort.

4. Die Zahl n wird als Lange l (p) des Wortes p bezeichnet.

5. W (X) bezeichnet die Menge aller Worter uber X.

BemerkungDie Abbildung l : W (X)→ N ist nicht umkehrbar, falls card (X) ≥ 2.

Um die Menge W (X) zu einer Algebra zu machen, definieren wir eine Operation aufW (X):

Definition 1.6.2 (Verkettung, concatenation)Es sei p : 0, . . . , n− 1 → X, q : 0, . . . ,m− 1 → X. Dann ist die Verkettung vonp mit q die Abbildung p_q : 0, . . . ,m+ n− 1 → X mit

p_q (i) :=p (i) , i ≤ n− 1q (i− n) , n ≤ i ≤ m+ n− 1.

Was hat diese Operation fur Eigenschaften?

Satz 1.6.3[W (X) ,_, e] ist eine Halbgruppe mit dem Einselement e.

BeweisMan rechnet leicht nach:

1. p_(q_r) = (p_q)_r (_ ist assoziativ)

2. p_e = p = e_p fur jedes p ∈W (X). (e ist Einselement in [W (X),_])

Ubung 14Wir kennen bereits folgende Halbgruppe: [N,+, 0]. Frage: Haben beide etwas Gemein-sames? Sind beide homomorph? (Standardfrage in der Mathematik in solchem Fall)

1.6. WORTER 39

Definition 1.6.4 (Homomorphismus)f ist Homomorphismus von der Halbgruppe [M, , 1M ] in [N, ?, 1N ] wenn gilt:

1. f : M → N

2. f (1M ) = 1N

3. f (m1 m2) = f (m1) ? f (m2)

Ist f uberdies bijektiv, so heißt f Isomorphismus.

Folgerung 1.6.5Die in 1.6.1 definierte Wortlangenfunktion l ist ein Homomorphismus von[W (X) ,_, e] auf [N,+, 0].

BemerkungWenn card (X) = 1, so ist l umkehrbar eindeutig, (folglich bijektiv). Mit anderenWorten, die Halbgruppen [N,+, 0] und [W (a),_, e] sind isomorph, d. h. [N,+, 0]und [W (a),_, e] sind algebraisch gesehen identisch. Worter sind also eine Verallge-meinerung von Zahlen, d. h. Zahlen sind spezielle Worter.

Wir werden nun die Schreibweise vereinfachen, indem wir Struktureigenschaften derWorter ausnutzen (z. B. erzeugendes Element)

Definition 1.6.6 (Erzeugendensystem)E ist Erzeugendensystem fur [W (X) ,_, e], wenn:

1. e /∈ E ⊆W (X)

2. zu jedem p ∈W (X)\e gibt es Elemente r1, . . . , rk ∈ E mit p = r_1 r_2 . . ._rk.

Man sucht naturlich einfache Elemente als erzeugende Elemente. Hierfur bieten sichBuchstaben an (sie sind keine Worter!). Deshalb setzen wir fest:

Definition 1.6.7 (Buchstaben – Worte der Lange 1)Fur x ∈ X sei x =Def [0, x] Wort der Lange 1.

Damit haben wir die Buchstaben auf das Niveau Wort gebracht. Spater werden wirx und x identifizieren.

Satz 1.6.8X =Def x|x ∈ X ist ein Erzeugendensystem fur [W (X) ,_, e].

BeweisSei p ∈W (X) und p : 0, . . . , n− 1 → X.Offenbar ist p = p (0)_p (1)_. . ._p (n− 1), da p (i) ∈ X. 2

Beispiele•[N+, ·, 1

]ist eine Halbgruppe.

Erzeugendensystem ist Pz – die Menge der Primzahlen, z. B. 6 = 2 · 3 = 3 · 2

• [N,+, 0] ist Halbgruppe.Erzeugendensystem ist 1, z. B. 3 = 1 + 1 + 1.


Unterschied zwischen beiden Halbgruppen ist, daß die Elemente im ersten Beispiel inmehreren Weisen, im zweiten Beispiel dagegen nur auf eine Weise erzeugbar sind. DieErzeugung der zweiten Halbgruppe ist frei von nichttrivalen Gleichungen.

Definition 1.6.9 (freie Halbgruppe)G = [M, , 1, E] sei eine Halbgruppe mit Erzeugendensystem E. Die Halbgruppe Gheißt frei erzeugt (frei von nichttrivialen Gleichungen), wenn aus m1 m2 · · · mk =m′1 m′2 · · · m′n stets k = n und m1 = m′1, . . . ,mk = m′k folgt (fur mi,m

′i ∈ E).

Folgerung 1.6.10[W (X) ,_, e,X ] ist freie Halbgruppe.

Satz 1.6.11Alle freien Halbgruppen mit derselben Zahl von erzeugenden Elementen sind isomorph.

BeweisIdee: Erzeugende Elemente einer freien Halbgruppe sind nicht zerlegbar. Wir werdendeshalb Erzeugende aufeinander abbilden.

Seien [M1, ,1, E1], [M2, ?, 1, E2] Halbgruppen mit card (E1) = card (E2).

Es sei f : E1 → E2 bijektiv. Weiter definiert man den Homomorphismus folgender-maßen: f (1) = 1. Sei m ∈M1. m besitzt genau eine Darstellung m = r1 1 r2 · · · rk(ri ∈ E1). Dann sei f (m) := f (r1) ? f (r2) ? · · · ? f (rk). Daß f ein Homomorphismusist, ist klar.

Es bleibt zu zeigen, daß f bijektiv ist, d. h. daß f eine umkehrbare Abbildung auf M2

ist.

Es sei m′ ∈M2. Wenn m′ = 1, so besitzt m′ das Urbild 1 ∈M1 wegen f(1) = 1. Furm ∈M1 \ 1 ist f(m) 6= 1 ∈M2, weil anderenfalls aus der Darstellung

m = r1 r2 · · · rk (ri ∈ E1)

von m in M1 eine Darstellung

1 = f(m) = f(r1) ? · · · ? f(rk) (f(ri) ∈ E2)

des Einselements in M2 gewonnen wurde im Widerspruch dazu, daß [M2, ?, 1, E2] freiist (Die obige Darstellung ware eine nichttriviale Gleichung). Also ist 1 ∈ M1 daseinzige Urbild von 1 ∈M2.

Ist m′ ∈M2 \ 1, dann sei

m′ = r′1 ? · · · ? r′k (r′i ∈ E2)

die Darstellung von m′ aus Erzeugenden. Da f bijektiv von E1 auf E2 ist, gibt eseindeutig bestimmte ri ∈ E1 mit f(ri) = r′i und

m = r1 · · · rk

ist ein Element von M1 mit f(m) = m′. Man uberlegt sich wie oben, daß m eindeutigbestimmt ist. 2

BemerkungEine Abbildung f : X → Y zwischen den Alphabeten X und Y induziert immereinen Homomorphismus von [W (X) ,_, e] auf [W (Y ) ,_, e]. Allgemein kann man so-gar schreiben f : X →W (Y ).

1.6. WORTER 41

Folgerung 1.6.12Jede freie Halbgruppe mit endlichem Erzeugendensystem ist isomorph zu einer Wort-halbgruppe.

[N,+, 0, 1] ist eine Halbgruppe mit genau einem Erzeugenden und ist isomorph zu[W (|) ,_, e,

|]

[N,+, 0, 1] ist kommutativ, also auch[W (|) ,_, e,

|]

folglich ist jede freie Halbgruppe mit genau einem Erzeugenden kommutativ.

Es ist bekannt, daß man bei der Ubermittlung von Nachrichten mit 2 Zeichen aus-kommen kann (z. B. Computer: 0, 1). Frage: Warum nicht mit einem Zeichen? DerGrund liegt in der Kommutativitat, denn es gibt Halbgruppen, die nicht kommutativsind. Dazu unternehmen wir einen kurzen Ausflug in die

Codierungstheorie

Unter einer Codierung C verstehen wir eine Abbildung C : W (X) → W (Y ). Furdie im Alphabet X formulierte Nachricht p ∈ W (X) ist dann C(p) ∈ W (Y ) dieim Alphabet Y (z. B. Morse–Alphabet) codierte Nachricht, der Code von p. DieCodierung C ist decodierbar, wenn die Abbildung eindeutig umkehrbar ist, d. h. ausC(p) = C(q) stets p = q folgt.

Die einfachsten Codierungen sind sogenannte kombinatorische Codierungen, namlichHomomorphismen von W (X) in W (Y ), die ja bereits durch die TeilabbildungC : X → W (Y ) festgelegt sind. Fur ein Wort p = x1 · · ·xn ist dann C(p) =C(x1) · · ·C(xn).

Eine solche Codierung ist genau dann decodierbar, wenn die Unterhalbgruppe, dievon der Wertemenge C(x) | x ∈ X in der freien Halbgruppe W (Y ) erzeugt wird,frei erzeugt ist. Klar, denn um ein Wort q = y1 · · · ym ∈W (Y ) zu decodieren, d. h. esin der Form q = C(x1) · · ·C(xn) darzustellen, darf es nur eine solche Zerlegung von qin Elemente von C(x) | x ∈ X geben.

Der folgende Satz sagt aus, daß es zu jedem endlichen Alphabet eine decodierbareCodierung in ein zweielementiges Alphabet gibt.

Satz 1.6.13 (Hauptsatz der Codierungstheorie)In der freien Halbgruppe [W (a, b) ,_, e, a, b] mit genau zwei Erzeugenden existiertzu jedem k ≥ 1 eine freie Unterhalbgruppe mit genau k Erzeugenden.

BeweisSei k gegeben.

Ek =Def a b︸︷︷︸1

a, . . . , a b . . . b︸︷︷︸k

a

Sei E?k die Menge aller Worter, die durch endlich oftmaliges Verketten von Elementenaus Ek entstehen. Hk = [E?k ,

_, e, Ek] ist frei, die Codierung C mit C(xk) = a b . . . b︸︷︷︸k

a

ist decodierbar. 2


1.6.2 Induktive Beweise in [W (X) ,_, e, X]

Beispiel [N,+, 0, 1]Um zu zeigen, daß eine Aussage H (n) fur alle n aus N gilt, genugt es zu zeigen:

A) H (0)

I) Wenn H (n), so H (n+ 1).

Wir verallgemeinern diese Aussage fur Halbgruppen mit beliebigem Erzeugendensy-stem:

InduktionstheoremUm zu zeigen, daß eine Aussage H auf alle Elemente p einer Halbgruppe [M, , 1, E]mit dem Erzeugendensystem E zutrifft, genugt es zu zeigen

A) H (1)

I) Fur alle Erzeugenden x gilt: Wenn H (r) und x ∈ E, so H (r x)(bzw.: Wenn H (r) und x ∈ E, so H (x r))

Beweis des Induktionstheoremserfolgt indirekt:

Nehmen wir an, daß es Elemente q ∈ M gibt, auf die H nicht zutrifft. Unter diesenElementen kommt das Einselement nicht vor, weil H (1) gilt (Anfangsschritt). Jedesdieser Elemente besitzt also eine Darstellung

q = q1 q2 · · · qk

aus Erzeugenden qi ∈ E. Es sei q? ein Element mit einer kurzesten Darstellung

q? = q?1 · · · q?k? (k? minimal).

Wir setzen q?? = q?1 · · · q?k?−1 falls k? ≥ 2 und q?? = 1 falls k? = 1. Wegen derMinimalitat von k? gilt H (q??) und es ist

q? = q?? q?k? , q?k? ∈ E

Aus I) erhalten wir damit H (q?); Widerspruch. 2

Auch das Prinzip der ordnungstheoretischen Induktion kann auf (freie) Halbgruppenubertragen werden:

Bemerkung (Ordnungstheoretische Induktion in [N,≤])Um zu zeigen, daß eine Aussage H fur alle n ∈ N gilt, ist z. z.: Wenn H auf alle k < nzutrifft, so trifft H auf n zu.

Definition 1.6.14 (Relationen in W (X))

1. p in q ↔Def es gibt Worter r, s mit q = rps

2. p v q (p ist Anfangsstuck von q) ↔Def Es gibt s mit q = ps

3. p w q (p ist Endstuck von q) ↔Def Es gibt r mit q = rp

Satz 1.6.15 (Halbordnungen in W (X))[W (X), in ], [W (X),v ], [W (X),w ] sind reflexive Halbordnungen.

1.6. WORTER 43

BeweisWir zeigen hier nur, daß in folgende Eigenschaften hat:

• reflexiv: p in p (r, s = e)

• transitiv: p in q und q in r, so p in r(q = r1ps1, r = r2qs2 und mit r3 = r2r1 und s3 = s1s2 folgt r = r3ps3)

• antisymmetrisch: p in q und q in p so p = q(q = r1ps1, p = r2qs2 und mit r1, r2, s1, s2 = e folgt p = q)

2

Ubung 15Man fuhre die restlichen Beweise analog.

Folgerung 1.6.16Wenn p in q so l (p) ≤ l (q).Wenn p v q so l (p) ≤ l (q).Wenn p w q so l (p) ≤ l (q).

Satz 1.6.17 (Ordnungstheoretische Induktion in W (X))Um zu zeigen, daß eine Aussage H auf alle p ∈ W (X) zutrifft, genugt es zu zeigen,daß fur alle p gilt:

Wenn fur alle r mit r in p (bzw. r v p bzw. r w p) und r 6= p stets H (r)gilt, so gilt H (p).

Nehmen wir an, daß H nicht fur alle p ∈ W (X) gilt, dann existiert ein kurzestesWort p so, daß H nicht auf p zutrifft. Alle r mit r in p (bzw. r v p bzw. r w p) undr 6= p sind aber echt kurzer als p, d. h. H trifft auf alle Worter r zu; folglich trifft Hauf p zu. Widerspruch.

1.6.3 Induktionsbeweise in Algebren [M, Φ, E]

Wir betrachten eine beliebige Algebra [M,Φ, E] mit Erzeugendensystem E. Hierbeiist M eine Menge, Φ ist eine Menge von Abbildungen φ : M × · · · ×M → M undE ist eine Teilmenge von M derart, daß jedes Element von M aus Elementen von Edurch Anwendung von Funktionen aus Φ erzeugt werden kann.

Beispiel[Mfin, +a|a ∈ E , ∅

]Dabei ist die Funktion +a fur a ∈ E (die Allmenge erster Stufe) und N ∈ Mfindefiniert als +a (N) =Def N ∪ a. Es ist also zum Beispiel

a, b, c = +c (+b (+a (∅))) .

Um zu zeigen, daß H (m) fur alle m ∈M gilt, genugt es zu zeigen, daß

1. H (x) fur alle Erzeugenden x ∈ E gilt (Anfangsschritt)

2. Fur alle φn ∈ Φ, a1 . . . , an ∈M mit H (a1) , . . . , H (an) gilt:

H(φn (a1, . . . an)︸︷︷︸

∈M

)


1.6.4 Induktive Definitionen

Eine induktive Definition einer (k+1)-stelligen Funktion f im Bereich der naturlichenZahlen folgt dem Schema

f (x1, · · · , xk, 0) = g (x1, · · · , xk)f (x1, · · · , xk, n+ 1) = h (x1, . . . , xk, n, f (x1, . . . , xk, n))

Die Definition ist implizit, da f auf der rechten und auf der linken Seite vorkommt.Eine implizite Definition muß gerechtfertigt werden:

Satz 1.6.18 (Dedekindscher Rechtfertigungssatz)Sind g, h Funktionen, so gibt es genau eine Funktion f , die das Schema erfullt.

BeweisWir zeigen

1. es existiert eine Funktion f

2. es existiert genau eine Funktion f .

Einzigkeit:Es seien f1, f2 Funktionen, die das Gleichungssystem erfullen.

Wir zeigen durch Induktion uber i, daß fur alle x1, . . . , xk, i

f1 (x1, . . . , xk, i) = f2 (x1, . . . , xk, i)

ist.

Im Anfangsschritt ist i = 0, also

f1 (x1, . . . , xk, i) = f1 (x1, . . . , xk, 0)= g (x1, . . . , xk)= f2 (x1, . . . , xk, 0)= f2 (x1, . . . , xk, i)

Im Induktionschritt schließen wir von i auf i+ 1:

f1 (x1, . . . , xk, i+ 1) = h (x1, . . . , xk, i, f1 (x1, . . . xk, i))= h (x1, . . . , xk, i, f2 (x1, . . . xk, i)) (Voraussetzung)= f2 (x1, . . . , xk, i+ 1)

Existenz:Zum Beweis der Losbarkeit des Gleichungssystems losen wir die induktive De-finition in eine unendliche Folge von expliziten Definitionen auf:

f0 (x1, . . . , xk, j) :=g (x1, . . . , xk) , fur j = 0nicht definiert, sonst

f1 (x1, . . . , xk, j) :=

f0 (x1, . . . , xk, j) , fur j < 1h (x1, . . . , xk, 0, f0 (x1, . . . xk, 0)) , fur j = 1nicht definiert, sonst

...

fi+1 (x1, . . . , xk, j) :=

fi (x1, . . . , xk, j) , fur j < i+ 1h (x1, . . . , xk, i, fi (x1, . . . xk, i)) , fur j = i+ 1nicht definiert, sonst

...

1.7. SPRACHEN 45

Diese sind alles explizite Definitionen, die Funktionen fi existieren also gemaßden Mengenbildungsaxiomen.

Folglich existiert auch f mit

f (x1, . . . , xk, i) =Def fi (x1, . . . , xk, i)

und es gilt

f (x1, . . . , xk, 0) = f0 (x1, . . . , xk, 0)= g (x1, . . . , xk)

sowie

f (x1, . . . , xk, i+ 1) = fi+1 (x1, . . . , xk, i+ 1)= h (x1, . . . xk, i, fi (x1, . . . , xk, i))= h (x1, . . . xk, i, f (x1, . . . , xk, i))

d. h. f erfullt das Gleichungssystem.

2

BemerkungDieses Definitionsprinzip kann auf Worthalbgruppen verallgemeinert werden (also aufbeliebige freie Halbgruppen), aber nicht auf beliebige Halbgruppen oder gar auf be-liebig erzeugte Algebren.

Es seien X,Y beliebige Mengen und X ein Alphabet. Um eine Abbildung f : X ×W (X)→ Y zu definieren genugt es anzugeben

• eine Abbildung g : X→ Y

• zu jedem x ∈ X eine Abbildung hx : X×W (X)×Y→ Y

Die Definition von f sieht dann so aus:

f (x, e) = g (x)f (x, px) = hx (x, p, f (x, p))

x ∈ Xp ∈W (X)x ∈ X

Dieses Gleichungssystem (bestehend aus card (X) + 1 Gleichungen) wird von genaueiner Funktion f : X×W (X)→ Y erfullt.

1.7 Sprachen

Wir haben die Theorie der Worter mit dem Ziel entwickelt, mathematische Modellezu bilden, d .h. Modelle, deren Elemente Worter sind. Dazu fixieren wir ein (endliches)Alphabet X und betrachten die Menge W (X). Im allgemeinen zeigt sich sofort, daßnicht allen Wortern uber X eine Bedeutung zukommt, nur gewisse wohlbestimmteWorter haben eine Bedeutung, diese bilden die Sprache L des Modells.


1.7.1 Grundbegriffe

Definition 1.7.1 (Sprache)Ist X 6= ∅ ein endliches Alphabet, so wird jede Teilmenge L der Menge aller Worteruber dem Alphabet X, also

L ⊆W (X)

als Sprache uber X bezeichnet.

Im Sinne der Sprachwissenschaft erfaßt diese Definition nur geschriebene Sprache,also Texte.

BeispielFur die deutsche Sprache nehmen wir als Alphabet die Menge aller deutschsprachigenWorter in allen grammatischen Formen, die deutsche Sprache ist dann gegeben alsMenge aller Worter uber diesem Alphabet (also aller endlichen Folgen von deutschenWortern), die (syntaktisch) richtig gebildete Satze sind, auch wenn ihr semantischerInhalt dunkel bleibt oder als sinnleer empfunden wird.

Satz 1.7.2Fur ein gegebenes endliches Alphabet X ist W (X) eine abzahlbar unendliche Mengeund P (W (X)), die Menge aller Sprachen uber X, ist uberabzahlbar.

Fur die Bildung mathematischer Modelle interessante Sprachen sind unendlich. Da-mit entsteht die Frage nach (endlichen) Beschreibungen fur Sprachen, denn zur Be-schreibung des Modells gehort die Beschreibung ”seiner Syntax“, als der Sprache desModells.

Wir konnen eine Sprache L ⊆ W (X) als hinreichend beschrieben (abgegrenzt) anse-hen, wenn wir

(a) ein Erzeugungsverfahren angeben konnen, mit dessen Hilfe jedes Element p ∈ L(und kein Element aus W (X) \ L) hergestellt werden kann

oder

(b) ein Akzeptierungsverfahren (oder Entscheidungsverfahren) angeben konnen, mitdessen Hilfe von jedem p ∈W (X) festgestellt werden kann, ob p ∈ L ist.

Ein Vorgehen nach (a) ware eine Formalisierung der Fahigkeit eines Sprechers von L,nur richtig gebildete Satze der Sprache L zu produzieren, wahrend (b) die Fahigkeiteines Horers der Sprache L formalisiert, nur richtig gebildete Satze zu akzeptieren.

BeispielEin Programmierer in der Sprache MODULA ist in diesem Sinne ein Sprecher,wahrend der M2-Compiler den Horer realisiert.

Zur Formalisierung des Sprecher–Aspekts dient der Begriff der Grammatik, den wirim folgenden fur den wichtigen Spezialfall der kontext-freien Grammatik definieren:

Definition 1.7.3 (kontextfreie Grammatik)G = [X,H, s,R] ist eine kontextfreie Grammatik, wenn

1. X, H sind endliche nichtleere disjunkte Mengen, d. h. X ∩H = ∅

2. s ∈ H ist das Satzsymbol oder Startsymbol von G

1.7. SPRACHEN 47

3. R ist eine endliche Teilmenge von H ×W (X ∪H).

Dabei ist X das Alphabet der zu beschreibenden Sprache, die Elemente von H werdenHilfssymbole (oder auch – in der Linguistik – syntaktische Kategorien) genannt unddie Elemente von R werden als Ersetzungsregeln bezeichnet (oder Ableitungsregeln).Die Idee ist, daß jedes Wort p ∈ L aus dem Startsymbol s mittels Regeln aus R

”abgeleitet“ werden kann und nur die p ∈ L diese Eigenschaft haben.

Definition 1.7.4 (Ableitbarkeit in einem Schritt)Es sei w1,w2 ∈W (X ∪H). Dann ist aus w1 das Wort w2 in einem Schritt mittels Rableitbar:

w1 7−→1R w2

wenn es h ∈ H und Worter p, q, r ∈W (X ∪H), so gibt, daß

w1 = p h q, w2 = p r q und [h, r] ∈ R ist.

w2 entsteht also aus w1 = p h q dadurch, daß h, die linke Seite der Ersetzungsregel[h, r] ∈ R, durch das Wort r, die rechte Seite der Ersetzungsregel, ersetzt wird. Manschreibt daher statt [h, r] ∈ R auch h −→ r ∈ R.

Definition 1.7.5 (Ableitbarkeit)Mit 7−→∗R bezeichnen wir die reflexiv-transitive Hulle der Relation 7−→1R .

Folgerung 1.7.6Es gilt w 7−→∗R w′ genau dann, wenn w = w′ ist oder endlich viele Worter w1, . . . , wn(n ≥ 0) existieren mit

w 7−→1R w1 7−→1R · · · 7−→1R wn 7−→1R w′.

Definition 1.7.7 (erzeugte Sprache)Die von einer Grammatik G erzeugte Sprache L ist

L(G) =Def

p | p ∈W (X) ∧ s 7−→∗R p

1.7.2 Beispiel: Sprache der Mengengleichungen

Als Beispiel wollen wir die Sprache der Mengengleichungen, die wir im Zusammenhangmit dem Dualitatstheorem verbal beschrieben haben, durch eine Grammatik erzeugen.

Eine Mengengleichung hat die Form T1 = T2, wobei T1, T2 Mengenterme sind, Termesetzen sich aus Mengenvariablen, den Operationszeichen und Klammern zusammen,Mengenvariablen Mi schreiben wir als ein Wort der Form M ? · · · ?︸︷︷︸

i

.

Wir setzen also X = M,?,=, (, ),∩,∪ und H = S, T, V (S ist das Startsymbol,T steht fur Term, V fur Variable).

Die Menge R der Regeln ist

S −→ T = T T −→ V

T −→ (T ∩ T ) T −→ (T ∪ T )V −→ M V −→ V ?

Wir konnen nun die Gleichung M0 ∩ (M0 ∪M1) = M0, d. h.

(M ∩ (M ∪M?)) = M

als Element von L ([X,H, S,R]) wie folgt nachweisen:

S 7−→1R T = T 7−→1R T = V

7−→1R T = M 7−→1R (T ∩ T ) = M

7−→1R (T ∩ (T ∪ T )) = M 7−→1R (V ∩ (T ∪ T )) = M

7−→1R (M ∩ (T ∪ T )) = M 7−→1R (M ∩ (V ∪ T )) = M

7−→1R (M ∩ (M ∪ T )) = M 7−→1R (M ∩ (M ∪ V )) = M

7−→1R (M ∩ (M ∪ V ?)) = M 7−→1R (M ∩ (M ∪M?)) = M

1.7.3 Weitere Grundbegriffe

Kontextfreie Grammatiken spielen eine große Rolle bei der Definition von Program-mierspachen. Dabei geht man i. a. so vor, daß eine kontextfreie Grammatik angegebenwird, die alle compilierbaren Programme und einige weitere Worter erzeugt und da-nach durch weitere Forderungen (” alle Variablen mussen deklariert sein“,. . . ) die

”richtigen“ Programme bestimmt werden. Die Grammatik wird uns dabei in der so-genannten Backus–Nauer–Form (BNF) angegeben:

Die syntaktischen Kategorien sind durch spitzgeklammerte Worter gege-ben, statt ”→“ schreibt man ”::=“, Regeln mit gleicher linker Seite werdenzusammengefaßt.

In unserem Beispiel ergibt sich

〈gleichung〉 ::= 〈term〉 ’=’ 〈term〉〈term〉 ::= 〈variable〉 | ’(’ 〈term〉 ’∩’ 〈term〉 ’)’ |

’(’ 〈term〉 ’∪’ 〈term〉 ’)’〈variable〉 ::= ’M’ | 〈variable〉 ’?’

Zu den kontextfreien Grammatiken gehort als Akzeptierungsmechanismus der soge-nannte Kellerautomat; diese Begriff wird in der Compilertechnik intensiv behandelt.

Naturlich konnen Sprachen auch in anderer Weise, z.B. durch Induktion, definiertwerden. Wir werden Beispiele im nachsten Kapitel kennenlernen.

Kapitel 2

Aussagenlogik

In diesem Kapitel beschaftigen wir uns mit der Formalisierung eines Teilbereichs desmenschlichen Denkens, dem logischen Schließen. Wir wollen ein mathematisches Mo-dell dieses Teilbereiches angeben, das uns gestattet, logisches Schließen durch Rechnenzu ersetzen; dadurch konnen logische Schlusse uberpruft werden.

Logisches Schließen ist eine Operation mit Aussagen, die auf der Basis von sogenann-ten Schlußregeln arbeitet. Von einer richtigen Schlußregel erwartet man, daß sie vongultigen Aussagen zu gultigen Aussagen fuhrt.

Es sind also zunachst folgende Fragen zu klaren:

• Was ist eine Aussage?

• Wann ist eine Aussage wahr?

• Was ist eine gultige Schlußregel?

2.1 Grundbegriffe

Unter einer Aussage verstehen wir die sprachliche Widerspiegelung eines Sachverhalts(in Form eines Aussagesatzes).

BeispieleEs regnet; wenn es regnet, dann ist die Straße naß.

Eine Aussage wird wahr genannt, wenn der ausgedruckte Sachverhalt vorliegt. DieAussage ”es regnet“ ist also genau dann wahr, wenn es regnet.

In der Realitat ist haufig unklar, ob eine Aussage wahr ist oder nicht, weil Maßstabeunscharf sind, z. B. ”Gestern war schlechtes Wetter“. Wir gehen hier von einer Idea-lisierung der wirklichen Verhaltnisse aus und verlangen als Axiom:

Satz der ZweiwertigkeitJede Aussage ist entweder wahr oder falsch.

Diese Idealisierung hat sich insbesondere in der Mathematik und der Informatik be-wahrt. Die sogenannte Fuzzy–Logik bietet Ansatze, ohne dieses Axiom auszukommen.

Nach dem Satz der Zweiwertigkeit zerfallt die Menge aller Aussagen erschopfend unddisjunkt in zwei Klassen, die Menge W aller wahren Aussagen und die Menge F aller

50 KAPITEL 2. AUSSAGENLOGIK

falschen Aussagen. Wir nennen W und F die Wahrheitswerte; wir haben also genauzwei Wahrheitswerte.

Neben den Sachverhalten selbst beobachten wir in der Realitat Beziehungen zwischenSachverhalten, die sich in Beziehungen und Operationen mit Aussagen widerspiegeln.

Eine n-stellige Aussagenfunktion α ist also eine Abbildung, die jedem n-Tupel vonAussagen eine Aussage zuordnet. Einige wichtige Aussagenfunktionen spiegeln sichsprachlich sehr einfach in Bindewortern wider, z. B.

• Konjunktion ”und“ und(A,B) = AundB

• Alternative ”oder“ oder(A,B) = A oderB

• Negation ”nicht“ nicht(A) = nichtA

• Implikation ”wenn. . . , so. . .“

• Aquivalenz ”genau dann, wenn“

Aussagen, wahre wie falsche, konnen nach verschiedenen Gesichtspunkten geordnetwerden, z. B. nach Wissensgebieten (etwa Physik, Mathematik, . . . ). Wir strebenhier eine Formalisierung der Logik an, die in allen Gebieten anwendbar ist, in denenlogisch gedacht wird. Damit stellt sich die Frage, welche Eigenschaften von Aussagenin unserem Formalismus (dem Aussagenkalkul) widergespiegelt werden sollen.

Wir beantworten diese Frage einschrankend: die einzige Eigenschaft ist Wahrheit bzw.Falschheit. Wir berucksichtigen hier beispielsweise nicht, daß Aussagen etwas uber ein-zelne Gegenstande aussagen (”3 ist eine Primzahl“) oder die Struktur einer Allaussagehaben (”jede Aquivalenzrelation ist transitiv“); das wird erst in der Pradikatenlogik(ab Seite 123) geschehen.

Was geschieht bei dieser Abstraktion Aussage → Wahrheitswert mit den Aussagen-verbindungen (Aussagenfunktionen)? Mit anderen Worten, kann zu jeder Aussagen-funktion

α :×nA→ A,

wobei A die Menge aller Aussagen ist, eine Wahrheitsfunktion

φ :×nW,F → W,F ,

d. h. eine Abbildung, die jedem n-Tupel von Wahrheitswerten einen Wahrheitswertzuordnet, gefunden werden, so daß fur A1, . . . , An gilt:

WW(α(A1, . . . , An)) = φ(WW(A1), . . . ,WW(An))

wobei WW die Funktion ist, die jeder Aussage A ihren Wahrheitswert WW(A) zu-ordnet, also W wenn A wahr ist und F sonst.

Fur die Aussagenfunktion ”und“ funktioniert das offensichtlich; die Wahrheitsfunktionet mit der Tabelle

w1 w2 et(w1, w2)W W WW F FF W FF F F

2.2. SYNTAX UND SEMANTIK DES AUSSAGENKALKULS 51

leistet das Verlangte, denn die Aussage ”A und B“ ist genau dann wahr, wenn dieAussage A wahr ist und die Aussage B wahr ist.

Definition 2.1.1 (Extensionale Aussagenfunktion)Eine Aussagenfunktion α :×

nA→ A heißt extensional, wenn es eine Wahrheitsfunk-

tion (Boolesche Funktion) φ :×nW,F → W,F so gibt, daß fur alle A1, . . . , An ∈

A giltWW(α(A1, . . . , An)) = φ(WW(A1), . . . ,WW(An))

Die Aussagenfunktion ”und“ ist also extensional, man stellt leicht fest, daß dasselbefur ”oder“, ”nicht“, ”wenn. . . , so. . .“ und ”genau dann, wenn“ gilt; die zugehorigen(sogenannten klassischen) Wahrheitsfunktionen werden als vel, non, seq (von sequitur)und aeq bezeichnet:

w1 w2 vel(w1, w2) seq(w1, w2) aeq(w1, w2) non(w1)W W W W W FW F W F F FF W W W F WF F F W W W

Gibt es uberhaupt Aussagenfunktionen, die nicht extensional sind, die wir also nichtdurch Wahrheitsfunktionen widerspiegeln konnen? Das ist der Fall, als Beispiel be-trachte man die Aussagenfunktionen ”weil“ bzw. ”damit“:

weil(A,B) = A, weilBdamit(A,B) = A, damitB

die eine kausale bzw. pragmatische Beziehung beschreiben. Diese Aussagenfunktionenkonnen also nicht durch Wahrheitsfunktionen reprasentiert werden.

2.2 Syntax und Semantik des Aussagenkalkuls

2.2.1 Aufbau des Kalkuls — Syntax

In unserem Kalkul brauchen wir Variable fur Wahrheitswerte, die wir Aussagenva-riable nennen werden, und Zeichen (Funktoren) fur Wahrheitsfunktionen. Aus denZeichen p und ? bilden wir Worter, unter denen die Aussagenvariablen ausgezeichnetwerden, ferner verwenden wir

¬ als Zeichen fur die Wahrheitsfunktion non∧ als Zeichen fur die Wahrheitsfunktion et∨ als Zeichen fur die Wahrheitsfunktion vel→ als Zeichen fur die Wahrheitsfunktion seq↔ als Zeichen fur die Wahrheitsfunktion aeq

sowie die technischen Zeichen ( und ). Das Alphabet des Aussagenkalkuls ist also

X = p, ?,¬,∧,∨,→,↔, ), (


Aussagenvariablewird induktiv definiert:

A) p ist eine Aussagenvariable

I) Ist das Wort w eine Aussagenvariable, so auch w_?

Die Menge AV der Aussagenvariablen ist die kleinste Menge von Wortern uberX, die das Wort p enthalt, und abgeschlossen ist in bezug auf das Anhangen desZeichens ?.

AV = p ? · · · ?︸︷︷︸i

|i ≥ 0

Schreibweise: p? wird abgekurzt als q, p ? ? als r, allgemein p ? · · · ?︸︷︷︸i

als pi.

Ausdruckwird ebenfalls induktiv definiert:

A) Jede Aussagenvariable ist ein Ausdruck

I) Sind H1, H2 Ausdrucke, so auch die folgenden Zeichenreihen:¬H1,(H1 ∧H2), (H1 ∨H2), (H1 → H2), (H1 ↔ H2).

Die Menge ausd der Ausdrucke ist die kleinste Menge von Wortern, die alle Aus-sagenvariablen enthalt und abgeschlossen ist bezuglich der unter I) angegebenenKonstruktionen.

Ubung 16Geben sie eine Grammatik G mit L (G) = ausd an.

BeispieleEs sind ¬p, (¬p ∨ p), ((¬p7 ∧ p5)→ p1) Ausdrucke; keine Ausdrucke: e, 11, (p).

Folgerung 2.2.1Durch die Klammerung ist fur jeden Ausdruck kenntlich, auf welche Weise er aus Aus-sagenvariablen oder einfacheren Ausdrucken aufgebaut ist, genauer: jeder Ausdruckkann auf genau eine Weise aus Aussagenvariablen aufgebaut werden. Die Menge ausdbildet daher mit dem Erzeugendensystem AV und den angegebenen Konstruktionsope-rationen eine freie Struktur, so daß wir im folgenden Funktionen induktiv auf ausddefinieren konnen.

Bei der Schreibweise von Ausdrucken konnen folgende Klammersparregeln verwendetwerden:

1. Außenklammern weglassen.

2. Klammern in mehrfachen Alternativen oder Konjunktionen weglassen.

3. Vorrangregeln

• ∧ bindet starker als ∨• ∨ bindet starker als →• → bindet starker als ↔


Beispiele

• p ∧ q ∨ r ∧= (p ∧ q) ∨ r

• p↔ r → q∧= p↔ (r → q)

Satz 2.2.2Es gibt einen Algorithmus, der fur jedes Wort w ∈ W (X) entscheidet, ob w ∈ ausdist.

2.2.2 Semantik

Ein Kalkul κ ist gegeben durch sein Alphabet (hier X), die Menge (Sprache) derin diesem Kalkul sinnvollen Worter uber diesem Alphabet (hier ausd) und seine Se-mantik, d. h. eine Zuordnung von Bedeutungen zu den Wortern seiner Sprache. BeiLogikkalkulen besteht die Angabe der Semantik aus der Menge S der (gultigen) Satzeund einem Deduktionsoperator.

Um uber Gultigkeit eines Ausdruckes reden zu konnen, definieren wir zunachst denWahrheitswert, den ein Ausdruck bei einer Belegung der Aussagenvariablen annimmt.

BelegungEine Abbildung β : AV → W,F der Menge AV der Aussagenvariablen in dieMenge W,F der Wahrheitswerte heißt Belegung.

Wert eines Ausdruckswert (H,β) wird induktiv uber den Aufbau von Ausdrucken definiert:

A) wert (pi, β) = β (pi)

I) – wert (¬H,β) = non (wert (H,β))

– wert ((H1 ∧H2) , β) = et (wert (H1, β) ,wert (H2, β))

– wert ((H1 ∨H2) , β) = vel (wert (H1, β) ,wert (H2, β))

– wert ((H1 → H2) , β) = seq (wert (H1, β) ,wert (H2, β))

– wert ((H1 ↔ H2) , β) = aeq (wert (H1, β) ,wert (H2, β))

LemmaEs sei H ein Ausdruck, in dem genau die Variablen pj1 , . . . , pjk vorkom-men. β, β′ seien Belegungen, die auf pj1 , . . . , pjk ubereinstimmen. Dann istwert (H,β) = wert (H,β′).

Definition 2.2.3Es sei H ∈ ausd, pj1 , . . . , pjn (j1 < · · · < jn) alle in H vorkommenden Aussagenva-riablen.

ΦH (w1, . . . , wn) := wert (H,β?) , wobei β? (pji) = wi fur 1 ≤ i ≤ n

ist die von H reprasentierte Wahrheitsfunktion.

ΦH (β? (pj1) , . . . , β? (pjn)) = wert (H,β?) fur alle Belegungen β?.


Damit haben wir jedem Ausdruck eine Wahrheitsfunktion zugeordnet, die seine Be-deutung ist, denn er reprasentiert diese Wahrheitsfunktion im Kalkul. Es entstehtdie Frage, ob alle Wahrheitsfunktionen durch Ausdrucke dargestellt werden konnen,oder ob wir beim Ubergang von Wahrheitsfunktionen zu Ausdrucken wieder etwasverlieren wie beim Ubergang von Aussagenfunktionen zu Wahrheitsfunktionen.

ReprasentantentheoremZu jeder Wahrheitsfunktion Φ existiert ein Ausdruck H mit ΦH = Φ.

BeweisSei Φ gegeben durch die Tabelle:

w1 . . . wn Φ(w1, . . . , wn)W . . . W Φ(W, . . . ,W)

......

Eine Elementarkonjunktion in p1, . . . , pn ist ein Ausdruck H der Form:

H : [¬] p1 ∧ [¬] p2 · · · ∧ [¬] pn

Sei H eine Elementarkonjunktion. Dann ist wert (H,β) = W genau dann, wenn furi = 1, . . . , n gilt:

β (pi) =

W, falls vor pi kein ¬ stehtF, falls vor pi ein ¬ steht

Beispielp1 ∧ ¬p2 ∧ p3 : β (p1) = W, β (p2) = F, β (p3) = W.

Fall 1: Φ = falsum, d. h. Φ(w1, . . . , wn) ≡ F, dann sei

H := (p1 ∧ ¬p1) ∨ (p2 ∧ ¬p2) ∨ . . . ∨ (pn ∧ ¬pn)

also gilt ΦH = Φ

Fall 2: Φ 6= falsum, d. h. es gibt n-Tupel [w1, . . . , wn] mit Φ (w1, . . . , wn) = W.

Es seien β1, . . . , βk alle Belegungen βi der Aussagenvariablen p1, . . . , pn so, daßΦ (βi (p1) , . . . , βi (pn)) = W ist. Zu βi sei Ki die Elementarkonjunktion mitwert (Ki, βi) = W. Dann leistet

H := K1 ∨K2 ∨ · · · ∨Kk

das Verlangte, d. h. ΦH = Φ.

2

2.2.3 Weitere semantische Begriffe

Oben im Abschnitt 2.2.1 haben wir ohne weitere Begrundung ¬ als Zeichen fur non,∧ als Zeichen fur et, . . . betrachtet, zuvor haben wir uns auf zwei Wahrheitswerteeingeschrankt. Wir konnen die Sprache ausd des Aussagenkalkuls aber auch in andererWeise interpretieren, d. h. den Ausdrucken eine andere Bedeutung zuweisen, wenn wirfestlegen,


• was die Menge M aller Wahrheitswerte ist,

• welche Wahrheitswerte wir als ”gute“ Werte betrachten, diese bilden die MengeM? ⊆M ,

• welche einstellige Funktion φ1 : M →M das Zeichen ¬ bedeutet und

• welche zweistelligen Funktionen φ2, . . . , φ5 : M ×M →M die Zeichen ∧, ∨, →und ↔ bedeuten sollen.

Ein Tupel µ = [M,M?, φ1, φ2, φ3, φ4, φ5] dessen Elemente obigen Eigenschaftengenugen, also eine Zusammenfassung dieser Angaben, nennen wir eine logische Ma-trix.

Beispiel 1: Die klassische logische Matrix

[W,F , W ,non, et, vel, seq, aeq]

Beispiel 2: Die wahrscheinlichkeitslogische Matrix

M := das reelle Intervall [0, 1]M? := 1

φ1(w) := 1− wφ2(w1, w2) := w1 · w2

φ3(w1, w2) := 1− (1− w1) · (1− w2)φ4(w1, w2) := φ3(1− w1, w2) = 1− w1 · (1− w2)φ5(w1, w2) := φ4(w1, w2) · φ4(w2, w1)

Entsprechend wie wir fruher den Wert eines Ausdrucks H bei einer Belegung der Aus-sagenvariablen mit Wahrheitswerten definiert haben, konnen wir jetzt auch allgemeinfestlegen:

Definition 2.2.4 (Belegung und Wert)Fur eine beliebige logische Matrix µ ist

1. die Belegung der Aussagenvariablen eine Abbildung β : AV →MBµ = β|β : AV →M ist die Menge aller Belegungen; fur die klassische logi-sche Matrix ist B = β|β : AV → W,F

2. der Wert eines Ausdrucks, d. h. wertµ (H,β), analog zu wert (H,β) induktivdefiniert.

BeispielEin Teil der induktiven wert–Definition sieht wie folgt aus:

wertµ ((H1 ∧H2) , β) = φ2 (wertµ (H1, β) ,wertµ (H2, β))

Wir fuhren nun die folgenden semantischen Begriffe fur die klassische logische Matrixein:


Erfullbarkeit, GultigkeitSei β ∈ B und H ∈ ausd.

1. β erfullt H (βerfH) :↔ wert (H,β) = W

In der logischen Matrix µ gilt: βerfµH :↔ wertµ (H,β) ∈M?

2. H ist erfullbar (H ∈ ef, efH), wenn eine Belegung β ∈ B existiert so, daßβerfH.

3. H ist (allgemein–)gultig (H ∈ ag, agH), wenn jede Belegung β ∈ B denAusdruck H erfullt. (H ist eine Identitat, bzw. Tautologie.)

In der logischen Matrix µ gilt: H ∈ agµ gdw. fur jede Belegungβ gilt wertµ (H,β) ∈M?

4. H ist Kontradiktion (H ∈ kt, ktH), wenn es keine Belegung β gibt, die Herfullt.

Folgerung 2.2.5Fur ag, ef und erf gilt:

1. ag ⊂ ef

2. agH gdw. nicht ef¬H; efH gdw. nicht ag¬H

3. Wenn βerfH, so nicht βerf¬H

Außerdem gilt:

Satz 2.2.6 (Ausgeschlossener Widerspruch fur die Gultigkeit)Es gibt keinen Ausdruck H mit agH und ag¬H.

Satz 2.2.7 (Ausgeschlossener Dritte fur die Erfullbarkeit)Fur jedes H ∈ ausd gilt: efH oder ef¬H.

2.3 Anwendung in der Schaltalgebra

Als Schaltalgebra bezeichnet man die Anwendung des Aussagenkalkuls auf die Be-schreibung und die Berechnung von Schaltungen.

2.3.1 Grundbegriffe

Unter einer Schaltung verstehen wir eine black box, die Eingangssignale empfangt undin Ausgangssignale umwandelt, diese Signale haben nur zwei Signalwerte (Impuls/keinImpuls, hohes/niedriges Potential, An/Aus, . . . ) und konnen durch Zeitfunktionen (je-dem Zeitpunkt wird einer der beiden Signalwerte zugeordnet) beschrieben werden. Alskombinatorische oder logische Schaltung bezeichnen wir eine Schaltung mit folgenderEigenschaft:

Die Schaltung hat kein Gedachtnis, d. h. der aktuelle Wert eines Ausgangs-signals hangt hochstens von den aktuellen Werten der Eingangssignale ab(nicht aber von zeitlich fruheren oder kunftigeren Eingabesignalwerten)und ist durch diese Werte eindeutig bestimmt.

2.3. ANWENDUNG IN DER SCHALTALGEBRA 57

Daraus folgt, daß eine Anderung der Eingabesignalwerte verzogerungsfrei zu einereventuellen Anderung der Ausgabesignale fuhren muß.

Daher kann eine logische Schaltung S, die n Eingangssignale x1(t), . . . xn(t) in einAusgangssignal y(t) transformiert, durch eine n–stellige Boolesche Funktion ΦS cha-rakterisiert werden:

Bezeichnen wir die beiden moglichen Signalwerte mit 0 und 1, so gilt fur ΦS :

ΦS (WW (”x1(t) = 1“) , . . . ,WW (”xn(t) = 1“)) = WW (”y(t) = 1“)

Weil S eine logische Schaltung ist, ist die Abhangigkeit von t in dieser Definitions-gleichung nur fiktiv.

Wir wissen bereits, daß jede Boolesche Funktion durch einen Ausdruck des Aus-sagenkalkuls reprasentiert wird, wir konnen also jede logische Schaltung mit einemAusgang syntaktisch durch den Ausdruck HS = HΦS beschreiben. Logische Schal-tungen mit mehr als einem Ausgang konnen wir durch eine Menge von Ausdruckenbeschreiben, jedem Ausgang entspricht ein Ausdruck. Im folgenden betrachten wirnur noch logische Schaltungen mit genau einem Ausgang.

Definition 2.3.1 (Aquivalente Schaltungen)Zwei Schaltungen werden aquivalent genannt, wenn sie die gleiche Signalverarbeitungrealisieren, d. h. jede von ihnen kann in jeder Umgebung durch die andere ersetztwerden, ohne daß sich das Verhalten des Gesamtsystems andert.

Satz 2.3.2Die Aquivalenz von Schaltungen spiegelt sich als semantische Aquivalenz zugehorigerAusdrucke wider:

S1 ∼ S2 gdw. HS1 ∼sem HS2 (d. h. (H1 ↔ H2) ∈ ag)

Diese Tatsache ermoglicht es zu unterscheiden, ob Schaltungen aquivalent sind unddamit auch, in gewisser Hinsicht optimale Schaltungen zu finden.

Wir betrachten einen wichtigen Spezialfall, sogenannte ∧∨– Schaltungen. Dabei han-delt es sich um logische Schaltungen mit genau einem Ausgang, die

1. aus sogenannten Gattern aufgebaut sind, und zwar aus Konjunktions- und Al-ternativgattern, und

2. die zweistufig sind, wobei jedes Eingangssignal zuerst hochstens ein Konjunkti-onsgatter und dann hochstens ein Alternativgatter durchlauft.

Ein Konjunktionsgatter ist eine logische Schaltung, die die Konjunktion der Eingangs-signale oder ihrer Negation realisiert; bei n Eingangssignalen gibt es also 2n Konjunk-tionsgatter; ein Alternativgatter realisiert die Alternative der Eingangssignale, d. h.am Ausgang steht der Signalwert 1 sobald eines der Eingangssignale den Wert 1 an-nimmt. Auch hier konnen Eingangssignale negiert sein.

Solche Schaltungen werden strukturell beschrieben durch Alternative Normalformen,d. h. Ausdrucke der Form H = K1∨K2∨· · ·∨Km, wobei die Alternativglieder Ki Fun-damentalkonjunktionen sind, d. h. Konjunktionen von negierten und nichtnegiertenAussagenvariablen, in denen keine Variable mehrfach vorkommt.

Beispiel

H1 = (p1 ∧ p2) ∨ (¬p1 ∧ p2) ∨ (¬p1 ∧ ¬p2)H2 = ¬p1 ∨ p2


sind Alternative Normalformen (ANF);H1 ist die Kanonische Alternative Normalformder Funktion seq, H2 ist semantisch aquivalent mit H1, also eine ANF von seq. Diezugehorigen Schaltungen sehen so aus:

2

1

2

S1

S2

1x

x

y

y

x

x

x

x x>

x

1

x1 2

2x

x

1 x2

1 2>

>

>>

>

_

_ _

_

BemerkungOffenbar ist die Schaltung S2 ”besser“ als S1: Sie ist ubersichtlicher, benotigt wenigerGatter, usw.

Deshalb betrachten wir

2.3.2 Optimierte Schaltungen

Wir wahlen als Optimierungsgroße (als ”Kosten“) einer Schaltung des betrachtetenTyps die Zahl der Eingange in Konjunktionsgatter (wenn ein Signal vom Eingangdirekt in das Alternativgatter gefuhrt wird, durchlauft es sozusagen ein Konjunkti-onsgatter mit genau einem Eingang).

BeispielS1 hat die Kosten 6 und S2 die Kosten 2.

Die Kosten eine ∧∨–Schaltung S spiegeln sich in der zugehorigen ANF als Zahl derStellen, an denen Variablen stehen wider.

Dementsprechend fuhren wir ein:

Definition 2.3.3 (Optimale ANF)Eine ANF H mit den Variablen p1, . . . , pn ist optimal, wenn fur jede ANF H ′, in derhochstens die Variablen p1, . . . , pn vorkommen und die semantisch aquivalent zu H ist,gilt, daß die Zahl der Stellen, an denen in H ′ Aussagenvariablen stehen mindestensso groß ist wie in H.

Folgerung 2.3.4Die Aufgabe, eine ∧∨–Schaltung S zu optimieren, bedeutet also eine optimale ANFH zu finden mit

H ∼sem HΦS = HS


Diese Aufgabe ist im Prinzip durch Probieren losbar, in der Praxis muß man dasProbieren gezielt einschranken, aber ohne Probieren geht es i. a. nicht, denn i. a. gibt esviele optimale ANF zu einer gegebenen Schaltung bzw. einer gegebenen BooleschenFunktion.

Wir vereinfachen zunachst die Schreibweise von ANF:

• das Negationszeichen ¬ wird als Querstrich uber die Variable geschrieben

• das Konjunktionszeichen ∧ entfallt

Beispiel¬p ∧ q wird als p q geschrieben

Wir betrachten die folgende Aufgabe:

gegeben: Eine logische Schaltung S mit n Eingangen bzw. eine n–stellige BoolescheFunktion Φ

gesucht: Eine optimale ANF H? mit

H? ∼sem HS bzw. H? ∼sem HΦ

BeispielΦ sei gegeben durch die Tabelle

w1 w2 w3 Φ(w1, w2, w3)W W W WW W F WW F W WW F F FF W W FF W F WF F W WF F F W

Wir wahlen als Variablenmenge p, q, r und bilden die KANF von Φ:

H1 = p q r ∨ p qr ∨ pq r ∨ p q r ∨ p q r ∨ p q r

H1 hat die Kosten 18; ΦH1 = Φ

Den Zugang zur Vereinfachung der KANF bildet der Begriff des Primimplikanden.

Definition 2.3.5 (Implikand, Primimplikand)Φ sei n–stellige Boolesche Funktion, H ein Ausdruck mit ΦH = Φ

1. Eine Fundamentalkonjunktion K in p1, . . . , pn heißt Implikand von Φ (bzw.H), wenn fur alle Belegungen β (von p1, . . . , pn) gilt:

Wenn wert(K,β) = W, so Φ (β(p1), . . . , β(pn)) = W

(bzw. wert(H,β) =W.


2. K heißt Primimplikand von Φ (bzw. H), wenn

(a) K Implikand von Φ (bzw. H) ist

(b) keine Fundamentalkonjunktion K ′, die aus K durch Streichen einer Varia-ble (samt Querstrich) entsteht, ein Implikand von Φ ist.

Folgerung 2.3.6Aus der Definition ergibt sich sofort:

1. Alle Elementarkonjunktionen, die in der KANF von Φ vorkommen, sind Impli-kanden von Φ

2. K ist ein Implikand von H gdw. (K → H) ∈ ag

In unserem Beispiel ist also p q r ein Implikand, aber kein Primimplikand, denn durchStreichen der Variablen r entsteht p q und p q ist ein Implikand von Φ, wie manleicht nachrechnet. Allerdings ist p q ein Primimplikand, denn weder p noch q sindImplikanden von Φ.

Satz 2.3.7Φ : ×

nW,F → W,F sei nichtkonstant. Dann besitzt Φ eine ANF, die nur aus

Primimplikanden besteht.

BeweisEs sei H1 = K1 ∨ · · · ∨Kl eine KANF von Φ (0 < l < 2n). Wenn alle Elementarkon-junktionen Primimplikanden sind, ist nichts zu zeigen.

O. B. d. A. sei K1 kein Primimplikand und K ′1 sei ein Primimplikand, der aus K1

durch Streichen von Variablen entsteht. Dann gilt fur die Belegung β:

Wenn wert(K1, β) = W, so wert(K ′1, β) = W.

Wir zeigen:K ′1 ∨K2 ∨ · · · ∨Kl ist ANF von Φ,

d. h. fur alle Belegungen β gilt

Φ (β(p1), . . . , β(pn)) = W gdw. wert(K ′1 ∨K2 ∨ · · · ∨Kl, β) = W.

(⇐): Wenn wert(K ′1 ∨ K2 ∨ · · · ∨ Kl, β) = W ist, so ist wert(K ′1, β) = W oderwert(K2, β) = W oder . . . oder wert(Kl, β) = W.

Weil alle diese Konjunktionen Implikanden von Φ sind, ist

Φ (β(p1), . . . , β(pn)) = W.

(⇒): Ist Φ (β(p1), . . . , β(pn)) = W, so ist wert(K1 ∨K2 ∨ · · · ∨Kl, β) = W, es ist alsowert(K1, β) = W oder . . . oder wert(Kl, β) = W.

Folglich ist wert(K ′1, β) = W oder wert(K2 ∨ · · · ∨Kl, β) = W, d. h.

wert(K ′1 ∨K2 ∨ · · · ∨Kl, β) = W.

Der Ausdruck H ′1 = K ′1∨K2∨· · ·∨Kl enthalt also mindestens einen Primimplikandenmehr als H1, wenn H ′1 noch Implikanden enthalt, die nicht Primimplikanden sind, sosetzen wir das Verfahren fort. 2


Folgerung 2.3.8Jede optimale Normalform von Φ besteht nur aus Primimplikanden von Φ.

In unserem Beispiel sind folgende Fundamentalkonjunktionen Primimplikanden:

p q, p r, p q, q r, q r, p r

Es sei H2 die ANF, die aus allen Primimplikanden von Φ besteht. Dann gilt nachKonstruktion

Φ = ΦH2 ,

d. h. H2 ist eine ANF von Φ.

Im allgemeinen ist aber H2 nicht optimal. Weil jede optimale ANF von Φ nur ausPrimimplikanden besteht, kann jede optimale ANF von Φ aus H2 durch Streichen vonKonjunktionen gewonnen werden.

Wir geben zunachst ein Kriterium an, wann ein Primimplikand nicht gestrichen wer-den darf, d. h. wann er in allen optimalen ANF vorkommt.

Definition 2.3.9 (Wesentlicher Primimplikand)Es sei M eine Menge von Primimplikanden von Φ und K ∈ M. K heißt wesentlichin bezug auf M, wenn es eine Belegung β gibt mit

1. wert(K,β) = W

2. fur alle K ′ ∈M mit K ′ 6= K ist wert(K ′, β) = F.

Satz 2.3.10Es sei M die Menge aller Primimplikanden von Φ und K sei wesentlich in bezug aufM. Dann kommt K in jeder optimalen ANF von Φ vor.

BeweisEs sei H = K1 ∨ · · · ∨Km eine beliebige optimale ANF von Φ und β eine Belegungvon p1, . . . pn mit

1. wert(K,β) = W

2. wert(K ′, β) = F fur alle K ′ ∈M mit K ′ 6= K.

Weil K Implikand von Φ ist, folgt aus wert(K,β) = W

W = Φ (β(p1), . . . , β(pn)) = wert(K1 ∨ · · · ∨Km, β) = W

d. h. fur wenigstens ein i ist wert(Ki, β) = W.

Aus Ki ∈M und (2) folgt Ki = K, d. h. K kommt in H vor. 2

Folgerung 2.3.11 (Optimale ANF)Es sei M die Menge aller Primimplikanden von Φ und N die Menge der in bezug aufM wesentlichen Primimplikanden von Φ. Wenn N 6= ∅ ist, H? die Alternative derElemente von N bezeichnet und ΦH? = Φ ist, dann ist H? die optimale ANF von Φ.


In unserem Beispiel ist die Menge N der wesentlichen Primimplikanden leer, wir kom-men daher nur durch Probieren weiter, d. h. wir lassen ”versuchsweise“ einen Pri-mimplikanden weg:

M = p q, p r, p q, q r, q r, p r N = ∅

Wir streichen p q:M′ = p r, p q, q r, q r, p r

In bezug auf M′ sind p r und q r wesentlich:

p q r p r p q q r q r p r

β1 W W W W F F F Fβ2 W W F F F W F F

also N′ = p r, q rWir streichen q r:

M′′ = p r, p q, q r, p r

Weil p r, q r wesentlich in bezug auf M′ sind, sind sie es auch in bezug auf M′′ ⊂M′.In bezug auf M′′ ist aber auch p q wesentlich:

p q r p r p q q r p r

β3 F F W F W F F

wahrend p r nicht wesentlich in bezug auf M′′ ist. Durch Streichen von p r erhaltenwir die Menge

M′′′ = p r, p q, q r = N′′′

In bezug auf M′′′ sind alle ihre Elemente wesentlich.

Man uberlegt sich, daßH? = pr ∨ p q ∨ q r

eine optimale ANF von Φ ist (weil jeder Primimplikand fur genau 2 Belegungen denWert W liefert und Φ 6 W–Stellen hat).

Leider kann das angegebene Probeverfahren auch in eine Sackgasse fuhren, d. h. zueiner Menge von wesentlichen Primimplikanden, die keine optimale ANF bilden.

Wenn wir z. B. im zweiten Schritt p q streichen:

M′′1 = p r, q r, q r, p r

so bleiben p r, q r wesentlich (in bezug auf M′′1) und q r, p r sind wesentlich in bezugauf M′′1 :

p q r p r q r q r p r

β4 F F W F F W Fβ5 F F F F F F W

Wir erhalten die ANFH?? = p r ∨ q r ∨ q r ∨ p r

mit großeren Kosten als H?, obwohl in H?? kein Primimplikand mehr gestrichenwerden kann.

2.4. FOLGERN 63

2.4 Folgern

Das logische Folgern ist eine Beziehung zwischen Mengen von Aussagen einerseits undAussagen andererseits. Wann sagen wir, daß eine Aussage logisch aus einer Menge vonAussagen folgt? Sicher dann, wenn in jeder denkbaren Situation, in der alle Aussagender betrachteten Menge von Aussagen wahr sind (wir nennen eine solche Situation einModell dieser Menge) die betreffende Aussage ebenfalls wahr ist; sicher dann nicht,wenn eine Situation vorliegt (oder denkbar ist), bei der zwar alle Aussagen in derMenge wahr, die betreffende Aussage aber falsch ist.

2.4.1 Grundbegriffe

Wir definieren:

Modell, Folgern und FolgerungsoperatorEs sei X ⊆ ausd

• Eine Belegung β heißt Modell von X ⊆ ausd (βModX), wenn fur alle H ∈ Xgilt: βerfH

• Aus X folgt H (XfolH), wenn jedes Modell β von X den Ausdruck H erfullt.

• Der Folgerungsoperator fl ist wie folgt definiert: fl (X) := H|XfolH

BeispielSei p die Aussage ”Es liegt Schnee“ und q die Aussage ”Es ist kalt“. Die Belegungβ: p=W, q=W ist Modell der Ausdrucksmenge X1 = p,¬p ∨ q, p → q; zur Aus-drucksmenge X2 = p,¬p gibt es dagegen kein Modell. Aus der Ausdrucksmenge X1

folgt die Aussage q; aus der widerspruchlichen Ausdrucksmenge X2 folgt dagegen dieMenge ausd aller Ausdrucke, d. h. fl (X2) = ausd.

Satz 2.4.1 (Eigenschaften des Folgerungsoperators)fl hat folgende Eigenschaften:

1. fl (∅) = ag.

2. fl (ag) ⊆ ag.

3. Hulleneigenschaften von fl:

(a) X ⊆ fl (X)(b) Wenn X ⊆ Y , so fl (X) ⊆ fl (Y ).(c) fl (fl (X)) = fl (X).

4. Endlichkeitssatz fur das Folgern:

Wenn H ∈ fl (X), so gibt es eine endliche Teilmenge X? ⊆ X mitH ∈ fl (X?)

Beweis von fl (ag) ⊆ ag:fl (ag) = fl (fl (∅)) = fl (∅) = ag

Ubung 17Man zeige, daß fl (∅) = ag und fl (p,¬p) = ausd ist und beweise, daß der Folge-rungsoperator fl die Hulleneigenschaften besitzt. Außerdem vollziehe man folgendenBeweis nach:


2.4.2 Beweis des Endlichkeitssatzes fur das Folgern

Wir benutzen zwei Hilfssatze:

Hilfssatz 1Voraussetzung: Jede endliche Teilmenge X? ⊆ X besitzt ein Modell.Behauptung: Zu jeder Aussagenvariable pi gibt es einen Wahrheitswert wi derart, daßjede endliche Teilmenge X? von X ein Modell β?i mit β?i (pi) = wi hat.

Beweis des ersten HilfssatzesEs sei pi ∈ AV fixiert. Fur jede endliche Teilmenge X? von X kann einer von vierFallen eintreten:

Fall 1: Es gibt ein Modell β? von X? mit β? (pi) = W und es gibt ein Modell β??

von X? mit β?? (pi) = F.

Fall 2: Es gibt ein Modell β? von X? mit β? (pi) = W und es gibt kein Modell β??

von X? mit β?? (pi) = F

Fall 3: Kein β? . . . und ein β?? . . .

Fall 4: Kein β? . . . und kein β??. . .

Wir uberlegen uns:

• Der Fall 4 kann nicht eintreten, da X? ein Modell β besitzt. Wenn β(pi) = W,so existiert also ein Modell β? = β von X? mit β?(pi) = W; wenn β(pi) = F, soexistiert ein Modell β?? = β von X? mit β??(pi) = F.

• Es kann nicht passieren, daß fur ein X?1 ⊆ X Fall 2 und fur ein X?

2 ⊆ X derFall 3 eintritt. Begrundung: X?

1 ∪ X?2 ⊆ X ist endlich und besitzt folglich ein

Modell β. β ist also zugleich Modell von X?1 und X?

2 . Weil fur X?1 der Fall 2

eintritt und β Modell von X?1 ist, gilt β (pi) = W. Weil fur X?

2 der Fall 3 eintritt,hat X?

2 kein Modell β? mit β?(pi) = W, folglich ware β (pi) = F, also folgt einWiderspruch.

Also ergeben sich nur noch zwei Moglichkeiten:

1. Moglichkeit Fur alle endlichen Teilmengen X? von X tritt Fall 1 oder 2 ein.Dann setzen wir wi := W.

2. Moglichkeit Fur alle endlichen Teilmengen X? von X tritt Fall 1 oder 3 ein.Dann setzen wir wi := F.

Da wi das Verlangte leistet, haben wir damit den ersten Hilfssatz bewiesen. 2

Diesen ersten Hilfssatz benotigen wir nur fur den Beweis des folgenden

Hilfssatz 2 (Endlichkeitssatz fur Modelle)Besitzt jede endliche Teilmenge X? von X ein Modell, so besitzt X ein Modell.

Beweis des Endlichkeitssatzes fur ModelleWir vervollstandigen die Menge X unter Erhalt der Eigenschaft, daß jede endlicheTeilmenge ein Modell besitzt, zu einer Menge Y , von der wir ein Modell ablesenkonnen: Wenn eine Aussagenvariable pi als Ausdruck in Y vorkommt, dann gilt furjedes Modell β von Y stets β(pi) = W, weil β den Ausdruck pi ∈ Y erfullt, wenndagegen pi /∈ Y ist, so gilt β(pi) = F fur jedes Modell von Y .

Wir gehen induktiv vor:

2.4. FOLGERN 65

Anfang: X0 := X

Schritt:

Xn+1 =

Xn ∪ pn , falls jede endliche Teilmenge X? ⊆ Xein Modell β? mit β? (pn) = W hat

Xn ∪ ¬pn , sonst

Wir setzen nun

Y =∞⋃n=0

Xn

Behauptung 1: Fur alle n ∈ N gilt: Jede endliche Teilmenge von Xn hat ein Modell.

Beweisdurch Induktion uber n.

Anfang: n = 0 — trivial: Jede endliche Teilmenge von X0 = X hat ein Modell(nach Vor.)

Schritt: n→ n+ 1Nach Hilfssatz 1 existiert zu pn ein wn so, daß jede endliche TeilmengeX? ⊆ Xn ein Modell β? mit β? (pn) = wn hat.Nun machen wir fur wn eine Fallunterscheidung:

Fall 1: wn = WDann hat jede endliche Teilmenge X? ⊆ Xn ein Modell β? mitβ? (pn) = W

Xn+1 = Xn ∪ pn

Sei X? endliche Teilmenge von Xn+1, dann hat X? ein Modell.Fall 2: wn = F

Xn+1 := Xn ∪ ¬pn usw. (analog Fall 1)

2

Behauptung 2: Jede endliche Teilmenge Y ? von Y besitzt ein Modell.

BeweisWeil Y ? endlich ist, existiert ein m mit Y ? ⊆ Xm

m = max i|pi ∈ Y ? oder ¬pi ∈ Y ? ,

also hat Y ? nach Behauptung 1 ein Modell. 2

Wir betrachten die Belegung β : AV→ W,F mit

β (pi) =

W, pi ∈ YF, ¬pi ∈ Y

Behauptung 3: βModX, d. h. wenn H ∈ X, so βerfH

BeweisEs sei H ∈ X, pj1 , . . . , pjn alle Aussagenvariablen von H.

Y ? = H ∪pjv , pjv ∈ Y¬pjv , ¬pjv ∈ Y

v = 1, . . . , n

Es ist card (Y ?) ≤ n+1, d. h. Y ? ⊆ Y ist endlich, besitzt also nach Behauptung2 ein Modell β?.


Dabei gilt: fur v = 1, . . . , n

β? (pjv ) =

W, falls pjv ∈ YF, falls ¬pjv ∈ Y

= β (pjv )

Nun istwert (H,β?) = wert

(H, β

)= W

also βerfH nach Lemma auf Seite 53. 2

Damit haben wir den Endlichkeitssatz fur Modelle bewiesen. 2

Nun kommen wir zum eigentlichen

Beweis des Endlichkeitssatzes fur das FolgernEs sei H ∈ fl(X), d. h.

jedes Modell β von X erfullt den Ausdruck H.

Wir nehmen an, daß keine endliche Teilmenge X? ⊆ X mit H ∈ fl(X?) existiert, d. h.fur jede endliche Teilmenge X? ⊆ X gilt:

Es gibt ein Modell β? von X? mit β?erf¬H

d. h.

Es gibt ein Modell von X? ∪ ¬H.

Wir betrachten nun Y := X ∪ ¬H.Ist Y ? eine endliche Teilmenge von Y , so ist Y ? \ ¬H eine endliche Teilmenge vonX, es gibt also ein Modell β? von (Y ? \ ¬H)∪¬H, d. h. ein Modell von Y ?. Nachdem Endlichkeitssatz fur Modelle (Hilfssatz 2) hat daher Y = X ∪ ¬H ein Modell.

Das steht im Widerspruch dazu, daß jedes Modell von X, also auch die Modelle vonX ∪ ¬H, den Ausdruck H erfullen.

Hiermit haben wir den Endlichkeitssatz fur das Folgern vollstandig bewiesen. 2

2.4.3 Ableitbarkeits- und Deduktionstheorem

Als weitere wichtige Eigenschaft des Folgerns zeigen wir, daß

das Ableitbarkeitstheorem

Wenn (H? → H) ∈ fl (X) , so H ∈ fl (X ∪ H?)

und das Deduktionstheorem

Wenn H ∈ fl (X ∪ H?) , so (H? → H) ∈ fl (X)

gelten.

Das Ableitbarkeitstheorem sagt aus, daß die Abtrennungsregel fur das Folgern gilt:Wenn (H? → H) aus einer Menge X folgt und H? als zusatzliche Voraussetzunghinzugenommen wird, so folgt H.

Beweis des AbleitbarkeitstheoremsVor.: Jedes Modell von X erfullt (H? → H)

2.4. FOLGERN 67

Beh.: Jedes Modell von X ∪ H? erfullt H.

Sei βMod (X ∪ H?). βModX, also βerf (H? → H) nach Voraussetzung. Es gilt

W = wert (H? → H,β) = seq(wert (H?, β)︸︷︷︸

W

,wert (H,β))

also wert (H,β) = W, d. h. βerfH. 2

Beweis des Deduktionstheorems

Vor.: Jedes Modell von X ∪ H? erfullt H.

Beh.: Jedes Modell von X erfullt (H? → H).

Sei βModX.

Fall 1: βerf¬H?, d. h. wert (H?, β) = F.Dann ist wert ((H? → H) , β) = W, d. h. βerf (H? → H)

Fall 2: βerfH?

Dann ist βMod (X ∪ H?). Folglich βerfH, also βerf (H? → H).

Wir erhalten also in beiden Fallen βerf (H? → H). 2

2.4.4 Der Kalkulbegriff

Unter einem Kalkul verstehen wir ein formales System, sprich ein mathematisches Mo-dell, in dem wir rechnen konnen. Als mathematisches Modell ist ein Kalkul gegebendurch ein Alphabet und eine Sprache uber diesem Alphabet, sowie einem Deduk-tionsoperator (einer Rechenoperation). Bei Logikkalkulen hebt man die Menge derTheoreme (die wahren bzw. beweisbaren) Aussagen hervor.

KalkulK = [X,A, S, F ] heißt Kalkul, wenn

1. X ist ein endliches Alphabet.

2. A ⊆W (X) ist eine Sprache uber X.

3. S ⊆ A ist eine Satzmenge (Menge der Theoreme)

4. F : P (A)→ P (A) (Deduktionsoperator des Kalkuls) mit

• Hulleneigenschaften

• Endlichkeitssatz

• F (S) ⊆ S

Folgerung 2.4.2AK = [X, ausd, ag,fl] ist ein Kalkul (Aussagenkalkul).

Man unterscheidet:

• Kalkul mit semantisch definierter Satzmenge.


ag = Menge der in der klassischen logischen Matrix gultigen Aus-drucke (fl (∅))

• Kalkul mit syntaktisch definierter Satzmenge.

S0 = Menge aller mittels rein syntaktischer Unformungsoperatio-nen aus einer endlichen Menge von Ausdrucken zu gewinnender Aus-drucke.

Beispiel

AbtrennungsregelH, (H → H?)

H? EinsetzungsregelH (pi) ,H?

H(pi/H?

)Definition 2.4.3 (Entscheidbarkeit eines Kalkuls)Ein Kalkul heißt entscheidbar, wenn es einen Algorithmus gibt, der fur jedes H ∈ Aentscheidet, ob H ∈ S ist.

Satz 2.4.4Der Aussagenkalkul ist entscheidbar.

BeweisO. B. d. A. seien p1, . . . pn alle in H ∈ ausd vorkommenden Aussagenvariablen.

Es gilt:H ∈ ag gdw. fur alle β ∈ B: wert (H,β) = W

Dabei ist wert nur von β(p1), . . . , β(pn) abhangig.

Also ist H ∈ ag gdw. fur jede Belegung β von p1, . . . pn gilt

wert (H,β) = W

Es mussen also ”nur“ 2n Belegungen gepruft werden, um die Allgemeingultigkeit einesAusdrucks zu entscheiden. 2

2.5 Aussagenlogisches Schließen

2.5.1 Grundbegriffe

Wozu ist die Menge ag gut?Es sei H ∈ ag; p1, . . . , pn alle Aussagenvariablen in H, dann ist ΦH (w1, . . . , wn) =W = wert (H,β) mit β (pi) = wi. H ∈ ag spiegelt eine verum-Funktion, d. h. spiegelteine extensionale Aussagenfunktion, die stets eine wahre Aussage als Funktionswerthat, eine sogenannte Tautologie.

Was ist eine Schlußregel?

”Wenn A1, . . . , An gilt, so gilt auch B1, . . . , Bm“. Oder ”Wenn A1, . . . , An, soα (A1, . . . , An)“. Eine Schlußregel ist eine Tautologie, wobei die Implikation Haupt-verknupfung ist.

Wie kann man feststellen, ob eine Schlußregel gultig ist?Wenn die Schlußregel die allgemeine Form

wenn A1, . . . , An so α(A1, . . . , An) (?)

2.5. AUSSAGENLOGISCHES SCHLIESSEN 69

hat und α eine extensionale Aussagenfunktion ist, dann konnen wir zu der zu αgehorigen Wahrheitsfunktion Φ einen reprasentierenden Ausdruck H des Aussagen-kalkuls finden. Wir nehmen an, daß dieser Ausdruck genau die Variablen p1, . . . , pnenthalt und betrachten den Ausdruck

H? = p1 ∧ p2 ∧ · · · ∧ pn → H.

Wenn H? ∈ ag ist, dann ist die Schlußregel (?) gultig, und umgekehrt. Wir konnensagen, daß die Allgemeingultigkeit von H? die Schlußregel (?) rechtfertigt.

2.5.2 Nutzliche aussagenlogische Schlußweisen

Im folgenden geben wir einige wichtige aussagenlogische Schlußregeln an. Ist dabei der

”Schluß“–Strich fett gedruckt, dann gilt die Regel auch in die umgekehrte Richtung.

1. Konjunktionsregel

Wenn A, so BWenn A, so C

Wenn A, so (B und C)

Rechtfertigung: (p→ q) ∧ (p→ r)↔ (p→ q ∧ r) ∈ ag

2. Alternative

(a) Schluß auf eine Alternative

Wenn A, so BWenn A, so (B oder C)

Rechtfertigung: (p→ q)→ (p→ q ∨ r) ∈ ag

(b) Schluß aus einer Alternative

Wenn A, so B oder CWenn A und B, so DWenn A und C, so D

Wenn A, so D

Rechtfertigung:((p→ q ∨ r) ∧ (p ∧ q → s) ∧ (p ∧ r → s))→ (p→ s) ∈ ag

3. Implikation

(a)

Wenn A und B, so CWenn A, so (wenn B, so C)

Rechtfertigung: (p ∧ q → r)→ (p→ (q → r)) ∈ ag


(b) Fregescher Kettenschluß

Wenn A, so (wenn B, so C)Wenn A, so BWenn A, so C

Rechtfertigung: (p→ (q → r)) ∧ (p→ q)→ (p→ r) ∈ ag(c) Kettenschluß

Wenn A, so BWenn B, so CWenn A, so C

Rechtfertigung: (p→ q) ∧ (q → r)→ (p→ r) ∈ ag(d) Abtrennungsregel (modus ponens)

A

Wenn A, so BB

Rechtfertigung: (p ∧ (p→ q))→ q ∈ ag

4. Aquivalenz

Wenn A, so (wenn B, so C)Wenn A, so (wenn C, so B)

Wenn A, so (B gdw. C)

Rechtfertigung:(p→ (q → r)) ∧ (p→ (r → q))↔ (p→ (q ↔ r)) ∈ ag

5. Negation

(a) Kontraposition

Wenn A, so BWenn nicht B, so nicht A.

Rechtfertigung: (p→ q)↔ (¬q → ¬p) ∈ ag(b) Doppelte Negation

A

nicht nicht A

Rechtfertigung: p↔ ¬¬p ∈ ag(c)

Wenn A und B, so CWenn A und B, so nicht C

Wenn A, so nicht B

Rechtfertigung: (((p ∧ q)→ r) ∧ ((p ∧ q)→ ¬r))→ (p→ ¬q) ∈ ag

2.6. ABLEITBARKEIT 71

2.5.3 Das Haubersche Theorem

n ≥ 2

Wenn A1, so B1

...Wenn An, so Bn

A1 oder A2 oder . . . oder An (Die Voraussetz. Ai erschopfen alle Falle).

nicht (B1 und B2), nicht (B2 und B3), . . .nicht (B1 und B3), . . .

...nicht (B1 und Bn). (Die Behauptungen Bi schließen sich paarweise aus)

A1 gdw. B1

...An gdw. Bn

Beweis (indirekt)Annahme: Es gibt j so, daß Aj gdw. Bj falsch.

Wenn Aj , so Bj ist wahr nach Voraussetzung, d. h. wenn Bj , so Aj ist falsch, d. h.Bj ist wahr und Aj falsch. Es gibt ein i 6= j so, daß Ai wahr ist.

Wenn Ai, so Bi ist wahr, also Bi ist wahr und i 6= j /?

nicht (Bi und Bj) 2

2.6 Ableitbarkeit

Das Ziel dieses Abschnittes besteht darin, die Folgerungsrelation XfolH syntaktischzu charakterisieren, d. h. wir suchen nach einer Moglichkeit, die Berechnung der Mo-delle vonX zu vermeiden, um danach festzustellen, ob alle diese Modelle den AusdruckH erfullen.

Syntaktisch zu charakterisieren bedeutet, daß wir die Menge X und den Ausdruck Hrein strukturell bearbeiten (mit Regeln wie zum Beispiel der Abtrennungsregel), ohneuns dabei um Erfullbarkeit, Gultigkeit oder Modelle (also die gesamte semantischeBegriffswelt) zu kummern.

Ziel ist also eine Gleichung der Form

fl(X) = ”syntaktisch definierte Hullenoperation“(X).

2.6.1 Ableiten mit Abtrennungs- und Einsetzungsregel

Auf Seite 68 hatten wir als Beispiel fur syntaktische Umformungsoperationen dieAbtrennungs– und Einsetzungsregel kennengelernt. Ausgehend von diesen Regeln wol-len wir jetzt entsprechende Korrespondenzen und syntaktische Operationen definie-ren:


Ableiten mit AbtrennungsregelAus Ausdrucken der Form H,(H → H?) ist H? ableitbar.ablaSei X ⊆ ausd, H ∈ ausd. Die Korrespondenz XablaH wird induktiv definiert:

A) Wenn H ∈ X, so XablaH

I) Wenn Xabla (H → H?) und XablaH, so XablaH?

abaDie Operation aba ist definiert als:

aba (X) := H|XablaH

Satz 2.6.1 (Widerspruchsfreiheit der Abtrennungsregel)aba(ag) = ag, d. h. wenn H, (H → H?) ∈ ag, so H? ∈ ag.

BeweisDie Abtrennungsregel ist eine Schlußregel, muß also gerechtfertigt werden:p ∧ (p→ q)→ q ∈ ag. 2

Ableiten mit EinsetzungsregelAus dem Ausdruck H, der die Aussagenvariable pi enthalt, entsteht der AusdruckH(pi/H?

), indem an allen Stellen von H zugleich die Variable pi durch den Aus-

druck H? ersetzt wird.ableSei X ⊆ ausd, H ∈ ausd. Die Korrespondenz XableH wird induktiv definiert:

A) Wenn H ∈ X, so XableH

I) Wenn XableH und H? ∈ ausd, so XableH(pi/H?

)abeDie Operation abe ist definiert als:

abe (X) := H|XableH

Satz 2.6.2 (Widerspruchsfreiheit der Einsetzungsregel)abe(ag) = ag, d. h. wenn H ∈ ag, dann H

(pi/H?

)∈ ag.

BeweisSei H ∈ ag und pi komme in H vor, H? ∈ ausd beliebig. Zu zeigen ist, daßH(pi/H?

)∈ ag.

Nun istwert

(H(pi/H?

), β)

= wert (H,β?)︸︷︷︸W weilH∈ag

mit der Belegung

β?(p) =β(p) falls p 6= piwert(H?, β) falls p = pi

also ist H(pi/H?

)∈ ag. 2


Ableitenmit Abtrennungs- und EinsetzungsregelablDie Korrespondenz abl wird induktiv definiert:

A) Wenn H ∈ X, so XablH

I) (a) Wenn Xabl (H → H?) und XablH, so XablH?

(mit Abtrennungsregel)

(b) Wenn XablH und H? ∈ ausd, so XablH(pi/H?

)(mit Einsetzungsregel)

abDie Operation ab ist definiert als:

ab (X) := H|XablH

Satz 2.6.3 (von der Ruckverlegbarkeit der Einsetzung)Es gilt:

ab (X) = aba (abe (X))

BeweisWenn H ∈ aba (abe (X)), dann ist nach Definition auch H ∈ ab (X). Bleibt dieUmkehrung zu zeigen: Wenn XablH, so abe (X) ablaH.

durch Induktion uber H.

A) H ∈ X, dann ist H ∈ abe (X), also abe (X) ablaH.

I) (a) Wir haben Xabl (H ′ → H) und XablH ′, nach Induktionsvorausset-zung ist also abe (X) abla (H ′ → H), abe (X) ablaH ′, wir erhalten alsoabe (X) ablaH.

(b) Wir haben XablH ′, H = H ′(pi/H?

). Also gilt nach Induktionsvorausset-

zung abe (X) ablaH ′.Wenn hier H ′ ∈ abe (X) ist, dann ist H = H ′

(pi/H?

)∈ abe (X) also

abe (X) ablaH. Wenn H ′ /∈ abe (X), so ist wegen abe (X) ablaH ′ auchabe (X) ablaH ′

(pi/H?

), d. h. abe (X) ablaH.

2

Satz 2.6.4 (Widerspruchsfreiheit von ab)Wenn X ⊆ ag, so ab (X) ⊆ ag.

BeweisEs gilt:

ab(X) = aba (abe(X)) ⊆ aba(ag) ⊆ ag

2

Satz 2.6.5 (Eigenschaften von ab, aba, abe)ab : P (ausd)→ P (ausd)

1. ab (∅) = aba (∅) = abe (∅) = ∅


2. ab, aba, abe haben die Hulleneigenschaften

3. Endlichkeitssatz:Wenn H ∈ ab (X), so gibt es eine endliche Teilmenge X? ⊆ X mit H ∈ ab (X?)

4. Ableitbarkeitstheorem (gilt fur ab und aba):Wenn (H? → H) ∈ ab (X), dann ist H ∈ ab (X ∪ H?).Das Deduktionstheorem (die Umkehrung des Ableitbarkeitstheorems) gilt nicht,denn wir finden ein Gegenbeispiel mit X = ∅ und H = H?:

H? ∈ ab (H?) = ab (∅ ∪ H?) , aber (H? → H?) /∈ ab (∅)

5. ab (ag) ⊆ ag (sogar gleich)

Folgerung 2.6.6[X, ausd, ag, ab] ist ein Kalkul.

Haben wir jetzt schon eine vollstandige syntaktische Charakterisierung des Folgerns?Nein, denn ab (∅) = ∅ 6= fl (∅) = ag und fl (X) = ab (ag ∪X) gilt ebenfalls nicht.

Satz 2.6.7 (Syntaktische Vollstandigkeit von ag bezuglich ab)Ist H /∈ ag, so ab (ag ∪ H) = ausd.

BeweisSei H fest, p1, . . . , pn alle Aussagenvariablen in H.

H /∈ ag ⇒ ef¬H, d. h. es existiert eine Belegung β? ∈ B mit wert (H,β?) = F.

Fur i = 1, . . . , n sei Hi :=

pi, falls β? (pi) = F¬pi, sonst.

BehauptungFur alle β ∈ B gilt: wert (H1 ∨ · · · ∨Hn, β) = F gdw. β stimmt auf p1, . . . , pn mit β?

uberein.

Beweis der Behauptungwert(H1 ∨ · · · ∨Hn, β) = F genau dann, wenn fur alle i = 1, . . . , n wert(Hi, β) = F,d. h.

β (pi) =

F, falls Hi = piW, sonst

= β?(pi)

2

Behauptung(H → H1 ∨ · · · ∨Hn) ∈ ag

Beweis der Behauptung (indirekt)Annahme:(H → H1 ∨ · · · ∨Hn) /∈ agdann existiert β ∈ B mit wert (H → H1 ∨ · · · ∨Hn, β) = F

wert (H,β) = W und wert (H1 ∨ · · ·Hn, β) = F︸︷︷︸β=β?auf p1,...pn

W = wert (H,β) = wert (H,β?) = F /?

Widerspruch 2

Also ist (H → H1 ∨ · · · ∨Hn) ∈ ag.

H ∈ ab (ag ∪ H)(H → H1 ∨ · · · ∨Hn) ∈ ab (ag ∪ H) .

H1 ∨ · · · ∨Hn ∈ ab (ag ∪ H) .


Wir setzen ein fur pi

p , falls Hi = pi¬p, falls Hi = ¬pi

in H1 ∨ · · · ∨Hn und erhalten

H? = [¬¬] p ∨ [¬¬] p ∨ · · · ∨ [¬¬] p

⇒H? ∈ ab (ag ∪ H)

(H? → p) ∈ ab (ag ∪ H)p ∈ ab (ag ∪ H) .

(weil H? → p ∈ ag)

H?? ∈ ausd: H?? = p[p/H??

]∈ ab (ag ∪ H). 2

Bemerkungag ist nicht syntaktisch vollstandig bezuglich fl.

Beispiele

• p /∈ ag; H ∈ fl (ag ∪ p) gdw. (p→ H) ∈ fl (ag) = ag gdw. (p→ H) ∈ ag

• (p→ q) /∈ ag, also q /∈ fl (ag ∪ p).

Die Gleichung fl (X) = ab (ag ∪X) gilt also nicht, aber vielleicht gilt

fl (X) = aba (ag ∪X)

denn offensichtlich ist es gerade die Einsetzungsregel, die die syntaktische Vollstand-igkeit von ag bzgl. ab impliziert.

Damit stellt sich die Frage: fl erfullt das Deduktionstheorem, aba nicht, kann dieGleichung trotzdem gelten?

Die Antwort gibt der

Satz 2.6.8 (Schwaches Deduktionstheorem fur aba)

Voraussetzung:

1. Wenn der Ausdruck H eine der Formen

• H1 → (H2 → H1) (1)• H1 → H1 (2)• (H1 → (H2 → H3))→ ((H1 → H2)→ (H1 → H3)) (3)

hat, so ist XablaH.

2. (X ∪ H??) ablaH?

Behauptung: Xabla (H?? → H?)

BeweisInduktion uber H?.

A) H? ∈ X ∪ H??.

Fall 1: H? = H??

Nach Voraussetzung Xabla (H? → H?), also Xabla (H?? → H?)


Fall 2: H? 6= H??

Dann ist H? ∈ X. Nach Voraussetzung

XablaH? → (H?? → H?)XablaH?

Xabla (H?? → H?)

I)X ∪ H?? ablaH1 → H?

X ∪ H?? ablaH1

→ X ∪ H?? ablaH?

Nach Induktionsvoraussetzung gilt XablaH?? → (H1 → H?) undXablaH?? → H1.

Nach Voraussetzung (2.6.8.1.3) istXabla (H?? → (H1 → H?))→ ((H?? → H1)→ (H?? → H?))wegen Abtrennungsregel folgt:Xabla (H?? → H1)→ (H?? → H?), also XablaH?? → H?.

2

Die Ausdrucke (2.6.8.1.1), (2.6.8.1.2) und (2.6.8.1.3) sind aus ag, also gultig!

Satz 2.6.9fl (X) = aba (ag ∪X).

Um den Beweis zu fuhren benotigen wir folgendes

LemmaEs seien F1, F2 : P (ausd)→ P (ausd) mit

1. F1 (∅) ⊆ F2 (∅)

2. F1 erfullt den Endlichkeitssatz

3. Wenn X? endlich, so gilt Deduktionstheorem fur F1:

Wenn H2 ∈ F1 (X? ∪ H1) , so (H1 → H2) ∈ F1 (X?)

4. Wenn X? endlich, X beliebig, X? ⊆ X, so F2 (X?) ⊆ F2 (X).

5. Wenn X? endlich, so gilt Ableitbarkeitstheorem fur F2:

Wenn (H1 → H2) ∈ F2 (X?) , so H2 ∈ F2 (X ∪ H1)

Dann ist fur alle X ∈ ausd:F1 (X) ⊆ F2 (X)

Beweis des LemmasEs sei H ∈ F1 (X). Da F1 den Endlichkeitssatz erfullt, existiert endlichesX? = H1, . . . ,Hn mit H ∈ F1 (X?).

Fall 1: n = 0, X? = ∅H ∈ F1 (∅) ⊆ F2 (∅) ⊆ F2 (X)


Fall 2: n > 0 H ∈ F1

(H1, . . . ,Hn−1 ∪ Hn︸︷︷︸

X?

). Mit Deduktionstheorem fur F1

ergibt sich (Hn → H) ∈ F1 (H1, . . . ,Hn−2 ∪ Hn−1), usw.

Wir erhalten also (H1 → (H2 → · · · (Hn → H) · · · ) ∈ F1 (∅) ⊆ F2 (∅).Mit Ableitbarkeitstheorem fur F2 ergibt sich dann

H ∈ F2 (H1, . . . , Hn) ⊆ F2 (X)

2

Beweis des Satzes 2.6.9

Wir wenden zweimal das Lemma an:• F1 (X) = fl (X)

• F2 (X) = aba (ag ∪X).

fl (X) ⊆

aba (ag ∪X)

• F1 (X) = aba (ag ∪X)

• F2 (X) = fl (X)

aba(ag ∪X) ⊆ fl (X)

Wir erhalten also fl (X) = aba (ag ∪X). 2

2.6.2 Syntaktische Charakterisierung von ag

Die mit Satz 2.6.9 gegebene Charakterisierung des Folgerns durch das Ableiten mitder Abtrennungsregel allein ist noch keine rein syntaktische Charakterisierung desFolgerns, weil auf der rechten Seite der Gleichung noch die Menge ag vorkommt,die unter Bezug auf die Semantik definiert ist. Es bleibt also ubrig, diese Mengesyntaktisch zu charakterisieren.

Das Axiomensystem axaDie Menge axa besteht aus den folgenden 15 Ausdrucken:

1. p→ (q → p) (Pramissenbelastung)

2. ((p→ q)→ p)→ p (Satz von Peirce)

3. (p→ q)→ ((q → r)→ (p→ r)) (Kettenschluß)

4. p ∧ q → p

5. p ∧ q → q

6. (p→ q)→ ((p→ r)→ (p→ (q ∧ r)))7. p→ p ∨ q8. q → p ∨ q9. (p→ r)→ ((q → r)→ ((p ∨ q)→ r))

10. (p↔ q)→ (p→ q)

11. (p↔ q)→ (q → p)

12. (p→ q)→ ((q → p)→ (p↔ q))

13. (p→ q)→ (¬q → ¬p)14. p→ ¬¬p15. ¬¬p→ p


Man sieht sofort

Satz 2.6.10axa ⊆ ag

Satz 2.6.11 (Widerspruchsfreiheit von axa bezuglich ab)Es gilt:

ab (axa) ⊆ ag

BeweisEs ist axa ⊆ ag und nach Satz 2.6.4 gilt fur ab die Widerspruchsfreiheit. 2

Satz 2.6.12 (Vollstandigkeit von axa bezuglich ab)Es gilt:

ab (axa) ⊇ ag

BeweisZeigen fur H? ∈ ausd:

Wenn H? /∈ ab (axa) , so H? /∈ ag

d. h. wir suchen eine Belegung β? mit wert(H?, β?) = F

Schritt 1: Satz 2.6.13 (Lindenbaumscher Erganzungssatz)M ⊆ ausd,H? /∈ F (M). Es sei F ein Deduktionsoperator, dann gibt es eineMenge M? mit

1. M? ⊇M2. H? /∈ F (M?)3. Fur alle H ∈ ausd gilt: Wenn H /∈ F (M?), so H? ∈ F (M? ∪ H).4. F (M?) = M?.

Beweis des Lindenbaumschen ErganzungssatzesWir gehen von einer Aufzahlung aller Ausdrucke aus: ausd = H0,H1, . . ..N0 := M .

Ni+1 :=Ni ∪ Hi , H? /∈ F (Ni ∪ Hi)Ni, sonst

M? =⋃i≥0Ni.

Zu 1: M ⊆M? ist klar.Zu 2: H? /∈ F (M?)

Ware H? ∈ F (M?), so wurde es X? ⊆ M? und X? – endlich geben, mitH? ∈ F (X?). Weil X? endlich, existiert ein k mit X? ⊆ Nk, also mitH? ∈ F (Nk) /

?zur Konstruktion.

Zu 3: Sei H = Hk ∈ ausd; H /∈ F (M?). Nach Konstruktion ist H? ∈F (Nk ∪ H), sonst ware H = Hk ∈ Nk ⊆ M? ⊆ F (M?). AlsoH? ∈ F (M? ∪ H).

Zu 4: Es sei H ∈ F (M?).Behauptung: H ∈M?

Es sei H = Hk.zu zeigen: H? /∈ F (Nk ∪ Hk).Nun ist H? /∈ F (M?), also H? /∈ F (M? ∪ H), weil H ∈ F (M?). H? /∈F (Nk ∪ H), weil Nk ⊆M?.


Damit haben wir den Lindenbaumschen Erganzungssatz bewiesen. 2

Schritt 2: Anwendung mit M = ab (axa) ;F = abaH? /∈ aba (ab (axa)) (sonst H? ∈ ab(axa) = aba(abe(axa))).

Es gibt M? ⊆ ausd mit

1. ab (axa) ⊆M?

2. H? /∈ aba (M?)

3. Fur alle H: Wenn H /∈ aba (M?), so H? ∈ aba (M? ∪ H).4. aba (M?) = M?.

Schritt 3: Man zeigt, daß die folgenden Ausdrucke aus axa ableitbar sind:

p→ p, (p→ (q → r))→ ((p→ q)→ (p→ r)) ∈ ab (axa)

außerdem ist p→ (q → p) ∈ axa.

Also gilt nach dem schwachen Deduktionstheorem fur aba:

Wenn (M? ∪ H1) ablaH2, so M?abla (H1 → H2)

Schritt 4: Lemma 1

(H1 → H2)∈M? gdw. Wenn H1 ∈M?, so H2 ∈M?

H1 ∧H2 ∈M? gdw. H1 ∈M? und H2 ∈M?

H1 ∨H2 ∈M? gdw. H1 ∈M? oder H2 ∈M?

H1 ↔ H2 ∈M? gdw. H1 ∈M? gdw. H2 ∈M?

¬H1 ∈M? gdw. H1 /∈M?

Beweisder ersten Behauptung von Lemma 1

⇒ (H1 → H2) ∈M?

H1 ∈M?

⇒ H2 ∈M? wegen Abtrennungsregel.

⇐ Wenn H1 ∈M?, so H2 ∈M?, d. h. H1 /∈M? oder H2 ∈M?.

Fall 1: Sei zunachst H1 /∈ M?, dann ist H? ∈ aba (M? ∪ H1), also(H1 → H?) ∈ aba (M?)indirekt: Sei (H1 → H2) /∈M?

Dann gilt: (H1 → H2) → H? ∈ aba (M?) und (H1 → H?) →((H1 → H2)→ H?) → H?) ∈ ab (axa) ⊆ M?, d. h. weil M? abge-schlossen gegen Abtrennung: H? ∈M? /

?Widerspruch.

Fall 2: H2 ∈M?

Es ist H2 → (H1 → H2) ∈ ab (axa) ⊆ M? (Pramissenbelastung) alsoH1 → H2 ∈M?.

Die restlichen Beweise fuhren wir hier nicht aus. 2

Schritt 5: Jetzt geben wir eine Belegung β? an, die H? falsch macht:

β? (pi) =

W, pi ∈M?

F, sonst

Lemma 2wert (H,β?) = W gdw. H ∈ M? (dann folgt unmittelbar wert (H?, β?) = F,d. h. H? /∈ ag).


Beweisdurch Induktion uber H

A) H ist AV piwert (H,β?) = β? (pi) = W gdw. pi ∈M?

I) H → ¬Hwert (¬H,β?) = W gdw. wert (H,β?) = F gdw. H /∈M? gdw. ¬H ∈M?

analog weiter mit Ausdrucken der Form H1 ∧H2, H1 ∨H2, H1 → H2 undH1 ↔ H2.

2

Damit haben wir den Vollstandigkeitssatz bewiesen. 2

2.6.3 Cut–Ableitbarkeit

Wir haben also ag = ab(axa). Liefert uns diese syntaktische Charakterisierung vonag auch einen Algorithmus, mit dem wir fur jeden Ausdruck H ∈ ausd die Frage

”H ∈ ag?“ entscheiden konnen, also ein syntaktisches Entscheidungsverfahren fur ag?

Nein, eine Axiomatisierung liefert im allgemeinen kein Entscheidungsverfahren, durchAbleiten konnen wir nur im Falle H ∈ ag zur Antwort ”ja“ kommen, wenn H nichtallgemeingultig ist, konnen wir das durch Ableiten i. a. nicht herausfinden.

Wir konnen aber die syntaktische Vollstandigkeit von ag ausnutzen:

Wenn H /∈ ag, so ab (ag ∪ H) = ausd.

Wenn H /∈ ag, so ist insbesondere der Widerspruch (die Kontradiktion) p ∧ ¬p ausag ∪ H bzw. aus axa ∪ H ableitbar.

Um dies gezielt tun zu konnen, erweitern wir den Kalkul um das Zeichen ⊥ fur denWiderspruch:

Der Anfangsschritt in der Ausdrucksdefinition (siehe Seite 52) lautet jetzt:

A) 1. Jede Aussagenvariable ist ein Ausdruck.

2. ⊥ ist ein Ausdruck.

Wir setzen fest, daß fur jede Belegung β gilt:

wert(⊥, β) = F

Folgerung 2.6.14Fur ⊥ gilt:

1. ¬⊥ ∈ ag

2. ⊥ hat kein Modell

3. ⊥ ∈ fl(X) genau dann, wenn X kein Modell besitzt, also X widerspruchlich ist.

Damit gilt dann


H ∈ ag gdw. ¬H nicht erfullbar istgdw. ¬H kein Modell hatgdw. ⊥ ∈ fl (¬H)

Wir benotigen also ”nur noch“ eine syntaktische Relation ` (ahnlich wie zuvor abla,. . . ) mit

Y ` ⊥ gdw. Y kein Modell besitzt,

fur die entscheidbar ist, ob Y ` ⊥ gilt oder nicht.

Eine solche Relation ist die Cut–Ableitbarkeit (mittels der Schnittregel), die vonGentzen angegeben wurde.

Ihr Nachteil besteht darin, daß die Schnittregel nur auf spezielle Ausdrucke, die Klau-seln, angewendet werden kann.

Gentzen–Ausdruck (Klausel)Ein Ausdruck H ∈ ausd heißt Klausel, wenn H eine der Formen hat:

• p1 ∧ p2 ∧ · · · ∧ pm → q1 ∨ q2 ∨ · · · ∨ qn (m,n ≥ 1)

• q1 ∨ q2 ∨ · · · ∨ qn (n ≥ 1)

• p1 ∧ · · · ∧ pm → ⊥ (m ≥ 1)

• ⊥

Dabei sind p1, . . . , pm bzw. q1, . . . , qn jeweils paarweise verschiedene Aussagenva-riablen.

Mit einer Einschrankung der Ausdrucksmenge ist stets die Frage verbunden, ob da-durch die Ausdrucksfahigkeit des Kalkuls (hier die Reprasentierbarkeit von Wahr-heitsfunktionen) ebenfalls echt eingeschrankt wird.

Zur Beantwortung fuhren wir folgenden Begriff ein:

Definition 2.6.15 (semantische Aquivalenz)Ausdrucke H1,H2 heißen semantisch aquivalent H1 ∼sem H2 gdw. (H1 ↔ H2) ∈ ag

Satz 2.6.16Jeder Ausdruck H ist semantisch aquivalent zu einer Konjunktion von Klauseln:

H ∼sem K1 ∧K2 ∧ · · · ∧Km

BeweisDer Ausdruck H = ⊥ ist eine Klausel, fur ¬⊥ gilt offenbar ¬⊥ ∼sem (p→ p) und dasist eine Klausel.

Alle Aussagenvariablen sind Klauseln und ¬pi ∼sem (pi → ⊥).

Nun sei H ein beliebiger Ausdruck, in dem genau die Variablen p1, . . . , pn vorkommen.Man beachte, daß n = 0 sein kann, etwa

H = ⊥ → (¬⊥ ∨ ⊥)

Solche Ausdrucke sind allerdings entweder allgemeingultig oder Kontradiktion.


Fall 1: H ∈ ag.Dann gilt

H ∼sem (p1 → p1) ∧ (p2 → p2) ∧ · · · ∧ (pn → pn)

und das ist eine Konjunktion von Klauseln

Fall 2: H ist eine Kontradiktiond. h. fur alle β ist wert(H,β) = F.

Dann istH ∼sem ⊥

Fall 3: H /∈ ag, H /∈ ktZu jeder Belegung β von p1, . . . , pn sei

Aβ := [¬]β(p1)p1 ∨ · · · ∨ [¬]β(pn)

pn

die zu β gehorige Elementaralternative, wobei [¬]F := e [¬]W := ¬ ist.

Beispiel

p1 p2 p3

F W F → Aβ = p1 ∨ ¬p2 ∨ p3

Man uberlegt sich (wie fur Elementarkonjunktionen – siehe Seite 54), daß fol-gendes gilt:

Lemmawert (Aβ , β?) = F gdw. β (pi) = β? (pi) , i = 1, . . . , n

Wir zeigen nun, daßH ∼sem

∧wert(H,β)=F

Aβ

BeweisEs ist zu zeigen, daß fur jede Belegung β? gilt

wert (H,β?) = wert

∧wert(H,β)=F

Aβ , β?

d. h.

wert (H,β?) = F gdw. wert

∧wert(H,β)=F

Aβ , β?

= F

Nun ist

wert

∧wert(H,β)=F

Aβ , β?

= F gdw.es ein β mit wert(H,β) = Fderart gibt, daß wert (Aβ , β?) = F

Nach dem Lemma ist das der Fall genau dann, wenn wert(H,β?) = F, was zuzeigen war. 2

Der Ausdruck ∧wert(H,β)=F

Aβ


heißt Kanonische Konjunktive Normalform (KKNF) von H.

Nachdem wir zu H die KKNF als eine Konjunktion von Elementaralternativenbestimmt haben, genugt es zu zeigen, daß jede solche Alternative semantischaquivalent zu einer Klausel ist:

1. In Aβ kommt ¬ nicht vor:

p1 ∨ p2 ∨ · · · ∨ pnDas ist eine Klausel.

2. alle Variablen sind mit ¬ versehen:

¬p1 ∨ ¬p2 ∨ · · · ∨ ¬pnDieser Ausdruck ist semantisch aquivalent zu

p1 ∧ p2 ∧ · · · ∧ pn → ⊥

3. sonst:Es seien pi1 , . . . , pik die Variablen, die in Aβ mit ¬ versehen sind undpik+1 , . . . , pin die Variablen, die ohne ¬ vorkommen. Dann ist

Aβ ∼sem

(pi1 ∧ · · · ∧ pik → pik+1 ∨ · · · ∨ pin

)und dieser Ausdruck ist eine Klausel.

Damit haben wir gezeigt, daß jeder Ausdruck semantisch aquivalent ist zu einer Kon-junktion von Klauseln. 2

Nun mussen wir die Abtrennungsregel entsprechend anpassen:

Die Schnittregel Cut (H1, H2, H)Sofern die Klauseln H1, H2 den Voraussetzungen genugen, entsteht durch Anwen-dung der Schnittregel auf H1,H2 eine Klausel H durch folgende Definition:

H1 : [L→] q1 ∨ · · · ∨ qnH2 : p1 ∧ · · · ∧ pm → R

Klauseln

es gibt i, k mit 1 ≤ i ≤ n, 1 ≤ k ≤ m und qi = pk.H : [L∧] p1 ∧ · · · ∧ pk−1 ∧ pk+1 ∧ · · · ∧ pm → R ∨ q1 ∨ · · · ∨ qi−1 ∨ qi+1 · · · ∨ qn

Die Schnittregel vereinfacht Klauselmengen semantisch aquivalent. Beachte: DasErgebnis ist i. a. noch keine Klausel, notwendig ist das Streichen mehrfach auf dergleichen Seite vorkommender Literale.

Dabei gilt als Bezug zum Folgern:

Satz 2.6.17 (Rechtfertigung der Schnittregel)Wenn Cut (H1,H2, H), so H ∈ fl (H1,H2).

Es gilt also insbesondere auch: Wenn agH1, agH2 und Cut (H1, H2, H), dann agH.

Beweis des Satzes (indirekt)Sei β Modell von H1,H2, d. h. wert (H1, β) = W und wert (H2, β) = W. Wir habenzu zeigen: βerfH.

Wir nehmen an, daß wert (H,β) = F.


Dann istwert (L, β) = W, fur j = 1, . . . ,m mit j 6= k β (pj) = Wwert (R, β) = F, fur j = 1, . . . , n mit j 6= i β (qj) = W

Wir betrachten jetzt H2. Nach Voraussetzung ist wert (H2, β) = W.Wegen wert (R, β) = F ist wert (p1 ∧ · · · ∧ pm, β) = F, also

β (pk) = F = β (qi)

Wir erhalten wert (H1, β) = F, also /?

zur Voraussetzung. 2

Wir definieren nun den wichtigen Begriff der

Cut–Ableitbarkeit Y ` HY sei eine Menge von Klauseln, H ∈ ausd. Dann ist Y ` H induktiv definiert durch

A) Wenn H ∈ Y , so Y ` H

I) Wenn Y ` H1, Y ` H2 und Cut (H1, H2, H), so Y ` H

Folgerung 2.6.18Wenn Y ` H, so H ∈ fl (Y )

Uns interessiert naturlich vor allem, wann Y ` ⊥ gilt.

LemmaWenn (Y ∪ pi) ` ⊥, so Y ` ⊥ oder Y ` (pi → ⊥).

BeweisWir betrachten eine Cut–Ableitung von ⊥ aus Y ∪ pi.

Fall 1: Bei einem Ableitungsschritt geht der Ausdruck pi (als H1) in die Schnittregelein.Wir lassen diese Ableitungsschritte aus dem Beweis heraus, dann ist entwederY ` (pi → ⊥) oder sogar Y ` ⊥.

Fall 2: Der Ausdruck pi wird bei keinem Ableitungsschritt verwendet, dann ist Y `⊥.Also ist Y ` ⊥ oder Y ` (pi → ⊥).

2

Folgerung 2.6.19Wenn (Y ∪ pi) ` ⊥ und (Y ∪ pi → ⊥) ` ⊥, so (Y ` ⊥).

BeweisAus (Y ∪ pi) ` ⊥ haben wir nach Lemma Y ` ⊥ oder Y ` (pi → ⊥).Aus Y ` (pi → ⊥) und (Y ∪ pi → ⊥) ` ⊥ ergibt sich sofort Y ` ⊥. 2

Satz 2.6.20Ist Y eine Menge von Klauseln, die kein Modell besitzt, d. h. ⊥ ∈ fl(Y ), dann istY ` ⊥.


BeweisWir zeigen, daß Y ein Modell hat (⊥ /∈ fl(Y )), wenn Y 6` ⊥ gilt.

Wir definieren induktiv

Y0 := Y

Yn+1 :=Yn ∪ pn , falls (Yn ∪ pn 6` ⊥)Yn ∪ pn → ⊥ , sonst.

und setzen

Y ? := die kleinste Menge von Klauseln, die alle Yi enthaltund abgeschlossen ist in bezug auf die Schnittregel.

(die Lindenbaumsche Erganzungsmenge)

Es gilt

1. Y ⊆ Y ?

2. Fur alle i ist pi ∈ Y ? oder (pi → ⊥) ∈ Y ?

3. Y ? 6` ⊥

Die dritte Aussage ergibt sich daraus, daß fur alle Yi gilt Yi 6` ⊥ (und dem Endlich-keitssatz fur ⊥), das beweisen wir durch Induktion uber i wie folgt:

Anfangsschritt: Y0 6` ⊥ (weil Y0 = Y ).

Induktionsschritt: Wenn Yi 6` ⊥, so Yi+1 6` ⊥.Damit gleichwertig ist

Wenn Yi+1 ` ⊥, so Yi ` ⊥

Wegen Yi+1 ` ⊥ ist nach Konstruktion

Yi+1 = Yi ∪ pi → ⊥

und(Yi ∪ pi) ` ⊥

Wir haben also

(Yi ∪ pi → ⊥) ` ⊥ und (Yi ∪ pi) ` ⊥

d. h. nach Folgerung Yi ` ⊥, was zu zeigen war.

Wir betrachten jetzt die Belegung β mit

β (pi) :=

W, falls pi ∈ Y ?F, falls (pi → ⊥) ∈ Y ?

Behauptung: β ist Modell von Y .

Zu zeigen: Wenn wert (H,β) = F, so H /∈ Y . H : p1 ∧ · · · ∧ pm → q1 ∨ · · · ∨ qnwert (H,β) = F

Fur i = 1, . . . ,m ist β (pi) = W, d. h. pi ∈ Y ?j = 1, . . . , n ist β (qi) = F, d. h. (qj → ⊥) ∈ Y ?


Es gilt:Cut (p1 ∧ · · · ∧ pm → q1 ∨ · · · ∨ qn, p1, p2 ∧ · · · ∧ pm → q1 ∨ · · · ∨ qn)Cut (p2 ∧ · · · ∧ pm → q1 ∨ · · · ∨ qn, p2, p3 ∧ · · · ∧ pm → q1 ∨ · · · ∨ qn)...Cut (pm → q1 ∨ · · · ∨ qn, pm, q1 ∨ · · · ∨ qn)Cut (q1 ∨ · · · ∨ qn, q1 → ⊥, q2 ∨ · · · ∨ qn)...Cut (qn, qn → ⊥,⊥)

Ware H ∈ Y , so hatten wir H ∈ Y ? und folglich Y ? ` ⊥ in Widerspruch zu 3. Alsoist H /∈ Y , was zu zeigen war. Damit haben wir den Satz bewiesen. 2

Wegen obiger Folgerung haben wir also

⊥ ∈ fl(Y ) gdw. Y ` ⊥

Satz 2.6.21Es sei Y eine Menge von Klauseln, die ein Modell hat; ⊥ 6∈ fl (Y ).

Dann gilt fur alle Aussagenvariablen pi

1. Wenn pi ∈ fl (Y ), so Y ` pi

2. Wenn (pi → ⊥) ∈ fl (Y ), so Y ` (pi → ⊥).

Die Schnittregel ist also vollstandig fur das Folgern von Formeln der Form pi bzw.(pi → ⊥).

BeweisSei pi ∈ fl (Y ), d. h. jedes Modell von Y erfullt pi, folglich

⊥ ∈ fl (Y ∪ pi → ⊥) ,

d. h. kein Modell von Y erfullt (pi → ⊥).

Nach Satz 2.6.20 folgt: (Y ∪ pi → ⊥) ` ⊥. Eine entsprechende Ableitung nehmenwir her und lassen die Schritte heraus, wo pi → ⊥ benutzt wird. Es entsteht einBeweis fur Y ` ⊥ oder fur Y ` pi. Y ` ⊥ kann nicht sein, weil Y ein Modell hat, alsoY ` pi.

Damit ist 1. bewiesen, 2. zeigt man analog. 2

Satz 2.6.22Wenn Y eine endliche Menge von Klauseln ist, so ist der SchnittregelabschlußH | Y ` H von Y endlich.

BeweisDa Y eine endliche Menge von Klauseln ist, ist die Menge der AV, die in den Klauselnin Y vorkommen endlich. Daher ist die Menge der AV, die im Schnittregelabschlußvon Y vorkommen, ebenfalls endlich. 2

Wir haben nun ein

2.7. WIDERSPRUCHSFREIHEIT, VOLLSTANDIGKEIT, . . . 87

2.6.4 Syntaktisches Entscheidungsverfahren fur ag

Der Algorithmus, der feststellt ob H ∈ ag ist, arbeitet wie folgt:

Schritt 1: Berechne eine endliche Menge Y = K1, . . . ,Kn von Klauseln derart,daß

¬H ∼sem

n∧i=1

Ki

(Idee: eliminiere ↔ und →, treibe ¬ rein und klammere ∨ ein)

Schritt 2: Berechne Y ? = H? | Y ` H?, den Schnittregelabschluß von Y

(Y ? ist eine endliche Menge nach Satz 2.6.22)

Schritt 3: Wenn der Ausdruck ⊥ Element von Y ? ist, dann ist agH, sonst ist Hnicht allgemeingultig.

Rechtfertigung

Es ist H ∈ ag gdw. ¬H kein Modell hatgdw. Y kein Modell hatgdw. ⊥ ∈ fl(Y )gdw. Y ` ⊥gdw. ⊥ ∈ Y ?

BeispielH = p→ (q → p)¬H = ¬ (p→ (q → p))

Berechnung von Y :

1. Elimination von →:¬ (p→ (¬q ∨ p))¬ (¬p ∨ (¬q ∨ p))

2. ¬ vor die Variablen treiben, ¬¬ weglassen

p ∧ ¬ (¬q ∨ p)p ∧ q ∧ ¬p

Y = p, q, p→ ⊥Offenbar Cut (p, p→ ⊥,⊥), also ⊥ ∈ Y ?, d. h. H ∈ ag.

2.7 Widerspruchsfreiheit, Vollstandigkeit undNichtableitbarkeit

2.7.1 Widerspruchsfreiheit

Widerspruchsfreiheit im Sinne des Wortes besteht dann, wenn in der gegebenen Men-ge von Aussagen ”kein Widerspruch steckt“, d. h. aus ihr kein Widerspruch bewiesen


bzw. gefolgert werden kann. Fur den Aussagenkalkul wird dies durch Hilberts Defi-nition der klassischen Widerspruchsfreiheit (bzgl. des Ableitens ab) gefaßt. Man kannscharfer die semantische Widerspruchsfreiheit mit der Forderung definieren, daß alleswas beweisbar ist, auch wahr ist oder schwacher, daß nicht alles beweisbar sein darf(syntaktische Widerspruchsfreiheit).

Definition 2.7.1 (Widerspruchsfreiheit)

1. (Godel)

X ⊆ ausd heißt semantisch widerspruchsfrei genau dann, wenn ab (X) ⊆ ag

2. (Hilbert)

X heißt klassisch widerspruchsfrei genau dann, wenn es keinen Ausdruck H ∈ausd mit H ∈ ab (X) und ¬H ∈ ab (X) gibt.

3. (Post)

X heißt syntaktisch widerspruchsfrei genau dann, wenn ab (X) 6= ausd.

Satz 2.7.2

1. Wenn X semantisch widerspruchsfrei, so ist X klassisch widerspruchsfrei.

2. Wenn X klassisch widerspruchsfrei, so X syntaktisch widerspruchsfrei.

3. Die Umkehrungen gelten nicht.

Beweisder einzelnen Aussagen des Satzes

1. weil niemals H und ¬H zugleich allgemeingultig

2. p, ¬p sind nicht beide ableitbar, also ab (X) 6= ausd.

3. X1 = ¬ (p→ p) 6⊆ ag. X1 nicht semantisch widerspruchsfrei.

ab (X1) = ¬ (H → H) |H ∈ ausd klassisch widerspruchsfrei.

X2 = p→ p,¬ (p→ p) nicht klassisch widerspruchsfrei

Behauptung: p /∈ ab (X2). d. h. X2 syntaktisch widerspruchsfrei.

Beweis spater (siehe unten), nicht ableitbar.

2

Satz 2.7.3 (Endlichkeitssatz fur Widerspruchsfreiheit)Die semantische/klassische/syntaktische Widerspruchsfreiheit hat finiten Charakter,d. h. eine Menge X ist genau dann semantisch bzw. klassisch bzw. syntaktisch wider-spruchsfrei, wenn jede endliche Teilmenge X? ⊆ X diese Eigenschaft hat.

BeweisWir zeigen zuerst: Wenn X die Eigenschaft hat, dann auch jede endliche TeilmengeX? ⊆ X.

semantisch:

Wegen X? ⊆ X ist ab (X?) ⊆ ab (X) ⊆ ag


klassisch:Wenn X? nicht klassisch widerspruchsfrei ist, dann gibt es ein H ∈ ausd mitH,¬H ∈ ab(X?) ⊆ ab(X), also ist X nicht klassisch widerspruchsfrei.

syntaktisch:

Wegen X? ⊆ X ist ab (X?) ⊆ ab (X) ⊂ ausd

Jetzt setzen wir voraus, daß jede endliche Teilmenge X? ⊆ X die Eigenschaft hat undzeigen, daß auch X die Eigenschaft hat.

semantisch:Fur ab(X) ⊆ ag genugt es zu zeigen, daß X ⊆ ag ist. Sei H ∈ X, dann istH ⊆ X, also ab (H) ⊆ ag, folglich H ∈ ag (wegen H ∈ ab (H)), also istX ⊆ ag, was zu zeigen war.

klassisch: indirektNehmen wir an, daß ein H ∈ ausd mit

H,¬H ∈ ab (X)

existiert, d. h. X ist nicht klassisch widerspruchsfrei.

Nach dem Endlichkeitssatz fur das Ableiten existieren endliche X?1 ,X

?2 ⊆ X mit

H ∈ ab (X?1 ) und ¬H ∈ ab (X?

2 )

Dann ist X?1 ∪X?

2 endliche Teilmenge von X und

H,¬H ∈ ab (X?1 ∪X?

2 ) .

im Widerspruch dazu, daß jede endliche Teilmenge von X klassisch wider-spruchsfrei ist.

syntaktisch: indirektNehmen wir an, daß X nicht syntaktisch widerspruchsfrei ist: ab (X) = ausd.

Dann ist p ∈ ausd = ab (X), es gibt also eine endliche Teilmenge X? ⊆ X mit

p ∈ ab (X?) ,

folglich ist ab (X?) = ausd, also ist X? nicht syntaktisch widerspruchsfrei. /?

2

2.7.2 Vollstandigkeit

Die Vollstandigkeit einer Menge besagt die Umkehrung der Widerspruchsfreiheit, d. h.

semantisch: alles was wahr ist, ist beweisbar.

klassisch: von zwei Aussagen A und nicht A ist stets eine beweisbar.

syntaktisch: wenn eine nicht beweisbare Aussage als Axiom genommen wird, so istdie Widerspruchsfreiheit verletzt, d. h. alles wird beweisbar.

Definition 2.7.4 (Vollstandigkeit)


1. X ⊆ ausd heißt semantisch vollstandig genau dann, wenn ab (X) ⊇ ag

2. X ⊆ ausd heißt klassisch vollstandig genau dann, wenn fur jedes H ∈ ausd giltH ∈ ab (X) oder ¬H ∈ ab (X).

3. X ⊆ ausd heißt syntaktisch vollstandig genau dann, wenn fur jedes H ∈ ausdgilt: Wenn H /∈ ab (X), so ab (X ∪ H) = ausd

Satz 2.7.5

1. axa ist semantisch widerspruchsfrei und semantisch vollstandig.

2. Es gibt im AK keine klassisch vollstandige und klassisch widerspruchsfreie Men-ge X.

Beweis der zweiten BehauptungWir zeigen:

Wenn X ⊆ ausd klassisch vollstandig ist, so ist X nicht klassisch wider-spruchsfrei

Sei X klassisch vollstandig, dann ist

p ∈ ab (X) oder ¬p ∈ ab (X)

Fall 1: p ∈ ab (X)Es ist ab(X) = ausd, da in p jeder Ausdruck eingesetzt werden darf, also istX nicht syntaktisch widerspruchsfrei, also nach Satz (2.7.2.2) nicht klassischwiderspruchsfrei.

Fall 2: ¬p ∈ ab (X)Es ist

¬p(p/¬p

)= ¬¬p ∈ ab(X)

also ¬p,¬¬p ∈ ab(X), d. h. X ist ebenfalls nicht klassisch widerspruchsfrei.

2

Satz 2.7.6

1. Wenn X semantisch vollstandig, so ist X syntaktisch vollstandig.

2. Umkehrung gilt nicht

Beweis der ersten BehauptungEs sei X semantisch vollstandig, d. h. ag ⊆ ab(X) und H /∈ ab(X). Folglich istH /∈ ag, also

ab (ag ∪ H) = ausd.

Alsoab (X ∪ H) = ab (ab (X ∪ H)) ⊇ ab (ag ∪ H) = ausd

d. h. X ist syntaktisch vollstandig. 2

Beweis der zweiten BehauptungBetrachten: X = ¬p.ab (X) = ¬H|H ∈ ausd ⊂ ausd, X syntaktisch widerspruchsfrei.

Nach Lindenbaum existiert eine Menge Y mit


1. Y ⊇ X = ¬p

2. Y ist syntaktisch widerspruchsfrei und syntaktisch vollstandig

3. ab (Y ) = Y

Y ist nicht semantisch vollstandig, d. h. ag 6⊆ ab (Y )

sonst ware axa ⊆ ab (Y ) und ¬p ∈ Y \ axa ⊆ Y d. h. ab (axa ∪ ¬p) = ausd ⊆ Y

d. h. Y – nicht syntaktisch widerspruchsfrei /?. 2

2.7.3 Nichtableitbarkeit

Im Zusammenhang mit Satz 2.7.2 sind wir auf das Problem gestoßen

Wie beweist man p /∈ ab (p→ p,¬(p→ p)) ?

allgemein:

Wie zeigt man H /∈ ab(X) ?

Fur den Spezialfall X = axa ist das leicht, denn wegen ab(axa) = ag handelt es sichdann um die Frage H /∈ ag, das konnen wir entscheiden.

Wenn wir statt des Ableitens das Folgern betrachten, d. h. die Frage H /∈ fl(X)?betrachten, so ist klar, wie sie zu beantworten ist: Wir mussen ein Modell von Xfinden, das H falsch macht, dann ist H /∈ fl(X).

Diese Methode konnen wir zum Beweis von H /∈ ab(X) nutzbar machen, wenn es unsgelingt, das Ableiten semantisch (durch das Folgern) zu charakterisieren.

Wir ersetzen die klassische logische Matrix [W,F , W ,non, et, vel, seq, aeq] durcheine Matrix µ = [M,M?,Φ1,Φ2, . . . ,Φ5] und definieren

• βerfµH (uber µ) genau dann, wenn wertµ (H,β) ∈M?.

• agµ = Menge der H ∈ ausd mit: Fur alle β ∈ Bµ ist wertµ (H,β) ∈M?

= flµ (∅).

Satz 2.7.7abe

(agµ)

= agµ fur jede logische Matrix µ

BeweisMan zeigt durch Induktion uber H:Wenn H = H1

(p/H?

)und H1 ∈ agµ, so H ∈ agµ. 2

BemerkungFur aba gibt es keinen aquivalenten Satz, betrachten wir als Beispiel die Ma-trix µ0 = [W,F , W ,non, et, vel,Φ4, aeq] mit Φ4 (w,w′) ≡ W. Hierbei ist(p→ p) ∈ agµ0

und ((p→ p)→ p) ∈ agµ0, d. h. p ∈ aba

(agµ0

), aber p /∈ agµ0

.

Hinreichend fur die Widerspruchsfreiheit der Abtrennungsregel:

Wenn w ∈M? und Φ4 (w,w′) ∈M?, so w′ ∈M?.

d. h. wenn w ∈M? und w′ ∈M \M?, so Φ4 (w,w′) ∈M \M? (?)


Definition 2.7.8Eine logische Matrix µ heißt normal, wenn Φ4 die Bedingung (?) erfullt.

Folgerung 2.7.9Wenn µ eine normale logische Matrix ist, so ist ab

(agµ)

= agµ.

Satz 2.7.10 (Satz von Lindenbaum)Zu jeder Menge X ⊆ ausd gibt es eine hochstens abzahlbare normale logische Matrixµ mit ab (X) = agµ.

BeweisWir betrachten die Matrix µ = [M,M?,Φ1, . . . ,Φ5] mit

M := ausdM? := ab (X)

Φ1 (H) := ¬HΦ2 (H1,H2) := (H1 ∧H2)Φ3 (H1,H2) := (H1 ∨H2)Φ4 (H1,H2) := (H1 → H2)Φ5 (H1,H2) := (H1,↔ H2)

Die Menge M ist abzahlbar unendlich. Wir zeigen, daß µ normal ist, d. h.

wenn H ∈ ab (X) und Φ4 (H,H ′) = (H → H ′) ∈ ab (X) , so H ′ ∈ ab (X)

das gilt nach Definition von ab (Abtrennungsregel).

Es bleibt zu zeigen, daß gilt:

ab (X) = agµ

Es sei H ∈ agµ, d. h. wertµ (H,β) ∈ ab (X) fur alle β ∈ Bµ.

Wir betrachten die Belegung β? ∈ Bµ mit

β? (pi) := pi ∈ ausd

Offenbar ist

wertµ (H,β?) = H

also ist H ∈ ab (X).

Es sei umgekehrt H ∈ ab (X), dann ist

abe (H) ⊆ ab (X)

Es sei β eine beliebige Belegung der Aussagenvariablen mit Ausdrucken. Dann ist(wenn genau p1, . . . , pn in H vorkommen)

wertµ (H,β) = H[p1/β(p1), . . . , pn/β(pn)

]∈ abe (H) ⊆ ab (X)

d. h. H ∈ agµ. 2

Bemerkung: Es geht im allgemeinen nicht mit einer endlichen Matrix.

2.8. DUALITATSTHEOREME 93

Satz 2.7.11 (Semantische Charakterisierung von ab)Es ist H ∈ ab (X) genau dann, wenn fur jede normale hochstens abzahlbare logischeMatrix µ mit X ⊆ agµ stets H ∈ agµ.

Beweis

(⇒) Es sei XablH (H ∈ ab (X)) µ–normal X ⊆ agµDann ist H ∈ ab (X) ⊆ agµ (weil µ–normal) also H ∈ agµ

(⇐)

H ∈⋂

µ–normalX ⊆ agµ

agµ

Nach Satz von Lindenbaum gibt es µ? mit ab (X) = agµ? . Dabei X ⊆ agµ? .Folglich H ∈ agµ? = ab (X). d. h. H ∈ ab (X).

2

Folgerung 2.7.12 (Satz uber Nichtableitbarkeit)H /∈ ab (X) genau dann, wenn es eine hochstens abzahlbare logische Matrix µ mitX ⊆ agµ und H /∈ agµ gibt.

Beispiel

p /∈ ab (p→ p,¬ (p→ p))µ = [W,F , W ,Φ1, et, vel, seq, aeq]

Φ1 : Φ1 (W ) = W,Φ1 (F ) = F .

µ normal, da Φ4 = seq.

wertµ (p→ p, β) = seq (β (p) , β (p)) = W ∈ Wp→ p ∈ agµ

wertµ (¬ (p→ p) , β) = Φ1 (wert (p→ p, β)) = wertµ (p→ p, β) ∈ W

aber β? (p) = F →wertµ (p, β?) = F d. h. p /∈ agµ.

Satz 2.7.13axa ist unabhangig, d. h. wenn H ∈ axa, so ab (axa \ H) 6= ag und es gilt: H /∈ab (axa \ H).

2.8 Dualitatstheoreme

Mit den im Aussagenkalkul entwickelten Hilfsmitteln kann nun der Beweis des Dua-litatstheorems fur Mengenterme angegangen werden. Dazu geben wir eine induktiveDefinition (im Gegensatz zur Erzeugung durch eine Grammatik — siehe Seite 47) furMengenvariablen, –terme und –gleichungen an:

Alphabet: A = M,?,∪,∩, ,=, (, )


Mengenvariable:

A) M ist eine Mengenvariable.

I) Wenn das Wort Z eine Mengenvariable ist, so auch Z?.E) Sonst nichts.

MV := M, M?, M ? ?, . . . = = = usw.M1 M2 M3

Mengenterme:

A) Jede Mengenvariable ist ein Mengenterm

I) 1. Ist T1 ein Mengenterm, so ist T1 ein Mengenterm2. Sind T1, T2 Mengenterme, so sind (T1 ∪ T2), (T1 ∩ T2) Mengenterme.

E) Sonst nichts.

Gleichungen: Sind T1, T2 Mengenterme, so heißt T1 = T2 Gleichung.

Weiterhin definieren wir:

Belegung: Eine Abbildung f : M0, . . . → P (E) heißt Belegung.

Set: Die von einem Term T bei einer Belegung f beschriebene Menge Set (T, f)

A) Set (Mi, f) := f (Mi)

I) Set(T , f

):= Set (T, f) = E \ Set (T, f)

Set(T1∪∩T2, f

)= Set (T1, f) ∪∩Set (T2, f)

Gultigkeit: Eine Gleichung G ≡ T1 = T2 heißt gultig gdw. fur alle Belegungen fSet (T1, f) = Set (T2, f) ist.

Satz 2.8.1 (Dualitatstheorem fur Mengengleichungen)Ist G eine gultige Gleichung und entsteht G′ aus G indem gleichzeitig an allen Stellen

”∩“ durch ”∪“ und ”∪“ durch ”∩“ ersetzt wird, dann ist G′ gultig.

Beispiel

(M0 ∪M1) =(M0 ∩M1

)↓

(M0 ∩M1) =(M0 ∪M1

)Beweis durch Reduktion auf das Dualitatstheorem der AussagenlogikZu jedem Term T konstruieren wir einen Ausdruck HT :

A) T ≡Mi HT ≡ pi

I) T ≡ T ′ HT ≡ ¬HT ′

T ≡ (T1 ∪ T2) HT ≡ (HT1 ∨HT2)T ≡ (T1 ∩ T2) HT ≡ (HT1 ∧HT2)

2.8. DUALITATSTHEOREME 95

HilfssatzSei T Mengenterm, a ∈ E und f Belegung, ferner

βa,f (pi) :=

W, falls a ∈ f (Mi)F, sonst

Dann gilt:a ∈ Set (T, f) gdw. wert (HT , βa,f ) = W

Beweis des Hilfssatzesdurch Induktion uber T

A) T = Mi

a ∈ Set (Mi, f) = f (Mi) gdw. wert (pi, βa,f ) = W gilt.

I) a ∈ Set(T , f

)gdw. a ∈ Set (T, f)gdw. nicht a ∈ Set (T, f)gdw. nicht wert (HT , βa,f ) = Wgdw. wert (HT , βa,f ) = Fgdw. wert (¬HT , βa,f ) = Wgdw. wert

(HT , βa,f

)= W

a ∈ Set (T1 ∩ T2, f) gdw. a ∈ Set (T1, f) und a ∈ Set (T2, f)gdw. wert (HT1 , βa,f ) = W und wert (HT2 , βa,f ) = Wgdw. wert (HT1 ∧HT2 , βa,f ) = Wgdw. wert (HT1∩T2 , βa,f ) = W

analog fur T = T1 ∪ T2. 2

Satz 2.8.2T1 = T2 gultig gdw. HT1 , HT2 semantisch aquivalent.

BeweisEs ist T1 = T2 gultig gdw.

fur alle f : Set (T1, f) = Set (T2, f)l

fur alle f , alle a ∈ E : a ∈ Set (T1, f) gdw. a ∈ Set (T2, f)l

fur alle β : wert (HT1 , β) = W gdw. wert (HT2 , β) = W

2

Satz 2.8.3 (Dualitatstheorem der Aussagenlogik)Es seien H1, H2 Ausdrucke, in denen die Zeichen →,↔ nicht vorkommen, fernersei H ′i der aus Hi durch simultanes Ersetzen von ∧ durch ∨ und von ∨ durch ∧entstehende Ausdruck. Dann gilt:

Wenn ag (H1 ↔ H2) , so ag (H ′1 ↔ H ′2) .

Offenbar gilt dann:

G ≡ T1 = T2 gultig → ag (HT1 ↔ HT2)← Dualitat

→ ag(H ′T1

↔ H ′T2

)→ T ′1 = T ′2 gultig.

Damit haben wir das Dualitatstheorem fur Mengenterme bewiesen. 2

Beweis des Dualitatstheorems der AussagenlogikWir zeigen: Wenn H1 → H2 ∈ ag, so H ′2 → H ′1 ∈ ag. Es seien o. B. d. A. p1, . . . , pnalle AV in H1 → H2. Dann ist

(H1 → H2)[p1/¬p1 , . . . , pn/¬pn

]= (H?

1 → H?2 ) ∈ ag

wobei H?i = Hi

[p1/¬p1 , . . . , pn/¬pn

].

Nun ist ¬ (H0 ∧H00) ∼sem ¬H0 ∨ ¬H00 und ¬ (H0 ∨H00) ∼sem ¬H0 ∧ ¬H00.

Mittels dieser Aquivalenz treiben wir die Negationszeichen nach außen. (← anwendenvon rechts nach links) Dabei geht H?

1 in ¬H ′1, H?2 in ¬H ′2 uber, wir erhalten also

(¬H ′1 → ¬H ′2) ∈ ag

also (H ′2 → H ′1) ∈ ag (Kontraposition). 2

Beispiel

M = M ∪ (M ∩N) Absorptionsgesetzubersetzen →p↔ p ∧ (p ∨ q)p↔ p ∨ (p ∧ q)

→M = M ∩ (M ∪N).

Kapitel 3

Berechnungstheorie

Warum unternehmen wir an dieser Stelle einen Abstecher in die Berechnungstheorie,d. h. in die Theorie der Algorithmen? Bisher sind wir doch mit dem intuitiven Al-gorithmenbegriff gut ausgekommen, z. B. als wir zeigten, daß es einen Algorithmusgibt, der auf jeden Ausdruck H des Aussagenkalkuls angewendet werden kann undstets nach endlich vielen Schritten terminiert mit einem der Resultate ”H ∈ ag“ oder

”H /∈ ag“ und mit ”H ∈ ag“ genau dann endet, wenn H allgemeingultig ist. Es zeigtsich aber, daß ein solcher Algorithmus zur Entscheidung der Gultigkeit im Pradika-tenkalkul (ab Seite 123) nicht gefunden wurde und es stellt sich damit die Frage nacheinem Beweis dafur, daß ein solcher Algorithmus nicht existiert. Ein exakter Beweiskann nur auf der Basis exakt definierter Begriffe gefuhrt werden; wir mussen also denAlgorithmenbegriff exakt definieren, d. h. Theorie der Algorithmen betreiben.

Obwohl hier die Logik zur Motivierung der Algorithmentheorie angefuhrt wird (sieist aus dem Bedurfnis der Logik entstanden), bildet die Algorithmentheorie heuteden Kern der Informatik, auch die Definition einer beliebigen Programmiersprache(und ihrer Semantik) ist nichts anderes als die Festlegung eines Algorithmenbegriffs.Insofern kann die Theorie der Programmierung als Teilgebiet der Algorithmentheoriebzw. als angewandte Algorithmentheorie verstanden werden.

Betrachten wir z. B. folgendes praktisches Problem: Sie haben ein Programm ge-schrieben und es mit einem Datensatz gestartet. Auf dem Bildschirm passiert nichts.Nach einiger Zeit des Wartens fragen Sie sich: Ist das Programm in eine Endlosschlei-fe geraten (durch einen Programmierfehler) oder dauert die Berechnung wirklich solange? Es ware doch schon, wenn man ein Programm hatte, das einen Programmtextund einen Datensatz einliest und dann die Frage beantwortet, ob das eingelesene Pro-gramm bei dem eingelesenen Datensatz terminiert. Die Algorithmentheorie beweist,daß ein solches Programm nicht existiert, das ”Halteproblem“ ist nicht entscheidbar.

Neben solchen prinzipiellen Fragen (”existiert ein Algorithmus, der . . .“) behandeltdie Berechnungstheorie aber auch die Frage nach der Qualitat von Algorithmen, diedurch Laufzeit- und Speicherplatz–Bedarf gemessen wird.

3.1 Grundbegriffe

Jeder kennt eine Vielzahl von Algorithmen (Rechenverfahren, Bedienungsanleitun-gen, Kochrezepte, . . . ) und hat daraus einen intuitiven Begriff des Machbaren (mitendlichen Mitteln und in endlicher Zeit) abstrahiert. Dieser Begriff reicht aus, um zuverifizieren, daß ein angegebenes Verfahren ein bestimmtes Problem lost (z. B. das

98 KAPITEL 3. BERECHNUNGSTHEORIE

Entscheidungsproblem im Aussagenkalkul). Dieser Begriff bietet aber keinen Ansatz-punkt fur einen Beweis dessen, daß ein Problem unlosbar ist.

Gibt es uberhaupt Probleme, die algorithmisch unlosbar sind? Betrachten wir alsBeispiel Entscheidungsprobleme fur Sprachen; wir fixieren ein endliches Alphabet Xund betrachten alle Sprachen uber X, also P (W (X)). Die Kardinalzahl dieser Mengeist großer als ℵ0, die Kardinalzahl der Menge N.

Zu jeder Sprache L ⊆W (X) gehort das Entscheidungsproblem von L, d. h. die Menge

p ∈ L?|p ∈W (X)

der Aufgaben festzustellen, ob ein spezifisches Wort p zu L gehort oder nicht.

Ein Algorithmus lost dieses Problem, wenn er auf jedes Wort p ∈ W (X) angewen-det werden kann und seine Anwendung stets nach endlich vielen Schritten mit derrichtigen Antwort auf die Frage p ∈ L? terminiert.

Ein Algorithmus selbst hat eine endliche Beschreibung, etwa durch ein Wort ubereinem endlichen Alphabet Y . Die Menge der Worter uber Y kann bijektiv auf Nabgebildet werden, ist also abzahlbar unendlich, d. h. es gibt ”weniger“ Algorithmenals Entscheidungsprobleme, es muß also unlosbare Probleme geben.

Der intuitive Ansatz bietet, wie gesagt, keinen Ansatz fur einen exakten Beweis dafur,daß ein bestimmtes Problem unlosbar ist. Dazu muß der Algorithmenbegriff prazisiertwerden. Jede Prazisierung bringt aber unvermeidlich eine Einschrankung der zugelas-senen Vorgehensweisen mit sich, so daß nach einem Unlosbarkeitsbeweis die Frageentsteht, ob es an der Prazisierung oder am Problem liegt, daß keine Losung existiert.

Dieser Frage ist man dadurch entkommen, daß man den Algorithmenbegriff mehr-fach in unterschiedlicher Weise prazisiert und die Gleichwertigkeit der verschiedenenPrazisierungen bewiesen hat. Diese Ansatze konnen wie folgt sortiert werden:

1. Axiomatischer Ansatz (Church, Kleene)Man erklart gewisse Funktionen per Axiom fur berechenbar und definiert Ope-rationen mit Funktionen, die per definitionem die Berechenbarkeit erhalten.

2. Maschinen–Ansatz (Turing)Man definiert einen Typ von Rechenmaschinen und erklart als berechenbar ge-nau das, was diese Maschinen berechnen konnen.

3. Semiotischer Ansatz (Markow, Post)Rechnen bzw. algorithmisches Vorgehen wird als Manipulation von Zeichenrei-hen (Wortern) nach gewissen Regeln verstanden.

4. Beweistheoretischer Ansatz (Godel)Das Berechnen eines Funktionswertes k = f(i) wird als Beweisen der Gleichungf(i) = k verstanden.

Wir werden uns im folgenden nur mit dem axiomatischen und dem Maschinen–Ansatzbefassen.

Was ist ein Problem?

Als Problem bezeichnen wir eine Familie von Aufgaben, die von einem oder mehrerenParametern abhangen. Dabei unterscheiden wir Berechnungsprobleme

f (x1, . . . , xn) =? | x1, . . . , xn ∈ N

und Entscheidungsprobleme, wie z. B.

H ∈ ag?|H ∈ ausd

3.2. AXIOMATISCHE CHARAKTERISIERUNG 99

In dem einen Fall geht es um die Berechnung eines Wertes (z. B. einer naturlichenZahl), im anderen um die Bestimmung eines Wahrheitswertes.

Das Berechnungsproblem f (x1, . . . , xn) =? | x1, . . . , xn ∈ N der Funktion f heißtlosbar bzw. die zahlentheoretische Funktion f heißt berechenbar, wenn es einen Algo-rithmus gibt, der fur jedes x1, . . . , xn ∈ N folgendes leistet:

Wenn f fur [x1, . . . , xn] definiert ist, dann stoppt die Anwendung des Algorithmus auf[x1, . . . , xn] nach endlich vielen Schritten mit dem Wert f(x1, . . . , xn) als Resultat;wenn f fur [x1, . . . , xn] nicht definiert ist, dann stoppt die Anwendung des Algorithmusniemals.

Wir verlangen also nicht, daß der Algorithmus erkennt, daß f fur [x1, . . . , xn] nichtdefiniert ist und mit einer Fehlermeldung stoppt.

Jedes Entscheidungsproblem, also auch

H ∈ ag? | H ∈ ausd,

kann auf ein Berechnungsproblem zuruckgefuhrt werden; dazu geht man zur charak-teristischen Funktion der zu entscheidenden Menge uber, hier:

χag(H) =

0, falls H ∈ ag1, sonst

und hat das Problemχag(H) =? | H ∈ ausd

zu losen. Durch eineindeutige Numerierung der Menge aller Ausdrucke kommt mandazu, daß man nur die Berechenbarkeit zahlentheoretischer Funktionen untersuchenmuß

3.2 Axiomatische Charakterisierung derBerechenbarkeit

Einer der historisch ersten Ansatze, den Berechenbarkeitsbegriff zu fassen, definiertinduktiv eine Klasse von Funktionen, indem zunachst einige einfache Anfangsfunktio-nen angegeben werden, die per Definition in der Klasse enthalten sind. Sodann werdenverschiedene Prinzipien angegeben, wie aus Funktionen, die in der Klasse liegen, neueFunktionen gewonnen werden konnen.

Wir nennen eine n-stellige zahlentheoretische Funktion total, wenn sie fur alle n-Tupelvon naturlichen Zahlen definiert ist.

3.2.1 Anfangsfunktionen

AnfangsfunktionenANF = Menge der folgenden zahlentheoretischen Funktionen

1. N (x) = x+ 1 (Nachfolgerfunktion)

2. Cni (x1, . . . , xn) = i (n-stellige Konstanten)

3. Ink (x1, . . . , xn) = xk (Argumentauswahl)

Satz 3.2.1Alle Funktionen aus ANF sind intuitiv–anschaulich berechenbar (und total).


3.2.2 Substitution und primitive Rekursion

SubstitutionDie Funktion φ(n) entsteht durch Substitution aus ψ(m) und χ

(n)1 , . . . , χ

(n)m gdw.

φ(n) (x1, . . . , xn) = ψ(m)(χ

(n)1 (x1, . . . , xn) , . . . , χ(n)

m (x1, . . . , xn))

Die Substitution kann auch auf partielle (d. h. nicht totale) Funktionen angewendetwerden. Die Funktion φ(n) ist fur [x1, . . . , xn] (durch die angegebene Gleichung) defi-niert genau dann, wenn χ(n)

1 , . . . , χ(n)m fur [x1, . . . , xn] definiert sind und ψ(m) fur das

m-Tupel[χ

(n)1 (x1, . . . , xn) , . . . , χ(n)

m (x1, . . . , xn)]

definiert ist.

Satz 3.2.2Sind ψ(m) und χ

(n)1 , . . . , χ

(n)m intuitiv–anschaulich berechenbare Funktionen und ent-

steht φ(n) durch Substitution von ψ(m) und χ(n)1 , . . . , χ

(n)m , so ist φ(n) intuitiv–

anschaulich berechenbar. Sind dabei ψ(m), χ(n)1 , . . . , χ

(n)m total, so ist auch φ(n) total.

Da wir die Substitution als Erzeugungsoperation verwenden werden, konnen wir auchmit einer kleineren Menge von Anfangsfunktionen auskommen, namlich von den Kon-stanten Cni nur die Konstanten Cn0 als Anfangsfunktion behalten, die ubrigen konnenja durch Substitution aus Cn0 und der Nachfolgerfunktion erzeugt werden:

Cn1 (x1, . . . xn) = N (Cn0 (x1, . . . , xn))Cn2 (x1, . . . xn) = N (N (Cn0 (x1, . . . , xn)))

...

Induktive Definition, die primitive RekursionDie Funktion φ(n+1) entsteht durch primitive Rekursion aus ψ(n) und χ(n+2), wennφ(n+1) die Losung des folgenden Gleichungssystems ist:

φ(n+1) (x1, . . . , xn, 0) = ψ(n) (x1, . . . , xn)

φ(n+1) (x1, . . . , xn, i+ 1) = χ(n+2)(x1, . . . , xn, i, φ

(n+1) (x1, . . . , xn, i))

.

Sind ψ(n) und χ(n+2) partielle Funktionen, so wird i. a. auch φ(n+1) partiell sein.Auch hier pflanzt sich das Nicht–Definiert–Sein fort, ist z. B. φ(n+1)(x1, . . . , xn, j)nicht definiert, so auch φ(n+1)(x1, . . . , xn, j + 1). Der folgende Satz verallgemeinertden Dedekindschen Rechtfertigungssatz (vgl. S. 44).

Satz 3.2.3Sind ψ(n) und χ(n+2) gegebene Funktionen, so existiert genau ein φ(n+1), welches dasSchema erfullt.

Satz 3.2.4Sind ψ(n), χ(n+2) intuitiv–anschaulich berechenbar und φ(n+1) entsteht durch primi-tive Rekursion aus ψ(n) und χ(n+2), so ist φ intuitiv–anschaulich berechenbar. Sindψ(n), χ(n+2) total, so ist auch φ(n+1) total.

primitiv-rekursive FunktionenPRM = die kleinste Klasse von zahlentheoretischen Funktionen, die ANF enthaltund abgeschlossen bezuglich Substitution und primitiver Rekursion ist.


Satz 3.2.5Die primitiv-rekursiven Funktionen sind total.

3.2.3 Beispiele fur primitiv–rekursive Funktionen

Die folgenden zahlentheoretischen Funktionen sind primitiv–rekursiv:

• Addition m+ n

• Multiplikation m · n

• Vorganger V (n) :=n− 1, n > 00, sonst

• Arithmetische Differenz

m.− n :=

m− n, m ≥ n0, sonst

m.− 0 = m

m.− (n+ 1) = V

(m

.− n

)• Betrag einer Differenz

|m− n| =(m

.− n

)+(n.− m

)• sg (signum)

sg (0) = 0sg (m+ 1) = 1

• sgsg (n) = 1

.− sg (n)

• Allgemeine Summe

Sei g eine (n+ 1)-stellige primitiv–rekursive Funktion.

Dann ist

f (m1, . . . ,mn, k) :=k∑i=0

g (m1, . . . ,mn, i)

primitiv–rekursiv.

Bemerkung:

f (m1, . . . ,mn, 0) = g (m1, . . . ,mn, 0)f (m1, . . . ,mn, k + 1) = f (m1, . . . ,mn, k) + g (m1, . . . ,mn, k + 1)

• allgemeines Produkt

Sei g wie oben, dann ist

f (m1, . . . ,mn, k) =k∏i=0

g (m1, . . . ,mn, i)

primitiv-rekursiv.


• Fakultat0! = 1

(n+ 1)! = n! · (n+ 1)

• Division mit Rest [x

y

]:=

0, y = 0xDIVy, sonst

[x

y

]= sg(y) ·

x∑j=0

sg

(j∏i=0

[(x+ 1)

.− (i+ 1) · y

])

• Rest der Division

rest (x, y) = x.−[x

y

]· y

Definition 3.2.6 (Beschrankter Minimum–Operator)Es sei g(n+1) eine (n+ 1)-stellige totale zahlentheoretische Funktion.

Fur m1, . . . ,mn, k ∈ N sei

f (m1, . . . ,mn, k) :=

die kleinste Zahl i mit i ≤ k undg (m1, . . . ,mn, i) = 0, falls ein sol-ches i existiert

0, sonst

Wir notieren die Funktion f durch

f(m1, . . . ,mn, k) = µi (i ≤ k ∧ g(m1, . . . ,mn, i) = 0)

und sagen, daß sie aus g durch Anwendung des beschrankten Minimumoperatorsentsteht.

Satz 3.2.7Die Anwendung des beschrankten Minimumoperators auf eine primitiv–rekursiveFunktion g erzeugt eine primitiv–rekursive Funktion f (fuhrt nicht aus der KlassePRM heraus).

BeweisMan uberlegt sich sofort, daß folgendes gilt

f (m1, . . . ,mn, k) =[∑ki=0 sg

(∏ij=0 g (m1, . . . ,mn, j)

)]· sg([∑k

i=0 sg(∏i

j=0 g (m1, . . . ,mn, j))] .− k

)2

Folgerung 3.2.8Die Funktion q (n) := die n-te Primzahl und exp(x, n) := der Exponent der n-tenPrimzahl in der Primzahldarstellung von x sind primitiv–rekursiv.


Beweis

q (0) = 2 = C02

q (n+ 1) = µj

(j ≤ (q (n)! + 1) ∧

(q (n) + 1

.− j)

+j−1∑k=2

sg (rest (j, k)) = 0

).

exp (x, n) =x∑j=1

sg(rest

(x, q(n)j

)).

3.2.4 Die Peterfunktion

Offensichtlich sind die primitiv-rekursiven Funktionen nicht alle berechenbaren, dennz. B. die partiellen Funktionen gehoren nicht zu PRM. Es gibt aber auch totale Funk-tionen, die intuitiv–anschaulich berechenbar, aber nicht primitiv–rekursiv sind.

Ackermann gab 1928 eine solche nicht primitiv–rekursive, aber totale und berechen-bare Funktion an. In der spater von R. Peter vereinfachten Version ist die Funktionwie folgt definiert:

PeterfunktionP : N × N → N

P (0, n) = n+ 1P (m+ 1, 0) = P (m, 1)

P (m+ 1, n+ 1) = P (m,P (m+ 1, n))

Beweis der Berechenbarkeit der Peterfunktion

PROCEDURE Peter(m,n : CARDINAL) : CARDINALBEGIN

IF m = 0 THEN RETURN(n+ 1); ELSEIF n = 0 THEN RETURN Peter(m− 1, 1);ELSE RETURN Peter(m− 1, Peter(m,n− 1));END;

END;END Peter;

Wir konnen also ein Programm angeben, das die Peterfunktion berechnet. 2

BeispielEinige Werte der Peterfunktion:

P (0, n) = n+ 1 P (1, n) = n+ 2P (2, n) = 2n+ 3 P (3, n) = 2n+3 − 3P (4, 0) = 13 P (4, 1) = 65533 P (4, 2) = 265536 − 3

Um zu zeigen, daß die Peterfunktion nicht primitiv-rekursiv ist, benutzen wir folgendesLemma, das die Existenz einer Majorante, d. h. einer Funktion, die schneller wachstals alle primitiv-rekursiven Funktionen, sichert.

LemmaZu jeder einstelligen primitiv-rekursiven Funktion φ gibt es eine Zahl m derart, daßfur alle n ∈ N gilt φ (n) < P (m,n).


Zum Beweis des Lemmas siehe R.Peter ”Rekursive Funktionen“ [6, Seite 68–73].

Mit der Existenz einer Majorante konnen wir nun indirekt zeigen, daß die Peterfunk-tion nicht primitiv-rekursiv ist.

BeweisAnnahme: P primitiv-rekursiv

Dann definieren wir

Q (n) := P(I11 (n) , I1

1 (n))

= P (n, n)

und Q ist ebenfalls primitiv-rekursiv.

Nach Lemma existiert eine Zahl m? mit

Q (n) < P (m?, n)

Fur n = m? ergibt sich

Q (m?) < P (m?,m?) = Q (m?) /?

Die Peterfunktion ist also nicht primitiv-rekursiv. 2

Folglich ist eine Erweiterung notig, um alle berechenbaren Funktionen zu bekommen:

3.2.5 Minimum-Operator und partiell-rekursive Funktionen

Am Beispiel der Peterfunktion sieht man, daß eine verschrankte Rekursion uber zweiVariable offenbar machtiger ist als eine primitive Rekursion, die nur abwarts ubereine Variable geht. Eine Rekursion ”aufwarts“ durfte dagegen niemals zu einem Endekommen. Der Kompromiß besteht darin, daß man zwar aufwarts geht, aber nichtrekursiv, sondern aufwarts nach einer Nullstelle (d. h. der kleinsten Nullstelle) sucht.Wir gehen damit vom beschrankten zum unbeschrankten Minimumoperator uber undlassen auch partielle Funktionen als Argument zu.

Minimum-OperatorEs sei ψ eine (n+ 1)-stellige zahlentheoretische Funktion. Die (partielle) Funktionφ entsteht durch Anwenden des Minimum-Operators auf ψ, wenn

φ (x1, . . . , xn) = µj (ψ (x1, . . . , xn, j) = 0) =

das kleinste j ∈ N, mitψ (x1, . . . , xn, j) = 0 und furalle i < j ist ψ (x1, . . . , xn, i)definiert, falls solches j existiert.

nicht definiert, sonst

(Das ist Formalisierung des systematischen Probierens.)

Satz 3.2.9Entsteht φ durch Anwendung des Minimum-Operators auf ψ und ist ψ intuitiv–anschaulich berechenbar, so ist φ intuitiv–anschaulich berechenbar.

Beweis


PROCEDURE PHI(x1, . . . xn : CARDINAL) : CARDINAL;VAR i, j:CARDINAL;BEGINi := 0;LOOP

j := PSI(x1, . . . xn, i);(? wenn ψ (x1, . . . , xni) nicht de-finiert ist, wird die Prozedur PSIniemals terminieren ?)

IF j = 0 THEN RETURN i;ELSE INC(i)END

ENDEND PHI;

Da wir ein Programm angeben konnen, ist φ intuitiv–anschaulich berechenbar. 2

partiell-rekursive FunktionenPREK ist die kleinste Klasse von Funktionen, die ANF enthalt und abgeschlossenist bezuglich Substitution, primitiver Rekursion und Anwendung des Minimum-Operators.

Folgerung 3.2.10ANF ⊆ PRM ⊆ PREK

Es ist z. B. die Addition primitiv–rekursiv, aber nicht Anfangsfunktion, und die ein-stellige leere (also nirgends definierte) Funktion l ist nicht primitiv–rekursiv (weilnicht total), aber partiell rekursiv:

l(m) = µj (N (+ (m, j)) = 0)

Definition 3.2.11 (allgemein–rekursive Funktionen)Eine zahlentheoretische Funktion heißt allgemein–rekursiv, wenn sie partiell–rekursivund total ist.

Bei der Anwendung des µ-Operators entsteht in der Regel aus einer totalen Funk-tion eine partielle, aber auch umgekehrtes ist moglich, aus einer partiellen Funktionentsteht eine totale.

Ist z. B.

g(x, i) :=

0, falls i = 0

nicht definiert, sonst

so ist µi (g(x, i) = 0) = C10 (x).

Offenbar ist µi (g(x1, . . . , xn, i) = 0) eine totale Funktion genau dann, wenn

1. zu jedem x1, . . . , xn ein i existiert mit g(x1, . . . , xn, i) = 0

2. fur alle j < i ist g(x1, . . . , xn, j) definiert.

Ist g eine totale Funktion, so ist die zweite Bedingung trivial.

Wenn die erste Bedingung erfullt ist, so sagt man, daß die Anwendung des µ-Operators

”im Normalfall“ erfolgte. Man kann dann zeigen, daß man die Klasse der allgemein–rekursiven Funktionen auch ohne Bezug auf partielle Funktionen definieren kann:


Satz 3.2.12 (allgemein–rekursive Funktionen)REK ist die kleinste Klasse von zahlentheoretischen Funktionen, die alle Anfangsfunk-tionen enthalt und abgeschlossen ist in bezug auf Substitution, primitive Rekursion undAnwendung des Minimum–Operators im Normalfall.

3.3 Der Maschinen–Ansatz

A.M. Turing schlug 1936 eine auf der — nach ihm benannten — Turing–Maschinebasierende formale Definition des Berechenbarkeitsbegriffs vor.

3.3.1 Die Turing–Maschine

Eine Turing–Maschine laßt sich wie folgt beschreiben:

• ein beidseitig unbegrenztes Band, das in Felder aufgeteilt ist

• jedes Feld kann ein Zeichen aus einem endlichen Alphabet oder ein Leerzeichenaufnehmen

• auf dem Band bewegt sich ein Schreib–Lesekopf, dabei kann genau das Feldunter dem Kopf gelesen oder beschrieben werden; danach bewegt sich der Kopfmaximal um eine Position nach links oder rechts

• ein Programm (auch Maschinentafel genannt) gibt die Berechnungsschritte an

• bei der Berechnung kann nur eine endliche Menge von Zustanden angenommenwerden

Veranschaulichung

Kopf

. . . . . .

Programm mit..

Zustandenendlich vielen

Formal definieren wir

Turing–MaschineT = [X,Z, z0, δ] ist Turing–Maschine, wenn:

1. X endliches Alphabet, ? /∈ X (Leerzeichen)

2. Z endliche Menge von Zustanden, z0 ist der Anfangszustand

3. δ : Z × (X ∪ ?)→ (X ∪ ?)×B ×Z ist die Uberfuhrungsfunktion, wobeiB = R,L,N, S die Menge der Kopfbewegungen ist.

Arbeitsweise

1. T arbeitet taktweise

3.3. DER MASCHINEN–ANSATZ 107

2. In Takt 1 ist T im Zustand z0

3. Ist zi−1 der Zustand von T im Takt i und x das Zeichen im betrachteten Feldund δ (zi−1, x) = [y, b, z], so wird

• y in das betrachtete Feld geschrieben

• die Kopfbewegung b ausgefuhrt:

b = L Kopf nach links b = R Kopf nach rechtsb = N keine Kopfbewegung b = S Stop der Berechnung

• in den Zustand zi = z ubergegangen.

Davon ausgehend definieren wir (indem wir die Definition der Turing–Maschine wei-ter einschranken und prazisieren) den Begriff der

Turing–BerechenbarkeitSei φ :×

nN → N eine zahlentheoretische Funktion.

φ heißt Turing–berechenbar, wenn es eine Turing–Maschine mit X = |,also

T = [| , Z, z0, δ]

so gibt, daß fur alle x1, x2, . . . , xn ∈ N gilt:Wenn [x1, . . . , xn] ∈ Dφ und T wird in der Situation

· · · ? ? | · · · |︸︷︷︸x1+1

? | · · · |︸︷︷︸x2+1

? · · · ? | · · · |︸︷︷︸xn+1

?4z0

? · · ·

gestartet, so stoppt T nach endlich vielen Takten in der Situation

· · · ? ? | · · · |︸︷︷︸x1+1

? | · · · |︸︷︷︸x2+1

? · · · ? | · · · |︸︷︷︸xn+1

? | · · · |︸︷︷︸φ(x1,...,xn)+1

?4z

· · ·

Wenn dagegen [x1, . . . , xn] /∈ Dφ, so kommt T nicht zum Stop.Wir verlangen noch zusatzlich, daß der Kopf bei der Berechnung nicht uber daszweite leere Feld links von den Argumenten hinauslauft.

Wie man sieht, codieren wir die naturlichen Zahlen unar, d. h. jede Zahl n wird durchn+ 1 Striche dargestellt. Dadurch konnen wir 0 als einen Strich schreiben.

Turing–berechenbare FunktionenTM = die Klasse der Turing–berechenbaren zahlentheoretischen Funktionen.

3.3.2 Bausteine fur Turing–Maschinen

Wir geben nun einige (spater benotigte) simple Bausteine, sogenannte Makros, furTuring–Maschinen–Programme an. Dazu sei X = |. Der Anfangszustand ist 1.Bei einem Stoppbefehl geben wir keinen Folgezustand an, obwohl das formal gefordertware, ebenso fullen wir Felder in den Tabellen nicht aus, die nicht zum Zuge kommenkonnen.

• r : ”Gehe ein Feld nach rechts“


r ? |1 ?R2 |R22 ?S |S

• l : ”Gehe ein Feld nach links“

l ? |1 ?L2 |L22 ?S |S

• ”|“ : ”Schreibe | auf das betrachtete Feld“

”|“ ? |1 |N2 |N22 – |S

• ”?“ : ”Schreibe ? auf das betrachtete Feld“

”?“ ? |1 ?N2 ?N22 ?S –

• −<: ”bedingter Sprung“

*

| ? |1 ?N2 |N32 ?S –3 – |S

• P1;P2 bzw. P1 → P2 : Programmverkettung als Operation mit Programmen

– P1 habe Zustande 1, . . . , l

– P2 habe Zustande 1, . . . , k

– In P2 alle Adressen um l erhohen: l + 1, . . . , l + k

– In P1 alle Stoppanweisungen ?S bzw. |S ersetzen durch ?N(l + 1) bzw.|N(l + 1) (Ubergang in den Anfangszustand von P2)

• R : ”Nach rechts auf den ersten ? gehen“ (WHILE not ? DO r END)

Dies ist eine Verkettung von zwei Programmen:

r|

*

R ? |1 ?N2 |N32 ?S –3 – |S/N44 ?R5 |R55 ?S/N1 |S/N1

wobei / fur ”ersetzen“ steht.

3.3. DER MASCHINEN–ANSATZ 109

• Rn (fur n ≥ 1) : ”Gehe nach rechts auf den n-ten ?, der ? unter dem Kopfmitgezahlt.“

– R1 := R

– Rn := (Rr)n−1R

• Ln : ”Gehe nach links auf den n-ten ?, der ? unter dem Kopf mitgezahlt.“

– L1 = L

– Ln = (Ll)n−1L.

• Kn : ”Kopiere die n-te Strichfolge links vom Kopf“

Dabei gilt:

? | · · · |︸︷︷︸k1

? · · · ? | · · · |︸︷︷︸kn

?4? · · · ? wird zu ? | · · · |︸︷︷︸

k1

? · · · ? | · · · |︸︷︷︸kn

? | · · · |︸︷︷︸k1

?4? · · · ?

und k1 = 0 ist erlaubt.

K = L rn n

Rn+1

+1

n+2R L* n+1 |||

*

• Lo : Loschprogramm

Das Loschprogramm brauchen wir, um die normierte Endsituation ”Argument,Leerzeichen, Funktionswert“ auf dem Band herzustellen, d. h. Zwischenergeb-nisse zu loschen.

Folgende Situation auf dem Band liege vor:

? ? ? | · · · |︸︷︷︸k1

? · · · ? | · · · |︸︷︷︸kn︸︷︷︸

Argumente

? ? ?︸︷︷︸3 Leerz.

| · · · | ? | · · · | ? · · · ? | · · · |︸︷︷︸Zwischenergebnisse

? | · · · |︸︷︷︸Wert

?4? · · · ?

Das Loschprogramm soll daraus die folgende Situation herstellen:

? ? ? | · · · |︸︷︷︸k1

? · · · ? | · · · |︸︷︷︸kn

? | · · · |︸︷︷︸Wert

?4? · · · ?

Dazu wird zunachst die Folge der Zwischenergebnisse in eine einzige Strichfolgeverwandelt (die trennenden Leerzeichen ? werden in | verwandelt) und danachsukzessive abgebaut.

r

r

r R l

L l

R

2

|

| |

|

|

| **

| ** r R l L 2

*

:

Lo = L l

l


3.4 Aquivalenz der Berechenbarkeitsbegriffe

Nachdem wir uns mit dem axiomatischen und dem Maschinen–Ansatz befaßt haben,wollen wir nun nachweisen, daß beide — so unterschiedlich ihre Konstruktion ist —aquivalent sind.

Wir zeigen fur eine beliebige Funktion φ, daß

φ Turing–berechenbar gdw. φ partiell-rekursiv

3.4.1 Partiell–rekursive Funktionen sind Turing–berechenbar

Da wir die Klasse der partiell–rekursiven Funktionen induktiv definiert haben, fuhrenwir den Beweis uber deren Aufbau. Dazu werden wir einige der ab Seite 107 auf-gefuhrten Turing–Maschinen–Makros benutzen.

Anfangsfunktionen

Satz 3.4.1Alle Anfangsfunktionen sind Turing–berechenbar

Beweis

1. N (x) = x+ 1

Das Programm K1|r berechnet N .

? ? | · · · |︸︷︷︸x+1

?4? wird zu ? ? | · · · |︸︷︷︸

x+1

? | · · · |︸︷︷︸x+2

?4

2. Cni (x1, . . . , , xn) = i

Das Programm (r|)i+1r berechnet Cni .

3. Ink (x1, . . . , xn) = xk

Kn−k+1 leistet das Verlangte.

Also sind alle Anfangsfunktionen Turing–berechenbar. 2

Substitution

Satz 3.4.2Wenn φ durch Substitution aus ψ und χ1, . . . , χm entsteht und ψ, χ1, . . . , χm sindTuring–berechenbar, so ist φ Turing–berechenbar.

Beweisφ (x1, . . . , xn) = ψ (χ1 (x1, . . . , xn) , . . . , χm (x1, . . . , xn))

Sei χi berechnet durch Hi und ψ berechnet durch P .

Dann wird φ berechnet durch

3.4. AQUIVALENZ DER BERECHENBARKEITSBEGRIFFE 111

:

Lo

r | r K( n+1 )n

L n+1 l * Rn+2 H1. . . . .( Kn+1 ) ( Kn+1 )

nH2

nHm

K ( m -1 ) n + m K ( m ) + mn-2. . . . . K m

F =

2

Primitive Rekursion

Satz 3.4.3Entsteht φ durch primitive Rekursion aus ψ und χ und sind ψ, χ Turing–berechen-bar, so ist φ Turing–berechenbar.

BeweisEs ist

φ(n+1) (x1, . . . , xn, 0) = ψ(n) (x1, . . . , xn)

φ(n+1) (x1, . . . , xn, j + 1) = χ(n+2)(x1, . . . , xn, φ

(n+1) (x1, . . . , xn, j) , j)

Man beachte das modifizierte Schema im Rekursionsschritt; durch geeignete Auswahl-funktionen kann man die Aquivalenz zum bekannten Rekursionsschema nachweisen.

Sei ψ berechnet durch P und χ berechnet durch das Programm H.

Dann wird φ berechnet durch F mit

*

|

:

Lo

K n+4

F = r r| K2( K n+3 )

nLn+3 r * Rn+3 P

r | r Ln+4r * r*

|

l | Rn+3 l

*

Rn+3 H K n+4 L n+6 | Rn+5(K n+4)nK n+2

2

BeispielSei n = 2; φ (a, b, 2) = ?

Anfangssituation:· · · ? a ? b ? |||?

4

r|rK2(K5)2L5r ? R5P :

· · · ? a ? b ? ||| ? ? ? ||| ? a ? b ? ψ (a, b) ?4

r|rL6r ? rR5H:

· · · | ? ? ? ?|| ? a ? b ? ψ (a, b) ? | ? χ (a, b, ψ (a, b) , 0) ?4


K6L8|R7(K6)2K4K6:

· · · | ? ? ? ||| ? a ? b ? φ (a, b, 0) ? | ? φ (a, b, 1) ? || ? a ? b ? φ (a, b, 1) ? |?4

|rL6r ? rR5H:

· · ·φ (a, b, 1) ? ?| ? a ? b ? φ (a, b, 1) ? || ? χ (a, b, φ (a, b, 1) , 1)︸︷︷︸φ(a,b,2)

?4

K6L8|R7(K6)2K4K6:

· · ·φ (a, b, 1) ? || ? a ? b ? φ (a, b, 2) ? | ? a ? b ? φ (a, b, 2) ? ||?4

|rL6r ? r· · ·φ (a, b, 2) ? ??

4a ? b ? φ (a, b, 2) ? |||?

l|R5l· · ·φ (a, b, 2) ? | ? a ? b ? φ (a, b, 2) ? |||

4?

?l ? l ? lLo:· · · ? ? ? a ? b ? ||| ? φ (a, b, 2) ?

4Stop

Minimum–Operator

Satz 3.4.4Entsteht φ durch Anwendung des µ-Operators auf ψ und ψ ist Turing–berechenbar,so ist φ Turing–berechenbar.

BeweisEs ist

φ (x1, . . . , xn) = µj (ψ (x1, . . . xn, j) = 0)

Sei ψ berechnet durch P .

Dann wird φ berechnet durch

r | rF = P *l l

|

*

* l

|

*

2

Folgerung 3.4.5Alle partiell–rekursiven Funktionen sind Turing–berechenbar.


3.4.2 Turing–berechenbare Funktionen sind partiell–rekursiv

Um die Umkehrung zu beweisen, verwenden wir ein Verfahren, das nach Kurt Godel

auch Godelisierung genannt wird: Mit Hilfe eineindeutiger und intuitiv–anschaulichberechenbarer Abbildungen wird der Formalismus der Turing–Maschinen in dieArithmetik der naturlichen Zahlen abgebildet. Dadurch gehen Beziehungen zwischenTuring–Maschinen und ihren Konfigurationen in Beziehungen zwischen Zahlen uber,die unter Umstanden durch partiell–rekursive Funktionen beschrieben werden. Daßdie von einer gegebenen Turing–Maschine berechnete zahlentheoretische Funktionpartiell–rekursiv ist, bedeutet ja nichts anderes, als daß die Godelzahl der Stop–Konfiguration partiell–rekursiv von der Godelzahl der Start–Konfiguration abhangt.

Dazu gebrauchen wir einige der auf Seite 101 aufgefuhrten primitiv–rekursiven Funk-tionen. Insbesondere werden wir die Eindeutigkeit der Primzahlzerlegung ausnutzen,um Tupel von Zahlen in einer Zahl zu codieren.

Bevor wir den Turing–Maschinen T = [X,Z, z0, δ] ihre Godelzahl zuordnen, machenwir einige Einschrankungen, die ihre Berechnungsfahigkeit nicht beeintrachtigen (wirnormieren die Turing–Maschine):

Wir setzen voraus, daß X = | ist und setzen

x0 := ? , x1 := |.

Die Zustandsmenge sei numeriert als

Z = z1, . . . , zm

wobei z0 = z1 der Anfangszustand ist. Die Menge B = N,R, L, S sei als

b0 = N , b1 = R , b2 = L und b3 = S

numeriert und wir setzen voraus, daß die Maschine beim Stop nichts mehr andert:Wenn δ (z, x) = [x′, S, z′], dann x′ := x und z′ := z.

Es sei TM die Menge aller Turing–Maschinen der angegebenen Art.

1. Die Godelzahl der Turing–Maschine

Die Turing–Maschine T ist durch die Tabelle der Funktion δ vollstandig be-schrieben. Deshalb codieren wir

1. Tabelleneintrag: neue Beschriftung, Kopfbewegung, Zustandsanderung

go ([xi, bj , zk]) := 2i3j5k.

mit i ∈ 0, 1, j ∈ 0, 1, 2, 3 und k ∈ 1, . . . ,m2. Zeile in der Tabelle von δ: [δ (zη, ?) , δ (zη, |)]

go (δ, zη) := 2go(δ(zη,x0)) · 3go(δ(zη,x1)).

3. Godelzahl der Turing–Maschine: alle Zeilen der Tabelle

go (T ) =m∏η=1

qgo(δ,zη)η−1

Lemma 1


1. Die Abbildung go : TM→ N ist eineindeutig.

2. Die charakteristische Funktion

χTM (i) =

0, falls eine Turing–

Maschine T ∈ TM mitgo (T ) = i existiert

1, sonst

ist primitiv–rekursiv

d. h. die Menge der Godelzahlen ist primitiv–rekursiv entscheidbar.

BeweisWenn i die Godelzahl einer Turing–Maschine T ist, dann (und nur dann) gilt:

1. i > 0

2. i ist Produkt von positiven Potenzen der Primzahlen q0, . . . , qm−1, wobeim die Zahl der Zustande der Turing–Maschine T ist und der Exponentvon qη−1 ist Godelzahl der η-ten Zeile in der Tabelle von T , d. h.

i =µm(m≤i∧exp(i,m)=0)

.−1∏

j=0

qexp(i,j)j

und fur alle j mit 0 ≤ j < µm (m ≤ i ∧ exp(i,m) = 0) gibt es Zahlen l1, l2mit

• exp(i, j) = 2l1 · 3l2(d. h. l1 = exp (exp(i, j), 0); l2 = exp (exp(i, j), 1))

• l1 = 2exp(l1,0) · 3exp(l1,1) · 5exp(l1,2)

l2 = 2exp(l2,0) · 3exp(l2,1) · 5exp(l2,2)

(d. h. l1, l2 sind Godelzahlen von Tripeln)• exp(l1, 0) ≤ 1 (die erste Komponente ist x0 oder x1)

exp(l1, 1) ≤ 3 (die zweite Komponente ist b0, b1, b2 oder b3)1 ≤ exp(l1, 2) < µm(m ≤ i ∧ exp(i,m) = 0) (die dritte Komponenteist eine Zustandsnummer)

• exp(l2, 0) ≤ 1exp(l2, 1) ≤ 31 ≤ exp(l2, 2) ≤ µm(m ≤ i ∧ exp(i,m) = 0)

Um zu zeigen, daß χTM primitiv–rekursiv ist, mussen wir diese logischen Zu-sammenhange arithmetisch ausdrucken. Dazu benutzen wir

a = b gdw. (a.− b) + (b

.− a) = 0 gdw. |a− b| = 0

a ≤ b gdw. a.− b = 0

a = 0 und b = 0 gdw. a+ b = 0

Aus der Aussage

Fur alle j mit 0 ≤ j < µm (m ≤ i ∧ exp(i,m) = 0) gibt es Zahlen l1, l2so, daß . . .

wird durch Elimination von l1, l2 logisch aquivalent:


µm(m≤i∧exp(i,m)=0).−1∑

j=0

[ ∣∣∣exp(i, j)− 2exp(exp(i,j),0) · 3exp(exp(i,j),1)∣∣∣+

+∣∣∣exp (exp(i, j), 0)− 2exp(exp exp((i,j),0),0) · 3exp(exp exp(i,j),0),1) · 5exp(exp exp(i,j),0),2)

∣∣∣+

+∣∣∣exp (exp(i, j), 1)− 2exp(exp exp((i,j),1),0) · 3exp(exp exp(i,j),1),1) · 5exp(exp exp(i,j),1),2)

∣∣∣+

+(

exp (exp (exp (i, j) , 0) , 0).− 1)

+

+(

exp (exp (exp (i, j) , 1) , 0).− 1)

+

+(

exp (exp (exp (i, j) , 0) , 1).− 3)

+

+(

1.− exp (exp (exp (i, j) , 0) , 2)

)+

+(

1.− exp (exp (exp (i, j) , 1) , 2)

)+

+(

exp (exp (exp (i, j) , 0) , 2).−[µm (m ≤ i ∧ exp(i,m) = 0)

.− 1])

+

+(

exp (exp (exp (i, j) , 1) , 2).−[µm (m ≤ i ∧ exp(i,m) = 0)

.− 1]) ]

= 0

Wenn wir den Term auf der linken Seite dieser Gleichung mit∑

[. . .] abkurzen,so haben wir:

χTM(i) = 0 gdw. i > 0 und

i =µm(m≤i∧exp(i,m)=0)

.−1∏

j=0

·qexp(i,j)j

und∑

[. . .] = 0

also ist

χTM (i) = sg

sg (i) +

∣∣∣∣∣∣∣i−µm(···)

.−1∏

j=0

∣∣∣∣∣∣∣+∑

[· · ·]

Offensichtlich ist χTM primitiv–rekursiv. 2

2. Die Godelzahl einer endlichen Bandbeschriftung

Wir numerieren die Felder unseres (”halben“) Bandes von links nach rechts mit0, 1, 2, . . .

Eine Bandbeschriftung σ ist dann eine Abbildung, die jeder Feldnummer dieNummer des in diesem Feld stehenden Buchstabens zuordnet, d. h.

σ : N → 0, 1

σ ist endlich, wenn auf fast allen Feldern das Zeichen ? steht, also wenn

jσ := supi|σ(i) = 1


existiert (das Supremum der leeren Menge ist 0), d. h. es gibt einen ”letzten“Strich auf dem Band.

Wir setzen

go(σ) =jσ∏j=0

qσ(j)j

Lemma 2Σ sei die Menge aller endlichen Bandbeschriftungen

1. Die Abbildung go : Σ→ N ist eineindeutig.


χΣ (i) =

0, falls ein σ ∈ Σ mitgo (σ) = i existiert

1, sonst

ist primitiv–rekursiv.

BeweisχΣ (i) = 0 gdw. i > 0 und fur alle j (0 ≤ j ≤ i) gilt exp (i, j) ≤ 1.χΣ (i) = sg

(sg (i) +

∑ij=0

(exp (i, j)

.− 1))

. 2

3. Die Godelzahl einer Konfiguration einer Turing–Maschine

Eine Konfiguration K der Turing–Maschine T ist ein Tripel

K = [j, σ, zi]

wobei j die Nummer des Feldes auf dem der Kopf steht, σ die Beschriftung desBandes und zi der aktuelle Zustand ist.

go (K) = 2j · 3go(σ) · 5i

Lemma 3

1. Die Abbildung go : K→ N ist eineindeutig.


χK (k) :=

0, falls es ein K ∈ K gibtmit k = go (K)

1, sonst

ist primitiv-rekursiv.

BeweisDie Zahl k ist genau dann die Godelzahl einer Konfiguration, wenn

1. k > 0


2. k die Godelzahl eines Tripels ist:

k = 2exp(k,0) · 3exp(k,1) · 5exp(k,2)

und exp(k, 1) Godelzahl einer Bandbeschriftung ist, d. h.

χΣ (exp(k, 1)) = 0

und 1 ≤ exp(k, 2), d. h. exp(k, 2) ist eine Zustandsnummer.

Also ist

χK (k) =

sg(

sg (k) +∣∣∣k − 2exp(k,0) · 3exp(k,1) · 5exp(k,2)

∣∣∣+ χΣ (exp (k, 1)) + sg (exp (k, 2))

).

2

4. Die Godelzahl der Folgekonfiguration einer Konfiguration

Sei N die Godelzahl einer Konfiguration der Turing–Maschine mit der Godel-zahl t.

Um die Folgekonfiguration zu berechnen, mussen wir diese Godelzahl N zu-erst decodieren, d. h. wir simulieren die Ausfuhrung eines Programmschrittesder Turing–Maschine, indem wir die Godelzahl der Konfiguration auswertenund daraus uber die Godelzahl t der Turing–Maschine die neue Godelzahl derFolgekonfiguration bilden.

1. N = 2j · 3s · 5i N = go ([j, σ, zi]) (Konfiguration)s = go(σ) (Bandbeschriftung)

2. κ = exp (s, j) Nummer des Zeichens im Feld j bei σ: σ (j) = κ

3. λ = exp (t, i− 1) Zeile des Zustands zi in Turing–Maschine T

4. τ = exp (λ, κ) δ (zi, xκ) (Tabelleneintrag)

Dann ist die Folgekonfiguration bestimmt als Funktion

F (t,N) := 2u · 3v · 5w

mit

u =

j, falls exp (τ, 1) = 0 (?N)j + 1, falls exp (τ, 1) = 1 (?R)j − 1, falls exp (τ, 1) = 2 (?L)

= j + exp (τ, 1).−(

exp (τ, 1).− 1)· 3

v =s

qκj· qexp(τ,0)j

w = exp (τ, 2)

und u ist die neue Kopfposition, v die geanderte Bandbeschriftung und w derneue Zustand.

BemerkungDie Stopsituation exp (τ, 1) = 3 wird nicht berucksichtigt, da wir vereinbarthaben, daß dann δ (zi, x) = [x, S, zi] gilt.


Lemma 4

F (t,N) :=

F (t,N) , falls χTM (t) = 0 und χK (N) = 0 und go−1 (N)

keine Stop–Konfiguration von go−1 (t) ist0, sonst


5. Die Folge der Godelzahlen der Konfigurationen bei der Berechnung

Nachdem wir aus einer beliebigen Konfiguration die Folgekonfiguration berech-nen konnen, laßt sich jetzt auch die Folge der Godelzahlen aller Konfiguratio-nen, die von der Turing–Maschine T bei Start in einer Anfangs–Konfigurationdurchlaufen werden, berechnen.

Eine Anfangs–Konfiguration bei der Berechnung einer n-stelligen Funktion siehtwie folgt aus:

?|a1+1 ? · · · ? |an+1?4? · · ·

d. h.

Ka1a2···an :=[

n+n∑v=1

(av + 1)︸︷︷︸Kopfposition

, σa1,...an︸︷︷︸Bandkod.

, z1︸︷︷︸Anfangszust.

]

Wir bezeichnen die Godelzahl der i-ten Konfiguration in der Folge der Konfigu-rationen, die T bei Start in Ka1,...,an durchlauft mit

AT (a1, . . . , an, i)

Dann ist fur die Anfangs–Konfiguration

AT (a1, . . . , an, 0) = go (Ka1,...,an)

und da bei der Stop–Konfiguration die letzte Konfiguration wiederholt wird,erhalten wir fur die Konfigurationsfolge

AT (a1, . . . , an, i+ 1) =AT (a1, . . . , an, i) , falls dies Stop–Konfig. istF (go (T ) , AT (a1, . . . , an, i)) , sonst

und AT ist primitiv-rekursiv.

Lemma 5Die Funktion

A (t, a1, . . . , an, j) :=AT (a1, . . . , an, j) , falls χTM (t) = 0, T = go−1 (t)0, sonst


6. Die Funktion β

Wir definieren nun eine Funktion β, die folgende Eigenschaften hat:


β (t, a1, . . . , an, j) = 0 gdw.• t ist Godelnummer einer Turing–Maschine T ,• es gibt Zahlen k, l mit j = 2k · 3l und

– k ≥ 0– l ist Godelzahl der Konfiguration, die T nach k Takten er-

reicht hat, wenn T in Ka1,...,an gestartet wurde.– Im Takt k hat T schon gestoppt.

Im Takt k = exp(j, 0) ist die Konfiguration mit der Godelzahl l = exp(j, 1)erreicht; dies ist eine Stop–Konfiguration genau dann, wenn (vgl. oben 4.)

τ = exp(λ, κ)= exp

(exp(t, i

.− 1), exp(s, j)

)= exp

(exp(t, exp(l, 2)

.− 1), exp(exp(l, 1), exp(l, 0)

)= exp

(exp(t, exp(exp(j, 1), 2)

.− 1), exp(exp(exp(j, 1), 1), exp(exp(j, 1), 0)

)exp(τ, 1) = 3

h?

Also ist

β (t, a1, . . . , an, j) :=

0, falls j = 2exp(j,0) · 3exp(j,1) und exp (j, 0) ≥ 0 und

exp(j, 1) = A (t, a1, . . . , an, exp(j, 0)) > 0 und h?

1, sonst

Man zeigt leicht:

Lemma 6β ist primitiv-rekursiv.

7. Die Resultatfunktion α

Wir benotigen noch eine Funktion α, die uns das Resultat einer Berechnung aufeiner Turing–Maschine anhand der Godelzahlen liefert. Dabei soll die Endkon-figuration wie folgt ausgewertet werden:

Ist n = exp (j, 1) = go ([k, σ, zl]) die Godelzahl der Konfiguration [k, σ, zl], wobeidie Bandbeschriftung die Form

σ = ?w?| · · · |︸︷︷︸b+1

?4?? · · · h∗

hat, wobei w ein beliebiges Wort uber ?, | ist, dann soll α (j) = b und sonst= 0 sein.

Offenbar ist α (j) = b gdw. j > 0 und fur die Zahl n = exp(j, 1) gilt

1. χ(n)K = 0

2. Fur k = exp(n, 0) und die Bandbeschriftung mit σ(i) = exp (exp(n, 1), i)gilt

b =

k .−2∑l=0

k.−1∏

i=l+1

σ (i).−k.−1∏i=l

σ (i)

((k .− l) .− 1) .− 1


Lemma 7α ist primitiv-rekursiv.

Nun haben wir das notige Handwerkszeug, um den Beweis zu fuhren, daß jedeTuring–berechenbare Funktion partiell–rekursiv ist.

BeweisEs sei f eine n-stellige zahlentheoretische Funktion, berechnet von der Turing–Maschine T = [|, Z, z1, δ], ferner sei t = go (T ).

Dann gilt fur alle a1, . . . , an ∈ N:

[a1, . . . , an] ∈ Df gdw. T bei Start in der Konfiguration Ka1,...,an mit

einer Konfiguration der Form h∗ von obenstoppt

gdw. es ein j gibt mit β (t, a1, . . . , an, j) = 0.

Wenn [a1, . . . , an] ∈ Df , so ist f (a1, . . . , an) = α (µj (β (t, a1, . . . , an, j) = 0)).

Ist dagegen [a1, . . . , an] /∈ Df , so

• stoppt T bei Start in Ka1,...,an nicht

• gibt es kein j mit β (· · · , j) = 0

• ist α (· · ·) nicht definiert

• ist f (a1, . . . , an) = α (µj (β (t, a1, . . . , an, j) = 0)).

Die Funktion f entsteht durch einmalige Anwendung des Minimum–Operators mitden primitiv–rekursiven Funktionen α, β; f ist also partiell–rekursiv. 2

3.5 Folgerungen

Im Sinne der Logik haben wir soeben einen Vollstandigkeitssatz bewiesen, wir ha-ben gezeigt, daß jede Turing–berechenbare Funktion partiell–rekursiv ist, die Mengeder aus den Anfangsfunktionen mittels Substitution, primitiver Rekursion und An-wendung des Minimumoperators ableitbaren Funktionen, also die Menge der partiell–rekursiven Funktionen die Menge der Turing–berechenbaren Funktionen umfaßt. Dashaben wir getan, indem wir eine Normalform fur Turing–berechenbare Funktionenhergeleitet haben:

Kleenescher DarstellungssatzEs gibt eine einstellige primitiv–rekursive Funktion α so, daß zu jeder Stellenzahln eine (n+ 2)-stellige primitiv–rekursive Funktion β derart existiert, daß zu jedern-stelligen Turing–berechenbaren (bzw. partiell–rekursiven) Funktion f eine Zahlt existiert so, daß fur alle [a1, . . . , an] gilt:

f (a1, . . . , an) = α (µj (β (t, a1, . . . , an, j) = 0))

Das besondere dieser Darstellung, dieser Normalform, besteht offensichtlich darin, daßdie primitiv–rekursiven (also totalen) Funktionen α, β von f (bis auf die Stellenzahl)gar nicht abhangen und daß der Minimumoperator genau einmal vorkommt.

3.5. FOLGERUNGEN 121

Wir haben damit gezeigt, daß eine zahlentheoretische Funktion genau dann Turing–berechenbar ist, wenn sie partiell–rekursiv ist. Analoge Satze wurden fur alle weiterenPrazisierungen des Berechenbarkeitsbegriffes bewiesen. Das stutzt die

Churchsche TheseEine zahlentheoretische Funktion ist genau dann intuitiv–anschaulich berechenbar,wenn sie partiell-rekursiv ist.

Wir ziehen noch einige Folgerungen aus dem Satz von Kleene. Insbesondere betrach-ten wir die primitiv–rekursiven Funktionen α und β im Falle n = 1 und setzen

A (t, i) := α (µj (β (t, i, j) = 0))

Offenbar ist A eine zweistellige partiell–rekursive Funktion, mit der folgenden Eigen-schaft:

Zu jeder einstelligen partiell–rekursiven Funktion f existiert eine Nummert derart, daß fur alle i ∈ N

f (i) = A (t, i)

Dafur sagt man auch, A ist eine Numerierung aller einstelligen partiell–rekursivenFunktionen.

A ist partiell–rekursiv, also auch Turing–berechenbar. Ist nun T eine Turing–Maschine, die A berechnet, so kann T offenbar alle einstelligen partiell–rekursivenFunktionen berechnen: Um die Funktion f mit der Nummer t fur das Argument i zuberechnen, startet T in der Situation

. . . ? | · · · |︸︷︷︸t+1

? | · · · |︸︷︷︸i+1

?4· · ·

Es gibt also eine ”universelle“ Turing–Maschine, die alle einstelligen berechenbarenFunktionen berechnen kann. Bedenkt man, daß durch Godelnumerierung der n-Tupel[a1, . . . , an] als 2a1 · · · qann−1 jede n-stellige berechenbare Funktion auf eine einstelligeberechenbare reduziert werden kann, so ist klar, daß die universelle Turing–Maschinejede Berechnung durchfuhren kann, deren Nummer ihr mitgeteilt wird.

A (t, i) ist eine partielle Funktion, sie ist z. B. nicht definiert, wenn t nicht Godelzahleiner Turing–Maschine ist. Wir betrachten

h (t, i) :=A(t, i) ,falls ein j existiert mit β(t, i, j) = 00 ,sonst.

Wenn es ein j mit β(t, i, j) = 0 gibt, so gibt es auch ein kleinstes solches j, also istA(t, i) definiert, folglich ist h total.

Wir zeigen: h ist nicht berechenbar, d. h. h ist nicht allgemein–rekursiv.

BeweisWare h ∈ REK, dann ware die Funktion g mit

g(n) := h(n, n) + 1

ebenfalls allgemein–rekursiv, also partiell–rekursiv, folglich gabe es eine Nummer t?

mitg(i) = A (t?, i) fur alle i ∈ N.

Nun hatten wir fur t = i = t?

h (t?, t?) + 1 = g (t?) = A (t?, t?) = h (t?, t?) /?

Wir erhalten also einen Widerspruch, d. h. h ist nicht berechenbar. 2

Woran liegt es, daß h nicht berechenbar ist?

Betrachten wir die Menge

M := [t, i]| Es gibt ein j mit β(t, i, j) = 0

der Argumentenpaare, wo h denselben Wert wie A hat, d. h. wo A definiert ist:

Die Menge M ist nicht entscheidbar, d. h. die charakteristische FunktionχM ist nicht allgemein–rekursiv.

Sonst wareh(t, i) = sg (χM (t, i) · α (µj (β(t, i, j) = 0)))

allgemein–rekursiv (hierbei gilt die Konvention ”Null · Irgendwas = Null“, auch wenn

”Irgendwas“ nicht definiert ist).

Was bedeutet die Unentscheidbarkeit von M?

Ist t die Godelzahl einer Turing–Maschine T , so ist [t, i] ∈M genau dann, wenn dieTuring–Maschine T bei Start in der Situation

? | · · · |︸︷︷︸i+1

?4? ? · · ·

irgendwann stoppt.

Daß M nicht entscheidbar ist, bedeutet also:

Es gibt keinen Algorithmus, der fur eine Turing–Maschine und eine Anfangssituationentscheidet, ob die Maschine nach dem Start in dieser Situation jemals stoppt. Kurz:Das Halteproblem fur Turing–Maschinen ist nicht entscheidbar (ist unlosbar).

Wenn also unsere Programmiersprache so ausdrucksfahig ist, daß alle partiell–rekursiven Funktionen programmiert werden konnen (oder alle Turing–Maschinensimuliert), dann kann es kein Programm geben, das Terminierung fur alle Programmeentscheidet.

Allgemein wird dieses Resultat durch den Satz von Rice wiedergegeben: Jedes nicht-triviale Problem fur Turing–Maschinen ist unentscheidbar.

Satz von RiceEs sei F eine Menge von partiell–rekursiven Funktionen und NF = t|A(t, i) ∈ Fdie Menge der Godelnummern der Funktionen aus F. Wenn F 6= ∅ und F 6= PREK(dann ist das Problem t ∈ NF?|t ∈ N nichttrivial) so ist χNF /∈ REK.

Kapitel 4

Pradikatenlogik

Die tagliche Praxis des logischen Schließens zeigt, daß der mit dem Aussagenkalkulobjektivierte Teilbereich (namlich das aussagenlogische Schließen) wichtig ist, aberim allgemeinen nicht ausreicht. Als Unzulanglichkeit des Aussagenkalkuls stellt sichdabei heraus, daß zuwenig von der inneren Struktur von Aussagen (namlich nur dieaussagenlogische Struktur, d. h. der Aufbau mittels Negation, Konjunktion, Alterna-tive,. . . ) widergespiegelt werden kann. Ein Schluß der Form

Es gibt ein x, das nicht die Eigenschaft E hatEs gilt nicht: Alle x haben die Eigenschaft E

kann im Aussagenkalkul nicht verifiziert werden.

Was wird im Aussagenkalkul nicht widergespiegelt:

1. Aussagen betreffen Gegenstande, sie entstehen aus ”Aussageformen“

• ”x ist gerade“

• ”k ist Primzahl“ (Aussageformen)

• ”x ist großer als z“

Dies sind keine Aussagen, ihnen kann ein Wahrheitswert erst zugeordnet werden,wenn die Variablen x, k, z (z. B. an feste Werte) gebunden sind. ”3 ist Primzahl“ist eine wahre, ”4 ist Primzahl“ eine falsche Aussage.

2. Aussagen betreffen Eigenschaften von und Beziehungen zwischen Gegenstanden

• ”Die Menge N ist unendlich“

• ”Die Relation < ist transitiv“

3. Aussagen konnen die Form von All- oder Existenzaussagen haben

• ”Jede naturliche Zahl ist Summe von vier Quadraten“

• ”Es gibt eine gerade Primzahl“

Logische Schlusse, bei denen solche Strukturen eine Rolle spielen, konnen im Aussa-genkalkul nicht uberpruft werden, weil sie nicht widergespiegelt werden.

124 KAPITEL 4. PRADIKATENLOGIK

4.1 Grundbegriffe

Wir brauchen in unserem Modell insbesondere die Moglichkeit der Quantifikation,d. h. eines Uberganges von einer Aussagenform zu einer Aussage durch Bindung derVariablen, wie zum Beispiel

”x ist Primzahl“ −→ ”alle x sind Primzahl“

”x ist gerade“ −→ ”es gibt ein x mit x ist gerade“

Damit entsteht die Frage: Was darf quantifiziert werden?

In unseren Beispielen ist stets die Variable x, also eine Variable fur Gegenstandequantifiziert worden, d. h. eine Variable erster Stufe.

Das 5. Peanosche Axiom lautet:

Fur jede Menge M ⊆ N gilt:Wenn 0 ∈ M und fur alle k gilt: Wenn k ∈ M , so (k + 1) ∈ M , dann istN ⊆M

Offenbar wird hier auch eine Variable (namlich M) quantifiziert, die uber Mengen vonGegenstanden, also sozusagen uber Gegenstanden zweiter Stufe, variiert. Man sagtdaher, daß diese Aussage zur Pradikatenlogik der zweiten Stufe gehort.

Wir werden hier nur die Pradikatenlogik der ersten Stufe behandeln, die sogenannteelementare Pradikatenlogik, in der nur Variable fur Gegenstande quantifiziert werdenkonnen. Dementsprechend nehmen wir in die Sprache des Pradikatenkalkuls auchnur Variable fur Gegenstande, nicht aber fur Mengen von bzw. Relationen zwischenGegenstanden auf.

Also was wollen wir in unserem Modell widerspiegeln, d. h. in unserer Sprache aus-drucken?

a) Gegenstande (Individuen) −→ Individuenzeichen (Individuenkonstanten)

BeispieleNull, Eins −→ 0, 1

b) Beziehungen, Eigenschaften zwischen (bzw. von) Individuen −→ Attributenzei-chen

BeispieleKleiner–Beziehung, Primzahleigenschaft −→ <, Pz

c) funktionale Abhangigkeiten zwischen Individuen −→ Funktionszeichen

BeispieleNachfolgerfunktion, Addition −→ Nf, +

d) Quantifiziert werden −→ Individuenvariable

e) aussagenlogische Struktur −→ ¬,∧,∨,→,↔

f) pradikatenlogische Struktur −→ Quantoren

g) Gleichheitsattribut fur Individuen −→ =

In dieser Liste ist der Punkt f) unklar, was ist ”pradikatenlogische Struktur“; welchepradikatenlogischen Verknupfungen gibt es uberhaupt?

4.1. GRUNDBEGRIFFE 125

Definition 4.1.1 (Individuenbereich, Attribut, Funktion)

1. Jede nichtleere Menge I heißt Individuenbereich.

2. αi ist ein i-stelliges Attribut uber I, wenn:

αi :×iI → W,F

Die Menge Rαi :=

[x1, . . . , xi] |αi (x1, . . . , xi) = W

wird die i-stellige Relationvon αi genannt.

3. Das Gleichheitsattribut IdI uber I ist fur x, y ∈ I definiert durch

IdI (x, y) =

W, falls x gleich y istF, sonst

4. φi ist eine i-stellige Funktion uber I, wenn

φi :×iI → I

Bemerkung

1. Es ist sehr wichtig, daß die Grundmenge I von Gegenstanden, uber die wir Aus-sagen formulieren, als nichtleer vorausgesetzt ist, andernfalls wurde der Schluß

Alle x haben die Eigenschaft EEs gibt ein x mit der Eigenschaft E

nicht richtig sein.

2. Attribute ordnen also Tupeln von Gegenstanden Wahrheitswerte zu. Einstel-lige Attribute werden auch Pradikate (Eigenschaften) genannt, die zugehorigeeinstellige Relation ist dabei einfach eine Menge von Gegenstanden.

Was ist nun eine pradikatenlogische Verknupfung?

Eine aussagenlogische Verknupfung (wie z. B. die Konjunktion) ordnet Aussagen eineneue Aussage zu, im extensionalen Fall wird diese Zuordnung durch eine Wahrheits-funktion charakterisiert.

Eine pradikatenlogische Verknupfung (erster Stufe) ordnet Aussageformen (mit Va-riablen fur Gegenstande) Aussagen zu und wird (im extensionalen Fall) beschriebendurch ein Attributenattribut, d. h. eine Abbildung, die Attributen einen Wahrheits-wert zuordnet:

Definition 4.1.2 (Pradikatenlogische Wahrheitsfunktionen)Pradikatenlogische Wahrheitsfunktionen ordnen Tupeln von Attributen einen Wahr-heitswert zu:

Om(α1)

=

W, falls fur alle x ∈ I gilt: α1 (x) = WF, sonst

Ex(α1)

=

W, falls fur wenigstens ein x ∈ I gilt: α1 (x) = WF, sonst

gv(α1, β1

)=

W, falls card

(x|x ∈ I ∧ α1 (x) = W

)=

card(x|x ∈ I ∧ β1 (x) = W

)F, sonst

Exn!!(α1)

=

W, falls es genau n Elemente x aus I mitα1 (x) = W gibt

F, sonst


In unserem Kalkul werden wir nur die einstelligen Attributenattribute Om und Exverwenden. gv laßt sich nicht durch Om und Ex ausdrucken.

4.2 Syntax und Semantik des Pradikatenkalkuls

4.2.1 Die Sprache des Pradikatenkalkuls der ersten Stufe

Als Alphabet des Pradikatenkalkuls verwenden wir die Menge

Y := ¬,∧,∨,→,↔, ), (, , ,=,∀,∃, a, x,A, F, ?, |

die offenbar aus 17 Grundzeichen besteht.

Die Worter der Form

x ? · · · ?︸︷︷︸i

bezeichnen wir kurz durch xi und nennen sie Individuenvariable. Die Menge der In-dividuenvariablen ist X = xi|i ∈ N.

Die Worter der Form

A? · · · ?︸︷︷︸i

| · · · |︸︷︷︸j

mit i ≥ 0, j ≥ 1 bezeichnen wir als (j-stelliges) Attributenzeichen und schreiben dafurkurzer Aji .

Die Worter der Form

F ? · · · ?︸︷︷︸i

| · · · |︸︷︷︸j

mit i ≥ 0, j ≥ 1 werden kurz als F ji geschrieben und (j-stelliges) Funktionszeichengenannt.

Die Worter der Form

a ? · · · ?︸︷︷︸i

geschrieben ai werden Individuenzeichen bzw. Individuenkonstanten genannt.

Termwird induktiv definiert:

A) Jede Individuenkonstante und jede Individuenvariable ist ein Term.

I) Ist F ji ein j-stelliges Funktionszeichen und sind T1, . . . , Tj Terme, so istF ji (T1, . . . , Tj) ein Term

BeispielF 2

1

(F 1

5 (xj) , a3

)ist ein Term.

4.2. SYNTAX UND SEMANTIK DES PRADIKATENKALKULS 127

Ausdruckwird ebenfalls induktiv definiert:

A) (Pradikative Ausdrucke)

1. Sind T1, T2 Terme, so ist T1 = T2 ein Ausdruck (Gleichung)

2. Ist Aji ein j-stelliges Attributenzeichen und sind T1, . . . , Tj Terme, so istAjiT1 · · ·Tj ein Ausdruck.

I) 1. (Aussagenlogische Zusammensetzung)Sind H1,H2 Ausdrucke, so auch ¬H1, (H1 ∧H2), (H1 ∨H2),(H1 → H2),(H1 ↔ H2).

2. (pradikatenlogische Zusammensetzung)Ist H ein Ausdruck, xj eine Variable und in H kommt xj vor, aber keinesder Worter ∀xj ,∃xj , so sind ∀xjH,∃xjH Ausdrucke.

E) Sonst nichts

AUSD = Menge aller so gebildeten Ausdrucke= Sprache des Pradikatenkalkuls der ersten Stufe

Bemerkung: Elementare Sprache mit der Signatur [K, P, F ]

In der Sprache des Pradikatenkalkuls kommen unendlich viele Individuenkonstanten,Attributen– und Funktionszeichen vor. Fur viele Anwendungen ist das nicht notwen-dig, wenn man z. B. die Arithmetik der naturlichen Zahlen formalisieren will, kommtman mit Zeichen fur die Zahlen Null und Eins, die Kleiner–Beziehung und die Funk-tionen Addition und Multiplikation aus; eine solche Vorgabe nennt man eine Signatur.Eine Signatur [K,P, F ] besteht also aus einer Menge K von Individuenzeichen, einerMenge P von Attributenzeichen und einer Menge F von Funktionszeichen. In unseremBeispiel ist K = a0, a1(= 0, 1), P = A2

0(= <) und F = F 20 , F

21 (= +, ·).

Die elementare Sprache mit der Signatur [K,P, F ] ist dann die Menge aller AusdruckeH ∈ AUSD des Pradikatenkalkuls der ersten Stufe, in denen hochstens Individuen-konstanten aus K, Attributenzeichen aus P und Funktionszeichen aus F vorkommen.

BeispielDer Ausdruck

∀x0∃x1 (x1 = N(x0))

ist nicht Element unserer elementaren Sprache der Arithmetik, weil N kein Elementvon F ist.

4.2.2 Einige syntaktische Eigenschaften

Definition 4.2.1 (vollfreie und quantifizierte Individuenvariablen)Es sei H ein Ausdruck, xj eine Individuenvariable.

1. xj kommt in H vollfrei vor

(a) xj kommt in H vor.

(b) Die Zeichenreihen ∀xj ,∃xj kommen nicht in H vor.

2. xj kommt in H an der n-ten Stelle quantifiziert vor, wenn


(a) xj steht in H an der n-ten Stelle, und n ≥ 2.

(b) An der (n− 1)-ten Stelle in H kommt ∃ oder ∀ vor.

Satz 4.2.2H ist ein Ausdruck, in dem xj an der n-ten Stelle quantifiziert vorkommt. Dann gibtes einen Ausdruck H1 mit

1. in H1 kommt xj vollfrei vor.

2. Wortern Z1, Z2 mit H = Z1QxjH1Z2, wobei Q ∈ ∀,∃.

Bevor wir den Satz beweisen, fuhren wir noch eine Bezeichnung ein:

Definition 4.2.3 (Wirkungsbereich eines Quantors)Der im Satz 4.2.2 mit H1 bezeichnete Ausdruck heißt Wirkungsbereich des Quantors,der in H an der (n− 1)-ten Stelle steht.

Beweis des Satzesdurch Induktion uber den Aufbau des Ausdrucks H

A) Wenn H pradikativer Ausdruck ist, d. h. T1 = T2 oder AjT1 . . . Tj , so kommtxj nicht quantifiziert in H vor, also ist nichts zu zeigen.

I) 1. (H durch aussagenlogische Zusammensetzung entstanden)Wenn H ≡ ¬H0, so ist xj in H0 an der (n − 1)-ten Stelle quantifiziert;nach Induktionsvoraussetzung hat H0 die Form

H0 ≡ Z1QxjH1Z2

alsoH ≡ ¬Z1QxjH1Z2.

Wenn H ≡ (H0 ⊗ H00) ist, wobei ⊗ eines der Zeichen ∧, ∨, →, ↔ ist,so befindet sich die n-te Stelle (an der xj quantifiziert steht) entweder imAusdruck H0 oder in H00, dieser kann nach Induktionsvoraussetzung alsZ1QxjH1Z2 geschrieben werden, womit sich eine entsprechende Zerlegungfur H ergibt, etwa bei H0 ≡ Z1QxjH1Z2 als

H = (Z1︸︷︷︸Z ′1

QxjH1 Z2 ⊗H2)︸︷︷︸Z ′2

2. (H ≡ Q′xiH00 durch pradikatenlogische Zusammensetzung entstanden)Entweder ist xi = xj , also H ≡ QxjH00, dann ist n = 2 und Q′ = Q,H1 = H00 und Z1 = Z2 = leeres Wort, oder es gilt xi 6= xj , dann kommtxj in H00 an der (n − 2)-ten Stelle quantifiziert vor. Nach Induktionsvor-aussetzung ist H00 ≡ Z1QxjH1Z2, also H ≡ Q′xiZ1QxjH1Z2.

2

Definition 4.2.4 (gebundenes und freies Vorkommen, Ausdruck)

1. xj kommt in H an der n-ten Stelle gebunden vor, wenn

(a) l (H) ≥ n ≥ 2


(b) xj steht in H an der n-ten Stelle.

(c) xj kommt an der n-ten Stelle quantifiziert vor oder steht im Wirkungsbe-reich eines mit xj versehenen Quantors.

2. xj kommt in H an der n-ten Stelle frei vor, wenn

(a) xj steht in H an der n-ten Stelle,

(b) xj ist an der n-ten Stelle nicht gebunden.

3. H heißt Aussage (abgeschlossen), wenn H keine freien Variablen enthalt.

BeispielWir betrachten den Ausdruck H ≡ ∃x0

(∀x1

(x0 = x1 ∧A2

1x1x2

)∧A3

2x0x1x2

):

Zuerst kennzeichnen wir die Wirkungsbereiche der Quantoren:

∃x0

(∀x1

(x0 = x1 ∧A2

1x1x2

)∧A3

2x0x1x2

)Wir numerieren nun die einzelnen Bestandteile des Ausdrucks H:

∃1

x0

2

(3

∀4

x1

5

(6

x0

7

=8

x1

9

∧10

A21

11

x1

12

x2

13

)14

∧15

A32

16

x0

17

x1

18

x2

19

)20

Die Variable x0 kommt an der 2., 7. und 17. Stelle gebunden, an der Stelle 2 sogarquantifiziert vor. x1 ist an 5., 9. und 12. Stelle gebunden und an 5. Stelle quantifiziert.An Stelle 18 ist x1 frei. Die Variable x2 kommt an 13. und 19. Stelle frei vor, x2 istsogar vollfrei in H.

Am Beispiel des allquantifizierten x1 an 5. Stelle zerlegen wir den Ausdruck H inZ1, Z2, Q und H1:

∃x0(︸︷︷︸Z1

∀︸︷︷︸Q

x1 (x0 = x1 ∧A21x1x2)︸︷︷︸

H1

∧A32x0x1x2)︸︷︷︸Z2

und x1 kommt in H1 vollfrei vor.

4.2.3 Semantik elementarer Sprachen

Interpretation[I, g] ist eine Interpretation der elementaren Sprache mit der Signatur [K,P, F ],wenn

1. I 6= ∅ ein nichtleerer Individuenbereich ist

2. g eine Abbildung ist, die

(a) jedem Individuenzeichen ai ein Element g (ai) ∈ I(b) jedem Funktionszeichen F ki eine k-stellige Funktion g

(F ki)

:×kI → I

(c) jedem Attributzeichen Aki ein k-stelliges Attributg(Aki)

:×kI → W,F

zuordnet.

Man bezeichnet g auch als die Interpretation von AUSD uber I. Zu jedem I, g gehortdie interpretierende Algebra

[I,g(F ki)|i ∈ N

, Rg(Ak), . . .

]


BelegungDie Abbildung f heißt Belegung uber I, wenn f jeder Individuenvariablen xi einIndividuum f (xi) ∈ I zuordnet.

Um Terme auszuwerten, d. h. das Element aus I zu erhalten, das ein Term T bei derInterpretation I, g und der Belegung f beschreibt, fuhren wir folgende Funktion ein:

elementelementI,g (T, f) wird wie folgt induktiv definiert:

A) Fur Variable xi: elementI,g (xi, f) = f (xi)Fur Konstanten ai: elementI,g (ai, f) = g (ai)

I) elementI,g(F ji (T1, . . . , Tj) , f

)=

g(F ji

)(elementI,g (T1, f) , . . . , elementI,g (Tj , f)) .

Analog wie im Aussagenkalkul bestimmen wir nun den Wert eines Ausdrucks:

wertwertI,g (H, f) wird induktiv uber den Aufbau von Ausdrucken definiert:

A) wertI,g (T1 = T2, f) = IdI (elementI,g (T1, f) , elementI,g (T2, f))wertI,g

(Aki T1 . . . Tk, f

)= g

(Aki)

(elementI,g (T1, f) , . . . , elementI,g (Tk, f))

I) wertI,g (¬H, f) = non (wertI,g (H, f))wertI,g ((H1 ∧H2) , f) = et (wertI,g (H1, f) ,wertI,g (H2, f))wertI,g ((H1 ∨H2) , f) = vel (wertI,g (H1, f) ,wertI,g (H2, f))wertI,g ((H1 → H2) , f) = seq (wertI,g (H1, f) ,wertI,g (H2, f))wertI,g ((H1 ↔ H2) , f) = aeq (wertI,g (H1, f) ,wertI,g (H2, f))

wertI,g (∀xjH, f) = Om(α1H,I,g,f,xj

)wertI,g (∃xjH, f) = Ex

(α1H,I,g,f,xj

)wobei:α1H,I,g,f,xj

(y) = wertI,g(H, [f ]jy

)mit [f ]jy (xi) =

y, falls i = jf (xi) , sonst

BeispielWir bestimmen den Wert des Ausdrucks H ≡ ∃x0A

20x0x1, I = N, g

(A2

0

)= ” < “,

f (x1) = 5.

Dann istwertI,g

(∃x0A

20x0x1, f

)= Ex

(α1A2

0x0x1,N,g,f,x0

)wobei fur k ∈ N

α1A2

0x0x1,N,g,f,x0(k) = wert

(A2

0x0x1, [f ]0k)

= g(A2

0

) ([f ]0k (x0) , [f ]0k (x1)

)= ” < “ (k, 5) =

W, falls k < 5F, sonst


Es gibt also ein k ∈ I = N mit

α1A2

0x0x1,N,g,f,x0(k) = W

d. h.wertI,g

(∃x0A

20x0x1, f

)= Ex

(α1A2

0x0x1,N,g,f,x0

)= W.

Bei einer Belegung f mit f (x1) = 0 ist jedoch

wertI,g(∃x0A

20x0x1, f

)= F.

4.2.4 Weitere semantische Begriffe

ErfullbarkeitSei H ∈ AUSD

1. f erfullt H in der Interpretation g uber Individuenbereich I; (ferfI,gH), wennwertI,g (H, f) = W.

2. H ist erfullbar in g uber I, wenn es eine Belegung f : X → I gibt, mitwertI,g (H, f) = W.

3. H heißt erfullbar uber I (H ∈ efI , efIH), wenn es g, f gibt, mit:wertI,g (H, f) = W.

4. H heißt erfullbar (H ∈ ef, efH), wenn es I, g, f gibt, mit wertI,g (H, f) = W.

BeispielWir betrachten den Ausdruck H ≡ ∃x0∃x1 ¬x0 = x1. Wenn I eine Einermenge ist, soist H nicht erfullbar uber I. Der Ausdruck H ≡ ∀x0∀x1 x0 = x1 ist dagegen erfullbaruber I gdw. I Einermenge.

GultigkeitSei H ∈ AUSD

1. H ist allgemeingultig in der Interpretation g uber Individuenbereich I(H ∈ agI,g

), wenn fur alle Belegungen f : wertI,g (H, f) = W.

2. H ist allgemeingultig uber I (H ∈ agI , agIH), wenn fur alle g, f gilt:wertI,g (H, f) = W.

3. H ist allgemeingultig (H ∈ ag, agH), wenn fur alle I, f, g gilt:wertI,g (H, f) = W.

Fur das folgende erinnern wir daran, daß ein Ausdruck H als Aussage bezeichnetwird, wenn in H keine freien Variablen vorkommen.

Satz 4.2.5Wenn H Aussage ist, dann hangt wertI,g (H, f) nicht von der Belegung f ab.

Definition 4.2.6 (wahre und falsche Aussagen)Sei H Aussage.

1. H heißt wahr in der Interpretation g uber I, wenn H erfullbar in g uber I ist.


2. H heißt falsch in g uber I, wenn ¬H erfullbar in g uber I ist.

Zentrales LemmaDer Wahrheitswert wertI,g (H, f) hangt nur ab von der Interpretation der Zeichen,die in H vorkommen, und von der Belegung der Variablen, die in H frei vorkommen

Mit anderen Worten: Kommt die Variable xj in H nicht frei vor (also quantifiziertoder gebunden), so gilt fur alle a ∈ I:

wertI,g (H, f) = wertI,g(H, [f ]ja

)Fur Aussagen gilt weiterhin:

Satz 4.2.7Ist H Aussage, so gilt: H ist erfullbar in g uber I gdw. H allgemeingultig in g uber Iist. Enthalt H zudem keine Zeichen, so ist H allgemeingultig uber I gdw. H erfullbaruber I ist.

Es gilt

Folgerung 4.2.8

1. H ∈ efI gdw. ¬H /∈ agI

2. H ∈ ef gdw. ¬H /∈ ag

3. agI ⊂ efI , ag ⊂ ef

Fur die dritte Aussage ist die Festsetzung wichtig, daß I 6= ∅ ist, denn ¬xj = xjwurde uber I = ∅ gultig sein.

Die Frage nach der Gultigkeit eines Ausdrucks ist durch

H ∈ ag gdw. ¬H /∈ ef

auf die Frage nach der Erfullbarkeit seiner Negation reduziert.

Um pradikatenlogische Schlußregeln zu verifizieren, brauchen wir also ein Verfahren,um die Erfullbarkeit von Ausdrucken zu entscheiden. Die Frage ”H ∈ ef?“ ist dasEntscheidungsproblem des Pradikatenkalkuls.

Wir wissen, daß im Aussagenkalkul die Mengen ef, ag entscheidbar sind. Wie sieht esnun im Pradikatenkalkul aus? Gibt es ein solches Verfahren?

Wir werden zeigen:

Wenn I eine unendliche Menge ist, so ist efI nicht entscheidbar.

Es gibt also keinen Algorithmus, der fur jedes H ∈ AUSD nach endlicher Zeit abbrichtmit dem Resultat ”H ∈ ef“ bzw. ”H /∈ ef“.

4.3. DIE UNENTSCHEIDBARKEIT DES PRADIKATENKALKULS 133

4.3 Die Unentscheidbarkeit des Pradikatenkalkuls

Wir wollen beweisen, daß die Menge efI der uber einem unendlichen Individuenbereicherfullbaren Ausdrucke des Pradikatenkalkuls nicht entscheidbar ist, mit anderen Wor-ten, daß die charakteristische Funktion χefI nicht allgemein–rekursiv ist. Dazu bildenwir die partiell–rekursiven Funktionen im Pradikatenkalkul nach (reprasentieren siedurch Ausdrucke) und numerieren die Ausdrucke.

1. Darstellung zahlentheoretischer Funktionen im PradikatenkalkulDazu brauchen wir zunachst eine Moglichkeit, naturliche Zahlen im Pradikaten-kalkul darzustellen. Wir erinnern uns daran, daß die Zahl Drei die Menge allerMengen mit genau drei Elementen ist, also jede Dreiermenge als Reprasentantder Zahl Drei herhalten kann. Eine Menge M kann beschrieben werden als eineinstelliges Attribut αM , das genau auf die Elemente der Menge M zutrifft:

x ∈M gdw. αM (x)

Fur Attribute haben wir Zeichen in unserem Kalkul, wir konnen also festlegen,daß das einstellige Attributenzeichen A1

j in einer Interpretation g die Zahl nreprasentiert, wenn das Attribut g

(A1j

)auf genau n Elemente von I zutrifft.

Dies konnen wir durch Anzahlaussagen ausdrucken:

Es sei H ∈ AUSD, x eine Individuenvariable, die in H frei vorkommt. Dann sei∃i!!xH(x) Abkurzung fur den Ausdruck

¬∃xH (x) falls i = 0∃x1 (H (x1) ∧ ∀x2 (H (x2)→ x2 = x1)) falls i = 1...∃x1 · · · ∃xi

(H (x1) ∧ · · · ∧H (xi) ∧ ¬x1 = x2 ∧ · · · fur beliebiges i

· · · ¬x1 = x3 ∧ · · · ∧ ¬xi−1 = xi ∧ ∀xi+1 (H (xi+1)→xi+1 = x1 ∨ · · · ∨ xi+1 = xi)

)Offenbar gilt:

wertI,g (∃i!!xH, f) = W genau dann, wenn es genau i Elementea1, . . . , ai ∈ I gibt mit wertI,g

(H, [f ]xai

)= W. Deshalb liest man

den Ausdruck ∃i!!xH(x) als ”es gibt genau i Elemente x mit H(x)“.

Ist A1j ein einstelliges Attributenzeichen, dann beschreibt also ∃n!!xA1

jx die Zahln in dem Sinne, daß der Ausdruck genau in den Interpretationen g wahr ist, beidenen das Attribut g

(A1j

)auf genau n Elemente zutrifft.

Definition 4.3.1Die Funktion φ : Nm → N heißt durch H ∈ AUSD bzgl.

A1

1, . . . , A1m+1

in I

dargestellt, wenn fur alle j1, . . . , jm+1 ∈ N gilt:

φ (j1, . . . , jm) = jm+1 gdw.(H ∧ ∃j1!!xA1

1x ∧ · · · ∧ ∃jm!!xA1mx ∧ ∃jm+1!!xA1

m+1x) ∈ efI

Es ist klar, daß eine solche Darstellung nur in einem unendlichen Individuenbe-reich I existieren kann, weil bei card(I) = n ∈ N der Ausdruck ∃(n+ 1)!!xA1

jxnicht uber I erfullbar ist.

Beispiele


1. Nachfolgerfunktion N (x) = x+ 1Die Nachfolgerfunktion N wird durch

H ≡ ∃x1

(¬A1

1x1 ∧ ∀x2

(A1

2x2 ↔(A1

1x2 ∨ x1 = x2

)))bzgl.

A1

1, A12

dargestellt.

2. Konstanten Cni (j1, . . . , jn) = iDie Konstante Cni wird durch

H ≡ ∃i!!xA1n+1x

bzgl.A1

1, . . . , A1n+1

dargestellt.

3. Argumentauswahlfunktionen Ini (j1, . . . , jn) = jiDie Argumentauswahlfunktion Ini wird durch

H ≡ ∀x(A1ix↔ A1

n+1x)

bzgl.A1

1, . . . , A1n+1

dargestellt.

Folgerung 4.3.2Die ANF–Funktionen sind im Pradikatenkalkul darstellbar.

Man zeigt durch Induktion

Satz 4.3.3Alle partiell–rekursiven Funktionen konnen im Pradikatenkalkul dargestellt wer-den.

2. Numerierung (Godelisierung) von AUSDWir numerieren unser Alphabet wie folgt:

ξ ∈ X : ¬ ∧ ∨ → ↔ ( ) , = ∀ ∃ a x A F ? |N(ξ) : 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

Definition 4.3.4 (Godelzahl eines Wortes uber dem Alphabet X)Fur ξ1ξ2 · · · ξn ∈W (X) sei

go (ξ1 . . . ξn) =n−1∏j=0

qN(ξj)j

die Godelzahl eines Wortes uber Alphabet X.

Beispielgo (x = x?) = 213 · 39 · 513 · 716

Satz 4.3.5

1. Die Funktion go ist eineindeutig.

2. Die charakteristische Funktion χAUSD mit

χAUSD (n) =

0, falls es H ∈ AUSD gibt, mit n = go (H)1, sonst


4.3. DIE UNENTSCHEIDBARKEIT DES PRADIKATENKALKULS 135

Es ist also ”H ∈ efI“ logisch gleichwertig mit ”go(H) ∈ go (efI)“, d. h. genau dannexistiert ein Algorithmus, der das Entscheidungsproblem H ∈ efI?|H ∈ AUSD lost,wenn die charakteristische Funktion χ der Menge der Godelzahlen der Ausdrucke ausefI

χ (n) =

0, falls n = go (H) fur H ∈ efI1, sonst

berechenbar ist.

Wir zeigen, daß χ nicht allgemein–rekursiv ist, nach der Churchschen These alsonicht berechenbar, sobald I unendlich ist.

Satz 4.3.6Ist I ein unendlicher Individuenbereich, dann ist χ nicht rekursiv.

BeweisWir nehmen an, daß χ allgemein–rekursiv ist.

Zu H ∈ AUSD sei

S(H) ≡ H ∧ ∃go(H)!!x1A11x1 ∧ ∃0!!x1A

12x1

Dieser Ausdruck kann als Darstellung einer einstelligen Funktion verwendet werden,die der Godelzahl von H die Zahl 0 zuordnet. Ware die dargestellte Funktion geradeχ, so konnte S(H) gerade als ”H ist erfullbar uber I“ gelesen werden.

Wir definieren die zahlentheoretische Funktion σ durch

σ (n) :=

go (S (H)) , falls n = go (H)0, sonst (d. h. χAUSD (n) = 1)

Man zeigt leicht:

Lemmaσ (n) ist allgemein-rekursiv.

Fur H ∈ AUSD gilt:

H ∈ efI gdw. χ (go(H)) = 0

also speziell fur Ausdrucke der Form S(H)

S(H) ∈ efI gdw. χ (go (S(H))) = 0gdw. χ (σ (go(H))) = 0

d. h.

S(H) /∈ efI gdw. sg (χ (σ (go(H)))) = 0

Wir setzenψ (n) := sg (χ (σ (n)))

und offenbar ist ψ allgemein–rekursiv.

Weil I unendlich ist, kann ψ im Pradikatenkalkul (bzgl. I) dargestellt werden, es gibtalso ein H? ∈ AUSD derart, daß fur alle m,n ∈ N gilt:

ψ(m) = n gdw.(H? ∧ ∃m!!xA1

1x ∧ ∃n!!xA12x)∈ efI


Folglich ist

ψ(m) = 0 gdw.(H? ∧ ∃m!!xA1

1x ∧ ∃0!!xA12x)∈ efI

und insbesondere fur m = go(H) ist

ψ (go(H)) = 0 gdw.(H? ∧ ∃go(H)!!xA1

1x ∧ ∃0!!xA12x)∈ efI

also ist

S(H) /∈ efI gdw.(H? ∧ ∃go(H)!!xA1

1x ∧ ∃0!!xA12x)∈ efI

Nun setzen wir fur H speziell H? ein und erhalten einen Widerspruch:

S(H?) /∈ efI gdw.(H? ∧ ∃go(H?)!!xA1

1x ∧ ∃0!!xA12x)︸︷︷︸

= S(H?) /?

∈ efI

Also ist χ nicht rekursiv, d. h. efI ist nicht entscheidbar. 2

Wie steht es mit der Entscheidbarkeit der Menge aller erfullbaren Ausdrucke

ef =⋃I 6=∅

efI ?

Auch diese Menge ist nicht entscheidbar.

Um das einzusehen, betrachten wir den Ausdruck H∞:

H∞ ≡ (∀x1¬A20x1x1

∧∀x1∀x2∀x3(A20x1x2 ∧A2

0x2x3 → A20x1x3)

∀x1∃x2A20x1x2)

Es gilt:

Lemma 1Fur alle I 6= ∅ gilt efIH∞ gdw. I unendlich ist.

weil namlich nur in einem unendlichen Bereich eine binare Relation existiert, dieirreflexiv und transitiv (also irreflexive Halbordnung) ist und kein maximales Elementhat.

Lemma 2Wenn ef entscheidbar ist, so ist auch efN entscheidbar.

BeweisWir nehmen also an, daß ein Algorithmus zur Losung von H ∈ ef?|H ∈ AUSDgegeben ist.

Um fur einen Ausdruck H ∈ AUSD herauszufinden, ob H ∈ efN (also im Bereich dernaturlichen Zahlen erfullbar) ist, wenden wir diesen Algorithmus auf den AusdruckH ∧ H∞ an (wobei wir o. B. d. A. voraussetzen, daß das Zeichen A2

0 in H nichtvorkommt).

4.4. LOSBARE FALLE DES ENTSCHEIDUNGSPROBLEMS 137

Fall 1: (H ∧H∞) /∈ efd. h. es gibt kein I 6= ∅ mit (H ∧H∞) ∈ efI , wegen H∞ ∈ efN gilt also H /∈ efN .

Fall 2: (H ∧H∞) ∈ efDann gibt es ein I? 6= ∅ mit (H∧H∞) ∈ efI? , wegen H∞ ∈ efI? ist I? unendlich.Nach dem

Satz 4.3.7 (von Lowenheim–Skolem)Wenn efIH und I unendlich, so efNH.

ist H ∈ efN .

Also gilt H ∈ efN gdw. (H ∧H∞) ∈ efI .

Mit ef ware also auch efN entscheidbar, was wir bereits als falsch nachgewiesen haben.Folglich ist auch ef nicht entscheidbar. 2

4.4 Losbare Falle des Entscheidungsproblems

Die Unlosbarkeit des Entscheidungsproblems wirft naturlich die Frage auf, in welchenFallen, d. h. zum Beispiel fur welche spezielle Klassen von Ausdrucken, man dennochdie Erfullbarkeit bzw. Gultigkeit entscheiden kann.

Trivial ist der Fall, daß der Individuenbereich I endlich ist. Dann gibt es zu gegebe-ner Stellenzahl n nur endlich viele n-stellige Attribute und nur endlich viele n-stelligeFunktionen uber I. Da in einem Ausdruck H nur endlich viele (freie) Individuenvaria-ble vorkommen, sind also auch nur endlich viele Interpretationen g und Belegungenf uber I daraufhin zu prufen, ob wertI,g(H, f) = W ist.

Im folgenden betrachten wir zwei unterschiedliche Spezialfalle, zum einen schrankenwir die Menge der betrachteten Ausdrucke ein (Klassenkalkul), zum anderen uber-tragen wir den Gultigkeitsbegriff des Aussagenkalkuls in den Pradikatenkalkul.

4.4.1 Klassenkalkul

Als Klassenkalkul bezeichnen wir die Menge der Ausdrucke H ∈ AUSD

• ohne Funktionszeichen

• ohne Konstanten

• ohne Gleichheitszeichen

in denen nur einstellige Attributenzeichen vorkommen.

Beispiel∀x ((Ax ∧ (Ax ∨Bx))↔ Ax)

In der Sprache des Klassenkalkuls kommen als Terme nur Individuenvariable in Frageund alle pradikativen Ausdrucke haben die Form Ajxk.

Satz 4.4.1Es sei H ∈ AUSD ohne Funktionszeichen, ohne Konstanten, ohne = und mit k ver-schiedenen einstelligen Attributenzeichen, o. B. d. A. A1, . . . , Ak. Dann ist efH gdw.ein I mit 0 < card (I) ≤ 2k existiert, mit efIH.


BeweisWenn H ∈ efI ist, dann gilt nach Definition H ∈ ef. Umgekehrt sei H erfullbar; es gibtalso ein I 6= ∅, eine Interpretation g und eine Belegung f uber I mit wertI,g(H, f) =W.

Es sei fur i = 1, . . . , k

αi := g(Ai),

wobei A1, . . . , Ak die in H vorkommenden einstelligen Attributenzeichen sind.

Wir konstruieren einen Individuenbereich I, eine Interpretation g und eine Belegungf mit

card(I)≤ 2k

wertI,g(H, f

)= W

durch Faktorisierung der Algebra [I, α1, . . . , αk]:

Fur a, b ∈ I definieren wir

a ∼ b :↔ α1 (a) = α1 (b) ∧ · · · ∧ αk (a) = αk (b)

Lemma 1∼ ist Aquivalenzrelation in I.

Fur a ∈ I bezeichne [a] := b|b ∈ I ∧ b ∼ a die Aquivalenzklasse von a und

I := [a]|a ∈ I

die Zerlegung I/ ∼.

Lemma 21 ≤ card

(I)≤ 2k.

Jetzt uberlegen wir uns, daß ∼ sogar Kongruenz bezuglich α1, . . . , αk ist:

wenn a ∼ b, so αi(a) = αi(b)

folglich konnen wir auf I definieren:

αi ([a]) = αi(a) (i = 1, . . . , k)

Wir betrachten g, f mit

g (Ai) = ai f (xj) = [f (xj)]

und behaupten

Lemma 3wertI,g

(H ′, f

)= wertI,g (H ′, f) fur alle Ausdrucke H ′ des Klassenkalkuls, die

hochstens die Attributenzeichen A1, . . . , Ak enthalten.

Beweisdurch Induktion uber H ′

4.4. LOSBARE FALLE DES ENTSCHEIDUNGSPROBLEMS 139

Anfangsschritt: H ′ ist pradikativ: H ′ ≡ Aixj (1 ≤ i ≤ k)

Dann ist

wertI,g(H ′, f

)= g (Ai)

(f [xj ]

)= αi ([f (xj)])

= αi (f (xj)) = wertI,g (H ′, f) .

Induktionsschritt:

(a) aussagenlogische Zusammensetzung:

wertI,g(¬H, f

)=

non(

wertI,g(H, f

))= non (wertI,g (H, f)) = wertI,g (¬H, f)

wertI,g

H1

∧∨→↔

H2

, f

=

et...

aeq

(wertI,g

(H1, f

),wertI,g

(H1, f

))= wertI,g

H1

∧...↔

H2, f

(b) pradikatenlogische Zusammensetzung:

wertI,g(∀xjH, f

)= Om

(α1H,I,g,f,xj

)=

W, falls αH,I,g,f,xj ([a]) = W fur alle [a] ∈ IF, sonst

Nun ist

αH,I,g,f,xj ([a]) = wertI,g(H,[f]j[a]

)= wertI,g

(H,[f]ja

)(nach Ind.–Vor.)

= αH,I,g,f,xj (a)

Also ist

wertI,g(∀xjH, f

)=

W, falls αH,I,g,f,xj (a) = W fur alle [a] ∈ IF, sonst

= wertI,g (∀xjH, f) .

Analog behandelt man den Fall H ′ ≡ ∃xjH.

2

Folgerung 4.4.2 (aus Satz 4.4.1)Um zu entscheiden, ob ein Ausdruck des Klassenkalkuls erfullbar (in irgendeinemnichtleeren Bereich) ist, genugt es, die Erfullbarkeit in dem Individuenbereich mit 2k

Elementen zu uberprufen (wobei k die Zahl der Attributenzeichen ist).

Das gilt deshalb, weil fur Ausdrucke ohne Gleichheitszeichen gilt: Wenn H ∈ efI undcard(I) ≤ card(I ′), so ist H ∈ efI′ .


4.4.2 Aussagenlogische Erfullbarkeit und Gultigkeit

Die aussagenlogisch gultigen Ausdrucke des Pradikatenkalkuls bilden eine wichtigeTeilmenge von ag, die entscheidbar ist.

Definition 4.4.3 (aussagenlogisch einfache Ausdrucke)Ein Ausdruck H ∈ AUSD heißt aussagenlogisch einfach oder unzerlegbar, wenn erentweder pradikativer Ausdruck ist oder mit einem Quantor beginnt.

AE ist die Menge der aussagenlogisch einfachen Ausdrucke.

Es ist klar, daß jeder Ausdruck H ∈ AUSD des Pradikatenkalkuls in eindeutigerWeise aus aussagenlogisch einfachen Ausdrucken mit Hilfe der aussagenlogischen Zu-sammensetzungen aufgebaut ist.

Definition 4.4.4 (aussagenlogische Belegung)Jede Abbildung β : AE→ W,F wird aussagenlogische Belegung genannt.

Definition 4.4.5 (aussagenlogischer Wert)Die Abbildung werta(H,β) wird fur H ∈ AUSD, β : AE→ W,F wie folgt induktivdefiniert:

Anfangsschritt:

Wenn H ∈ AE, so werta(H,β) = β(H)

Induktionsschritte:

Wenn H ≡ ¬H1, so werta(H,β) = non(werta(H1, β))Wenn H ≡ (H1 ∧H2) , so werta(H,β) = et(werta(H1, β),werta(H2, β))

und analog fur ∨, →, ↔.

Definition 4.4.6 (aussagenlogische Erfullbarkeit, Gultigkeit)Ein Ausdruck H ∈ AUSD heißt aussagenlogisch erfullbar (bzw. gultig), wennwerta(H,β) = W fur ein (bzw. alle) aussagenlogischen Belegungen β gilt. Es seiefa bzw. aga die Menge aller aussagenlogisch erfullbaren bzw. gultigen Ausdrucke.

Satz 4.4.7Es sei I 6= ∅, g eine Interpretation in I und f eine Belegung uber I und fur H ∈ AEsei β(H) = wertI,g(H, f). Dann gilt fur H? ∈ AUSD

wertI,g(H?, f) = werta(H?, β)

Diese Aussage beweist man leicht durch Induktion uber den Aufbau von H? ausaussagenlogisch einfachen Ausdrucken.

Folgerung 4.4.8

• ef ⊂ efaBeispiel∃x(Ax ∧ ¬Ax) ∈ efa \ ef

• aga ⊂ agBeispiel∀x(Ax ∨ ¬Ax) ∈ ag \ aga

Wichtig ist die

Folgerung 4.4.9Die Mengen aga und efa sind entscheidbar.

4.5. FOLGERN UND ABLEITEN 141

4.5 Folgern und Ableiten

4.5.1 Folgern

Modell, Folgern und FolgerungsoperatorSei X ⊆ AUSD

• [g, f ] ist ein Modell von X in I, wenn fur alle H ∈ X gilt: wertI,g (H, f) = W.

• Aus X folgt H in I, (XfolIH), wenn jedes Modell von X in I den AusdruckH erfullt. Aus X folgt H (XfolH), wenn fur jedes I 6= ∅ gilt: XfolIH.

• Der Folgerungsoperator flI ist wie folgt definiert: flI (X) := H|XfolIH.Analog ist fl (X) definiert.

Satz 4.5.1 (Eigenschaften der Folgerungsoperatoren)flI und fl haben folgende Eigenschaften:

0. H ∈ flI(X) gdw. die Menge X ∪ ¬H kein Modell in I hat.

1. flI (∅) = agI

2. flI hat die Hulleneigenschaften

3. flI erfullt den EndlichkeitssatzBeweis uber den Endlichkeitssatz fur Modelle, analog wie im Aussagenkalkul.

4. Ableitbarkeitstheorem: Wenn (H1 → H2) ∈ flI (X), so H2 ∈ flI (X ∪ H1).

5. Deduktionstheorem: Wenn H2 ∈ flI (X ∪ H1), so (H1 → H2) ∈ flI(X).

6. flI (agI) ⊆ agI , fl (ag) ⊆ ag

Beweis des Deduktionstheorems

Voraussetzung: Es sei H2 ∈ fl(X ∪ H1) und [g, f ] ein Modell von X in I.

Behauptung: wertI,g (H1 → H2, f) = W

Fall 1: [g, f ]erfIH1 (wertI,g (H1, f) = W)

Dann ist [g, f ] Modell von X ∪ H1 in I. Es ist also wertI,g (H2, f) = W nachVoraussetzung.

Daraus folgt die Behauptung.

Fall 2: [g, f ]erfI¬H1 (wertI,g (H1, f) = F)

Dann ist wertI,g ((H1 → H2) , f) = W.

Also gilt die Behauptung. 2

BemerkungDie Relation XfolIH ist unentscheidbar, auch wennX endlich ist (∅folIH gdw. agIH).


4.5.2 Ableiten

Wie im Aussagenkalkul wollen wir fur X ⊆ AUSD und H ∈ AUSD das Folgernsyntaktisch charakterisieren und definieren deshalb XablH.

ablwird induktiv definiert:

A) Wenn H ∈ X, so XablH

I) 1. Wenn XablH1 und Xabl(H1 → H2), so XablH2 (modus ponens)

H1

(H1 → H2)H2

2. Regel der vorderen Generalisierung

Xabl(H1 (x)→ H2)Xabl(∀xH1 → H2)

3. Regel der hinteren Generalisierung

Xabl(H1 → H2 (x)), und x nicht in H1.Xabl(H1 → ∀xH2)

4. Regel der vorderen Partikularisierung

Xabl(H1 (x)→ H2), x nicht in H2

Xabl(∃xH1 → H2)

5. Regel der hinteren Partikularisierung

Xabl(H1 → H2 (x))Xabl(H1 → ∃xH2)

6. Regel der gebundenen UmbenennungAus H entsteht H ′ durch gebundene Umbenennung, wenn gilt:Es gibt Individuenvariablen xk, xl mit

(a) xk kommt in H gebunden vor(b) xl kommt im Wirkungsbereich H? von xk in H nicht quantifiziert

und nicht frei vor,(c) H? liegt in keinem Wirkungsbereich von xl. (Insgesamt wird also

gefordert, daß xl nicht in H? vorkommt.)(d) H ′ entsteht aus H, indem in QxkH

? uberall xk durch xl ersetztwird (mit Quantor Q ∈ ∀,∃)

XablHH geht durch gebundene Umbenennung in H ′ uber

XablH ′

7. Termeinsetzung

XablH (x)T Term, wobei alle Stellen in H, an denen x steht, ste-

hen in keinem Wirkungsbereich einesQuantors einer Variable, die in T vor-kommt

XablH(x/T

)

4.5. FOLGERN UND ABLEITEN 143

Die gebundene Umbenennung eines Ausdrucks H veranschaulichen wir an folgendemBeispiel:

H ≡ ∃y∀x

H?︷︸︸︷A2xy H ′ ≡ ∃y∀zA2zy

Ein Beispiel fur die Termeinsetzung ist

H ≡ ∀zA2zy mit T ≡ F (x, a)

Der Term T erfullt alle Bedingungen fur die Termeinsetzung und wir erhalten

H(y/T

)≡ ∀zA2zF (x, a)

Wir definieren wieder die Operation

ab

ab (X) := H|XablH

und die Relation und Operation

abla und abaDie Relation XablaH gilt gdw. H ist nur mit der Abtrennungsregel (modus ponens)aus X ableitbar.

aba (X) := H|XablaH

Satz 4.5.2 (Eigenschaften von ab und aba)

1. ab (∅) = aba (∅) = ∅;

2. ab und aba haben die Hulleneigenschaften.

3. ab und aba erfullen den Endlichkeitssatz.

4. Ableitbarkeitstheorem: Xabl (H1 → H2), so X ∪ H1 ablH2.

5. Deduktionstheorem gilt nicht.

6. Wenn X ⊆ agI , so ab (X) ⊆ agI und wenn X ⊆ agI , so aba (X) ⊆ agI .

Schwaches Deduktionstheorem

Wie im Aussagenkalkul wollen wir zeigen, unter welchen Voraussetzungen abl dasDeduktionstheorem erfullt.

Satz 4.5.3Wenn fur alle H1, H2 ∈ AUSD gilt: XablH1 → (H2 → H1) und XablH (xj), soXabl∀xjH.

BeweisEs sei H0 ∈ AUSD mit xj kommt in H0 nicht vor und XablH0.

XablH → (H0 → H)XablH

XablH0 → H (xj) (nach modus ponens)XablH0 → ∀xjH (hintere Generalisierung)

XablH0

Xabl∀xjH (nach modus ponens)

2


Definition 4.5.4 (”Die“ Generalisierte eines Ausdrucks)Fur H ∈ AUSD ist Gen (H) einer der Ausdrucke (vielleicht der mit der kleinstenGodelzahl), die aus H entstehen, wenn zuerst alle gebundenen Variablen nacheinanderin nicht vorkommende Variablen umbenannt werden, dann alle vollfrei vorkommendenVariablen x mit ∀x quantifiziert werden.

BeispielWir bestimmen die Generalisierte des Ausdrucks H ≡ ∀x

(A2

1yz → A22xy)∧A1

3x.

Zuerst nennen wir die gebundenen Variablen in nicht vorkommende um:

∀u(A2

1yz → A22uy)∧A1

3x

Alle freien Variablen sind jetzt vollfrei. Nun quantifizieren wir alle vollfreien Variablenund erhalten

Gen(H) ≡ ∀x∀y∀z∀u((A2

1yz → A22uy)∧A1

3x)

Dual zu Gen (H) definieren wir ”die“ Partikularisierte Part (H) eines Ausdrucks H,indem wir x mit ∃ quantifizieren.

Satz 4.5.5 (Schwaches Deduktionstheorem)

Voraussetzung: Es gelte

• Xabl (H ′ → (H ′′ → H ′)) (1)

• Xabl (H ′ → H ′) (2)

• Xabl (H ′ → (H ′′ → H ′′′))↔ ((H ′ → H ′′)→ (H ′ → H ′′′)) (3)

• Xabl (H ′ → (H ′′ → H ′′′))→ (H ′′ → (H ′ → H ′′′)) (4)

• Xabl (H ′ → (H ′′ → H ′′′))↔ ((H ′ ∧H ′′)→ H ′′′) (5)

Behauptung: Wenn (X ∪ H1) ablH2, so Xabl (Gen (H1)→ H2).

BemerkungWenn H1 Aussage ist, dann ist Gen (H1) = H1, da dann alle vorkommenden Aus-sagenvariablen quantifiziert sind. Unter den Voraussetzungen (1)–(5) erfullt abl dasDeduktionstheorem.

Beweis des Satzes durch Induktion uber H2.

Syntaktische Charakterisierung des Folgerns

Die syntaktische Charakterisierung des Folgerns, die wir im Aussagenkalkul durch dieGleichung

fl(X) = aba(abe(axa) ∪X)

vorgenommen haben, erfolgt ahnlich auch im Pradikatenkalkul. Man zeigt

Satz 4.5.6

fl(X) = ab(ag ∪X)

Der Beweis verlauft ahnlich wie im Aussagenkalkul mit Hilfe des Endlichkeitssatzesfur das Folgern.

4.6. PRADIKATENLOGISCHES SCHLIESSEN 145

Syntaktische Charakterisierung von ag

Es bleibt, die Menge ag syntaktisch zu charakterisieren:

Die Menge AXA

AXA = H| H entsteht aus einem Axiom aus axa durch Ersetzen derAussagenvariablen durch Ausdrucke aus AUSD.

Folgerung 4.5.7Durch Einsetzen von Aussagen des Pradikatenkalkuls in die Menge axa des Aussa-genkalkuls erhalten wir Axiome des Pradikatenkalkuls und es gilt:

AXA ⊆ aga ⊆ ag

Weiterhin definieren wir:

Die Menge AXI

AXI =x0 = x0, x0 = x1 → x1 = x0, x0 = x1 ∧ x1 = x2 → x0 = x2

∪

x0 = x1 → Ajix2x3 · · ·xkx0xk+1 · · ·xj ↔Ajix2 · · ·xkx1xk+1 · · ·xj |i ≥ 0, k = 1, . . . , j

∪

x0 = x1 → F ji (x2, . . . , xk, x0, xk+1, . . . , xj) =

F ji (x2, . . . , xk, x1, xk+1, . . . , xj)|i ≥ 0, k = 1, . . . , j

Dann ist

Die Menge AX

AX := AXA ∪AXI

Man zeigt

Satz 4.5.8 (Axiomatisierbarkeit des Pradikatenkalkuls)

ag = ab(AX)

BemerkungDie Widerspruchsfreiheit ab(AX) ⊆ ag ist dabei leicht zu sehen, wahrend die Voll-standigkeit ag ⊆ ab(AX) schwieriger zu beweisen ist.

4.6 Pradikatenlogisches Schließen

Wir geben nun noch einige abgeleitete Schlußregeln fur den Umgang mit Quantorenan. Dabei erinnern wir daran, daß Schlußregeln mit fetten ”Schlußstrichen“ in beidenRichtungen gelten.


1. Quantoren–Einfuhrung und –Beseitigung

Voraussetzung: Die Individuenvariable x kommt vollfrei in H ∈ AUSD vor

(X ∪AX)ablH(x)(X ∪AX)abl ∀xH

(X ∪AX)ablH(x)(X ∪AX)abl ∃xH ,

(X ∪AX)abl ∀xH(X ∪AX)abl ∃xH

2. Quantoren–Vertauschung

(X ∪AX)abl ∀x∀y H(X ∪AX)abl ∀y∀xH ,

(X ∪AX)abl ∃x∃y H(X ∪AX)abl ∃y∃xH

(X ∪AX)abl ∃x∀y H(X ∪AX)abl ∀y∃xH

3. Quantoren–Verteilung

(X ∪AX)abl ∀x (H1(x) ∧H2(x))(X ∪AX)abl ∀xH1 ∧ ∀xH2

,(X ∪AX)abl ∃x (H1(x) ∧H2(x))

(X ∪AX)abl ∃xH1 ∧ ∃xH2

(X ∪AX)abl ∃x (H1(x) ∨H2(x))(X ∪AX)abl ∃xH1 ∨ ∃xH2

,(X ∪AX)abl ∀xH1 ∨ ∀xH2

(X ∪AX)abl ∀x (H1(x) ∨H2(x))

4. Quantoren–Verschiebung

Die Individuenvariable x komme in H1 nicht vor:

(X ∪AX)abl ∀x (H1 → H2(x))(X ∪AX)abl (H1 → ∀xH2)

,(X ∪AX)abl ∃x (H1 → H2(x))

(X ∪AX)abl (H1 → ∃xH2)

(X ∪AX)abl ∀x (H2(x)→ H1)(X ∪AX)abl ∃xH2 → H1

,(X ∪AX)abl ∃x (H2(x)→ H1)

(X ∪AX)abl (∀xH2 → H1)

(X ∪AX)abl ∀x (H1 ∧H2(x))(X ∪AX)abl (H1 ∧ ∀xH2)

,(X ∪AX)abl ∃x (H1 ∧H2(x))

(X ∪AX)ablH1 ∧ ∃xH2

(X ∪AX)abl ∀x (H1 ∨H2(x))(X ∪AX)abl (H1 ∨ ∀xH2)

,(X ∪AX)abl ∃x (H1 ∨H2(x))

(X ∪AX)ablH1 ∨ ∃xH2

(X ∪AX)abl ∀x¬H(X ∪AX)abl ¬∃xH ,

(X ∪AX)abl ∃x¬H(X ∪AX)abl ¬∀xH

4.7 Widerlegen

Da es kein Entscheidungsverfahren fur die Menge ag gibt, ag kann nur axiomatisiertwerden als

ag = ab(AX),

konnen wir auch nicht durch ein algorithmisches Verfahren garantieren, daß eine Wi-derlegung fur einen Ausdruck H gefunden wird, wenn er nicht allgemeingultig ist.

4.7. WIDERLEGEN 147

Wir gehen hier auf das Widerlegen ein, weil es eine große Rolle in der Wissensverar-beitung (in der kunstlichen Intelligenz) spielt.

Im folgenden sei X ⊆ AUSD eine Menge von Aussagen ohne Identitat, d. h. in denendas Gleichheitszeichen nicht vorkommt. Die Menge X moge das Wissen uber einTeilgebiet darstellen, also eine Art von Axiomensystem. Eine Vermutung sei durcheine Aussage H ohne Identitat gegeben.

Die AussageH folgt ausX (H ∈ fl(X)), wenn jedes Modell vonX H erfullt, bzw. wennX ∪ ¬H kein Modell hat. (Dabei spielen die Belegungen der Individuenvariablenkeine Rolle, weil wir nur Aussagen betrachten.)

Zum Widerlegen brauchen wir einen syntaktischen Ableitungsbegriff, notiert durch`, mit

X ` ⊥ gdw. X kein Modell hat.

4.7.1 Klauselbildung

Wir gehen vor wie im Aussagenkalkul und definieren

Literal und Klausel

• Ausdrucke der Form [¬]AijT1 · · ·Ti (wobei Aij ein i-stelliges Attributensymbolist und T1, . . . , Ti Terme sind) werden Literal genannt.

• Als Klausel wird ein Literal oder eine Alternative von Literalen, bei der alleIndividuenvariablen durch ∀ gebunden (generalisiert) sind, bezeichnet.

Die allgemeine Form einer Klausel ist also

∀x1 · · · ∀xk (¬L1 ∨ ¬L2 ∨ · · · ∨ ¬Ln ∨ L′1 ∨ · · · ∨ L′m)

wobei die Li, L′j Literale und x1, . . . , xk alle vorkommenden Individuenvariablen sind.Als logisch aquivalente Schreibweise notiert man die Klausel wie folgt

L1 ∧ L2 ∧ · · · ∧ Ln → L′1 ∨ · · · ∨ L′m

Es sei X eine Menge von Aussagen ohne Identitat. Nach dem Endlichkeitssatzfur Modelle hat X genau dann kein Modell, wenn eine endliche Teilmenge X? =H1, . . . , Hk ⊆ X existiert, die kein Modell hat, d. h. genau dann, wenn die Einer-menge H? mit

H? = H1 ∧ · · · ∧Hk

kein Modell hat.


Wir konstruieren zu H? eine Menge K von Klauseln mit

efH? gdw. K hat ein Modell.

Satz 4.7.1Zu jeder Aussage H ohne Identitat existiert eine Menge K von Klauseln mit

efH gdw. K hat ein Modell.

BeweisWir formen die Aussage H wie folgt semantisch aquivalent um:

Schritt 1: Die Zeichen →, ↔ eliminieren

H1 ↔ H2 ∼ (H1 → H2) ∧ (H2 → H1)H1 → H2 ∼ ¬H1 ∨H2

Betrachten wir als Beispiel

H ≡ ∀x∀y (∃z (Axz ∨Ayz)→ ∃z Bxyz);wir erhalten nach dem ersten Schritt

H ∼ ∀x∀y (¬∃z (Axz ∨Ayz) ∨ ∃z Bxyz)

Schritt 2: Das Zeichen ¬ wird vor die Attributenzeichen getrieben

¬(H1 ∨H2) ∼ ¬H1 ∧ ¬H2

¬(H1 ∧H2) ∼ ¬H1 ∨ ¬H2

¬¬H1 ∼ H1

¬∀xH1 ∼ ∃x¬H1

¬∃xH1 ∼ ∀x¬H1

Im Beispiel erhalten wir

H ∼ ∀x∀y (∀z (¬Axz ∧ ¬Ayz) ∨ ∃z Bxyz)

Schritt 3: Die Quantoren nach vorne ziehen

QxH1(x) ∧H2 ∼ Qx (H1(x) ∧H2)QxH1(x) ∨H2 ∼ Qx (H1(x) ∨H2)

wobei x nicht in H2 vorkommt

∀xH1(x) ∧ ∀xH2(x) ∼ ∀x (H1(x) ∧H2(x))∃xH1(x) ∨ ∃xH2(x) ∼ ∃x (H1(x) ∨H2(x))

Die Variable z komme weder in H1 noch in H2 vor

Q1xH1(x)∧∨Q2xH2(x) ∼ Q1xQ2z(H1(x)∧∨H2

(x/z

))Im Beispiel erhalten wir

H ∼ ∀x∀y (∀z (¬Axz ∧ ¬Ayz) ∨ ∃uBxyu)∼ ∀x∀y∀z∃u ((¬Axz ∧ ¬Ayz) ∨Bxyu)

Schritt 4: Den quantorenfreien Ausdruck in Form einer Konjunktion von Alter-nativen bringen

(H1 ∧H2) ∨H3 ∼ (H1 ∨H3) ∧ (H2 ∨H3)H1 ∨ (H2 ∧H3) ∼ (H1 ∨H2) ∧ (H1 ∨H3)

Im Beispiel:

H ∼ ∀x∀y∀z∃u ((¬Axz ∨Bxyu) ∧ (¬Ayz ∨Bxyu))

BemerkungDer jetzt erhaltene Ausdruck wird als pranexe Normalform (PNf(H)) be-zeichnet; bisher sind alle Umformungen semantisch aquivalent erfolgt, d. h.ag(H ↔ PNf(H)).

Schritt 5: Elimination der ∃-Quantoren (Skolemisierung)

4.7. WIDERLEGEN 149

Dieser Schritt fuhrt von H ′ = PNf(H) nicht zu einem semantisch aquivalentenAusdruck H ′′, sondern zu einem H ′′ mit

efH ′ gdw. efH ′′,

d. h. einem erfullbarkeitsaquivalenten Ausdruck, was fur unsere Zwecke aus-reicht.

Sei H = Q1x1 · · ·QnxnH0(x1, . . . , xn)︸︷︷︸quantorenfrei

, Qi sei das von links erste ∃

Fall 1: i = 1, H ≡ ∃x1 . . .

Wir nehmen eine (neue) Individuenkonstante aj (nullstelliges Funktions-zeichen) und setzen

H ′ ≡ Q2x2 · · ·QnxnH0

[x1/aj

]Offenbar gilt efH gdw. efH ′

Fall 2: i > 1, H ≡ ∀x1 · · · ∀xi−1∃xiQi+1xi+1 · · ·Wir nehmen ein (neues) (i − 1)-stelliges Funktionssymbol F i−1

j her undsetzen

H ′ ≡ ∀x1 · · · ∀xi−1Qi+1xi+1 · · ·QnxnH0

[xi/F i−1j

(x1,...,xi−1)

]Diese Operation wird wiederholt bis alle ∃ eliminiert sind

Im Beispiel erhalten wir

H ≈ ∀x∀y∀z ((¬Axz ∨BxyF (x, y, z)) ∧ (¬Ayz ∨BxyF (x, y, z)))

Schritt 6: Zerlegung in Klauseln

Es erfolgt eine Umbenennung der Variablen, so daß in jedem Konjunktionsgliedverschiedene Variable sind.

∀x (H1(x) ∧H2(x)) ∼ ∀xH1 ∧ ∀y H2

[x/y

]Im Beispiel:

H ≈ ∀x∀y∀z (¬Axz ∨BxyF (x, y, z)) ∧ ∀x′∀y′∀z′ (¬Ay′z′ ∨Bx′y′F (x′, y′, z′))

Die Konjunktionsglieder liefern jetzt die Klauseln; in unserem Beispiel erhalten wir

K = Axz → BxyF (x, y, z),Ay′z′ → Bx′y′F (x′, y′, z′)

Damit haben wir die Erfullbarkeitsaquivalenz gezeigt. 2

Die Klauseln in unserem Beispiel haben eine besondere Form:

Horn–KlauselnKlauseln, die nur ein Literal auf der rechten Seite haben, heißen Horn–Klauseln.

Horn–Klauseln spielen (wie wir spater sehen werden) eine wichtige Rolle in der logi-schen Programmierung (PROLOG).

4.7.2 Herbrand–Modell

Wir betrachten nun spezielle (syntaktische) Modelle und zeigen, daß diese zum Nach-weis, daß eine Klauselmenge kein Modell hat, ausreichen.


Herbrand–ModellH sei eine Konjunktion von Klauseln.Wir setzen

I0 = a0 ∪ Menge aller Konstantenzeichen, die in H vorkommenIj+1 = Ij ∪ Fnk (t1, . . . , tn)|Fnk ist ein in H vorkommendes Funkti-

onszeichen, t1, . . . , tn ∈ Ij

IH =⋃j≥0 Ij ist eine Menge von Wortern (Grundtermen), die wir als Individuen-

bereich verwenden.Das Tripel [IH , gH , fH ] heißt Herbrand–Modell, wenn

1. gH(ai) = ai fur alle ai, die in H vorkommen)

2. gH(Fnk )(t1, . . . , tn) = Fnk (t1, . . . , tn) (fur alle Fnk , die in H vorkommen)

3. [gH , fH ] ist Modell in IH , d. h. wertIH ,gH (H, fH) = W

In unserem Beispiel ist

I0 = a0 (in K kommen keine Konstanten vor)I1 = a0, F (a0, a0, a0)I2 = a0, F (a0, a0, a0), F (F (a0, a0, a0), a0, a0), . . .

Satz 4.7.2H sei eine Konjunktion von Klauseln. Dann gilt

efH gdw. H ein Herbrand–Modell hat.

BeweisEs genugt zu zeigen, daß jede erfullbare Konjunktion von Klauseln ein Herbrand–Modell hat.

Es sei [I, g, f ] gegeben mit wertI,g(H, f) = W, d. h. fur jede Klausel

∀x1 · · · ∀xnH0(x1, . . . , xn)

gilt bei beliebiger Belegung f ′ : x1, . . . , xn → I

wertI,g(H0, f′) = W.

Entsprechend der Definition bestimmen wir IH und gH und vervollstandigen gH furAttributenzeichen wie folgt:

gH(Aij)(t1, . . . , ti) := wertI,g(Aijt1 · · · ti, f)

Dabei hangt die rechte Seite (der zugeordnete Wahrheitswert) nicht von f ab, weilAijt1 · · · ti keine Individuenvariablen enthalt.

Es sei nun fH : X → IH eine Belegung und AijT1 · · ·Ti ein Literal aus H0. Dann gilt

wertIH ,gH (AijT1 · · ·Ti, fH) =

= gH(Aij) (elementIH ,gH (T1, fH), . . . , elementIH ,gH (T1, fH))

= wertIH ,gH

(AijT1

[xγ/fH(xγ)

]· · ·Ti

[xγ/fH(xγ)

], f

)wobei f eine beliebige I-Belegung ist.

4.8. UNIFIKATION UND RESOLUTION 151

Wir betrachten zu fH die I-Belegung f? mit

f?(xγ) := elementI,g (fH(xγ), f)

Die rechte Seite hangt von f nicht ab, weil fH(xγ) ein Term ohne Individuenvariableist. Ist z. B. fH(xγ) = a0, so ist elementI,g (fH(xγ), f) = g(a0). Nun ist

wertI,g(AijT1 · · ·Ti, f?) = wertI,g

(AijT1

[xγ/fH(xγ)

]· · ·Ti

[xγ/fH(xγ)

], f

)= wertIH ,gH (AijT1 · · ·Ti, fH)

folglich gilt fur alle IH -Belegungen fH

wertIH ,gH (H0, fH) = wertI,g(H0, f?) = W,

denn alle Literale in H0 haben bei [IH , gH , fH ] denselben Wert wie bei [I, g, f?]; d. h.

wertIH ,gH (∀x1 · · · ∀xnH0, fH) = W

also hat H das Herbrand–Modell [IH , gH , fH ]. 2

Der Test, ob eine Konjunktion von Klauseln ein Herbrand–Modell besitzt, ist i. a.sehr aufwendig. Es gibt aber Falle, wo man sofort sieht, daß kein Modell existiert:

Beispiel

H ≡ Aa0 ∧ ¬Aa0

d. h. als Klauselmenge geschrieben

Aa0

Aa0 → ⊥

Die Schnittregel liefert hier sofort ⊥.

Im Beispiel

H ≡ ∀y Aaf(y) ∧ ∀x¬Axf(b)

bzw. als KlauselmengeAaf(y)

Axf(b) → ⊥

ist die Schnittregel nicht unmittelbar anwendbar, erst wenn man die Substitution x/a ,

y/b ausgefuhrt hat, kommt man mit der Schnittregel zum Widerspruch ⊥.

4.8 Unifikation und Resolution

Im vorhergehenden Beispiel haben wir gesehen, daß die Schnittregel nicht immer un-mittelbar anwendbar ist. Wir definieren deshalb den Begriff der Substitution und derUnifikation und bilden mittels der Resolution davon ausgehend einen syntaktischenAbleitungsoperator.


4.8.1 Substitution und Unifikation

SubstitutionEine Substitution σ ist eine Abbildung, die jeder Individuenvariablen einen Termzuordnet. Ist T ein Term, so bezeichne T [σ] den Term, der entsteht, wenn simul-tan fur jede Variable xi der Term σ(xi) eingesetzt wird und H[σ] bezeichnet denAusdruck, der aus H in diesem Fall entsteht.

UnifikatorEine Substitution σ heißt Unifikator fur Ausdrucke H1,H2, wenn H1[σ] ≡ H2[σ]ist.

BeispielWir betrachten die Ausdrucke H1 ≡ Aaxf(g(y)) und H2 ≡ Azf(z)f(v) und wollenbeide unifizieren.

x y z v

σ1 f(a) a a g(a)

H1[σ1] ≡ Aaf(a)f(g(a)) ≡ H2[σ1]

also σ1 ist ein Unifikator fur H1,H2.

x y z v

σ2 f(a) y a g(y)

H1[σ2] ≡ Aaf(a)f(g(y)) ≡ H2[σ2]

Auch σ2 ist ein Unifikator fur H1, H2, aber σ2 ist allgemeiner als σ1, weil eine Sub-stitution σ3 so existiert, daß

σ3(σ2(.)) = σ1(.)

ist.

allgemeinster Unifikatorσ heißt allgemeinster Unifikator fur H1, H2, wenn

1. σ ein Unifikator fur H1,H2 ist

2. Zu jedem Unifikator σ′ fur H1, H2 eine Substitution σ? mit

σ′(.) = σ?(σ(.))

existiert.

4.8.2 Berechnung eines allgemeinsten Unifikators

Wir formulieren einen Algorithmus, der folgendes leistet:

Eingabe: H1 = AijT1 · · ·Ti, H2 = AijT′1 · · ·T ′i

zwei pradikative Ausdrucke mit dem gleichen Attributensymbol und disjunktenVariablenmengen

Ausgabe: allgemeinster Unifikator falls existent, ”¬©“ sonst.


PROCEDURE Unify (H1,H2: Literal): Substitution;k := 0; M0 := H1, H2; σ0 = idLOOP

IF card(Mk) = 1 THEN RETURN σk END;Tk := t1, t2|t1, t2 bestimmen den von links ersten Unterschied in

Ausdrucken von Mk;IF Es gibt eine Variable y in Tk und einen Term t in Tk, in

dem diese Variable nicht vorkommtTHEN

σk+1(x) =t, falls x = yσk(x), sonst

Mk+1 := σk+1(Mk);INC(k);

ELSE RETURN ”¬©“END

END;

BeispielWir betrachten

k = 0, M0 = Aaxf(g(y)), Azf(z)f(v); σ0 =

v → vx→ xy → yz → z

und zeigen, wie die Prozedur Unify den allgemeinsten Unifikator bestimmt:

T0 = a, zwσ1 =

v → vx→ xy → yz → a

M1 = Aaxf(g(y)), Aaf(a)f(v)

wT1 = x, f(a)

σ2 =

v → vx→ f(a)y → yz → a

M2 = Aaf(a)f(g(y)), Aaf(a)f(v)

wT2 = g(y), v

σ3 =

v → g(y)x→ f(a)y → yz → a

M3 = Aaf(a)f(g(y))

wStop


Ein Beispiel fur das Scheitern der Unifikation zeigen wir mit

k = 0, M0 = Af(a)g(x), Ayy

Die Prozedur Unify fuhrt folgende Berechnung aus:

T0 = f(a), ywσ1 =

x→ xy → f(a) M1 = Af(a)g(x), Af(a)f(a)

wT1 = g(x), f(a) =⇒ enthalt keine Variable

=⇒ ¬©

4.8.3 Resolution

Die soeben definierte Unifikation ermoglicht die Anwendung der Schnittregel, aberauch die Vereinfachung von Klauseln.

Beispiel

Ax ∧Af(y) → ⊥Af(g(a))

Unifizieren Ax Af(y) durch σ : x→ f(y) und erhalten

Af(y) → ⊥Af(g(a))

Unifizieren durch σ : y → g(a)

Af(g(a)) → ⊥Af(g(a))

und Cut liefert ⊥, also ist die ursprungliche Klauselmenge nicht erfullbar und hatkein Modell.

Resolutionsregel

Seien K1 : L1 ∧ · · · ∧ Ln → L′1 ∨ · · · ∨ L′m und K2 : L?1 ∧ · · · ∧ L?n? → L′′1 ∨ · · · ∨ L′′m′Klauseln mit disjunkten Variablenmengen.

Wir fuhren folgende Begriffe ein:

Resolventeσ sei allgemeinster Unifikator von L′µ und L?γ . Die Klausel

σ(L1 ∧ · · · ∧ Ln ∧ L?1 ∧ · · · ∧ L?γ−1 ∧ L?γ+1 ∧ · · · ∧ L?n? →L′1 ∨ · · · ∨ L′µ−1 ∨ L′µ+1 ∨ · · · ∨ L′m ∨ L′′1 ∨ · · · ∨ L′′m′)

heißt Resolvente von K1, K2 bzgl. µ, γ und σ.


rechter FaktorIst σ ein allgemeinster Unifikator von L′i, L

′j (1 ≤ i < j ≤ m), so heißt

σ(L1 ∧ · · · ∧ Ln → L′1 ∨ · · · ∨ L′i−1 ∨ L′i+1 ∨ · · · ∨ L′m)

ein rechter Faktor von K1.linker FaktorIst σ ein allgemeinster Unifikator von Li, Lj (1 ≤ i < j ≤ n), so ist

σ(L1 ∧ · · · ∧ Li−1 ∧ Li+1 ∧ · · · ∧ Ln → L′1 ∨ · · · ∨ L′m)

ein linker Faktor von K1.

Ableiten mit der Resolutionsregel

Mit der Resolution definieren wir jetzt wieder induktiv einen syntaktischen Ableit-barkeitsbegriff (wie die Cut–Ableitbarkeit im Aussagenkalkul):

Ableiten mit der Resolutionsregel Y ` HEs sei Y eine Menge von Klauseln, H eine Klausel.

A) Wenn H ∈ Y , so Y ` H

I) 1. Wenn Y ` K1 und Y ` K2 und H ist Resolvente von K1,K2, so Y ` H.

2. Wenn Y ` K und H ist rechter oder linker Faktor von K, so Y ` H.

Es gilt der

Satz 4.8.1Es sei Y eine Menge von Klauseln, die kein Modell hat. Dann ist Y ` ⊥.

Beweis (Idee)Wenn Y kein Modell hat, so besitzt Y kein Herbrand–Modell. Also gibt es Klau-seln K1, . . . ,Kn ∈ Y und Substitutionen σ1, . . . , σn derart, daß aus K1[σ1], . . . ,Kn[σn] aussagenlogisch (mit der Schnittregel) der Widerspruch ⊥ abgeleitet wer-den kann. Aus einer solchen Ableitung konstruiert man eine Ableitung gemaß `. 2

Das Ableiten mit der Resolutionsregel veranschaulichen wir uns an folgendem

Beispiel

K1 : Ax ∧Ab → ⊥K2 : Aa → AbK3 : Ab → AaK4 : Aa ∨Ay

Resolution K1,K2, x→ aAa ∧Ab → ⊥

Aa → AbK5 : Aa → ⊥

Cut(K5,K3) : Ab → AaK6 : Ab → ⊥

Resolution K4,K6, y → bAa ∨Ab

K7 : AaCut(K7,K5) : Aa → ⊥

⊥


4.9 Logische Programmierung

Jeder Programmierer einer Programmiersprache, wie z. B. MODULA, muß, nachdemer sich die Frage gestellt hat: ”Was ist das Problem?“, uberlegen: ”Wie ist dasProblem zu losen?“. Algorithmen werden erstellt, indem eine Abfolge von Befehlenentwickelt wird.

Grundgedanke des logischen Programmierens ist, daß die Ausfuhrung eines Pro-gramms auch als das automatische Herleiten eines Widerspruchs aus einer gegebenenKlauselmenge aufgefaßt werden kann. Dabei wird das schon skizzierte Widerlegenmittels Resolution unter Anwendung der Unifikation benutzt. Eine aus dem Resolu-tionsbeweis extrahierte Antwort wird als das Rechenergebnis des Logik–Programmsaufgefaßt.

Oft findet man folgende schematische Darstellung des Grundgedankens der logischenProgrammierung:

algorithm = logic + control

wobei logic dem rein logischen Aspekt, also dem Wissen uber die Zielsetzung desAlgorithmus (auch Spezifikation genannt) und control dem prozeduralen Aspekt, alsoder Strategie der Anwendung von Ableitungsregeln, entspricht.

4.9.1 Prolog

Die logik–orientierte Sprache PROLOG (PROgramming in LOGic) wurde in den70er Jahren an verschiedenen Universitaten entwickelt und erfreut sich großer Be-liebtheit im Bereich der Kunstlichen Intelligenz (z. B. zur Entwicklung von Experten-systemen).

PROLOG basiert auf dem Pradikatenkalkul der ersten Stufe und arbeitet nur mitHorn–Klauseln (zur Erinnerung: Horn–Klauseln haben hochstens ein positives Li-teral; alle Variablen sind gebunden).

Die Beschrankung auf Horn–Klauseln bedeutet nur eine geringe Einschrankung derAusdrucksfahigkeit, da die meisten mathematischen Theorien (wenn uberhaupt) mitHorn–Klauseln axiomatisierbar sind. Außerdem wurden sich sonst große Effizienz-probleme bei der Auswertung ergeben.

Ein PROLOG–System besteht aus einer Wissensbasis, d. h. einer Menge von Horn–Klauseln (sogenannte Regeln und Fakten) und einem Interpreter, der problemun-abhangig Abfragen der Wissensbasis auswerten und so Schlußfolgerungen ziehen kann.Der Interpreter ist ein (auf Resolution beruhendes) Beweisprogramm, das die Unerfull-barkeit einer Klauselmenge nachweist.

Wie werden nun Horn–Klauseln in PROLOG notiert?

Variablen werden mit einem Großbuchstaben am Bezeichneranfang gekennzeichnet.Ihr Gultigkeitsbereich bezieht sich nur auf eine Klausel. Mit Kleinbuchstaben wer-den dagegen Pradikate, Funktionssymbole und Konstanten benannt. Wie mansieht, wird die semantische Unterscheidung zwischen Funktionen und Pradikaten (imGegensatz zum Pradikatenkalkul) syntaktisch nicht unterstutzt. Das ist Aufgabe desProgrammierers. Klauseln werden mit einem Punkt am Ende versehen und in Faktenund Regeln unterteilt. Objekte, uber die wir Aussagen machen, werden als Atomebezeichnet.

4.9. LOGISCHE PROGRAMMIERUNG 157

Fakten sind Aussagen uber Objekte der Form

funktor (objekt).

und entsprechen allgemeinen Tatsachen, d. h. Horn–Klauseln, die nur aus einempositiven Literal bestehen, die Vorbedingung ist also leer.

BeispielEinfache Aussage (als Fakten) in unserer Wissensbasis sind:

vater(peter,harald).mutter(anna,harald).eltern(adam,eva,kain).

Ebenso konnen wir Allaussagen wie mag(X,blumen). machen (eine mogliche Inter-pretation dieser Allaussage ist ”Jeder mag Blumen“).

Regeln sind logische Ausdrucke, mit denen aus bekannten Fakten neue Fakten gefol-gert werden konnen. Die Schreibweise lautet

kopf:-rumpf.

wobei der Rumpf–Teil der Regel eine Konjunktion (mit Komma unterteilt) von Vor-bedingungen ist, die erfullt sein mussen, bevor der Kopf–Teil erfullt ist.

BeispielWir geben in unsere Wissensbasis folgende Regeln ein:

kind(K,V):-vater(V,K).kind(K,M):-mutter(M,K).eltern(V,M,K):-vater(V,K),mutter(M,K).

Das Zeichen :- hat den Charakter einer Implikation (es soll ein symbolisierter Pfeilnach links sein), denn eine Horn–Klausel

R1 ∧ · · · ∧Rn → K

wird in PROLOG als

K : −R1, . . . , Rn

notiert.

Als PROLOG–Pradikat wird eine Menge von Klauseln (also eine Menge von Faktenund Regeln) mit demselben Funktor und der gleichen Stelligkeit bezeichnet.

BeispielWir haben den Fakt

eltern(adam,eva,kain).

und die Regel

eltern(V,M,K):-vater(V,K),mutter(M,K)..

Beide zusammen bilden das PROLOG–Pradikat eltern\3.


Induktiv definieren wir nun den Term–Begriff (nicht zu verwechseln mit der Term–Definition im Pradikatenkalkul):

A) Alle Atome und Variablen sind Terme.

I) Ist α ein n-stelliges Pradikat und t1, . . . , tn sind Terme, so ist auch α(t1, . . . , tn)ein Term.

Mit Pradikaten beschreiben wir einen Sachverhalt, ein Problem. Wichtig dabei ist,daß PROLOG die Bedeutung der Klauseln nicht versteht.

BeispielDie Klausel eltern(adam,eva,kain). wird von uns als ”Adam und Eva sind dieEltern von Kain“ interpretiert. Wir mussen also sehr genau die Reihenfolge der Ar-gumente beachten.

Ausgehend von der geschaffenen Wissensbasis konnen wir nun Anfragen an dasPROLOG–System stellen. Dabei wird die Gultigkeit von Ausdrucken anhand dervorher im Einfugemodus eingegebenen Klauseln gepruft.

Diese Prinzip wird als ”closed world assumption“ bezeichnet, d. h. selbst wenn wirwissen, daß ein bestimmter Sachverhalt in der wirklichen Welt vorliegt, muß nochnicht garantiert sein, daß er aus unseren Klauseln auch abgeleitet werden kann.

Abfragen werden wie folgt eingegeben:

?-ziel.

Das zu beweisende Ziel wird als ”goal“ bezeichnet.

BeispielEine einfache Frage ist z. B.

?-vater(peter,harald).

PROLOG antwortet erwartungsgemaß mit YES. Die Abfrage

?-vater(peter,paul).

dagegen erzeugt NO.

Fragen, die eine oder mehrere Variablen enthalten, entsprechen Existenzfragen:

?-vater(X,harald).

wird beantwortet, indem die Bindung der Variable X ausgegeben wird, die zum Erfolggefuhrt hat: X= peter. Konjunktiv verknupfte Fragen werden mit einem Kommaunterteilt:

?-vater(X,harald),mag(X,blumen).

Die Antwort ist X= peter.

4.9. LOGISCHE PROGRAMMIERUNG 159

Bei der Abarbeitung einer Frage, die eine Variable enthalt, uberpruft PROLOG, obdie Variable geeignet mit einem Wert instantiiert werden kann. Dies wird uber diebereits oben erwahnte Unifikation gelost, die hier auf Termen arbeitet.

4.9.2 Ein abstrakter Interpreter

Ein abstrakter Interpreter fur Logik–Programme sieht wie folgt aus:

Eingabe: P Menge von Klauseln, Z Ziel

Ausgabe: eine Instanz von Z, die aus P abgeleitet wurde, falls diese existiert, ”¬©“sonst.

PROCEDURE Logische Berechnung (P : Programm, Z: Ziel): Antwort;k := 0; RS0 := Z; Z0 = ZLOOP

IF card(RSk) = 0 THEN RETURN Zk END;A := Ziel in RSk;A′ := Klausel in P , die mit A unifizierbar ist; die

Klausel hat die Form A : −B1, . . . , Bn;σk+1 := Unify(A,A′);IF σk+1 = ¬©THEN RETURN¬©ELSERSk+1 := σk+1 (B1, . . . , Bn ∪RSk \ A);Zk+1 := σk+1(Zk);INC(k);

ENDEND;

Die Berechnung beginnt mit der Anfrage Z; falls das Programm terminiert, wirdentweder die bewiesene Instanz von Z oder das Scheitern ausgegeben. Die Berechnungschreitet mittels Ziel–Reduktion fort. In jedem Schritt gibt es eine Resolvente, diebewiesen werden soll. Wird mit einer Regel resolviert, so wird der Kopf der Regel nachder Unifikation durch den Rumpf ersetzt. Die Berechnung endet, wenn die Resolventeleer ist.

Variablen mussen bei der Berechnung vorsichtig behandelt werden, um Namenskon-flikte zu vermeiden. Da Variablen nur lokal in Klauseln gelten, sind gleichnamigeVariablen in verschiedenen Klauseln voneinander verschieden. Eine Losung ist, beijeder Reduktion die Variablen einer Klausel in noch nicht verwendete Variablen um-zubenennen.

Unser Interpreter ist nicht–deterministisch, d. h. nach jedem Ableitungsschritt gibtes eventuell mehr als eine Moglichkeit, die Berechnung fortzufahren. Unbestimmt ist:

• die Wahl des zu reduzierenden Ziels aus RSK

• die Wahl der Klausel in P , mit der reduziert wird

Durch alternative Auswahlen wird implizit ein Suchbaum definiert. Da Computernur deterministisch vorgehen, mussen die Auswahlmoglichkeiten gezielt eingeschranktwerden.


Eine Losung ist, den Suchbaum erst in der Breite zu durchsuchen (breadth–first), dasheißt, alle endlichen erfolgreichen Pfade im Suchbaum (mogliche Beweise des Ziels)werden auch gefunden. Die Breitensuche ist vollstandig, aber ineffizient (exponentiel-ler Aufwand).

Eine andere Moglichkeit ist, den Suchbaum zuerst in der Tiefe zu durchsuchen (depth–first), wobei fruher durchgefuhrte Beweisschritte eventuell zuruckgenommen werdenmussen (Backtracking). Im Gegensatz zur Breitensuche garantiert die Tiefensuchenicht, daß ein eventuell vorhandener Beweis auch gefunden wird, da der Suchbaumunendliche Pfade enthalten kann, die unendlichen Berechnungen der Prozedur ent-sprechen.

Die Tiefensuche kann auf einen unendlichen Pfad geraten, bevor ein endlicher Pfadgefunden wurde, selbst wenn er existiert.

4.9.3 Die Auswertungsstrategie von Prolog

Prolog realisiert die Tiefensuche, indem der Nichtdeterminismus (Freiheit in derWahl der Berechnungsschritte) wie folgt aufgelost wird:

• RSk wird als Stack verwaltet, d. h. es wird immer das oberste Ziel zur Reduktionentfernt und die abgeleiteten Ziele werden wieder oben auf den Stack abgelegt.

• Die Klauseln in P sind linear sortiert, d. h. sie werden von oben nach untendurchsucht.

Durch diese Einschrankung werden Klauseln nicht als Mengen, sondern als Folgenaufgefaßt, da die Resolution von Literalen in der Zielklausel von links nach rechtsfortschreitet.

Die Auswertungsstrategie von Prolog lauft der Idealvorstellung der logischen Pro-grammierung entgegen, denn wir mussen uns bei der Programmformulierung Gedan-ken machen, wie wir unsere Klauseln im Programm und die Teilziele der Regelnanordnen. Trotz logischer Aquivalenz ergeben sich verschiedene Suchbaume; eventu-ell kann durch Umstellung von Klauseln und Umformulierung von Regeln ein vorhergefundener Beweis nicht mehr gefunden werden, da die Berechnung in einen unendli-chen Pfad des Suchbaumes geraten ist. Naturlich kann eine geschickte Formulierungunseres Logikprogramms auch das Umgekehrte erreichen (dies ist unsere Absicht);dazu mussen wir die Auswertungsstrategie von Prolog genau kennen und dement-sprechend umsichtig bei der Aufstellung unseres Programms sein.

Literaturverzeichnis

[1] Asser, G.: Einfuhrung in die Mathematische Logik (Teil 1: Aussagenkalkul; Teil2: Pradikatenkalkul 1.Stufe); B. G. Teubner, Leipzig, 1972 und 1982.Grundlage der Kapitel ”Aussagenlogik“ und ”Pradikatenlogik“

[2] Bachmann, P.: Mathematische Grundlagen der Informatik; Akademie–Verlag,Berlin, 1992.allgemeine Einfuhrung (mit einer Darstellung des Klassenkalkuls)

[3] Cordes/Kruse/Langendorfer/Rust: Prolog; Vieweg Verlag, Braunschweig,1992.Erganzung des Abschnittes ”Logische Programmierung“

[4] Hermes, H.: Aufzahlbarkeit, Entscheidbarkeit, Berechenbarkeit; Teubner Ver-lag, Stuttgart, 1976.Erganzung des Kapitels ”Berechnungstheorie“

[5] Klaua D.: Einfuhrung in die allgemeine Mengenlehre (Band 1: Elementare Axio-me der Mengenlehre; Band 2: Grundbegriffe der axiomatischen Mengenlehre);Akademie–Verlag, Berlin, 1971 und 1972.Grundlage des Kapitels ”Mengenlehre“ (mit Stufenkalkul, Mengenalgebra etc.)

[6] Peter, R.: Rekursive Funktionen; Budapest, 1951.Grundlage des Kapitels ”Berechnungstheorie“ (mit Beweis der Existenz einerMajorante fur primitiv–rekursive Funktionen)

[7] Rusza J.: Die Begriffswelt der Mathematik; Volk und Wissen Verlag, Berlin,1975.

[8] Schoning, U.: Logik fur Informatiker; Theoretische Informatik kurz gefaßt; BIWissenschaft, Mannheim, beide 1992.Aussagenlogik, Pradikatenlogik, Logische Programmierung bzw. Berechnungstheo-rie

[9] Siefkes, D.: Formalisieren und Beweisen; Vieweg Verlag, Braunschweig, 1992.weniger formalistischer Zugang zur Logik mit vielen Beispielen

[10] Tuschik/Wolter: Mathematische Logik — kurzgefaßt: Grundlagen, Modell-theorie, Entscheidbarkeit , Mengenlehre; BI Wissenschaft, Mannheim, 1994.allgemeine Einfuhrung

[11] Sterling/Shapiro: Prolog — Fortgeschrittenen Programmiertechniken;Addison–Wesley Verlag, Bonn, 1988.Erganzung des Abschnittes ”Logische Programmierung“

Symbolverzeichnis

Die folgende Tabelle verzeichnet das griechische Alphabet, dabei ist der erste Eintragin der Tabelle immer der Kleinbuchstabe, eventuell gefolgt von einer alternativenSchreibweise. Der letzte Eintrag fur einen Buchstaben zeigt die Großschreibweise,falls ein besonderes Symbol dafur existiert.

α Alpha ι Jota ρ Rhoβ Beta κ Kappa σ, ς,Σ Sigmaγ,Γ Gamma λ,Λ Lambda τ Tauδ,∆ Delta µ My υ,Υ Ypsilonε Epsilon ν Ny ϕ, φ,Φ Phiζ Zeta ξ,Ξ Xi χ Chiη Eta o Omikron ψ,Ψ Psiϑ,Θ Theta π,Π Pi ω,Ω Omega

Die folgende Liste zeigt die Großbuchstaben der Frakturschrift:

A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, W, X, Y, Z

Die meisten anderen Symbole werden an der Stelle ihrer Definition bzw. bei der er-sten Verwendung erklart und eingefuhrt. ℵ ist der erste Buchstabe des hebraischenAlphabets und wird als Aleph bezeichnet.

Documents

Logische Grundlagen der Informatik · Logische Grundlagen der Informatik Skript zur Vorlesung Theoretische Informatik I c Prof. Peter H. Starke Lehrstuhl fur Automaten- und Systemtheorie¨