52
Welträtsel aus Sicht der modernen Wissenschaften Anhang: Mathematische Begriffe Hermann Helbig Springer Spektrum, Heidelberg 2018, 2020 Print: ISBN 978-3-662-60761-9 eBook: ISBN 978-3-662-60762-6

Welträtsel aus Sicht der modernen Wissenschaften

  • Upload
    others

  • View
    7

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Welträtsel aus Sicht der modernen Wissenschaften

Welträtsel aus Sicht der modernen

Wissenschaften

Anhang: Mathematische Begriffe

Hermann Helbig

Springer Spektrum, Heidelberg 2018, 2020

Print: ISBN 978-3-662-60761-9eBook: ISBN 978-3-662-60762-6

Page 2: Welträtsel aus Sicht der modernen Wissenschaften
Page 3: Welträtsel aus Sicht der modernen Wissenschaften

Anhang A

Exkurs in die Welt dermathematischen Begriffe

Vorbemerkung Die Schaffung bzw. Entdeckung der Mathematik1 durch denMenschen ist selbst ein Wunder und nur als immense kollektive Leistungzu verstehen. Das moderne Gedankengebäude der Mathematik hat sich sehrweit von der unmittelbaren Anschauung entfernt. Trotzdem liegt sein eigent-licher Ausgangspunkt in der Erfahrung, genauer im Zählvorgang und damitbei den natürlichen Zahlen, was in dem im Buch bereits erwähnten Zitat vonKronecker zum Ausdruck kommt, wonach „Die ganzen Zahlen Gott gemacht[habe], alles andere ist Menschenwerk“. Durch immer weiter fortschreitendeVerallgemeinerung ist es dann ausgehend von den natürlichen bzw. ganzenZahlen zu Begriffsbildungen wie rationale Zahlen, reelle Zahlen, komplexeZahlen, Vektoren, Matrizen, Tensoren gekommen2. Auch im Bereich der ma-thematischen Strukturen haben sich Raumbegriffe (wie Funktionenräume) undabstrakte algebraische Strukturen (wie Symmetriegruppen in komplexen Räu-men) herausgebildet, die jenseits unseres alltäglichen Vorstellungsvermögensliegen.Im Folgenden sollen die im Buchtext verwendeten und mit einem besonde-ren FONT gekennzeichneten mathematischen Begriffe in ganz knapper Formerläutert werden. Dabei lässt sich nicht die mathematische Strenge oder All-gemeinheit der Definitionen eines Lehrbuches erreichen. So ist, um nur zweiBeispiele zu nennen, bei der Darstellung von Ortskomponenten, Geschwindig-keiten oder Kräften dort, wo das nicht unbedingt erforderlich ist, auf die vek-torielle Schreibweise verzichtet und der mathematische Ausdruck nur auf eineDimension beschränkt worden. Bei den Logiksystemen wurden nur die Axio-me und Regeln angeführt, die für das Verständnis des Buches wichtig sind,ohne dabei Vollständigkeit anzustreben usw. Für ein vertieftes Verständnis ist

1 Wozu wir auch die Logik und die Theorie der formalen Systeme überhaupt zählen.2 Eventuell sollte man hier noch Quaternionen und Oktonionen aufzählen, wobei erstere als

Paare von komplexen Zahlen und letztere als Paare von Quaternionen mit bestimmten Re-chenregeln aufgefasst werden können. Es wäre durchaus möglich, dass die Quaternionen –obwohl bisher kaum genutzt – noch einmal im Rahmen der Stringtheorie in der Physik eineRolle spielen werden.

Page 4: Welträtsel aus Sicht der modernen Wissenschaften

4 A. Exkurs in die Welt der mathematischen Begriffe

also auf jeden Fall die Hinzuziehung eines entsprechenden Fachbuches, wiez.B. [2], oder eines Nachschlagewerkes (u.U. auch der Wikipedia) zu empfeh-len. – Sehr hilfreich dürfte es sein, sich vor der Lektüre der Einzelartikel die-ses Anhangs die Symbolik der Mengen-Relationen bzw. -Funktionen in Anh.A.32 einzuprägen. Selbst wenn Ihnen die Kurzdefinitionen zu knapp erschei-nen sollten, vermitteln sie doch einen Eindruck, mit welchen mathematischenObjekten man es zu tun hat, und wie die entsprechenden Begriffe untereinan-der zusammenhängen.

A.1 Abbildung (in der Mathematik)

Eine Abbildung A: M→W ist eine Vorschrift, die jedem Element einer MengeM genau ein Element einer zweiten Menge W zuordnet (s. hierzu auch Anh.A.12). Man spricht von einer Abbildung von M auf W, wenn jedes Elementaus W bei der Abbildung A aus einem Element von M hervorgeht, andernfallsspricht man von einer Abbildung von M in W. Die Abbildung ist eineindeutig(auch umkehrbar eindeutig oder bijektiv genannt), wenn sich durch die Abbil-dungsvorschrift A Paare (a, b) bilden lassen, so dass durch A jedem a ∈ Mgenau ein b ∈W zugeordnet ist und umgekehrt.Ein Homomorphismus ist eine strukturerhaltende Abbildung A von M in W,bei der sich die Relationen zwischen Elementen aus M (s. Anh. A.45) entspre-chenden Relationen zuordnen lassen, die zwischen den durch die Abbildung Azugeordneten Bildelementen in W bestehen.Wenn die Abbildung A bijektiv und ein Homomorphismus ist, dann sprichtman auch von einem Isomorphismus. Isomorphe Strukturen unterscheidensich nur hinsichtlich ihrer Darstellung, sind also im Wesentlichen äquivalent.

A.2 Algebra und Algebraische Strukturen

Eine algebraische Struktur (kurz: Algebra) ist gegeben durch eine Menge A(die sogenannte Trägermenge) und eine bestimmte Anzahl von Operationenoi, 1 ≤ i ≤ n (s. Anh. A.37), die über A definiert sind.Die Lehre von den algebraischen Strukturen als mathematische Disziplin nenntman ebenfalls Algebra.Ein Schwerpunkt der klassischen Algebra war die Untersuchung algebraischerGleichungen der Gestalt: a0 + a1x + a2x2 + . . . + anxn = 0 (n heißt ’Grad’ desPolynoms auf der linken Seite, s. Anh. A.39, und auch Grad der Gleichung; die

Page 5: Welträtsel aus Sicht der modernen Wissenschaften

A.3 Arithmetik 5

Koeffizienten ai sind beliebige, aber feste reelle oder komplexe Zahlen; x isteine Variable). Eine wichtige Erkenntnis bestand darin, dass jede algebraischeGleichung n-ten Grades im Bereich der komplexen Zahlen genau n Lösungenbesitzt (sogenannter Fundamentalsatz der Algebra).Grundlegend für die Computertechnik ist die sogenannte Boolesche Algebra,die durch eine Trägermenge A = {0, 1} mit nur zwei Elementen und die zwei-stelligen Operationen and und or sowie die einstellige Operation not charak-terisiert ist. Die beiden zweistelligen Operationen sind kommutativ, assozia-tiv und wechselseitig distributiv, s. Anh. A.37. Außerdem gilt not(0) = 1 undnot(1) = 0. Für die zweistelligen Operationen sind ebenfalls bestimmte Ver-knüpfungsregeln definiert: (0 and 1) = 0, (1 and 0) = 0, (0 and 0) = 0 und(1 and 1) = 1 sowie (0 or 1) = 1; (1 or 0) = 1, (0 or 0) = 0 und (1 or 1) = 1.3

Diese Definitionen gestatten es, eine klare Beziehung zur Aussagenlogik her-zustellen, wobei dort üblicherweise anstelle der Werte 0 und 1 die Wahrheits-werte F (false) bzw. T (true) verwendet werden, s. Anh. A.4.In der modernen Algebra werden beliebige algebraische Strukturen untersucht.Dabei sind in unserem Kontext vor allem die Gruppen, insbesondere die Sym-metriegruppen wichtig (s. Anh. A.19 und A.48), die in der Physik eine grund-legende Rolle spielen.

A.3 ArithmetikDie Arithmetik ist der Zweig der Mathematik, der sich mit den OperationenAddition, Subtraktion, Multiplikation und Division über Zahlen (und insbe-sondere über natürlichen Zahlen) befasst. Für die Addition (die Summe S) vonn Zahlen a1, a2, . . . an schreibt man auch: S =

∑ni=1 ai.

Für die Multiplikation (das Produkt P) von n Zahlen a1, a2, . . . an verwendetman die Symbolik: P =

∏ni=1 ai. – Ein besonderes Produkt und zugleich eine

wichtige Funktion f(n) einer natürlichen Zahl n ist die Fakultätsfunktion (kurz:n-Fakultät, Symbol n!). Sie ist definiert durch f(n) = n! = 1 · 2 · 3 . . . · n =∏ni=1 i (dabei wird zusätzlich festgelegt: 0! = 1). Ihre Werte wachsen mit grö-

ßer werdendem n extrem schnell an. n-Fakultät wird in dieser Hinsicht aller-dings noch von der Ackermannfunktion übertroffen, die auch moderne Rechnerschnell an die Grenzen der Berechenbarkeit führt.Als wichtige Vergleichsrelationen zwischen Zahlen, die auch im Buch immerwieder vorkommen, werden in der Arithmetik die Gleichheit (Symbol: n = m),

3 Man schreibt die zweistelligen Operatoren, ähnlich wie bei + und -, bevorzugt zwischenderen Argumente bzw. Operanden (sogenannte ‚Infixnotation‘).

Page 6: Welträtsel aus Sicht der modernen Wissenschaften

6 A. Exkurs in die Welt der mathematischen Begriffe

größer bzw. größer oder gleich (Symbol: n > m bzw. n ≥ m) und kleiner bzw.kleiner oder gleich (Symbol: n < m bzw. n ≤ m) verwendet.

A.4 Aussagenlogik

Die Aussagenlogik erlaubt es, die Verknüpfung von Aussagen bzw. von Wahr-heitswerten formal zu behandeln. Als Wahrheitswerte sind T (steht für ‚wahr‘)und F (steht für ‚falsch‘) zugelassen. Man unterscheidet dabei eine syntakti-sche oder formalsprachliche Seite, die durch den sogenannten Aussagenkalküldefiniert ist (zum Kalkül-Begriff s. Anh. A.10) und eine semantische Seite, diebestimmt, wie die formalsprachlichen Elemente zu interpretieren sind.Ein grundsätzliches Anliegen der Logik (einschließlich der Prädikatenlogik, s.Anh. A.30) ist es, den inhaltlichen (semantisch definierten) Folgerungsbegriff(Symbol:⇒) durch den syntaktisch definierten Ableitungsbegriff (Symbol: `)eines formalen Kalküls K = <V, F , Ax, R> zu modellieren.Zum Zeichenvorrat oder Alphabet V des Aussagenkalküls gehören die Aussa-genvariablen A, B, C, . . . Z, die für beliebige Aussagen (bzw. für Wahrheits-werte auf der semantischen Seite) stehen; die logischen Verknüpfungen ‚¬‘(wobei ¬A für Verneinung oder Negation von A steht, auch (NOT A) genannt);‚∨‘ (wobei A∨ B bedeutet, es gilt entweder A oder B oder beide; logischesODER bzw. Disjunktion) sowie die Klammersymbole ‚(‘ und ‚)‘.Die Menge F der wohlgeformten Formeln bzw. Ausdrücke besteht aus denAussagenvariablen A, B, C, ... , Z (elementare Ausdrücke); und mit den Aus-drücken G bzw. H aus F gehören auch ¬ G und (G ∨ H) zu F (komplexeAusdrücke). – Im folgenden stehen A und B für beliebige elementare oderkomplexe Ausdrücke. Als Abkürzungen führt man noch die folgenden ein:(A→ B) für (¬A ∨ B), d.h. A impliziert B oder „Wenn A dann B“;(A ∧ B) für ¬(¬A ∨ ¬B), als Ausdruck für das logische UND bzw. die Kon-junktion (es gelten sowohl A als auch B), und(A↔ B) für (A→ B) ∧ (B→ A), d.h. A und B sind äquivalent.Die beiden anderen Komponenten des Kalküls, die Menge Ax der Axiome unddie Ableitungsrelationen R, können wir hier nur exemplarisch behandeln.Typische Axiome des Aussagenkalküls sind: Der Satz von der doppelten Ne-gation (¬ ¬ A→ A) und der Satz vom ausgeschlossenen Dritten (A ∨ ¬A).Wichtige Ableitungsregeln sind der „Modus ponens“: Wenn A und A→ B ab-leitbar sind, dann ist auch B ableitbar (symbolisch: A, A→ B ` B) unddie „Ausdehnungsregel“: Wenn A ableitbar ist, dann auch A ∨ B (symbolisch:A ` A ∨ B). Wenn man die Ausdehnungsregel A ` (A ∨ B) in eine Implikati-on umwandelt (der Zusammenhang ist durch das Deduktionstheorem gegeben,

Page 7: Welträtsel aus Sicht der modernen Wissenschaften

A.5 Bayessche Theorie, Bayes-Theorem 7

s.u.) erhält man A→ (A ∨ B) als allgemeingültigen Ausdruck, und dieser lässtsich leicht umformen in (¬A ∧ A)→ B (also in eine wahre Implikation; dassogenannte „Ex falso quodlibet“). Damit kann man unter Verwendung des Mo-dus ponens – wenn man denn einen Widerspruch in der Ausdrucksmenge bzw.in einer Wissensbasis hat – jede beliebige Aussage B, auch eine solche, dieinhaltlich nichts mit A zu tun hat oder gar unsinnig ist, ableiten.Der Zusammenhang zwischen dem metasprachlichen Ableitungsbegriff undder logischen Implikation ist durch das Deduktionstheorem gegeben. Diesesbesagt etwas verkürzt ausgedrückt, dass A ` B genau dann gilt, wenn die Im-plikation A→ B allein aus den Axiomen ableitbar ist (symbolisch: ` A→ B).Dieses Theorem bildet die Grundlage des deduktiven Schließens.Wenn man den Aussagenvariablen Wahrheitswerte (T oder F bzw. 1 oder 0)zuordnet, und den logischen Verknüpfungen ¬, ∨, ∧ in dieser Reihenfolge dieBooleschen Funktionen not, or und and, dann erhält man eine Interpretationdes Aussagenkalküls als Boolesche Algebra, s. Anh. A.2. Unter dieser Inter-pretation geht z.B. das Axiom (A ∨ ¬A) in den Ausdruck (A or (not A)) über,der bei jeder Belegung von A mit einem Wahrheitswert 1 oder 0 den Wert 1(d.h. T = true) ergibt.

A.5 Bayessche Theorie, Bayes-Theorem

Man kann den Begriff der Wahrscheinlichkeit nicht nur frequentistisch fas-sen, s. Anh. A.53, sondern auch als Grad der Überzeugung P(A), dass einbestimmter Sachverhalt A zutrifft. Dieser Ansatz wurde von Bayes in seinerWahrscheinlichkeits-Theorie gewählt (kurz: Bayessche Theorie genannt). DasMaß P(A) nennt man auch die A pripori-Wahrscheinlichkeit von A, da es ohneweitere Voraussetzungen, also ‚a priori‘, angenommen wird. Um Widersprü-che zu vermeiden, muss es den Axiomen von Kolmogorow genügen, s. Anh.A.53. Als Pendant zu P(A) betrachtet man die bedingte WahrscheinlichkeitP(A|B), die angibt, wie wahrscheinlich A unter der Voraussetzung ist, dass Bbereits eingetreten ist. P(A|B) hängt mit der Wahrscheinlichkeit P(A, B), dasssowohl das Ereignis A als auch das Ereignis B eintreten, wie folgt zusammen:P(A, B) = P(A|B) · P(B) = P(B|A) · P(A), woraus sich leicht das Bayes-Theorem in der üblichen Form gewinnen lässt: P(A|B) = P(B|A) · P(A) / P(B).Die Ereignisse A, B sind unabhängig voneinander, wenn gilt: P(A|B) = P(A).Die Bayessche Theorie liefert auch einen geeigneten Formalismus zur mathe-matischen Behandlung des Abduktiven Schließens.

Page 8: Welträtsel aus Sicht der modernen Wissenschaften

8 A. Exkurs in die Welt der mathematischen Begriffe

A.6 Differentialrechnung und Differentialgleichungen

Die Differentialrechnung befasst sich mit der Bestimmung lokaler Eigenschaf-ten von Funktionen in einer oder mehreren Veränderlichen. Sie wird zusammenmit der Integralrechnung zur Infinitesimalrechnung (Rechnung mit ‚beliebigkleinen‘ Größen) zusammengefasst, s. Anh. A.23. Ein wichtiger Grundbegriffist die Ableitung einer Funktion, wobei wir zunächst erst einmal Funktionenf(x) in einer Variablen x (s. hierzu Anh. A.12) betrachten.

Eine solche Funktion heißt differenzierbar an der Stelle x, wenn der Grenz-wert des Differenzenquotienten limh→0

f(x+h)−f(x)h existiert. Dieser heißt dann

1. Ableitung f’(x) der Funktion f(x) an der Stelle x. Man verwendet dafürauch die symbolische Schreibweise f’(x) = df(x)

dx (auch Differentialquotient ge-nannt). Die 1. Ableitung f’(x) bestimmt den Tangentenanstieg im Punkt x derdurch y = f(x) in der x-y-Ebene gegebenen Kurve (dem Graphen der Funktionf(x), s. Anh. A.12).Die 2. Ableitung f”(x) = d2f(x)

dx2(das ist die 1. Ableitung der 1. Ableitung) lie-

fert dementsprechend die Krümmung dieser Funktion im Punkt x.Die n-te Ableitung von f(x) bezeichnet man mit f(n)(x).Die Berechnung der Ableitungen (Differentiation) erfolgt nach festen Regeln,wie d c

dx = 0 (Ableitung einer Konstanten c) oder d xn

dx = n · xn−1 u.a. Damitlässt sich die Ableitung einer Funktion (im Gegensatz zur Berechnung des In-tegrals, s. Anh. A.24) algorithmisch relativ leicht berechnen.Wenn die erste Ableitung im Punkt x gleich Null ist, und die zweite Ableitungdort größer als Null ist, besitzt die Kurve bei x ein Maximum. Wenn die zweiteAbleitung dort jedoch kleiner als Null ist, hat sie im Punkt x ein Minimum. Aneinem Punkt x, an dem die ersten beiden Ableitungen verschwinden (d.h. f’(x)= f”(x) = 0), die dritte aber nicht (d.h. f”’(x) 6= 0), besitzt die Funktion f(x) ander Stelle x einen Sattelpunkt (Wendepunkt).Bei Funktionen f(x1, x2, . . . , xn) in mehreren Variablen muss man mit partiel-len Ableitungen ∂

∂xiarbeiten. Dies entspricht der Durchführung einer ‚norma-

len‘ Differentiation der Funktion f nach xi bei gleichzeitigem Festhalten derWerte aller anderen Variablen (diese werden dabei wie Konstanten behandelt).Im Falle einer Funktion z = f(x, y) mit zwei Variablen entspricht die Funktion∂f∂x dem Tangentenanstieg einer Kurve, die durch eine Ebene parallel zur x-z-Ebene im Punkt y aus dem Funktionsgebirge der z-Werte (dargestellt über derx-y-Ebene) herausgeschnitten wird, s. auch Anh. A.16.Differentialgleichungen (DGL) sind solche Gleichungen, in denen neben einergesuchten Funktion auch deren Ableitungen nach ihren Variablen vorkommen.Wenn die Funktion nur von einer Variablen abhängt und die DGL deshalb auchnur Ableitungen nach dieser einen Variablen enthält, spricht man von einer ge-

Page 9: Welträtsel aus Sicht der modernen Wissenschaften

A.8 Felder und Feldtheorien 9

wöhnlichen DGL. Andernfalls, d.h. bei Vorkommen von Funktionen in meh-reren Variablen, können auch die entsprechenden partiellen Ableitungen nachdiesen Variablen in der Gleichung auftreten (sogenannte partielle DGL). Wenndie Ableitungen der gesuchten Funktion nur linear (d.h. nicht als höhere Poten-zen oder als Produkte mit anderen Funktionen) in die DGL eingehen, sprichtman von einer linearen DGL, andernfalls von einer nichtlinearen DGL.

A.7 Exponentialfunktion und Eulersche Zahl e

Im Gegensatz zur Potenzfunktion f(x) = xn mit der variablen Basis x, dient dieVariable x bei der Exponentialfunktion f(x) = ax als Exponent zu einer belie-bigen, aber festen Basis a (daher der Name). Eine herausragende Bedeutungbesitzt die Exponentialfunktion exp(x) = ex, bei welcher die Eulerschen Zahle = 2,718 . . . als Basis verwendet wird. Die Funktion exp(x) wird als Taylor-reihe (s. Anh. A.40) wie folgt definiert: exp(x) = ex =

∑∞n=0

xn

n! . Daraus ergibtsich auch die genaue Definition der Eulerschen Zahl: e = exp(1) =

∑∞n=0

1n! .

A.8 Felder und Feldtheorien

Der Feldbegriff hatte sich zwar schon im Zusammenhang mit der mathemati-schen Behandlung der Massenanziehung (Gravitation) von Körpern bzw. derdamit verbundenen Potentialtheorie (Lagrange, Gauß) und der elektromagne-tischen Wechselwirkung (Faraday, Maxwell) herausgebildet. Er ist aber erstin den modernen Feldtheorien der Physik bei der Behandlung der Wechselwir-kung von Teilchen und Feldern zum Fundament eines einheitlichen Gedanken-gebäudes geworden.Allgemein wird durch ein Feld jedem Punkt des Raumes eine bestimmte ma-thematische Größe zugeordnet. Dabei unterscheidet man je nach mathema-tischem Typ der Feldgrößen Skalarfelder (d.h. jedem Raumpunkt wird ei-ne Zahl, wie Temperatur oder Massedichte, zugeordnet), Vektorfelder (jedemPunkt wird eine durch Betrag und Richtung charakterisierte Größe, wie eineKraft, eine Geschwindigkeit in einer strömenden Flüssigkeit usw. zugeordnet)und analog dazu: Spinor- und Tensorfelder, auf die hier nicht näher eingegan-gen werden kann (zum Begriff des Tensors s. Anh. A.49). Es sei nur erwähnt,dass Spinorfelder in der Quantenfeldtheorie zur Beschreibung von Fermionenund Tensorfelder in der Allgemeinen Relativitätstheorie zur Charakterisierungder Raumgeometrie, insbesondere der Krümmung des Raums an jedem Raum-punkt, eine wichtige Rolle spielen. – Bei den für die Naturbeschreibung inter-

Page 10: Welträtsel aus Sicht der modernen Wissenschaften

10 A. Exkurs in die Welt der mathematischen Begriffe

essanten physikalischen Feldern handelt es sich natürlich bei der oben genann-ten Zuordnung - wie schon in den Beispielen sichtbar wurde - um die Zuwei-sung von physikalischen Größen (wie Druck, Temperatur, Potentiale, Kräfteusw.) zu den entsprechenden Raumpunkten.Wenn Felder mit den Methoden der Quantentheorie behandelt werden, sprichtman von Quantenfeldtheorien. Für diese ist charakteristisch, dass nicht nur dieErwartungswerte für die Operatoren, sondern auch die Felder selbst quanti-siert werden (deshalb der Name und deshalb auch die Zuordnung bestimmterAustauschquanten zu jeder Wechselwirkung, s. Tab. 2.1 im Buch).

A.9 Formale Grammatiken und Formale Sprachen

Eine formale (generative) Grammatik G ist ein spezielles formales System, s.Anh. A.10, bestehend aus 4 Komponenten G = <V, V∗, S, P>. Das AlphabetV = VN ∪ VT ist in eine Menge VN von nichtterminalen Symbolen und ineine Menge VT von terminalen Symbolen aufgeteilt, mit: VN ∩ VT = ∅. V∗

ist die Menge aller Zeichenketten, die sich über dem Alphabet V bilden lassen.G besitzt nur ein einziges Axiom S ∈ VN (das sogenannte Startsymbol oderSatzsymbol). Die Ableitungsregeln P (hier Produktionsregeln genannt) habenje nach Grammatiktyp eine spezielle Gestalt, s.u. Sie werden gewöhnlich nichtals Relationen in der Form R(φ, ψ), sondern in der Gestalt φ → ψ geschrie-ben, wobei φ, ψ ∈ V∗. Jedes v ∈ VN muss wenigstens in einer Regel r ∈ Pauf der linken Seite vorkommen. Da die Typologie der formalen Grammatikenvon Chomsky entwickelt wurde, heißen diese auch Chomsky-Grammatiken.Eine generative Grammatik G bestimmt jeweils eine zugehörige formale Spra-che LG als Menge aller aus dem Startsymbol S durch wiederholte Anwen-dung der Regeln r ∈ P ableitbaren Wörter, die nur noch terminale Symbole v∈ VT enthalten. Diese Sprachen bilden insofern eine Hierarchie, als die miteinem niedrigerem Typ gekennzeichneten Sprachen, diejenigen von höheremTyp enthalten. Es gilt also nachstehend L0 ⊇ L1 ⊇ L2 ⊇ L3.Wenn die Regeln r keinerlei Einschränkungen unterliegen, spricht man von ei-ner Typ-0 Grammatik bzw. Sprache oder uneingeschränkten Grammatik bzw.uneingeschränkten Sprache L0. Wenn die Regeln r die Form: uAw→ uψw ha-ben, mit A ∈ VN und u, w ∈ V∗, dann heißen die Grammatik bzw. die damitgenerierbare Sprache L1 kontextabhängig (ψ darf nicht leer sein; beide, Gram-matik und Sprache, sind dann vom Typ-1). Mit fortschreitenden Einschrän-kungen für die Regeln kommt man noch zu den Grammatiken und Sprachenvom Typ-2 bzw. Typ-3, die man kontextfrei bzw. regulär nennt (Sprachen L2

bzw. L3). Für uns sind hier nur die kontextfreien Grammatiken (Abkürzung:

Page 11: Welträtsel aus Sicht der modernen Wissenschaften

A.11 Fourierreihe, Fourier-Zerlegung 11

CFG – ‚Context free grammar‘) bzw. Sprachen interessant. Bei diesen habendie Regeln die Form: φ→ ψ, mit φ ∈ VN

A.10 Formales System, Kalkül

Ein formales System S = <V, F , Ax, R> besteht aus vier Komponenten: einerMenge V von Zeichen, dem Alphabet (mit V∗ bezeichnet man alle Zeichenket-ten bzw. Wörter, die sich durch Aneinanderreihen von Elementen aus V bildenlassen); einer wohldefinierten Teilmenge F ⊆ V∗, den Formeln von S; einerausgezeichneten Menge Ax ⊆ F , den Axiomen, und schließlich einer MengeR von n+1-stelligen Relationen über den Formeln aus F (den Ableitungsre-geln), wobei r(x1,x2, ..., xn, z) ∈ R und n≥ 1 bedeutet, dass die Formel z ausden Formeln xi ableitbar ist.Die Ableitbarkeit von Formeln wird induktiv dadurch eingeführt, dass manfestlegt, dass jedes Axiom a ∈ Ax per definitionem ableitbar ist. Jede Anwen-dung einer Regel r ∈ R liefert wieder ein ableitbare Formel z, und die gesamteMenge aller ableitbaren Formeln ergibt sich dann durch wiederholte Anwen-dungen der Ableitungsregeln.Ein Kalkül ist ein formales System, bei dem die Ableitungsregeln (auch Ablei-tungsrelationen genannt) bestimmten Einschränkungen, den sogenannten Hül-lenaxiomen, unterliegen (Forderung nach Monotonie, Einbettung und Abge-schlossenheit der Ableitungsrelation). Wenn man den Komponenten des Kal-küls genau definierte Bedeutungen zuordnen kann, spricht man von einem in-terpretierten Kalkül, wofür der Aussagenkalkül ein Beispiel ist, s. Anh. A.4.

A.11 Fourierreihe, Fourier-Zerlegung

Nach Fourier lässt sich jede stetige und periodische Funktion (s. Anh. A.12)mit der Periode T als eine Reihe von Sinus- und Cosinus-Funktionen darstel-len. Da man dies wie in dem wichtigen Anwendungsgebiet der Akustik als eineZerlegung in einzelne Schwingungen auffassen kann, bezeichnet man diesesVorgehen auch als Fourieranalyse bzw. Fourierzerlegung. Diese stützen sich,wie angedeutet, wesentlich auf die Winkelfunktionen, s. Anh. A.54. Bei denDarstellungen einer Fourierreihe unterscheidet man verschiedene Formen, diesich ineinander überführen lassen, von denen wir hier aber nur zwei anführenwollen:

Page 12: Welträtsel aus Sicht der modernen Wissenschaften

12 A. Exkurs in die Welt der mathematischen Begriffe

a) die reelle Darstellung (wobei als Name der Funktionsvariablen gern t ver-wendet wird – wegen der in der Signaltheorie vorherrschenden Deutung von tals Zeit; der Parameter ω = 2π

T bezeichnet die sogenannte Kreisfrequenz):f(t) = a0 +

∑∞n=1 (an · cos(nωt) + bn · sin(nωt)).

b) die komplexe Darstellung: f(t) =∑∞

n=−∞ cn · einωt.Es sei nur angemerkt, dass sich auch nichtperiodische Funktionen, die be-stimmte Bedingungen erfüllen, als Fourierreihe darstellen lassen. Hinweis: Alsgedanklichen Zugang kann man sich hierfür einen Grenzübergang T→∞ vor-stellen (allerdings treten dann in den Formeln Integrale anstelle von Summenauf, s. Anh. A.24). – Die Gesamtheit der Betragswerte |cn| der Koeffizientencn (s. Darstellung b oben) zusammen mit den ihnen zugeordneten Frequenzennω nennt man das Spektrum der Funktion f(t), und spricht dementsprechendauch von einer Spektralzerlegung. |cn| heißt Amplitude zur Frequenz nω.

A.12 Funktion

Der Begriff der Funktion wird in der Mathematik weitgehend synonym zu demder Abbildung verwendet. Eine Funktion f: M→W ist eine Abbildung von ei-ner Menge M (dem Definitionsbereich) in eine Menge W (den Wertebereich).Für eine Funktion f, die über den reellen Zahlen definiert ist (d.h. M, W = R),die also nur ein Argument hat, schreibt man auch y = f(x) mit x ∈ M und y ∈W. Man nennt eine Funktion f(x) an der Stelle x0 stetig, wenn f(x0) definiertist und limx→x0 f(x) = f(x0).Wenn man die y-Werte über den x-Werten in einem zweidimensionalen Ko-ordinatensystem (s. Anh. A.26) mit x- und y-Achse aufträgt, erhält man eineKurve in der x-y-Ebene, den Graphen der Funktion. Ist M das KartesischesProdukt mehrerer Mengen M1, M2, . . . Mn, d.h. M = {M1 ×M2, × . . .×Mn}(s. hierzu auch Anh. A.45), dann spricht man von einer mehrstelligen, genauereiner n-stelligen Funktion und schreibt w = f(x1, x2, . . . , xn). Im Falle einerzweistelligen Funktion z = f(x, y) ergibt sich als Graph eine mehr oder weni-ger gekrümmte Fläche über bzw. (bei negativen Werten von z) unter der x-y-Ebene. Es sei nur nebenbei bemerkt, dass sich jede n-stellige Funktion auchals (n+1)-stellige Relation auffassen lässt (s. hierzu Anh. A.45).

A.13 Fuzzy-Logik (Fuzzy logic)

Das Grundanliegen der Fuzzy-Logik ist die Formalisierung des rationalenSchließens mit unscharfen Begriffen bzw. Prädikaten, wie z.B. „heiß“, „sehr

Page 13: Welträtsel aus Sicht der modernen Wissenschaften

A.13 Fuzzy-Logik (Fuzzy logic) 13

klein“ usw. Wie im klassischen Fall wird eine unscharfe Menge F durch einPrädikat PF , hier nur eben durch ein ungenau definiertes Prädikat (oder wieman auch sagt, durch ein Fuzzy concept) bestimmt. F heißt auch Extensionvon PF . Beide sind verschiedene Aspekte ein und derselben Sache und führenzu komplementären Theorien: der Theorie der Fuzzy sets bzw. der Theorie derFuzzy concepts. Man beginnt zunächst mit der Verallgemeinerung des Kon-zepts der charakteristischen Funktion einer Menge, s. Anh. A.32, und führtanalog dazu eine Zugehörigkeitsfunktion µF (x) ein, die angibt, bis zu wel-chem Grade oder mit welcher Akzeptanz ein Element x aus dem betrachtetenUniversum U von Objekten zur Menge F gehört. Man definiert dann µF alsAbbildung: µF (x): U → [0,1]. Das bedeutet µF (x) kann beliebige Werte imIntervall [0,1], d.h. zwischen 0 und 1, annehmen. Für das Prädikat ‚reif‘ könntedann in einem Universum von Früchten χreif (x) = 0.9 etwa gleichbedeutendmit ‚ziemlich reif‘ und χreif (x) = 0 gleichbedeutend mit ‚unreif‘ sein. Manmuss also bei einer unscharfen Menge F zu jedem Element ui des Universumsden Wert der charakteristischen Funktion µF (ui) angeben, wofür sich die No-tation F = µ1/u1 + µ2/u2 + ... + µn/un bzw. F =

∫µF (u)/u eingebürgert hat

(Achtung: Diese Symbolik hat nichts mit Addition bzw. Integration zu tun).In der nachstehenden Tabelle sind die jeweils entsprechenden Konzepte derTheorie der Fuzzy sets und der Theorie der Fuzzy concepts gegenübergestellt.Sie zeigt auch, wie die Wahrheitswerte von prädikativen Ausdrücken in derFuzzy-Logik mit Hilfe der Zuordnungsfunktion µ(x) definiert werden.

Fuzzy-Mengen Fuzzy-Logik

Mengen: F =∫µF (u)/u Prädikate: PF (u) = u ε F 1)

G =∫µG(u)/u PG(u) = u ε G

Zugehörigkeiten: µF (u) Wahrheitswerte: PF (u) = µF (u)2)

µG(u) PG(u) = µG(u)

F ∪ G =∫max[µF (u), µG(u)]/u PF (u) ∨ PG(u) = max[PF (u), PG(u)]

F ∩ G =∫min[µF (u), µG(u)]/u PF (u) ∧ PG(u) = min[PF (u), PG(u)]

F =∫[1− µF (u)]/u ∼ PF (u) = [1 - PF (u)]

(Mengenkomplement) 3)

Tabelle A.1. Gegenüberstellung von Fuzzy-Mengen und Konzepten der Fuzzy-Logik1) Die Relation ε bezeichnet die Elementbeziehung für Fuzzy-Mengen.2) Der Wahrheitswert zu einem prädikativen Ausdruck wird durch Überstreichen des Ausdruckssymbolisiert.3) Zu diesen Festlegungen treten noch die Definition der Wahrheitswerte für die Implikationund der Transport der Wahrheitswerte von den Prämissen auf die Konklusion bei der Ableitung(z.B. mit Hilfe des Modus ponens) hinzu.

Page 14: Welträtsel aus Sicht der modernen Wissenschaften

14 A. Exkurs in die Welt der mathematischen Begriffe

A.14 Geometrie

Der Begriff Geometrie wird in doppelter Bedeutung verwendet. Zum einenbezeichnet er einen Zweig der Mathematik, der sich mit den räumlichen Ver-hältnissen und insbesondere mit elementaren Gebilden wie Punkten, Geraden,Abständen, Winkeln (sog. Elementargeometrie) befasst. Zum anderen bezeich-net der Begriff Geometrie, um den es hier geht (in dieser Bedeutung auch mitdem Plural „Geometrien“), mathematische Strukturen, die durch bestimmteaxiomatische Festlegungen charakterisiert sind.Wichtig in unserem Kontext sind die folgenden Geometrien:– Euklidische Geometrie (es gilt das Parallelenaxiom; die Winkelsumme imDreieck ist gleich 180◦);– Sphärische Geometrie (das Parallelenaxiom gilt nicht; die Winkelsumme imDreieck ist größer als 180◦);– Hyperbolische Geometrie (das Parallelenaxiom gilt nicht; die Winkelsummeim Dreieck ist kleiner als 180◦).Bezüglich der Abstandsdefinition in den verschiedenen Geometrien s. die Aus-führungen zu Räumen und insbesondere zu metrischen Räumen in Anh. A.42.

A.15 Gödelscher Unvollständigkeitssatz

Der Gödelsche Unvollständigkeitssatz besagt Folgendes: In jedem formalenKalkül, der in dem Sinne ausdrucksstark genug ist, dass er wenigstens dieAxiome der Zahlentheorie umfasst, lassen sich Sätze (Aussagen) bilden, dienicht beweisbar sind. Andernfalls, d.h. wenn alle Aussagen in diesem Systembeweisbar wären, müsste der Formalismus widersprüchlich sein. Dies gilt ins-besondere für den Prädikatenkalkül (s. Anh. A.30).Der Beweis gelang Gödel mit einem genialen Trick, der sogenannten Gödeli-sierung. Darunter versteht man ein Verfahren, mit dem man den Aussagen desKalküls eineindeutig natürliche Zahlen zuordnet und den zulässigen Ableitun-gen mathematische Operationen. Damit lässt sich eine Aussage konstruieren(nennen wir sie ANA), die ihre eigene Nichtableitbarkeit aussagt (Anmerkung:In der normalen Standard-Prädikatenlogik lässt sich eine solche Aussage nichteinmal formulieren). Mit Hilfe der auf diese Weise – man möchte fast sagen,mit List – eingeführten Selbstbezüglichkeit lässt sich der Gödelsche Unvoll-ständigkeitssatz beweisen. Es ergibt sich nämlich folgende Situation: WennANA wahr ist, aber nicht ableitbar wäre, dann wäre der Kalkül nicht voll-ständig. Wenn ANA jedoch falsch ist, müsste ANA ableitbar sein (das sagtdie Negation von ANA aus). Wenn ANA also ableitbar wäre, dann ergäbe das

Page 15: Welträtsel aus Sicht der modernen Wissenschaften

A.17 Graph und Graphentheorie 15

einen Widerspruch, da ANA gerade ihre eigene Nichtableitbarkeit aussagt. Al-so gibt es nur die Alternative: Entweder der Kalkül ist unvollständig oder insich widersprüchlich.

A.16 Gradient

Der Gradient grad eines skalaren Feldes φ(x,y,z) bzw. einer Funktion φ(x,y,z)im dreidimensionalen Raum bezeichnet die in einem Vektor zusammengefass-ten partiellen Ableitungen nach den Koordinaten x, y, z (d.h. in Richtung der x-Achse, y-Achse bzw. z-Achse). Er wird mathematisch durch den sogenanntenNabla-Operator ∇ ausgedrückt grad φ(x,y,z) = ∇φ(x,y,z) (s. Anh. A.37). DieKomponenten des Vektors grad φ(x,y,z) beschreiben den Anstieg der Funktionφ(x,y,z) parallel zu den entsprechenden Koordinatenachsen. Der Vektor gradφ(x,y,z) insgesamt charakterisiert Betrag und Richtung des steilsten Anstiegsder als Potential interpretierten Funktion φ(x,y,z) im Punkt x, y, z.

A.17 Graph und Graphentheorie

Ein gerichteter Graph G ist formal ein Paar G = <N, A> bestehend aus einerMenge N von Knoten und einer Menge A ⊆ N × N von Kanten. Er reprä-sentiert also eine zweistellige Relation RG, s. Anh. A.45. Zeichnerisch wird Gdargestellt als eine Menge von benannten Punkten (diese entsprechen den Kno-ten) und - wenn G eine Kante <n1,n2> ∈ A zwischen den Punkten (Knoten)n1 und n2 enthält - einer entsprechend gerichteten Verbindung (einem Pfeil)zwischen diesen Punkten. Wenn die Relation RG reflexiv ist, gibt es auch Pfei-le, die von einem Knoten n ∈ N ausgehen und wieder auf n gerichtet sind. ImFalle einer symmetrischen Relation RG (wie z.B. einem Straßennetz zwischeneiner Menge N von Städten) lässt man die Pfeile an den Kanten meist weg. Imletztgenannten Fall nennt man den Graphen auch ungerichtet.Ein Knoten w ∈ N heißt Wurzel des Graphen G, wenn es keinen Knoten u ∈N gibt mit (u, w) ∈ A (d.h. von einer Wurzel können nur Kanten ausgehen, esführen aber keine hin). Eine Folge von Knoten <a1, a2, . . . , ak> mit aj ∈ N für1 ≤ j ≤ k nennt man Pfad in G, wenn alle Paare <ai, ai+1> ∈ A.Ein Baum B (im Sinne der Graphentheorie) ist ein Graph, der eine einzigeWurzel w besitzt, wobei von w zu jedem anderen Knoten aus B genau ein Pfadexistiert.

Page 16: Welträtsel aus Sicht der modernen Wissenschaften

16 A. Exkurs in die Welt der mathematischen Begriffe

A.18 Grenzwert

Der Grenzwert oder Limes (Symbol: lim) einer Folge {a1, a2, . . . , an} ist derWert, dem sich die Elemente ak der Folge mit immer größer werdendem Indexk nähern (der Laufbereich des Index k wird unten oder rechts am Symbol ‚lim‘angeschrieben). Beispiele: limk→∞

1k = 0 oder limk→∞

ek

kn =∞, für belie-biges aber festes n. Das letzte Beispiel zeigt, dass die in Anh. A.7 beschriebeneExponentialfunktion exp(x) = ex schneller wächst als die n-te Potenz xn einerreellen Zahl x.Eine Reihe ist der Grenzwert limn→∞ der Summen

∑nk=1 ak einer solchen

Folge, s. auch den Begriff der Potenzreihe in Anh. A.40.Beispiele: limn→∞

∑nk=1

1k2

= π2

6 oder limn→∞∑n

k=11k =∞

Bei einem Grenzwert von∞ (allgemeiner und genauer: wenn kein Grenzwertexistiert) spricht man von Divergenz der Folge bzw. Reihe, andernfalls sprichtman von Konvergenz.

A.19 Gruppen und speziell Symmetriegruppen

Eine Gruppe ist eine algebraische Struktur (s. Anh. A.2) mit einer zweistel-ligen assoziativen Operation ◦ (s. Anh. A.37) über einer Trägermenge A miteinem Einselement e◦ ∈ A, d.h. es gilt a ◦ e◦ = a bzw. e◦ ◦ a = a für alle Ele-mente a ∈ A. Außerdem muss zu jedem a ∈ A ein inverses Element a−1 ∈ Agehören, so dass a ◦ a−1 = e◦.Beispiele: Die ganzen Zahlen mit der Addition als ◦, der 0 als ‚Einselement‘e◦ und -a als inversem Element zu a bilden eine Gruppe.Auch die vier Drehungen eines Quadrates in der Ebene um 0◦, 90◦, 180◦, 270◦

um eine Achse, die durch seinen Mittelpunkt geht, bildet eine Gruppe G. Diesehat die genannten 4 Drehungen als Elemente und die Gruppenoperation ◦ istdie ‚Hintereinanderausführung zweier Drehungen‘. Die Drehung um 0◦ (oder,was auf das Gleiche hinausläuft, um 360◦) bildet das Einselement, da dies garkeiner Drehung des Quadrats entspricht. Das Inverse zur Drehung um 90◦ bil-det die Drehung um 270◦, die Drehung um 180◦ ist zu sich selbst invers usw.Diese Gruppe G ist eine Symmetriegruppe, da jedes Element der Gruppe (d.h.jede Drehung) das Quadrat in sich selbst überführt (weitere Drehungen alsSymmetrieoperationen gibt es in diesem Fall auch nicht). Hier handelt es sichwegen der endlichen Anzahl von Gruppenelementen um eine endliche Dreh-gruppe. Es gibt aber auch unendliche Drehgruppen, wie z.B. die Drehungen,die einen Kreis oder eine Kugel in sich überführen. Diese heißen kontinuierli-che Drehgruppen. Die letztgenannten Drehgruppen für Kreis bzw. Kugel sind

Page 17: Welträtsel aus Sicht der modernen Wissenschaften

A.21 Hilbertraum, Funktionenraum 17

ebenfalls Symmetriegruppen.Wichtig für die Kristallographie und die Molekülphysik sind die sogenanntenPunktgruppen. Diese sind dadurch gekennzeichnet, dass es einen Punkt des zubeschreibenden räumlich-geometrischen Gebildes gibt, der durch alle Opera-tionen der Gruppe in sich selbst überführt wird.

A.20 Hamilton-Funktion und Hamilton-Operator

Die Hamilton-Funktion H ist in der klassischen Mechanik vereinfacht gesagtdie Energie eines Teilchensystems ausgedrückt im Phasenraum der Orts- bzw.Impulskoordinaten qi bzw. pi dieses Systems (s. Anh. A.38). Im allgemeinenist die Verwendung generalisierter Koordinaten erforderlich (s. Anh. A.27). Inder klassischen Mechanik ergeben sich die Bewegungsgleichungen der Teil-chen eines Systems direkt aus der Hamilton-Funktion:qi = ∂H

∂piund pi = −∂H

∂qi(qi, pi bedeutet: 1. Ableitung nach der Zeit)

In der Quantentheorie ist analog zur Hamilton-Funktion der klassischen Me-chanik der Hamilton-Operator entscheidend für die Beschreibung eines Sy-stems von Teilchen. Man gewinnt ihn aus der Energie des Systems, indemman die physikalischen Größen durch entsprechende Operatoren ersetzt (alsoz.B. die Impulskoordinaten pi durch die Operatoren - i~ ∂

∂qi).

A.21 Hilbertraum, Funktionenraum

Ein Hilbertraum H, so benannt nach dem Mathematiker Hilbert, ist ein Vektor-raum (s. Anh. A.52), in dem ein Skalarprodukt und mit Hilfe desselben wie-derum eine Norm definiert sind (s.u.), wobei bezüglich der Norm bestimmteKonvergenzeigenschaften gefordert werden (Vollständigkeit von H bezüglichder Norm).Im Euklidischen Raum ist das Skalarprodukt u · s der Vektoren u = (u1, u2, . . . ,un) und v = (v1, v2, . . . , vn) definiert als u · v =

∑ni=1 ui vi. Das ist also eine

Zahl bzw. ein Skalar (deshalb der Name ‚Skalarprodukt‘). – Zwei Vektoren,deren Skalarprodukt verschwindet, d.h. u · v = 0, heißen orthogonal zuein-ander. Die Wurzel des Skalarprodukts

√v · v eines Vektors v mit sich selbst

heißt Norm von v, Symbol: ‖v‖. Diese entspricht anschaulich der Länge desVektors in der Pfeildarstellung. Wenn die Vektoren der Basis B des betrach-teten Vektorraums (s. Anh. A.52) die Norm 1 haben (s. oben) und paarweisezueinander orthogonal sind, spricht man von einer Orthonormalbasis.Der Begriff des Hilbertraums bzw. des Vektorraums ist so weit gefasst, dass

Page 18: Welträtsel aus Sicht der modernen Wissenschaften

18 A. Exkurs in die Welt der mathematischen Begriffe

auch Funktionen als Elemente eines solchen Raums in Frage kommen (diesehaben dann kaum mehr etwas mit den relativ anschaulichen Vektoren eines Eu-klidischen Raums gemeinsam). In diesem Fall wird das Skalarprodukt zweierVektoren des Hilbertraums (das sind dann zwei Funktionen) über das Integraldes Produkts dieser Funktionen definiert (Anmerkung: Damit dieses Skalar-produkt existiert, und dieser Funktionenraum auch ein Hilbertraum ist, müs-sen die Funktionen quadratisch integrierbar sein). Solche Hilberträume sindvor allem für die Quantentheorie wichtig. Die Zustände eines Quantensystems,definiert durch diejenigen Wellenfunktionen, die Lösung der Schrödingerglei-chung sind, bilden die Elemente (die Vektoren) des Hilbertraums. Die Eigen-zustände eines bestimmten Operators bilden die Basis (s. Anh. A.52) für denzu diesem Operator gehörenden Hilbertraum.

A.22 IndexschreibweiseDie Indexschreibweise ist eine Methode, die Elemente einer abzählbaren Men-ge mit Hilfe von Zeigern (sogenannten Indizes, Singular: Index) zu kennzeich-nen. Meist benutzt man dafür natürliche Zahlen und spricht auch von einerNummerierung der Elemente. Man kann die Menge M = {a1, a2, . . . an} damitauch schreiben als M = {ai | 1 ≤ i ≤ n}. Vor dem senkrechten Strich steht dieBezeichnung der Elemente und danach der Zahlenbereich, über den der Index iläuft. Bei abzählbar unendlichen Mengen (s. A.51) ist auch n =∞ zugelassen.

A.23 InfinitesimalrechnungUnter Infinitesimalrechnung versteht man das Rechnen mit unendlich kleinenGrößen oder genauer gesagt, die mathematische Behandlung von Funktionenüber beliebig kleinen Intervallen. Sie umfasst die Differentialrechnung, s. Anh.A.6, und die Integralrechnung, s. Anh. A.24. Entscheidende Grundlage für die-sen Zweig der Mathematik ist der Begriff des Grenzwertes, s. Anh. A.18.

A.24 IntegralrechnungDie Integralrechnung oder die Berechnung des Integrals einer Funktion f(x)ist die Umkehroperation zur Differentiation, s. Anh. A.6 (sogenannter Fun-damentalsatz der Analysis). Man unterscheidet die Berechnung des bestimm-ten Integrals (Symbol:

∫ ba f(x) dx) der Funktion f(x) in den Grenzen x=a bis

Page 19: Welträtsel aus Sicht der modernen Wissenschaften

A.25 Komplexe Zahlen und Eulersche Formel 19

x=b von der des unbestimmten Integrals (Symbol:∫

f(x) dx). Der Wert des be-stimmten Integrals, das ist eine reelle Zahl, kann als Flächeninhalt interpretiertwerden, der durch die von f(x) bestimmten Kurve (dem Graphen der Funkti-on), den Parallelen x=a bzw. x=b zur y-Achse und der x-Achse gebildet wird(s. hierzu Anh. A.12). a und b heißen Integrationsgrenzen und bestimmen densogenannten Integrationsbereich. Das unbestimmte Integral F(x) =

∫f(x) dx

wird auch Stammfunktion zu f(x) genannt. Sie ist dadurch charakterisiert, dassgilt:

∫ ba f(x) dx = F(b) - F(a). Dabei besteht folgende grundlegende Beziehung

zwischen der Funktion f(x) und ihrer Stammfunktion F(x), die den oben er-wähnten Fundamentalsatz mathematisch zum Ausdruck bringt: dF (x)

dx = f(x).Daran erkennt man auch, dass die Stammfunktion nur bis auf eine KonstanteC bestimmt ist, da ebenfalls gilt: d(F (x)+C)

dx = f(x).Für die Berechnung von Integralen gibt es keine vergleichbaren algorithmi-schen Vorschriften wie für die Differentiation. Ja für manche Funktionen las-sen sich überhaupt keine geschlossenen Formeln für das unbestimmte Integralangeben (in diesem Fall können dann die bestimmten Integrale nur numerischberechnet werden).Die Definition des Integrals lässt sich auch auf Funktionen in mehreren Va-riablen erweitern bzw. auf Räume in mehreren Dimensionen ausdehnen. Manspricht dann auch von Volumenintegralen, weil dann an die Stelle des eindi-mensionalen Differentials dx (ein als Grenzwert zu denkender ‚unendlich klei-ner‘ Abschnitt auf der x-Achse) ein Volumenelement dv des entsprechendenRaumes tritt (im dreidimensionalen euklidischen Raum, der durch die x-, y-und z-Achse aufgespannt wird, wäre dann dv = dx dy dz).Kennt man z.B. die Massendichte ρ(x,y,z) = (Masse/Volumenelement) in ei-nem bestimmten Raum, dann kann man die Gesamtmasse in diesem Raum miteinem Mehrfachintegral berechnen:

∫∞−∞

∫∞−∞

∫∞−∞ ρ(x,y,z) dx dy dz oder als

Volumenintegral geschrieben:∮V ρ(x,y,z) dv.

A.25 Komplexe Zahlen und Eulersche Formel

Im Bereich der reellen Zahlen R, s. Anh. A.43 ist die Operation des Wur-zelziehens nicht uneingeschränkt durchführbar, da die Gleichung x2 = -1 dortkeine Lösung besitzt. Erweitert man R durch die imaginäre Einheit i =

√−1,

so gelangt man zu den komplexen Zahlen z = a + b·i, mit a, b ∈ R. In diesemBereich sind alle Grundrechenarten der Arithmetik einschließlich des Poten-zierens und deren Umkehroperationen (mit Ausnahme der Division durch 0)uneingeschränkt durchführbar, s. Anh. A.3. Jeder Zahl z = a + b·i ist in derkomplexen Zahlenebene (das ist ein Koordinatensystem K mit den Achsen a

Page 20: Welträtsel aus Sicht der modernen Wissenschaften

20 A. Exkurs in die Welt der mathematischen Begriffe

und b statt x und y, s. Anh. A.26) eindeutig ein Punkt Pz zugeordnet und um-gekehrt.Bezeichnet man mit r =

√a2 + b2 den Abstand von Pz zum Ursprung von K

und den Winkel, den die Strecke von Pz zum Ursprung mit der a-Achse bildet,mit φ, so lässt sich z auch in der Form z = r·(cosφ + i·sin(φ)) darstellen.Auf dieser Grundlage wurde von Euler ein bemerkenswerter Zusammen-hang zwischen der Exponentialfunktion und den Winkelfunktionen entdeckt:exp(iφ) = eiφ = (cos(φ) + i·sin(φ)), die sogenannte Eulersche Formel mit demSpezialfall eiπ = -1. Diese Formel ergibt sich relativ einfach aus der Taylor-reihe für exp(iφ), s. Anh. A.7). Damit besitzt jede komplexe Zahl z eine sehrkompakte Darstellung mittels der Exponentialfunktion: z = r·eiφ.

A.26 Koordinatensystem

Ein Koordinatensystem ist der Beschreibungsrahmen, in dem man mit Hilfeeiner Anzahl von Zahlen (den Koordinaten) die Lage von Punkten in einemRaum (s. Anh. A.42) festlegt, der mit einer bestimmten Geometrie (s. A.14)ausgestattet ist. Die Anzahl n der hierzu benötigten Zahlen nennt man Dimen-sion des Raumes (man sagt auch, das Koordinatensystem sei „n-dimensional“).Das bekannteste Beispiel für ein Koordinatensystem ist das kartesische Koor-dinatensystem, das unseren dreidimensionalen Ortsraum mit Hilfe von drei be-liebigen aufeinander senkrecht stehenden, und mit einem Maßstab versehenenLinien, den Koordinatenachsen, im Raum beschreibt (orthogonales Koordina-tensystem). Diese Achsen schneiden sich in einem Punkt U (dem Ursprung)des Koordinatensystems. Sie sind in dem Sinne gerichtet, dass die Messwerteauf der einen Seite des Ursprungs mit Null beginnend positiv und die auf deranderen Seite als negativ angegeben werden. Die Koordinaten eines Punktes Pim Raum werden dadurch bestimmt, dass man das Lot von P auf die jeweiligeAchse (meist x-, y- und z-Achse genannt) fällt. Der so erhaltene Messwert (x,y bzw. z) ist die x-, y- bzw. z-Koordinate des Punktes P.

A.27 Lagrange-Funktion und Lagrange-Dichte

Der Lagrange-Formalismus stützt sich in analoger Weise wie der Hamil-ton-Formalismus, der von der Hamiltonfunktion ausgeht, s. Anh. A.20, aufdie Konzepte der Lagrange-Funktion und Lagrange-Dichte. Der Hamilton-Formalismus und der Lagrange-Formalismus der klassischen Mechanik sind

Page 21: Welträtsel aus Sicht der modernen Wissenschaften

A.28 Lexeme, Valenzen und Valenzrahmen 21

äquivalent. Beide Formalismen sind für die Physik von grundlegender Bedeu-tung, weil sich sowohl aus der Hamiltonfunktion als auch aus der Lagrange-funktion das Verhalten des damit beschriebenen Systems nach bestimmten Ex-tremalprinzipien bestimmen lässt (s. das Prinzip der kleinsten Wirkungen un-ter: https://de.wikipedia.org/wiki/Hamiltonsches_Prinzip).Im Gegensatz zum Hamilton-Formalismus, der mit verallgemeinerten Phasen-raum-Koordinaten für Ort qi und Impuls pi arbeitet (s. Anh. A.38), werdenim Lagrange-Formalismus generalisierte Variablen qi und deren Ableitungennach der Zeit dqi

dt verwendet. Anmerkung: Die generalisierten Koordinatenwerden so gewählt, dass Zwangsbedingungen, denen ein System unter Um-ständen unterliegt, in die Definition der Koordinaten einbezogen werden. DieLagrange-Funktion L ist für ein physikalisches System definiert als die Diffe-renz aus kinetischer Energie T und potentieller Energie V, ausgedrückt in ver-allgemeinerten Orts- und Geschwindigkeitskoordinaten: L = T - V = L(qi,dqidt ).Sie hat sich gegenüber dem Hamilton-Formalismus als besonders geeignet fürdie Beschreibung von Feldern und deren Symmetrien erwiesen. Genau genom-men arbeitet man in den Feldtheorien mit der sogenannten Lagrange-Dichte Λ.Das ist eine Funktion, die abhängig von den Feldgrößen ist, und deren Raum-integral über ein betrachtetes Volumen gerade die entsprechende Lagrange-Funktion ergibt (dementsprechend kann man auch sagen, dass Λ die Dichteder Lagrange-Funktion L in einem Volumenelement beschreibt).

A.28 Lexeme, Valenzen und Valenzrahmen

Wörter sind im allgemeinen mehrdeutig, wobei vor allem die Erscheinungender Polysemie und der Homographie (bei geschriebener Sprache) bzw. Ho-mophonie (bei gesprochener Sprache) zu berücksichtigen sind.Zur Charakterisierung der verschiedenen, einem Wort zugrundeliegen Bedeu-tungen in einem Computerlexikon benötigt man eine formale Charakterisie-rung der bedeutungstragenden Einheiten. Letztere nennt man auch Lexeme. Sohat das Verb „schreiben“ in den nachstehenden Wendungen ganz verschiedeneBedeutungen: „einen Brief schreiben“ (schreiben.1.1), „eine Oper schreiben“(schreiben.1.2), . . . , „rote Zahlen schreiben“ (schreiben.1.n). Lexeme und Be-griffe sind im Gegensatz zu Wörtern eindeutig. Um diese Eindeutigkeit dereinem Wort zugrundeliegenden Bedeutungsträger zu gewährleisten, benutzenwir folgende Bezeichnungs-Konvention: <Grundwort>.<Doppelindex>, wobeidie erste Zahl im Doppelindex die Homographen durchnummeriert (wir be-schränken uns hier auf die Schriftsprache); der zweite Index dient dann zurUnterscheidung der verschiedenen Bedeutungen polysemer Wörter.

Page 22: Welträtsel aus Sicht der modernen Wissenschaften

22 A. Exkurs in die Welt der mathematischen Begriffe

Die formale Beschreibung eines Lexems lässt sich günstig mit Hilfe einesMerkmal-Wert-Schemas durchführen, das hier für das Beispiel ‚schreiben.1.1‘stark verkürzt skizziert werden soll (die vollständige Charakterisierung für die-ses Verb und für Wörter aus anderen Wortklassen findet sich in [1, Kap. 12.2]).schreiben.1.1[morph ([root schreib], [flex-class k.2] . . . )][syn ([v-type main], [perf-aux haben] . . . )][sem ([sort action] [net ([SYNO verfassen.1.3] . . . )])][select ([rel-AGT ([synsel ([categ NP] [case nom])]

[semsel [legper +])] . . . ]. . .

[rel-ORNT ([synsel ([categ NP] [case dat])][semsel [legper +]] . . . )]

[rel-RSLT ([synsel ([categ NP] [case acc])][semsel [info +]]) . . . ])]

Merkmale (auch ’Attribute’ genannt) sind in diesem Schema fett und Wertenormal gedruckt. Jeweils ein Merkmal-Wert-Paar ist in eckige Klammern ein-geschlossen, wobei ein Wert wiederum eine Liste (gekennzeichnet durch rundeKlammern) von Merkmal-Wert-Paaren sein kann (rekursiver Aufbau).Dieser Ausschnitt aus der formalen Beschreibung des Lexems ‚schreiben.1.1‘zeigt die wesentlichen Charakteristika des betreffenden Lexikoneintrags (dervollständige Ausdruck nimmt eine ganze Seite ein): Unter dem Merkmalmorph findet man die morphologischen Charakteristika: die Wurzel des Verbs(root) und den Konjugationstyp (Flexionsklasse ‚k.2‘). Es folgen unter syn diesyntaktischen Eigenschaften des Verbs: Es ist ein Hauptverb und das Perfektwird mit „haben“ (nicht mit „sein“) gebildet. Die semantischen Eigenschaftendes Verbs selbst sind unter dem Merkmal sem eingetragen: Es gehört zur Klas-se der Handlungen (und nicht etwa zu den Zuständen oder Geschehnissen) undist in der Wissensbasis (im semantischen Netz der Begriffe) mit dem Konzept‚verfassen.1.3‘ über die Relation SYNO (Synonymie-Beziehung) verknüpft.Schließlich folgt unter dem Merkmal select die Liste der Selektionsanforde-rungen, auch Valenzen genannt. Darunter versteht man die Anforderungen, dievon dem Verb an andere Konstituenten in einem Satz ausgehen. Hier sind nurder Handlungsträger AGT (wer schreibt), das Objekt der Hinwendung ORNT(an wen wird geschrieben) und das Ergebnis RSLT (was wird geschrieben)angegeben. Hinzu kommen noch zwei weitere Valenzen (hier weggelassen):BENF – der Nutznießer (für wen wird geschrieben) und MCONT – was ist derInformationsgehalt bzw. mentale Gehalt der Schreibhandlung (worüber wirdgeschrieben). Außerdem muss noch spezifiziert werden, welche der Valenzen

Page 23: Welträtsel aus Sicht der modernen Wissenschaften

A.30 Logik (mathematische) mit Schwerpunkt Prädikatenlogik 23

obligatorisch sind, damit ein Satz mit dem Lexem ‚schreiben.1.1‘ vollständigist (das betrifft in diesem Fall nur AGT), und welche als fakultativ anzusehensind (ORNT, RSLT, BENF und MCONT). Insgesamt bezeichnet man die unterselect angeführte Liste SB von Selektionsbedingungen als Valenzrahmen.Jedes Element von SB umfasst einen syntaktischen Teil (Merkmal synsel)und einen semantischen Teil (Merkmal semsel). Bei den Valenzen AGT bzw.ORNT bedeutet dies, dass die betreffende Konstituente syntaktisch eine No-minalphrase/Substantivgruppe (NP) im Nominativ ‚nom‘ bzw. im Dativ ‚dat‘sein muss. Semantisch muss die NP eine juristische oder natürliche Person sein(Merkmalswert [legper +]).

A.29 Logarithmus

Der (natürliche) Logarithmus ln(x) ist die Umkehrfunktion zur Exponential-funktion exp(x) = ex, s. Anh. A.7, d.h. es gilt: ln(ex) = x (im Kontext diesesBuches ist das die wichtigste Logarithmus-Funktion). Für Logarithmen, die alsUmkehrung zu Exponentialfunktionen mit einer anderen Basis a definiert sind,schreibt man loga. Für diese gilt dann: loga(ax) = x.Mit Hilfe der Logarithmengesetze ln(a · b) = ln(a) + ln(b) und ln(an) = n · ln(a)lässt sich der Logarithmus eines Produkts auf die Addition der Logarithmender Faktoren und der Logarithmus einer Potenz auf das Produkt des Exponen-ten mit dem Logarithmus der Basis zurückführen. Auf dieser Grundlage kannman auch sehr große Zahlen (wie z.B. bestimmte Messwerte in der Physik oderAstronomie) ganz übersichtlich in einem logarithmischen Maßstab darstellen.Logarithmen zu verschiedenen Basen, sagen wir a und e lassen sich leicht in-einander umrechnen, denn es gilt: ln(x) = ln(a) · loga(x).

A.30 Logik (mathematische) mit Schwerpunkt Prädi-katenlogik

Als Ausgangspunkt nehmen wir die Aussagenlogik, s. Anh. A.4, und erweiterndiese zur Prädikatenlogik (genauer zur Prädikatenlogik 1. Stufe, dem Prädika-tenkalkül PK1). Hier besitzen die Aussagen eine wohldefinierte innere Struk-tur, weshalb auch die Aussagenvariablen im Alphabet V der Prädikatenlogikentfallen. Dafür treten in V andere Symbole zum Aufbau von Aussagen hin-zu: Namen für einstellige Prädikate P, Q, R, . . . , n-stellige Relationen Rn,Qn, . . . (n ≥ 2), Variable x, y, z, . . . und Symbole fn, gn, hn, . . . für n-stellige

Page 24: Welträtsel aus Sicht der modernen Wissenschaften

24 A. Exkurs in die Welt der mathematischen Begriffe

Funktionen sowie die zwei Quantoren ∃ und ∀ (logische Konstanten sind null-stellige Funktionen, für die auch die Symbole a, b, c . . . verwendet werden).Die Menge F der wohlgeformten Formeln wird auf dieser Grundlage induktivdefiniert: Variablen und logische Konstanten bezeichnet man als Terme; dieAnwendung fn(t1, t2, . . . tn) einer n-stelligen Funktion auf n Terme ist wie-der ein Term. Die Anwendung P(t) eines Prädikats P auf einen Term t oderdie Anwendung Rn(t1, t2, . . . tn) einer n-stelligen Relation Rn auf n Termesind prädikative bzw. relationale Ausdrücke, die wir auch als atomare Formelnbezeichnen. Wir werden im Folgenden sowohl Prädikate als auch Relationenallgemein als Prädikate bezeichnen, da sie sich einfach durch ihre Stelligkeitunterscheiden lassen. Wenn eine atomare Formel P(. . . , x, . . . ) die Variable xfrei enthält, dann sind ∃x P(. . . , x, . . . ) und ∀x P(. . . , x, . . . ) zusammengesetzteFormeln. Die Variable x nennt man in dieser Formel ‚gebunden‘. Andernfalls,d.h. wenn x in einer Formel nicht durch einen Quantor gebunden ist, dann heißtsie ‚frei‘. Die Anwendung der aussagenlogischen Operationen ¬ ∧, ∨ und deranderen mit deren Hilfe definierbaren Operationen (s. Anh. A.4) auf atomarebzw. zusammengesetzte Formeln liefern wieder eine zusammengesetzte For-mel. Beide Arten von Formeln (atomare und zusammengesetzte) bilden dieMenge F der wohlgeformten Formeln. Diese entsprechen den Aussagen derAussagenlogik.Zur Menge A der Axiome der Prädikatenlogik gehören zunächst einmal dieje-nigen der Aussagenlogik, wobei (je nach Aufbau des prädikatenlogischen Kal-küls) noch spezifische Axiome hinzutreten. Typisch hierfür ist das sogenannteSpezialisierungsaxiom ∀x P(x) → P(a), wobei a eine beliebige Konstante ist.Dazu treten noch Axiome bezüglich der Gleichheit bzw. Identität von Termen.Als charakteristische Ableitungsregel ist (neben den Regeln der Aussagenlo-gik) die Regel zur ∃-Einführung anzusehen: A → B ` ∃x A → B, wenn A,aber nicht B die Variable x frei enthält. – Das bisher Gesagte bestimmt diesyntaktische Seite des PK1. Diesem Kalkül wird das Attribut ‚1. Stufe‘ zu-geordnet, weil es im PK1 nicht erlaubt ist, Quantoren auf Prädikatensymboleanzuwenden (andernfalls spricht man von einer Logik höherer Stufe).Wie steht es nun um die Bedeutung dieser formalen Ausdrücke, d.h. um dieSemantik des Kalküls K? Hierzu müssen wir den Begriff der Interpretationdes Kalküls einführen. Diesem wird eine Struktur S = <U, F, P> zugrunde-gelegt, die aus den drei Komponenten besteht: U – einem Universum vonIndividuen, auch Individuenbereich genannt (U könnte z.B. Napoleon I, So-krates, Paris u.a. enthalten); F – einer Menge von Funktionen über U (z.B.vater_von(x), gewicht_von(x) usw.); P – einer Menge von Prädikaten (auchAttribute genannt) bzw. Relationen über U (z.B. Vogel(x), Hauptstadt_von(x),

Page 25: Welträtsel aus Sicht der modernen Wissenschaften

A.31 Matrizen und Matrizenmechanik 25

Verheiratet_mit(x, y), Erbaut_von(x, y, loc) usw.). Dabei könnte beispielswei-se Erbaut_von(Eiffelturm, Eiffel, Paris) bedeuten: „Der Eiffelturm wurde vonEiffel in Paris erbaut“. Eine Interpretation I eines Kalküls K über S ordnet denKonstanten von K Elemente aus U zu und den Funktionen fn bzw. PrädikatenPn von K ordnet man Funktionen bzw. Prädikate entsprechender Stelligkeitaus F bzw. P zu. Durch I werden letztlich den Ausdrücken (Formeln) aus Knach Auswertung mit Hilfe der booleschen Funktionen Wahrheitswerte zuge-ordnet.Ein Ausdruck H heißt erfüllbar, wenn er bei wenigstens einer Interpretationwahr wird. Man bezeichnet ihn als allgemeingültig, wenn er bei jeder Interpre-tation wahr ist.Wenn eine Menge G von Ausdrücken bei der Interpretation I über einer Struk-tur SI wahr ist, dann heißen sowohl I als auch SI Modell von G. Ein AusdruckA folgt semantisch aus G oder ist eine Folgerung von G (Symbol: G ⇒ A),wenn jedes Modell von G auch Modell von A ist.Ein Anliegen der Prädikatenlogik ist es, den inhaltlichen Folgerungsbegriffdurch den Begriff der formalsyntaktischen Ableitung zu ersetzen. Ein logi-scher Formalismus und ganz konkret der PK1 heißen vollständig, wenn al-le allgemeingültigen Ausdrücke des Formalismus in demselben auch ableit-bar sind (s. hierzu jedoch den ‚Gödelschen Unvollständigkeitssatz‘ in Anh.A.15). Eine Ausdrucksmenge G (insbesondere ein Axiomensystem) heißt wi-derspruchsfrei, wenn es eine Struktur S gibt, über der die Ausdrücke von Gerfüllbar sind.Neben dem PK1 gibt es noch viele andere Logiksysteme (wie die temporaleLogik oder die kausale Logik u.a.), wobei wir aber in diesem mathematischenAnhang nur auf die Modallogik (s. Anh. A.33) und die Fuzzy-Logik (s. Anh.A.13) eingehen werden.

A.31 Matrizen und Matrizenmechanik

Eine (n,m)-Matrix M ist eine zweidimensionale Anordnung von doppelt indi-zierten Elementen xij (wobei wir als Elemente nur Zahlen betrachten werden):

M =

x11 x12 . . . x1mx21 x22 . . . x2m

......

.... . .

xn1 xn2 . . . xnm

n = Zahl der Zeilen; m = Zahl der Spalten

Page 26: Welträtsel aus Sicht der modernen Wissenschaften

26 A. Exkurs in die Welt der mathematischen Begriffe

Für Matrizen von gleichem Typ ist eine Addition definiert, die der Additionderjenigen Elemente entspricht, die jeweils die gleichen Indizes besitzen. DieMultiplikation P = M · K zweier Matrizen M und K ist nur dann definiert,wenn die erste Matrix M vom Typ (m, n) und die zweite Matrix K vom Typ (n,k) ist. Dann ergeben sich die Elemente pij der Produktmatrix P, die dann vomTyp (m, k) ist, durch Bildung des Skalarprodukts des i-ten Zeilenvektors vonM mit dem j-ten Spaltenvektor von K. Diese Multiplikation ist assoziativ undbezüglich der Addition auch distributiv. Sie ist aber nicht kommutativ.Für quadratische Matrizen Q vom Typ (m, m) lässt sich eine Skalare Größeableiten, die Determinante Det(Q) genannt wird. Diese Zahl hat eine entschei-dende Bedeutung für die Matrizenrechnung. Beispielsweise ist Det(Q) 6= 0die Bedingung dafür, dass Q ein Inverses Q−1 hat, was gleichbedeutend istmit Q · Q−1 = E. Dabei ist E die Einheitsmatrix vom Typ (m,m), für derenElemente gilt: eij = 1 für i=j (Hauptdiagonal-Elemente), und eij = 0 sonst. –Auch für die Anwendungen der Matrizenrechnung hat die Determinante einewichtige Bedeutung. Wenn beispielsweise für die Koeffizientenmatrix K eineslinearen inhomogenen Gleichungssystems mit n Gleichungen und n Variablen(Unbekannten) gilt Det(K) 6= 0, dann hat dieses Gleichungssystem genau eineLösung in diesen Variablen.

Die Quantentheorie (QT) kann mit Hilfe zweier verschiedener Formalis-men beschrieben werden: Erstens mit der von Schrödinger aufgestellten Wel-lenmechanik, in deren Zentrum die Schrödingergleichung steht, s. Anh. A.47,und zweitens mit der auf Heisenberg zurückgehenden Matrizenmechanik. Bei-de haben sich bezüglich ihrer Vorhersagekraft als äquivalent erwiesen und las-sen sich ineinander überführen. In der Formulierung der QT als Matrizenme-chanik ist der Begriff der Eigenwerte einer Matrix wichtig. Hierfür genügt eszu wissen, dass sich ein Operator O der Quantentheorie (s. Anh. A.37), derin einem Hilbertraum mit einer Orthonormalbasis {|n>} wirkt (s. Anh. A.21),in eine Matrixform O überführen lässt. Das Symbol |n> bezeichnet den n-tenBasisvektor in dem genannten Hilbertraum.Die möglichen Werte einer Messgröße, die zu dem Operator O gehört, sinddie Eigenwerte der Matrix O. Diese Eigenwerte (hier mit λ bezeichnet) be-rechnen sich aus der Gleichung O v = λ v, wobei v für einen Vektor aus demoben genannten Hilbertraum steht. Die Lösungen dieser Gleichung sind dieje-nigen Werte für λ (nennen wir sie λ1, λ2, . . . , die sogenannten Eigenwerte vonO), für welche die Anwendung dieses Operators auf den Vektor v denselbenbis auf einen Faktor reproduziert. Das ist nur für bestimmte Vektoren vi derFall, und zwar für diejenigen, die zu dem jeweiligen Eigenwert λi gehören (siewerden dementsprechend Eigenvektoren von O genannt).

Page 27: Welträtsel aus Sicht der modernen Wissenschaften

A.32 Mengen, Mengenoperationen und Mengenrelationen 27

A.32 Mengen, Mengenoperationen und Mengenrela-tionen

Der Begriff der Menge, der Bolzano und Cantor eingeführt wurde, ist grundle-gend für die gesamte Mathematik. Er bezeichnet eine Zusammenstellung vonEinzeldingen (Elementen), die wohlunterscheidbar sind.Beispiele: Die Menge H aller Hauptstädte oder die Menge K aller Katzen.

N = {1, 2, 3, . . . } ist die Menge der natürlichen Zahlen.Die Beziehung, dass e ein Element der Menge M ist (Elementbeziehung) be-zeichnet man mit e ∈ M. Man kann diesen Sachverhalt auch durch eine soge-nannte charakteristische Funktion χ(e) ausdrücken, wobei gilt χ(e) = 1, wenne ∈M, und χ(e) = 0, wenn e kein Element von M ist (Symbol: e /∈M).Die Menge, die kein Element enthält, heißt leere Menge (Symbol: ∅ oder {}).Man nennt eine Menge T Teilmenge der Menge M (Symbol: T⊆M), wenn je-des Element von T auch Element von M ist. Wenn es darüber hinaus Elementee ∈ M gibt, die nicht gleichzeitig Element von T sind (d.h. e 6∈ T), dann ist Teine echte Teilmenge von M (Symbol: T ⊂M).Die Menge P(M) aller Teilmengen einer Menge M bezeichnet man als Po-tenzmenge von M (Symbol: P(M) = 2M ).Als Mengenoperationen sind zu nennen (F und G seien beliebige Mengen):Durchschnitt von F und G: F ∩ G = {e | (e ∈ F) ∧ (e ∈ G)}Vereinigung von F und G: F ∪ G = {e | (e ∈ F) ∨ (e ∈ G)}Differenz von F und G: F \ G = {e | (e ∈ F) ∧ (e /∈ G)}Komplementbildung von F: F = {e | (e /∈ F)} = {e | ¬(e ∈ F)}An den Definitionen sieht man deutlich die Parallele zwischen den Mengen-operationen und den logischen Operatoren ∧, ∨ und ¬, s. Anh. A.4.

Listen bzw. Tupel sind im Grunde genommen auch Mengen, wobei es aberim Gegensatz zu den allgemeinen Mengen auf die Reihenfolge ankommt (ge-ordnete Mengen) und ein Element in einer Liste bzw. einem Tupel auch mehr-fach vorkommen kann.Die Mächtigkeit einer Menge M (sozusagen ihre Größe) wird mit Hilfe vonKardinalzahlen charakterisiert und mit |M| bezeichnet. Man beginnt mit end-lichen Mengen, deren Kardinalzahl per definitionem eine natürliche Zahl ist,eben die Anzahl ihrer Elemente. Zwei Mengen M1 und M2 heißen gleichmäch-tig, wenn es eine bijektive Abbildung von M1 auf M2 gibt (s. Anh. A.1). DieseBeziehung ist eine Äquivalenzrelation (s. Anh. A.45). Für die Mächtigkeit derMengeN der natürlichen Zahlen und aller zu dieser gleichmächtigen Mengenlegt man das Symbol ℵ0 fest. Dies ist die Mächtigkeit der kleinsten unendli-chen Menge. Man kann zeigen, dass für die Mächtigkeit |<| der reellen Zahlen

Page 28: Welträtsel aus Sicht der modernen Wissenschaften

28 A. Exkurs in die Welt der mathematischen Begriffe

< gilt: |<| = |P(N )| = 2ℵ0 . Wenn man die kleinste auf ℵ0 folgende Kardi-nalzahl mit ℵ1 bezeichnet, dann besagt die sogenannte Kontinuumshypothese,dass es zwischen den beiden Mächtigkeiten ℵ1 und |<| vermutlich keine wei-tere gibt, d.h. dass |<| = ℵ1 gilt. Diese Hypothese kann jedoch - wie der Namebereits sagt - aus den Axiomen der Mengenlehre allein nicht bewiesen werden.Eine wichtige Axiomatisierung der Mengenlehre stammt von Zermelo undFraenkel. Diese schließt das sogenannte Auswahlaxiom ein, das folgendes be-sagt: Wenn A eine Menge von nichtleeren Mengen ist, dann gibt es eine Aus-wahlfunktion F, die aus jeder Menge M ∈ A ein Element auswählt. Das ist fürendliche Mengen A von Mengen unproblematisch und sofort einzusehen, dasich für diese immer eine solche Funktion angeben lässt. Für unendliche Men-gen A von Mengen (wie z.B. für die Potenzmenge der reellen Zahlen) ist dasnicht ohne weiteres klar, da das Axiom nicht angibt, wie eine solche Funktionzu konstruieren ist. Konstruktivisten lehnen dieses Axiom deshalb ab, wie dasauch manche Physiker wegen des Zusammenhangs mit dem Banach-Tarski-Paradoxon tun (s. https://de.wikipedia.org/wiki/Banach-Tarski-Paradoxon).

A.33 Modallogik

Viele Sätze der natürlichen Sprache enthalten Elemente wie „vielleicht“, „not-wendigerweise“, „sollen“, „dürfen“ usw., die eine Stellungnahme des Spre-chers zur Gültigkeit der Aussage (sogenannte Modalitäten) zum Ausdruckbringen. Zur logischen Behandlung solcher Sätze wurden Ausdrucksmittel ein-geführt, die dementsprechend zu modalen Logiksystemen oder Modallogikenführen. Diese sind durch Paare von speziellen modalen Operatoren (meist be-zeichnet mit 2 bzw. 3) bestimmt, die jeweils ein natürlichsprachliches Wort-paar und die zu diesem gehörigen Synonyme als Entsprechung haben. DieseOperatoren wirken auf logische Ausdrücke, s. Anh. A.30. Sie sind nachstehendfür die sogenannte alethische Logik angegeben:

2P steht für: „Der Ausdruck P gilt notwendigerweise“3P steht für: „Der Ausdruck P gilt möglicherweise“.

In der Modallogik werden diese Operatoren im Rahmen einer Kripke-Semantikdurch Wahrheitsbedingungen folgender Art definiert:[2P ist wahr in w0]↔ ∀w[R(w0, w)→ (P ist wahr in w)][3P ist wahr in w0]↔ ∃w[R(w0, w)→ (P ist wahr in w)]w0 bezeichnet die reale Welt, und R ist eine Relation, die alternative (oderauch mögliche) Welten miteinander verbindet. „Notwendig wahr“ bedeutet da-nach „gültig in allen möglichen/alternativen Welten“. „Möglicherweise wahr“

Page 29: Welträtsel aus Sicht der modernen Wissenschaften

A.35 Neuronale Netze und Neuronenfunktionen 29

bedeutet „gültig in wenigstens einer der alternativen Welten“. Die Wahrheits-bedingungen und die Eigenschaften der Alternativweltrelation R (ob transitiv,symmetrisch usw.) bestimmen wesentlich die Axiomensysteme, die diese Ope-ratoren in ihren formalen Eigenschaften festlegen

Man hat noch weitere Logiksysteme entwickelt, die durch Begriffspaare,wie „fordern“ und „erlauben“ (deontische Logik) oder „wollen“ und „hoffen“(intentionale Logik) oder „wissen“ und „glauben“ (epistemische Logik) cha-rakterisiert werden. Auf diese Logiken können wir hier nicht weiter eingehen.

A.34 Natürliche Zahlen

Die natürlichen Zahlen sind aus dem Abzählen von Gegenständen hervorge-gangen. Sie stellen ein gemeinsames Merkmal von bestimmten in der Naturvorfindbaren Mengen von Gegenständen dar (drei Äpfel, drei Häuser, dreiSandkörner usw.), die in dem Merkmal der gleichen Größe oder Mächtigkeitübereinstimmen. Die Null wird meist ebenfalls zur Menge der natürlichen Zah-len N gerechnet (sozusagen als Merkmal der leeren Menge).In der Mathematik werden die natürlichen Zahlen durch die sogenanntenPeano-Axiome definiert, s. Anh. A.55.Die Kardinalzahlen sind eine Verallgemeinerung der natürlichen Zahlen unddienen generell zur Definition der Mächtigkeit von Mengen, s. Anh. A.32.

A.35 Neuronale Netze und Neuronenfunktionen

Künstliche Neuronale Netze (KNN) dienen zur Modellierung des Verhal-tens Biologischer Neuronaler Netze (BNN). Die KNN können im wesentli-chen durch drei Merkmale bestimmt werden (s.u.), wobei hier drei grund-sätzlich verschiedene, aber repräsentative Typen von KNN behandelt werden:Backpropagation-Netze (BP), Hopfield-Netze (HN) und Kohonen-Netze (KN).Die wesentlichen Merkmale sind für die genannten Typen die folgenden:• Der Strukturgraph, der die Topologie des aus mehreren Neuronen beste-henden Netzes festlegt. Jedes Neuron hat mehrere Eingänge (Input-Verbindun-gen; diese entsprechen den Dendriten in einem BNN) und genau einen Aus-gang (eine Output-Verbindung; diese entspricht dem Axon eines Neurons ineinem BNN). Die Koten des Graphen stellen die Neuronen dar und die Kantendie Verbindungen zwischen den Neuronen. Die Stärke der Verbindung zwi-schen dem i-ten und dem j-ten Neuron des Netzes wird jeweils durch ein Ge-wicht wij ausgedrückt (wij = 0 bedeutet ‚keine Verbindung‘).

Page 30: Welträtsel aus Sicht der modernen Wissenschaften

30 A. Exkurs in die Welt der mathematischen Begriffe

BN: Hier sind die Neuronen in k parallelen Reihen angeordnet (auch Schichtenoder Layers genannt), wobei die erste Schicht nur Inputs von außen empfängtund nur die n-te Schicht Outputs nach außen abgibt. Ansonsten ist der Outputeines jeden Neurons der k-ten Schicht mit einem Input eines jeden Neuronsder (k+1)-ten Schicht verbunden (topologisch ist das also ein ‚Feedforward-Netz‘ kurz: FFN; die Bezeichnung ‚Backpropagation‘ bezieht sich nur auf dieRichtung der Fehlerfortpflanzung beim Trainieren des Netzes).HN: Dieses Netz besitzt nur eine Reihe bzw. Schicht von Neuronen, wobei dieOutputs eines jeden Neurons sowohl nach außen gegeben werden als auch alsInput für die anderen Neuronen dienen (sog. Rückkopplungsnetz mit symme-trischen Gewischten wij = wji und wii = 0).KN: Hier unterscheidet man eine Eingabeschicht von Neuronen, die nur zurAufnahme und zur identischen Weitergabe der Inputs dient, und eine Aus-gabeschicht. Die Neuronen der letzteren Schicht, denkt man sich am bestenin einem quadratischen Gitter angeordnet. Sie erhalten ihre Inputs von jedemNeuron der Eingabeschicht. Die Neuronen der Ausgabeschicht sind nicht mit-einander verbunden, stattdessen ist eine Funktion für den ‚Abstand‘ gij zwi-schen dem i-ten und dem j-ten Neuron definiert. Gewichte wij sind jeweilszwischen dem i-ten Eingabeneuron und dem j-ten Ausgabeneuron definiert.• Die Neuronenfunktion, welche die Wirkungsweise des Neurons mathema-tisch beschreibt. Sie besteht aus drei Komponenten:(1) der Inputfunktion, die den Nettoinput neti für das i-te Neuron Ni bestimmt.Hier kann man für alle drei Netztypen BN, HN und KN die gewichtete Summeder k Inputs ej von Ni nehmen: neti =

∑kj=1 wij · ej (auf die Doppelindizie-

rung der Inputs wurde hier verzichtet). Der Nettoinput nach dieser Formel lässtsich auch als Skalarprodukt neti = wi · e aus Gewichtsvektor wi und Inputvek-tor e des i-ten Neurons schreiben. Die Besonderheit der HN besteht darin, dassals Inputs ej nur die Werte +1 oder -1 zugelassen sind. Bei den KN wird vor-ausgesetzt, dass Gewichtsvektor wi und Inputvektor e normiert sind.(2) der Aktivierungsfunktion. Sie berechnet den Aktivierungszustand ai desNeurons Ni. Hierfür kommen verschiedene Funktionen in Frage, z.B.:

– Schwellwertfunktionen wie ai ={

1 falls neti ≥ θi (mit Schwellwert θi)0 sonst

– Sigmoide Funktionen, wie die Fermifunktion: ai = sF (neti) = 11+e−neti/T

Für die BN wird wegen der erforderlichen Differenzierbarkeit der Aktivie-rungsfunktion bevorzugt die Fermifunktion eingesetzt (keine Schwellwert-funktion!). Bei HN und KN gilt ai = neti.(3) der Outputfunktion. Diese bestimmt den Output oi des i-ten Neurons Ni,

Page 31: Welträtsel aus Sicht der modernen Wissenschaften

A.35 Neuronale Netze und Neuronenfunktionen 31

der bei den BN gleich der Aktivierung gesetzt wird, also oi = ai.Die HN arbeiten dagegen nur mit den binären Ausgabewerten +1 und -1. Des-halb wird als Outputfunktion die Signumfunktion sgn(x) verwendet:oi = sgn(ai) =

{1−1

fürfür

aiai>≤

00

Bei den KN wird der Output nach dem „Winner-Takes-all“-Prinzip ermittelt:

ok =

{ak, wenn ak = max

j(aj) (j indiziert alle Neuronen)

0 sonstAlle Outputs (außer dem des Gewinnerneurons) werden also auf Null gesetzt.• Das Lernverfahren legt schließlich fest, wie die Gewichte eingestellt

werden.4,In diesem Zusammenhang sind zwei Grundtypen zu unterscheiden: Das über-wachte Lernen und das nichtüberwachte Lernen. Während die BN zu ersteremgehören und die KN zu letzteren, nehmen die HN eine Zwischenstellung ein.Die HN werden nämlich in einer Vorbereitungsphase ‚belehrt‘, indem die Ge-wichte zu Beginn voreingestellt werden.Grundlage für das Lernen bzw. Einstellen der Gewichte ist für BN und HNeine Trainingsmenge von m Paaren von Vektoren (es, os), mit 1 ≤ s ≤ m, wo-bei os = {os1, os2, . . . , osk} der Vektor der gewünschten Outputs (Solloutputs)des Netzes bei vorgegebenem Vektor der Inputs es = {es1, es2, . . . , esn} ist. Dertatsächlich beim Input e vom Netz gelieferte Output wird im Unterschied zumSolloutput o schlicht mit o (ohne Überstreichung) bezeichnet.

Überwachtes Lernen bei den BN: Die Grundidee besteht darin, einen (qua-dratischen) Gesamtfehler des KNN zu definieren: E = 1

2

∑ms=1(o

s − os)2.Dieser ist vermöge der Outputfunktion abhängig von allen Gewichten wij desNetzes. Wenn man den Fehler E in einem mehrdimensionalen Koordinatensy-stem als Funktion über diesen wij darstellt, erhält man ein Fehlergebirge. DasZiel ist es nun, diesen Fehler E zu minimieren, indem man in diesem Gebir-ge einen Gradientenabstieg durchführt (Suche nach Minima bzw. Tälern). Diemathematische Durchführung dieses Prozesse liefert schließlich die erweiter-te Delta-Regel: ∆wij = η · oj · δi für die Änderung der Gewichte in einemLernschritt. Dabei ist η eine frei wählbare Lernrate, welche die Geschwindig-keit des Lernens bestimmt. Im folgenden verzichten wir auf den oberen Indexs und betrachten nur immer ein Paar (e, o). Für die Outputschicht des BN istδi einfach eine Funktion der Differenzen (oi - oi). Für die inneren Schichten

4 Ausgangspunkt der Überlegungen zum Lernen von KNN ist eine von dem PsychobiologenDonald O. Hebb aufgestellte Regel, die Hebbsche Lernregel, welche eine Aussage zur Ver-änderung ∆wij der Stärke der synaptischen Verbindungen in Neuronalen Netzen trifft. Siekann mathematisch wie folgt ausgedrückt werden: ∆wij = η · ai · oj mit η – Lernrate, ai– Aktivierung des i-ten Neurons, oj – Output des j-ten Neurons und ∆wij – synaptischeVerbindugsstärke (Gewicht) zwischen i-tem und j-tem Neuron.

Page 32: Welträtsel aus Sicht der modernen Wissenschaften

32 A. Exkurs in die Welt der mathematischen Begriffe

berechnet sich das δi komplizierter mit Hilfe aller Gewichte wki und δk derjeweils eine Stufe weiter zum Ausgang hin liegenden Schicht (k läuft über al-le Neuronen dieser Schicht). – Das Training läuft nun so ab, dass jeweils beiAnlegen eines Trainigsmusters die Gewichte nach der Delta-Regel verändertwerden, wobei die sich immer weiter verringernden Unterschiede zwischenSoll- und Ist-Ausgabe δi bei jedem Trainingsschritt von der Outputschicht inRichtung Inputschicht nach einer genau definierten Vorschrift rückwärts durchdas Netz fortgepflanzt werden (deshalb der Name Backpropagation).

Nichtüberwachtes Lernen bei den KN: Das „Winner-Takes-all“-Prinzip ausder Outputfunktion der KN lässt sich zusammen mit der oben erhobenen For-derung, dass die Gewichtsvektoren wi und der Inputvektor e bei KN normiertsein müssen, ausdrücken durch ai = wi · e = Maximum! (für alle Neuronen,wobei i die Neuronen nummeriert). Es lässt sich leicht zeigen, dass sich darausdas Zentrum der Erregung (das Gewinnerneuron mit der Nummer k) ermittelnlässt durch Berechnung der minimalen Differenz: ‖wk−e‖ = minj ‖wj −e‖.

Voreinstellung der Gewichte bei den HN: Bei einem HN mit N Neuronen,das m Standardmuster es erkennen, d.h. die hierzu gehörigen Solloutputs os

für 1 ≤ s ≤ m liefern soll, werden die Gewichte wie folgt vorgegeben (dasVerhältnis α = m/N ist ein Indikator für die ‚Speicherkapazität‘ des HN):

wij =

1N

m∑s=1

o si osj für i 6= j

0 für i = jDiese Festlegung lässt sich aus der Definition einer ‚Energiefunktion‘ für dasHopfield-Netz ableiten, die derjenigen für Spingläsern in der Physik nachgebil-det ist. Die Berechtigung für dieses Herangehen kann mit der Ähnlichkeit derCharakteristika von HN mit Isospin-Systemen begründet werden. Die Werteder Spins können wie die der Inputs/Outputs von HN nur +1 oder -1 sein. Auchdie Bedingungen für die Gewichte wij der HN entsprechen den Eigenschaftender Kopplungsstärken wij von Spins (Symmetrie: wij = wji und Verbot derSelbstkopplung: wii = 0). Das HN arbeitet so, dass man zum Zeitpunkt t = 0einen bestimmten Input x(0) = {x1(0), . . . , xN (0)} anlegt, und den dazugehö-rigen Output berechnet, der wegen der im HN gegebenen Rückkopplung zumInput zum Zeitpunkt t+1 wird (deshalb verwenden wir für Input und Output dieneutrale Variable x). Der Wert von x zum Zeitpunkt t+1 berechnet sich entspre-

chend der Outputfunktion iterativ wie folgt: xi(t+ 1) = sgn

(N∑j=1

wijxj(t)

)Das Verfahren konvergiert nach einer bestimmten Anzahl von Iterationen undman erhält als Ausgabe nach Konvergenz: o′ = {x1 ′, x2 ′, . . . , xN ′ }. Dassdas Verfahren tatsächlich konvergiert, kann man intuitiv dadurch verstehen,

Page 33: Welträtsel aus Sicht der modernen Wissenschaften

A.37 Operator, Operation, Transformation 33

dass physikalische Systeme mit einer definierten Energie (und HN sind diesennachgebildet) von selbst einem Energieminimum zustreben. Es lässt sich zei-gen, dass sich mit obiger Gewichtsfestlegung Minima im ’Energiegebirge’ derHN bilden (sogenannte Attraktoren), in denen bei diesem Iterationsverfahrenjeweils entsprechende Mustervektoren os zusammen mit den ihnen ähnelndenMustern „landen“.

A.36 Newtonsche Mechanik (Klassische Mechanik)

Die Newtonsche Mechanik, auch klassische Mechanik genannt, wird im we-sentlichen durch die nachstehenden Newtonschen Gesetze charakterisiert:a) Jeder Körper beharrt in Ruhe oder in gleichförmiger Bewegung, solangekeine Kraft auf ihn einwirkt.b) Kraft gleich Masse mal Beschleunigung: K = m ·d2x

dt2

c) Jede Einwirkung einer Kraft K ruft das Auftreten einer gleich großen Ge-genkraft K’ hervor, es gilt also: K = - K’ (vektoriell: die beiden Kräfte habenden gleichen Betrag, aber genau entgegengesetzte Richtung).Von besonderer Wichtigkeit für die klassische Physik und insbesondere dieHimmelsmechanik (Keplersche Gesetze) ist das von Newton aufgestellte

Gravitationsgesetz: K = G · m1· m2r2

(G ist die Gravitationskonstante)Dieses bestimmt die Stärke, mit der sich zwei punktförmig gedachte Massenm1 und m2 anziehen, die sich im Abstand r voneinander befinden.

A.37 Operator, Operation, Transformation

Unter einer Operation versteht man die Anwendung einer Vorschrift (auchOperator oder Transformation genannt) auf ein oder mehrere Argumente. DieZahl der für einen Operator bzw. eine Operation vorgeschriebenen Argumen-te wird als dessen bzw. deren Stelligkeit bezeichnet. Damit ist der Begriff derOperation weitgehend synonym mit dem der Abbildung (s. Anh. A.1), wo-bei bei einer Operation eher die Auffassung im Vordergrund steht, dass derentsprechende Operator je nach Stelligkeit aus ein oder mehreren mathemati-schen Objekten ein anderes mathematisches Objekt erzeugt.Eine zweistellige Operation ◦ über einer Menge A heißt kommutativ, wenn füralle a, b, c ∈ A gilt: a ◦ b = b ◦ a. Die Operation wird assoziativ genannt, wenngilt (a ◦ b) ◦ c = a ◦ (b ◦ c). Zwei Operationen ◦ bzw. � nennt man distributiv,

Page 34: Welträtsel aus Sicht der modernen Wissenschaften

34 A. Exkurs in die Welt der mathematischen Begriffe

wenn die folgenden Gleichungen gelten a ◦ (b � c) = (a ◦ b) � (a ◦ c) bzw. a �(b ◦ c) = (a � b) ◦ (a � c).Beispiele für Operatoren, die eine große Bedeutung für die Quantentheorie ha-ben, sind der Energieoperator i~ ∂

∂t und der Impulsoperator −i~ ∂∂x (sie sind

gedanklich auf eine rechts stehende Wellenfunktion anzuwenden). Im dreidi-mensionalen Fall ist die Differentialoperation nach einer Variablen x (ausge-drückt durch den Operator ∂

∂x ) durch den Nabla-Operator ∇ = ( ∂∂x ,∂∂y ,

∂∂z )

zu ersetzen, und die zweifache Differentialoperation ∂2

∂x2durch den Laplace-

Operator ∆ = ( ∂2

∂x2+ ∂2

∂y2+ ∂2

∂z2), dabei ist ∆ f das Gleiche wie ∇(∇ f) oder

∇2 f.Typische Operationen, die in mathematischen Räumen, insbesondere im

dreidimensionalen Vektorraum durchgeführt werden, sind Translationen (Ver-schiebungen) entlang bestimmter Achsen oder Drehungen um diese Ach-sen sowie Spiegelungen. Solche Operationen bzw. Transformationen könnendurch Vektor- bzw. Matrixoperationen beschrieben werden, s. Anh. A.52 bzw.A.31.

A.38 PhasenraumIn der Hamiltonschen Mechanik (s. Anh. A.20) dient der Phasenraum zur Be-schreibung der Dynamik eines Teilchensystems. Er ist derjenige Raum, derdurch die Ortsvektoren qi und die Impulsvektoren pi aller n Teilchen des Sy-stems aufgespannt wird (d. h. der Index i läuft von von 1 bis n). Für ein solchesSystem aus n Teilchen besitzt der zugehörige Phasenraum demnach 6n Dimen-sionen. Die Punkte des Phasenraums heißen auch Mikrozustände (im Gegen-satz zu den makroskopisch beobachtbaren Zuständen des Gesamtsystems). Diezeitliche Entwicklung des Systems stellt eine Trajektorie, d.h. eine Art „Le-bensweg“, im Phasenraum dar. Die Beschreibung eines Systems von Teilchenim Phasenraum und die Unterscheidung von Mikro- und Makrozuständen istwichtig für das Verständnis der Entropie.

A.39 PolynomUnter einem Polynom n-ten Grades Pn(x) (n ≥ 0) in der Variablen x verstehtman die endliche Summe Pn(x) =

∑ni=0 anx

n = a0+a1x+a2x2+ . . .+anx

n.Die ai heißen Koeffizienten und sind beliebige komplexe Zahlen. Die n Lösun-gen {w1, w2, . . . , wn} der Gleichung Pn(x) = 0 nennt man Wurzeln dieses Po-lynoms, s. hierzu den ‚Fundamentalsatz der Algebra‘ in Anh. A.2. Auf dieser

Page 35: Welträtsel aus Sicht der modernen Wissenschaften

A.41 Primzahlen 35

Grundlage lässt sich zeigen, dass sich das Polynom Pn(x) in n Linearfakto-ren zerlegen lässt, d.h. es gilt: Pn(x) = an

∏ni=1(x−wi). Die Faktorzerlegung

von Polynomen spielt eine wichtige Rolle bei der Behandlung von rationalenFunktionen R(x) = Pn(x)/Pm(x), insbesondere bei deren Integration (s. Anh.A.24). Eine solche Funktion R(x) ist als Quotient zweier Polynome definiert.

A.40 Potenzen, Potenzreihen

Die Berechnung der n-ten Potenz einer Zahl a (der sogenannten Basis) ist einemathematische Operation (Symbol: an), die als n-maliges Multiplizieren derZahl a mit sich selbst definiert ist. Also an = a · a . . . · a (n mal). Die in derSchreibung hochgestellte Zahl n heißt Exponent.Beispiele: 101 = 10, 102 = 100, 103 = 1000 usw.Die negative Potenz (Symbol: a−n) bezeichnet einfach den Kehrwert von an,d.h. a−n = 1 / an. Als Definition wird festgelegt: a0 = 1.Beispiele: 10−1 = 0,1, 10−2 = 0,01, 10−3 = 0,001 usw.Ein positiver Exponent gibt bei den Zehnerpotenzen also die Nullen vor demKomma und ein negativer Exponent die Stellen nach dem Komma an.Eine Potenzreihe ist eine unendliche Reihe (s. Anh. A.3) der Gestalt:P(x) =

∑∞n=0 an(x−x0)n, wobei x und x0 beliebige reelle Zahlen sein können

(x0 heißt ‚Entwicklungsstelle‘ der Potenzreihe). Potenzreihen können genutztwerden, um eine Funktion f(x) an einer interessierenden Stelle x0 zu untersu-chen bzw. zu approximieren. Hierzu verwendet man spezielle Potenzreihen,die sogenannten Taylorreihen, bei denen die Koeffizienten an die folgende Ge-stalt haben: an = f (n)(x0)

n! (fn(x0) bezeichnet dabei die n-te Ableitung derFunktion f(x) an der Stelle x0, s. Anh.A.6).

Mit Hilfe von Potenzreihen lassen sich sogar Funktionen über Matrizenund anderen mathematischen Größen definieren, s. Anh. A.7.

A.41 Primzahlen

Eine Primzahl ist eine natürliche Zahl, die nur durch sich selbst und durchEins teilbar ist. Beispiele: 1, 2, 3, 5, 7, 11, 13, . . . Ein grundlegender Satz derZahlentheorie besagt, dass sich jede natürliche Zahl (bis auf die Reihenfolge)eindeutig in Primzahl-Faktoren zerlegen lässt. Beispiele für solche Zerlegun-gen sind: 4 = 2 · 2, 6 = 2 · 3, 8 = 2 · 2 · 2, 999 = 3 · 3 · 3 · 37 usw.Bemerkenswert ist, dass es keine größte Primzahl gibt (Satz von Euklid), wassich übrigens relativ leicht mit einem indirekten Beweis zeigen lässt.

Page 36: Welträtsel aus Sicht der modernen Wissenschaften

36 A. Exkurs in die Welt der mathematischen Begriffe

A.42 Raum, mathematischerEin Raum ist in der Mathematik eine Menge M, auf der durch bestimmte Rela-tionen bzw. Verknüpfungen (s. Anh. A.45) eine Struktur definiert ist. Das kanneine algebraische Struktur sein (s. Anh. A.2), eine Struktur, die durch eine Ord-nungsrelation gegeben ist, oder eine topologische Struktur (sog. topologischeRäume). Je nachdem, von welcher Art die Elemente von M sind, unterscheidetman: Vektorräume (M ist eine Menge von Vektoren, s. Anh. A.52), Funktio-nenräume (M ist eine Menge von Funktionen, s. Anh. A.21) u.a., wobei diebeiden zuletzt genannten für die Physik eine besonders wichtige Rolle spielen.Ein metrischer Raum, ist ein Raum, auf dem ein Abstandsmaß (eine Distanz-funktion) mit bestimmten, axiomatisch festgelegten Eigenschaften definiert ist.Der Begriff der Dimension eines Raumes ist nicht einheitlich definiert. Für un-sere Zwecke genügt es, zu sagen, dass dies die Anzahl der Bestimmungsstückeist, die zur eindeutigen Charakterisierung der Elemente des Raums benötigtwerden. Im Falle eines Vektorraums ist dies die Anzahl der Komponenten derVektoren dieses Raums, s. Anh. A.52.Der uns vertraute Ortsraum kann z.B. durch eine Menge von Punkten in einemdreidimensionalen Koordinatensystem (s. Anh. A.26) mit den Koordinaten x,y, z und einem speziellen Abstandsmaß dargestellt werden, wobei jeder Punkteinem Vektor v = (x, y, z), oder anschaulich einem Pfeil vom Ursprung des Ko-ordinatensystems zu diesem Punkt entspricht. Dieser uns vertraute Ortsraumbesitzt eine Euklidische Geometrie (s. Anh. A.14). Der Abstand ds zwischenzwei Punkten, deren Koordinaten sich um die infinitesimalen Werte dx, dy, dzunterscheiden (das ist die Länge eines Linienelements), beträgt in dieser Geo-metrie ds =

√dx2 + dy2 + dz2. Der Raum unserer alltäglichen Anschauung

ist also ein spezieller metrischer und euklidischer Vektorraum.Die vierdimensionale Raumzeit der SRT (s. Anh. A.46) besitzt hingegenkeine Euklidische Geometrie, da dort der Abstand definiert ist durch ds =√dx2 + dy2 + dz2 − c2dt (sog. Minkowski-Raum). Entscheidend für die

Geometrie ist die Vorzeichenkombination (+, +, +, -) der vier Summanden immathematischen Ausdruck für ds (auch Signatur genannt). Diese ist verschie-den von derjenigen einer Euklidischen Geometrie mit Signatur (+, +, +, +).5

Allgemein wird die Metrik eines Vektorraumes, in dem ein Abstandsmaß de-finiert ist, mit Hilfe des metrischen Tensors gab definiert (s. auch Anh. A.46).

5 Früher wurde in der SRT statt des Zeitparameters t auch der imaginäre Parameter t = ict ver-wendet, um eine einheitliche Darstellung für die Raum- und Zeitkomponenten zu gewinnen.Damit erhält man dann für die Länge des Linienelements ds =

√dx2 + dy2 + dz2 + dt2.

Bei dieser Transformation sieht man deutlich, dass die Zeit als imaginäre Komponente in dieVektordarstellung der Raumzeit eingeht. Es ist eine Sache der Konvention, ob man mit demZeitparameter t oder dem imaginären Parameter t = ict arbeitet.

Page 37: Welträtsel aus Sicht der modernen Wissenschaften

A.44 Reihenentwicklung 37

Damit ergibt sich: ds2 = gab dxa dxb, wobei xa und xb die Komponenten vonzwei Vektoren des betreffenden Raums sind (nach Einsteinscher Summations-konvention ist in dieser Formel über gleich benannte Indizes zu summieren).Im Fall der Euklidischen Geometrie (die ja keine Raumkrümmung aufweistund deshalb ‚flach‘ genannt wird) gilt: gab = 1, wenn die Indizes a und b gleichsind, sonst gilt gab = 0. In einem Raum mit einer solchen Geometrie, der auchEuklidischer Raum genannt wird, ist also das Abstandsmaß über das Skalar-produkt oder genauer die Norm eines Vektors definiert, s. Anh. A.52.

A.43 Reelle Zahlen

Die Menge R der reellen Zahlen umfasst zwar die rationalen Zahlen, enthätaber Zahlelemente, die nicht als Bruch von zwei ganzen Zahlen darstellbarsind (aber z.B. als unendliche, nichtperiodische Dezimalzahlen, wie die Zahlπ oder die Eulersche Zahl e; diese nennt man irrationale Zahlen). Die reeellenZahlen lassen sich auf einer Geraden (der sogenannten Zahlgeraden) darstel-len, wobei jeder Punkt der Geraden einer reellen Zahl entspricht. Erstaunlichist, das sich zwar zwischen je zwei gegebene, beliebig nahe aneinander liegen-de rationale Zahlen (z.B. dargestellt als Dezimalbrüche) immer noch weitererationale Zahlen einfügen lassen. Trotzdem liegen erst die reellen Zahle überalldicht auf der Geraden, d.h. wenn man sich einen ideal spitzen Zirkel vorstellenkann, mit dem man auf die Zahlengerade sticht, dann trifft man immer auf einereelle Zahl, die aber nicht unbedingt eine rationale Zahl sein muss (z.B.

√2). –

Jede reelle Zahl lässt sich aber beliebig genau durch rationale Zahlen annähern.Das ist übrigens auch der Grund, weshalb wir auf dem Rechner sehr genaueLösungen für Probleme finden können, die eigentlich reelle Zahlen oder garkomplexe Zahlen für ihre Darstellung verlangen, obwohl wir auf dem Rech-ner nur mit rationalen Zahlen (genauer mit endlichen Dezimalzahlen) arbeitenkönnen.

A.44 Reihenentwicklung

Siehe unter den Stichwörtern: Potenzreihe, s. Anh. A.40, (dort insbesondere:Taylorreihe) und Fourierreihe, s. Anh. A.11.

Page 38: Welträtsel aus Sicht der modernen Wissenschaften

38 A. Exkurs in die Welt der mathematischen Begriffe

A.45 Relationen

Der Begriff der Relation repräsentiert in der Mathematik bzw. in der Logikdas, was man umgangssprachlich als Beziehung bezeichnet. Zur Definition ei-ner n-stelligen Relation Rn nimmt man an, dass n Mengen A1, A2, ..., An, diesogenannten Trägermengen von Rn, gegeben seien.Die Menge Dn aller Tupel <x1, x2, ..., xn> mit x1 ∈ A1, x2 ∈ A2, ..., xn ∈ An

bezeichnet man als Kartesisches Produkt dieser Mengen und schreibt dafür:Dn = A1 × A2 × ... × An. Eine Relation Rn ist dann definiert als spezielleTeilmenge von Dn, d.h. Rn ⊆ Dn. Sie ist etwas anders ausgedrückt durch dieKombinationen derjenigen Elemente aus den Trägermengen gegeben, für diediese Relation erfüllt bzw. wahr ist (sogenannte extensionale Definition).Ein Prädikat oder eine Eigenschaft ist in dieser formalen Sicht eine ‚einstelli-ge Relation‘. Wenn es genau ein Element xn ∈ An gibt, dass mit <x1, x2, ...,xn−1> in der Relation Rn steht, dann nennt man die Relation rechtseindeutigoder eine Funktion. Anders ausgedrückt: eine (n-1)-stellige Funktion kann im-mer als n-stellige Relation aufgefasst werden (das Umgekehrte gilt i.a. nicht).Eine zweistellige Relation R(x, y) ⊆ A × B heißt symmetrisch, wenn für al-le x ∈ A und y ∈ B gilt: R(x y) = R(y, x). Sie ist reflexiv, wenn R(x, x) gilt,und transitiv, wenn aus R(x, y) und R(y, z) folgt: R(x, z). Eine zweistelligeRelation, die alle drei dieser Eigenschaften hat, nennt man Äquivalenzrelation.

A.46 Relativitätstheorie

Wie bereits im Text erläutert, besteht die Relativitätstheorie aus zwei Teilberei-chen, die mit den jeweils charakteristischen Formeln und Grundsätzen nach-stehend aufgeführt sind:(1) Die Spezielle Relativitätstheorie (SRT)• c = const. (Konstanz der Lichtgeschwindigkeit c = 300.000 km/s)• E0 = m · c2 (Äquivalenz von Masse und (Ruhe-)Energie)

• E = m · c2/√

1− v2

c2(Relativistische Energie)

Wenn m die Masse eines ruhenden Objekts O ist, dann ist die Energie von O,wenn es mit der Geschwindigkeit v bewegt wird, um den sogenannten Lorentz-

Faktor 1 /√

1− v2

c2größer als diejenige des ruhenden Objekts, vgl. die vor-

hergehende Formel (man beachte, dass 1 - v2

c2nach der SRT immer kleiner als 1

ist). Mitunter wird auch der Ausdruck mr = m /√

1− v2

c2zur Abgrenzung von

der Ruhemasse m (etwas problematisch) als relativistische Masse bezeichnet.

Page 39: Welträtsel aus Sicht der modernen Wissenschaften

A.46 Relativitätstheorie 39

Man sieht an der Formel, dass man eine unendliche Energie aufwenden müss-te, um ein massebehaftetes Objekt auf Lichtgeschwindigkeit zu beschleunigen(Grenzübergang: v→ c), was natürlich unmöglich ist. Nur Teilchen mit Ruh-masse Null fliegen mit Lichtgeschwindigkeit, und zwar immer.

• ∆t’ = ∆t ·√

1− v2

c2(Zeitdilatation)

Die Zeitspanne ∆t’ zwischen zwei Ereignissen, die in einem mit der Ge-schwindigkeit v bewegtem Koordinatensystem K’ gemessen wird, ist kleinerals die Zeitspanne ∆t, die in einem im Vergleich dazu ruhenden Koordinaten-system gemessen wird (d.h. die Uhren gehen im bewegten Bezugssystem K’langsamer; die Zeit wird dort ‚gedehnt‘).

• ∆l’ = ∆l ·√

1− v2

c2(Längenkontraktion)

Sei S eine Strecke oder ein Abstand (z.B. ein Stab) der Länge ∆l, die in ei-nem fest mit S verbundenen (ruhenden) Koordinatensystem K gemessen wird.Dann wird die Länge ∆l’ von S in einem längs zu S mit der Geschwindig-keit v bewegten Koordinatensystem K’ durch die zuletzt angeführte Formelbestimmt. Das bedeutet, dass der Stab aus Sicht des bewegten Koordinatensy-stems K’ um den angegebenen Faktor kürzer ist.Das Verhältnis zwischen den Messgrößen der Raumzeit in verschiedenenKoordinatensystemen wird durch die sogenannte Lorentz-Transformation be-stimmt. Diese findet auch in den Formeln für die Zeitdilatation und die Län-genkontraktion ihren Ausdruck.(2) Die Allgemeine Relativitätstheorie (ART)Die ART beruht auf dem Postulat der Äquivalenz von träger und schwererMasse. Nach dieser Theorie ist die Gravitation als Auswirkung der Verände-rung der Raumgeometrie6 durch anwesende Massen bzw. Energien zu deuten.

Der mathematische Zusammenhang ist durch die Einsteinschen Feldglei-chungen gegeben, die im Rahmen einer besonderen Tensoralgebra formuliertwerden (s. Anh. A.49):

Rab - 12 · gab · R + Λ gab = 8πG

c4· Tab mit

Rab – Ricci-Tensor, er ist ein Maß für die Raumkrümmung, die sich imallgemeinen von Raumpunkt zu Raumpunkt ändert;

gab – metrischer Tensor; er bestimmt Abstände und Winkel in einemmetrischen Raum (s. Anh. A.14);

Tab – Energie-Impuls-Tensor, er beschreibt die Energie-Impulsdichte unddamit insbesondere die Massenverteilung im Raum;

sowie die reellen Zahlen (Skalare): G – Gravitationskonstante, c – Lichtge-

6 Wenn hier verkürzt von ‚Raumgeometrie‘ gesprochen wird, geht es in der ART wie in derSRT immer um die vierdimensionale Raumzeit, also um einen abstrakten mathematischenRaum.

Page 40: Welträtsel aus Sicht der modernen Wissenschaften

40 A. Exkurs in die Welt der mathematischen Begriffe

schwindigkeit und R – Ricci Krümmung (eine Größe, die aus Rab mit Hil-fe einer Tensoroperation abgeleitet wird, die man Verjüngung nennt) und dieKosmologische Konstante Λ (s. Kap. 3.2 im Buch).

Die Einsteinschen Feldgleichungen sind zwar sehr kompakt geschrieben,aber äußerst schwierig zu lösen. Zum einen haben die oben angegeben Ten-soren 2. Stufe wegen der 4 Dimensionen der Raumzeit, das sind Länge, Brei-te, Höhe (bezüglich der Ortskoordinaten) und der Zeit als vierter Dimension,formal 4 · 4 = 16 Komponenten. Diese Komponenten sind allerdings wegeneinzuhaltender Symmetriebedingungen nicht unabhängig voneinander. Außer-dem enthalten die Tensoren der linken Seite partielle Differentialoperatoren (s.Anh. A.6), so dass man es insgesamt mit einem komplexen System von 10miteinander gekoppelten partiellen Differentialgleichungen zu tun hat.

A.47 Schrödingergleichung

Die Schrödingergleichung SGL ist das fundamentale Gesetze der von ErwinSchrödinger formulierten Wellenmechanik. Letztere ist wiederum äquivalentzu der von Werner Heisenberg formulierten Matrizenmechanik, s. Anh. A.31.Beide zusammen stellen gleichwertige Formulierungen der grundlegenden Ge-setzmäßigkeiten der Quantentheorie dar.

Hψ = i~∂ψ

∂t(SGL)

Die SGL enthält die folgenden Größen: H – Hamiltonoperator (s. Anh. A.20),~ = h

2π – reduziertes Plancksches Wirkungsquantum und ψ – Wellenfunktion.Die Wellenfunktion ψ beschreibt die Dynamik eines quantenmechanischenSystems (z.B. eines Atoms oder eines Moleküls) und ist abhängig von denOrtskoordinaten der beteiligten Quantenobjekte (im Beispiel der Atomkerneund der Elektronen) sowie von der Zeit t. Die SGL gilt jedoch nur für dennichtrelativistischen Fall. Sie wurde später von Dirac unter Einbeziehung desSpins zur Behandlung von Fermionen (diese haben einen Spin 1/2) und un-ter Berücksichtigung der Relativitätstheorie zur sogenannten Dirac-Gleichungverallgemeinert. Die entsprechende relativistische Gleichung für Teilchen mitSpin 0, das sind Bosonen, ist die sogenannte Klein-Gordon-Gleichung.

A.48 Symmetrie

Unter Symmetrie versteht man die Eigenschaft eines Objekts oder eines Sy-stems von Objekten, bei Anwendung einer bestimmten Operation oder Trans-

Page 41: Welträtsel aus Sicht der modernen Wissenschaften

A.49 Tensor 41

formation (s. Anh. A.37) in sich selbst überzugehen. Typische Symmetrie-Operationen sind Spiegelungen an einer Ebene (Spiegelsymmetrie) oder Dre-hungen (Rotationssymmetrie). Eine Kugel ist zum Beispiel sowohl spiegel-symmetrisch (Invarianz gegenüber Spiegelungen an einer beliebigen Ebene,die durch den Mittelpunkt geht) als auch rotationssymmetrisch (Invarianz ge-genüber beliebigen Drehungen um eine Achse durch den Mittelpunkt). Sie be-sitzt also einen sehr hohen Grad an Symmetrie, die wir gegenständlich nennenwollen. Es gibt aber auch Symmetrien, die nicht so anschaulich sind und –wie z.B. die internen Symmetrien in den Feldtheorien der Physik aus Kap.2.3 im Buch – nur mit abstrakten mathematischen Mitteln, genauer mit Hil-fe der Gruppentheorie, beschrieben werden können. Diese bezeichnen wir imKontrast zum oben Gesagten als abstrakte Symmetrien. Der Vorzug der Grup-pentheorie besteht gerade darin, dass sie generell das Instrumentarium zur Be-schreibung von Symmetrien liefert, ganz gleich ob es sich um gegenständlich-anschauliche oder abstrakte Symmetrien handelt (s. Anh. A.19).

A.49 Tensor

Der Begriff Tensor stammt im Gegensatz zu vielen anderen mathematischenKonzepten aus der Physik, da er es u.a. gestattet, die Beziehungen zwischenSpannungen (Tensionen) und Dehnungen in Körpern kompakt zu beschreiben.Aus algebraischer Sicht ist ein Tensor T ein Operator, der in einem VektorraumV (s. Anh. A.52) der Dimension n definiert ist, und auf r Vektoren einwirkt.Er stellt eine lineare Beziehung zwischen den r Vektoren her und kann auchals Funktion von r vektoriellen Argumenten T(v1,v2, . . . vr) in diesem Vek-torraum aufgefasst werden. r nennt man Stufe des Tensors oder mitunter auchRang (beide Begriffe werden allerdings in der Mathematik gelegentlich alsvoneinander verschieden aufgefasst). T ist primär eine abstrakte Größe, die al-lein durch ihre algebraischen Eigenschaften definiert werden kann. So mussz.B. für einen Tensor T der Stufe 2 gelten:T(v1 + k· v2, v3) = T(v1,v3) + k·T(v2,v3), wobei k eine komplexe Zahl ist (Tist also ein linearer Operator, der distributiv gegenüber der Addition ist).In der Physik wird gegenüber dieser Charakterisierung eine Komponentendar-stellung bevorzugt. Diese hat zwar den Vorteil, nicht so abstrakt wie die reinalgebraische Behandlung zu sein, dafür ist sie aber im Gegensatz zu letzterervom gewählten Koordinatensystem abhängig (vgl. hierzu Anh. A.26). Wenn B= {b1, b2 , . . . bn}⊂ V eine Basis des Vektorraums V ist, erhält man die Kom-ponentendarstellung von T wie folgt. Zwei Vektoren u und v aus V lassen sichmit Hife von B darstellen durch: u = (u1b1 + u2b2 + . . . + unbn) = uibi (der

Page 42: Welträtsel aus Sicht der modernen Wissenschaften

42 A. Exkurs in die Welt der mathematischen Begriffe

letzte Ausdruck verwendet die Einsteinsche Summenkonvention, nach welcherüber doppelt vorkommende, d.h. gleich benannte, Indizes zu summieren ist).Analog gilt dann: v = (v1b1 + v2b2 + . . . + vnbn) = vibi.An dieser Darstellung ist hervorzuheben, dass hier für die Bezeichnung derVektorkomponenten ui bzw. vi obere Indizes verwendet wurden. Im Rahmender Tensoralgebra werden für die Darstellungen verschiedenste Koordinaten-systeme verwendet, auch solche, die keine Orthonormalbasis (s. Anh. A.52)besitzen, was insbesondere für die Anwendung in der Relativitätstheorie wich-tig ist (s. Anh. A.46). In diesem Fall muss man zwei Arten von Vektoren unter-scheiden: kontravariante Vektoren, deren Komponenten sich bei einer Trans-formation des Koordinatensystems (sagen wir durch eine Drehung um einenbestimmten Winkel α) entgegengesetzt zu der Transformation der Basisvek-toren verhalten (die Komponenten werden entsprechend einer Drehung um -αtransformiert, wodurch der Vektor selbst insgesamt unverändert bleibt). DieKomponenten solcher Vektoren werden mit oberen Indizes gekennzeichnet.Demgegenüber gibt es aber Vektoren, wie z.B. den Gradienten einer skalarenFunktion (so weit ist eben der Vektorbegriff gefasst), die sich in gleicher Wei-se (kovariant) wie die Basisvektoren transformieren. Die Komponenten dieserVektoren, die man Kovektoren oder kovariante Vektoren nennt, werden mit un-teren Indizes gekennzeichnet. – Setzt man die obige Komponentendarstellungfür u und v in die Operatoranwendung T(u,v) ein, so erhält man die Glei-chung: T(u,v) = T(uibi, vjbj) = ui vjT(bi, bj) = uivj Tij , wobei die Tij =T(bi, bj) die Komponenten des Tensors T der Stufe 2 sind. Wie man sieht,entspricht die Anzahl der Indizes in der Komponentendarstellung (hier 2) derStufe des Tensors. Außerdem erkennt man, dass sich jeder Tensor zweiter Stu-fe in einem n-dimensionalen Vektorraum als (n, n)-Matrix darstellen lässt (dasUmgekehrte gilt übrigens nicht, da nicht jede Matrix als Tensor aufgefasst wer-den kann, weil Tensoren bestimmten Transformationsbedingungen unterwor-fen sind, s.u.). Man kann also insofern eine Hierarchie der Verallgemeinerun-gen feststellen, dass man Tensoren 0-ter Stufe als Skalare, Tensoren 1-ter Stu-fe als Vektoren und Tensoren 2-ter Stufe als Matrizen ansehen bzw. darstellenkann. Es sei nur angemerkt, dass es auch Tensoren höherer Stufe gibt. Die-se entstehen z.B. durch das über Tensoren definierte dyadische Produkt (auchTensorprodukt genannt: T = T1 ⊗ T2 (was nicht verwechselt werden darf mitdem Matrixprodukt, s. Anh. A.31). Dabei entsteht aus zwei Tensoren r-ter Stu-fe (z.B. zwei Vektoren T1 und T2, also zwei Tensoren 1. Stufe) ein Tensor Tvon 2r-ter Stufe (also im diesem Fall ein Tensor der Stufe 2).Sei T = (Tij) wieder ein Tensor 2-ter Stufe über einem n-dimensionalen Vek-torraum V, und die Matrix M = (mij) beschreibe eine Transformation (z.B. eine

Page 43: Welträtsel aus Sicht der modernen Wissenschaften

A.50 Turingmaschine 43

Drehung) aller Vektoren von V. Dann ist die dementsprechende Transformati-on von T in das neue Koordinatensystem wie folgt durchzuführen (die Koordi-naten nach der Transformation werden mit Tij bezeichnet): Tij = mikmjlTkl.Daran erkennt man, dass sich die Spalten eines Tensors wie Vektoren transfor-mieren (s. hierzu die Definition der Matrizenmultiplikation in Anh. A.31 unddie Einsteinsche Summationskonvention über gleich benannte Indizes in Anh.A.42).

A.50 Turingmaschine

Alan Turing hat eine besondere abstrakte Maschine erdacht, die nach ihm be-nannte Turingmaschine. Sie kann als 7-Tupel definiert werden:TM = 〈 Z , V, z0, F, δ, B, 2 〉,mit folgenden Komponenten:Z – endliche Menge von Zuständen;V – Menge von Inputsymbolen mit V ⊆ (B \ 2);z0 – Anfangszustand z0 ∈ Z;F – Menge von Endzuständen F ⊆ Z;δ – Übergangsfunktion mit δ : (Z \ F )×B → Z ×B × {L, 0, R}

(bestimmt u.a. den nächsten Zug, s.u.);B – Menge der zulässigen Bandsymbole;2 – das Leerzeichen (leeres Feld, Blank); 2 ∈ B.

Eine Turingmaschine TM besteht aus einem Band mit einem Lese-/Schreib-kopf, der in Abhängigkeit vom augenblicklichen Zustand z ∈ Z der Maschineauf dem Band genau definierte Aktionen ausführen kann, die wir sogleich be-schreiben werden.

b1 b2 . . . bi . . . bm . . .Bildlich:6

L⇐ ⇒ R

endlicheSteuerung

realisiertZ und δ

Bei einem Zug führt die Turingmaschine TM in Abhängigkeit von ihrem Zu-stand und dem Input-Symbol folgende Aktionen aus:

Page 44: Welträtsel aus Sicht der modernen Wissenschaften

44 A. Exkurs in die Welt der mathematischen Begriffe

• Lesen des im augenblicklichen Zustand z ∈ Z gerade unter dem Lese-Schreibkopf befindlichen Bandsymbols b ∈ B;• Änderung des Zustandes (→ erste Komponente des Ergebnisses von δ);• Drucken eines Symbols s ∈ B auf Band (Ersetzen des augenblicklichen

Input-Symbols gemäß der zweiten Komponente des Ergebnisses von δ);• Bewegen des Lesekopfes nach links (L), nach rechts (R) oder keine Band-

bewegung (0) entsprechend der dritten Komponente des Ergebnisses δ.

Die ‚Lösung eines Problems‘, das durch eine Funktion f(x1, x2, . . . , xn)charakterisiert wird, und damit die ‚Berechnung der Funktion‘ f läuft auf einerTuringmaschine wie folgt ab. Zunächst ist die Übergangsfunktion δ so zu pro-grammieren, dass sie genau die intendierte Funktion f realisiert. Dann werdendie Größen xi mit Hilfe der zulässigen Bandsymbole B geeignet kodiert undals Eingabewerte links beginnend auf das Band der TM geschrieben. Wenn dieTM nach Ausführung der durch δ verkörperten Rechenvorschrift bei vorge-gebenen Eingabewerten nach jeweils endlich vielen Schritten anhält (d.h. dieTM in einen Endzustand aus F überführt), ist die Berechnung beendet. Dienach dem Halt auf dem Band stehenden Symbole charakterisieren das Ergeb-nis der Berechnung von f.Eine Turingmaschine TM, bei der keine Übergangsfunktion δ, sondern eineÜbergangsrelation δR verwendet wird, heißt nichtdeterministische TM. DerUnterschied zu einer deterministischen TM besteht darin, dass es dann zu ei-nem Zustand mehrere Nachfolgezustände geben kann. In diesem Fall mussder jeweilige Nachfolgezustand aus der Menge der durch δR erlaubten Nach-folgezustände z ∈ Z entweder zufällig ausgewählt werden, oder die zulässigenz müssen nacheinander betrachtet werden (im Idealfall wäre auch eine paral-lele Abarbeitung denkbar). Die Unterscheidung dieser beiden Arten von TM(deterministisch bzw. nichtdeterministisch) ist von Bedeutung für die Komple-xitätstheorie und dort insbesondere für die Definition der verschiedenen Kom-plexitätsklassen, s. Kap. 8.2 im Buch.

A.51 Unendlichkeit und Unendliche MengenEine der bekanntesten Definitionen des Begriffs der unendlichen Menge gehtauf Dedekind zurück: Eine Menge wird als „unendlich“ bezeichnet, wenn siegleichmächtig zu einer ihrer echten Teilmengen ist, s. Anh. A.32.Eine Menge, die endlich oder gleichmächtig zur Menge N der natürlichenZahlen ist (also die Kardinalzahl ℵ0 hat; s. Anh. A.32), heißt abzählbar un-endliche Menge. Andernfalls handelt es sich um eine überabzählbar unendli-che Menge.

Page 45: Welträtsel aus Sicht der modernen Wissenschaften

A.52 Vektor, Vektorraum 45

Bezüglich der Unendlichkeit von Mengen gibt es zwei verschiedene Auffas-sungen: Die eine nimmt an, dass auch etwas Unendliches, wie z.B. die MengeN der natürlichen Zahlen, einfach gegeben sein kann, sogenanntes aktualesUnendlich. Dies kommt einer platonischen Auffassung der Zahlen gleich. Dieandere Auffassung (die für die sogenannten Konstruktivisten charakteristischist) besagt, dass sich zwar zu jeder natürlichen Zahl eine noch größere angebenlässt, dass man N aber nicht einfach als fertig gegeben annehmen kann. Manspricht dann von einem potentiellen Unendlich.Bei den natürlichen Zahlen bezeichnet man den Grenzwert ‚Unendlich‘ (s.Anh. A.18) mit dem Symbol:∞.

A.52 Vektor, Vektorraum

Ein Vektorraum V ist eine Menge von Objekten, den Vektoren, über denen eineAdditionsoperation und die Multiplikation von Vektoren mit reellen bzw. kom-plexen Zahlen definiert ist, wobei diese Operationen ganz bestimmte Eigen-schaften (wie Kommutativität, Assoziativität und Distributivität) haben müs-sen. Außerdem müssen ein Nullelement und ein Inverses bezüglich der Ad-dition in V existieren, und die Operationen dürfen nicht aus V herausführen(man sagt auch, dass V geschlossen über diesen Operationen ist). Im folgen-den wird die Konvention verwendet, die Symbole für Vektoren fett zu drucken.Die als Multiplikatoren erlaubten Zahlen heißen in diesem Kontext Skalare.Wir werden uns hier auf die Menge R der reellen Zahlen als skalare Größenund auf die typischsten Vektorräume, wie den Euklidischen Raum, beschrän-ken (s. Anh. A.42.Eine Teilmenge B = {b1, b2 , . . . bn} ⊂ V heißt Basis von V, wenn sich je-der Vektor v ∈ V als Linearkombination v = (v1b1 + v2b2 + . . . + vnbn) derElemente von B darstellen lässt. Die vi ∈ R heißen auch Koordinaten oderKomponenten von v bezüglich des durch die Basis B aufgespannten Koordina-tensystems, s. Anh. A.26. In der Komponentenschreibweise wird der Vektor vdargestellt als Tupel seiner Koordinaten: v = (v1, v2, . . . , vn). Die Anzahl n derKomponenten jedes Vektors aus V nennt man die Dimension von V. Es sei nurangemerkt, dass es auch Vektorräume mit unendlich vielen Dimensionen gibt.Als Operationen zwischen den Vektoren von V werden gewöhnlich verschie-dene Arten von Multiplikationen bzw. Produkten definiert. Die in unseremKontext wichtigste zweistellige Operation ist die Bildung des sogenannten in-neren Produkts oder Skalarprodukts, was aber schon zum Konzept des Hilbert-

Page 46: Welträtsel aus Sicht der modernen Wissenschaften

46 A. Exkurs in die Welt der mathematischen Begriffe

raums führt, s. Anh. A.21.

A.53 Wahrscheinlichkeiten und Wahrscheinlichkeits-rechnung

Der Begriff der Wahrscheinlichkeit kann aufgrund verschiedener Denkansät-ze bestimmt und demgemäß unterschiedlich definiert werden. Der geläufigsteAnsatz beruht auf dem Begriff der Häufigkeit (sogenannter frequentistischerAnsatz). – Sei M eine vollständige Menge von gleichmöglichen Ereignissen(d.h. eins von ihnen muss eintreten). Die Anzahl der Elemente von M sei AM

(M kann z.B. die Menge aller möglichen Resultate von Würfen mit einemWürfel sein, mit AM = 6). Dann bestimmt man die Zahl AE der günstigen Fäl-le für das Ereignis E, dessen Wahrscheinlichkeit man berechnen will (das kannim einfachsten Fall ein Element E ∈ M sein, z.B. das Ereignis, eine Sechs zuwürfeln, also ist hier AE = 1), oder auch eine Kombination von Ereignissen Ei∈M (wie z.B. eine gerade Zahl zu werfen, mit AE = 3). Das Verhältnis p(E) =AE / AM ist die Wahrscheinlichkeit für das Eintreten des Ereignisses E (also1/6 für das Werfen einer Sechs bzw. 1/2 für das Werfen einer geraden Zahl).Das Maß p(E) für die Wahrscheinlichkeit eines Ereignisses kann aber auchsubjektiv begründet sein, indem es den Grad der Überzeugung eines Beob-achters ausdrückt, dass E eintritt. Dieser Denkansatz wird gewöhnlich in derBayesschen Wahrscheinlichkeitstheorie (s. Anh. A.5) zugrunde gelegt, obwohldort auch eine frequentistische Begründung möglich ist.Jedes Wahrscheinlichkeitsmaß p(E), welche Vorstellung ihm auch zugrundeliegen mag, sollte den Axiomen von Kolmogorow genügen:(1) Für das sichere Ereignis E gilt: p(E) = 1.(2) Die Wahrscheinlichkeit p(E) eines beliebigen Ereignisses E unterliegt derBeschränkung: 0 ≤ p(E) ≤ 1.(3) Für das Eintreten wenigstens eines der wechselseitig inkompatiblen Er-eignisse E1, E2 . . . En aus der Menge M oben (das entspricht dem sicherenEreignis E) gilt: p(E) =

∑ni=1 p(Ei) = 1.

Wenn E das komplementäre Ereignis zu E ist, dann ergibt sich dessen Wahr-scheinlichkeit wegen (3) aus p(E) = 1 - p(E). Und für das unmögliche EreignisEnil, das komplementär zum sicheren Ereignis ist, ergibt sich aus (3) wegenp(Enil) + p(E) = 1 die Wahrscheinlichkeit p(Enil) = 0.

Page 47: Welträtsel aus Sicht der modernen Wissenschaften

A.55 Zahlen 47

A.54 Winkelfunktionen, Trigonometrische Funktionen

Die Winkelfunktionen sin(α), cos(α), tg(α) und ctg(α), gesprochen: ‚Sinus‘,‚Cosinus‘,‚Tangens‘ bzw. ‚Kotangens‘, sind die wichtigsten Funktionen zurBerechnung von Dreiecken und damit Gegenstand der Trigonometrie.Gegeben sei ein rechtwinkliges Dreieck mit den Ecken (A, B, C), wobei derrechte Winkel γ an der mit C bezeichneten Ecke liege (bitte Zeichnung zu-hilfe nehmen). Die C gegenüberliegende Seite heiße c (oder ‚Hypotenuse‘).Bezeichnet man von c ausgehend im Uhrzeigersinn die zwei übrigen Seitenmit a und b, sowie die a bzw. b gegenüberliegenden Ecken mit A bzw. B unddementsprechend die Winkel bei A bzw. B mit α bzw. β, so lassen sich dieWinkelfunktionen von α wie folgt definieren (die Seiten a bzw. b heißen be-züglich des Winkels α ‚Gegenkathete‘ bzw. ‚Ankathete‘):sin(α) = a/c; cos(α) = b/c; tg(α)= sin(α)

cos(α) und ctg(α) = cos(α)sin(α) .

Wie man an den Definitionen erkennt, hängen die Werte der Funktionen nurvon den entsprechenden Winkeln ab, nicht aber von der Größe des Dreiecks.Denn eine Streckung aller Seiten um den gleichen Faktor k (das ist eine Ähn-lichkeitstransformation) lässt die Funktionswerte unverändert.Für den Winkel als Messgröße werden verschiedene Winkelmaße verwendet:Beim Gradmaß werden einem vollen Winkel (das ist der Winkel, um den maneinen Strahl in der Ebene drehen muss, damit er in seine Ausgangslage zu-rückkehrt) 360◦ zugeordnet. Beim Bogenmaß wird dem Vollwinkel der Wert2π zugewiesen (damit entsprechen 180◦ im Gradmaß dem Wert π im Bogen-maß). – Die Winkelfunktionen sin(x) und cos(x) besitzen eine Periodizität von2π, d.h. in einem Abstand von jeweils 2π kehren immer die gleichen Funkti-onswerte wieder. Demgegenüber haben die Funktionen tg(x) und ctg(x) einePeriodizität von π.

A.55 Zahlen

Zahlen sind die mathematischen Größen, die ganz wesentlich für quantitativeAngaben, d.h. insbesondere für Maßangaben bzw. Messprozesse in den Na-turwissenschaften, sind. Den Ausgangspunkt bilden die natürlichen Zahlen (s.A.34), die - wie dort bereits festgestellt - durch die Peanoschen Axiome cha-rakterisiert werden.Diese Axiome, welche die arithmetischen Eigenschaften der natürlichen Zah-len (der Elemente n von N ) logisch-formal festlegen, benutzen eine logischeKonstante 0 (für die Null) und eine einstellige Funktion Suc(n):

Page 48: Welträtsel aus Sicht der modernen Wissenschaften

48 A. Exkurs in die Welt der mathematischen Begriffe

(1) 0 ist eine natürliche Zahl (d.h. 0 ∈ N );(2) Jede natürliche Zahl n hat genau einen Nachfolger Suc(n);(3) Es gibt keine natürliche Zahl, für die gilt Suc(n) = 0(d.h. die Null hat keinen Vorgänger);

(4) Das vierte Axiom (Induktionsaxiom) wird mit Hilfe eines einstelligen,ansonsten beliebigen Prädikates P(n) formuliert:Wenn P(0) gilt, und wenn gezeigt werden kann, dass aus P(n) auch P(Suc(n))folgt, dann gilt P(n) für jede natürliche Zahl.

Während die Addition und Multiplikation uneingeschränkt über den natür-lichen Zahlen ausführbar sind, gilt das für die anderen arithmetischen Opera-tionen nicht mehr, s. Anh. A.3. Die Subtraktion von Zahlen führt schon ausden natürlichen Zahlen heraus zu den negativen Zahlen (beide zusammen bil-den den Bereich der ganzen Zahlen). Um die Division zweier ganzer Zahlenuneingeschränkt durchführen zu können, müssen die rationalen Zahlen oderBrüche eingeführt werden. Weiterhin gelangt man durch die Umkehroperationdes Potenzierens (s. Anh. A.40), das Wurzelziehen, zu den reellen Zahlen (s.Anh. A.43), und durch das Wurzelziehen aus negativen Zahlen schließlich zuden komplexen Zahlen (s. Anh. A.25).

Page 49: Welträtsel aus Sicht der modernen Wissenschaften

Literaturverzeichnis

1. H. Helbig. Wissensverarbeitung und die Semantik der Natürlichen Sprache - Wissensreprä-sentation mit MultiNet. Springer, Berlin, 2 edition, 2008.

2. R. Penrose. The Road to Reality: A Complete Guide to the Laws of the Universe. VintageBooks, London, 2007.

Page 50: Welträtsel aus Sicht der modernen Wissenschaften

Index

Abbildung (in der Mathematik), 4Algebra und Algebraische Strukturen, 4Allgemeine Relativitätstheorie (ART), 38Arithmetik, 5Attraktor, 33Aussagenkalkül, 6, 7Aussagenlogik, 6, 23Auswahlaxiom, 28Axiom, 6, 7, 10, 24, 25, 27–29, 46Axon, 29

Backpropagation-Netze, 29, 32Banach-Tarski-Paradoxon, 28Bayessche Theorie, Bayes-Theorem, 7, 46Boolesche Algebra, 5, 7Bosonen, 40

Chomsky, Noam, 10Computerlexikon, 21

Deduktion, deduktives Schließen, 7Dendriten, 29Differentialrechnung, 8Dimension, 36Dirac, Paul, 40

Eigenwerte e. Operators, 26Einsteinsche Feldgleichungen, 39Entropie, 34Erfüllbarkeit, 25Euklid, 35Euklidische Geometrie, 14, 37Euklidischer Raum, 17, 19, 36, 37, 45Eulersche Zahl e, 9, 37Ex falso quodlibet (Regel), 7Exponentialfunktion, 9, 20, 23

Felder und Feldtheorien, 9Fermionen, 40Folge, 16Formales System, Kalkül, 10, 11

Fourier-Zerlegung, 11Fourierreihe, 11, 12, 37Fundamentalsatz der Algebra, 5, 34Funktion, 12Fuzzy reasoning, Fuzzy concepts/sets, 13Fuzzy-Logik, 12, 13, 25

Gödel, Kurt, 14Gödelscher Unvollständigkeitssatz, 14Gauß, Carl Friedrich, 9Geometrie, 14Gradient, 15, 31, 42Grammatik, formale, 10Graph, 15Graphentheorie, 15Gravitationsgesetz, 33Grenzwert, 16Gruppen, Gruppentheorie, 16

Hamilton-Funktion, 17Hamilton-Operator, 17Hilbert, David, 17Hilbertraum, 17, 18, 26, 36Homographie, 21Hopfield-Netze, 29

Indexschreibweise, 18Infinitesimalrechnung, 8, 18Integralrechnung, 18

Kalkül, 6, 10, 11, 14, 24, 25Kardinalzahl, 27–29, 44Kartesisches Produkt, 12, 38Kepler, Johannes, 33Kohonen-Netze, 29Kolmogorow, Andrej Nikolajewitsch, 46Komplexe Zahlen, 19, 34, 37, 45, 48Konstituenten, linguist., 22Koordinatensystem, 20Kosmologische Konstante, 40Kripke, Saul, 28

Page 51: Welträtsel aus Sicht der modernen Wissenschaften

Index 51

Kronecker, Leopold, 3

Längenkontraktion, 39Lagrange-Funktion und Lagrange-Dichte, 20Lernen, 31, 32Lernen, automat., 31Lexem, 21Logarithmus, 23Logik, 23

Mathematik, 3Matrizen und Matrizenmechanik, 25Mengen, Mengenlehre, 27Modalitäten, Modallogik, 25, 28Modus ponens, 6, 7, 13Morphologie, 22

Natürliche Zahlen, 29Neuron, 29Neuronale Netze, 29, 30Newtonsche Gesetze, 33Newtonsche Mechanik (Klassische

Mechanik), 33

Operator, Operation, 33

Paradoxon, 28Phasenraum, 34Pi (π), 37, 47Polynom, 34Polysemie, 21Potenz, 35Potenzreihe, 35, 37Prädikatenkalkül (PK1), 23Prädikatenlogik, 23–25Primzahlen, 35

Raum, mathematischer, 36Raumkrümmung, 39

Raumzeit, 36, 39reelle Zahlen, 37Reihe, Reihenentwicklung, 16, 37Rekursivität, 22Relationen, 38Relativitätstheorie, 38Ricci-Tensor, 39

Satz von der doppelten Negation, 6Schrödingergleichung, 40Skalar, 17, 45Spezielle Relativitätstheorie (SRT), 38Spin, 40Symmetrie, 40Symmetriegruppen, 5, 16

Taylorreihe, 9, 20, 35, 37Tensor, 3, 9, 36, 39, 41Transformationen, 34Transitivität, Relation, 29Turing, Alan, 43Turingmaschine, 43

Unendlich, 45Unendliche Menge, 18, 44

Valenz, Linguistik, 21, 22Vektor, 36, 45Vektorraum, 36, 45Vollständigkeit, Kalkül, 25

Wahrscheinlichkeit, 7, 46Wahrscheinlichkeit, bedingte, 7Winkelfunktionen, Trigonometrische

Funktionen, 20, 46

Zahlen, 47Zahlentheorie, 14, 35Zeitdilatation, 39

Page 52: Welträtsel aus Sicht der modernen Wissenschaften

http://www.springer.com/978-3-662-60761-9