233
Vorlesungsskript zur Analysis 1 Martin Brokate und Johannes Zimmer Wintersemester 2021/22 Zentrum Mathematik, TU M¨ unchen

Vorlesungsskript zur Analysis 1 -

  • Upload
    others

  • View
    8

  • Download
    1

Embed Size (px)

Citation preview

Page 1: Vorlesungsskript zur Analysis 1 -

Vorlesungsskript zur Analysis 1

Martin Brokate und Johannes Zimmer

Wintersemester 2021/22

Zentrum Mathematik, TU Munchen

Page 2: Vorlesungsskript zur Analysis 1 -

Vorwort und Danksagung

Das vorliegende Skript ist fur Studienanfanger an der TU Munchen verfasst. Eine Reihevon Motivationen und Skizzen, die normalerweise normalerweise in den Vorlesungen ge-gebenen werden, wurden in das Skript aufgenommen, um der besonderen Lehrsituationin Pandemiezeiten Rechnung zu tragen.

Carl-Friedrich Kreiner, Hans-Peter Kruse und Florian Lindemann haben mit großem En-gagement Vorversionen des Skripts gelesen und wertvolle Verbesserungsvorschlage einge-bracht. Ganz herzlichen Dank fur die großartige Hilfe!

Fur Hinweise auf verbliebene Fehler sowie Verbesserungsvorschlage, etwa per Email [email protected], sind wir jederzeit dankbar.

i

Page 3: Vorlesungsskript zur Analysis 1 -

Inhaltsverzeichnis

1 Aussagen 1

1.1 Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Verknupfung von Aussagen . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.3 Quantoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2 Vollstandige Induktion 8

2.1 Summen- und Produktnotation . . . . . . . . . . . . . . . . . . . . . . . . 8

2.2 Die Beweismethode der vollstandigen Induktion . . . . . . . . . . . . . . . 9

2.3 Verallgemeinerungen des Induktionsprinzips . . . . . . . . . . . . . . . . . 11

2.4 Bonusmaterial und Anmerkungen . . . . . . . . . . . . . . . . . . . . . . . 12

3 Mengen 13

3.1 Grundbegriffe der Mengenlehre . . . . . . . . . . . . . . . . . . . . . . . . 13

3.2 Mengenoperationen und ihre Rechenregeln . . . . . . . . . . . . . . . . . . 16

3.3 Indizierte Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

3.4 Mengen von Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

3.5 Geordnete Paare. Das Produkt zweier Mengen . . . . . . . . . . . . . . . . 20

3.6 Schlussbemerkungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

3.6.1 Cantors Werk und seine Rezeption . . . . . . . . . . . . . . . . . . 20

3.6.2 Zur Definition der naturlichen Zahlen . . . . . . . . . . . . . . . . . 21

4 Einige Beweistechniken 23

4.1 Kontraposition und Widerspruchsbeweis . . . . . . . . . . . . . . . . . . . 23

4.2 Zum axiomatischen Aufbau der Mathematik . . . . . . . . . . . . . . . . . 25

4.3 Bonusmaterial: Die Jagd nach dem kleinsten Verbrecher . . . . . . . . . . . 28

5 Reelle Zahlen 30

5.1 Axiomatische Charakterisierung . . . . . . . . . . . . . . . . . . . . . . . . 30

5.1.1 Korperaxiome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

5.1.2 Anordnungsaxiome . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

5.1.3 Vollstandigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

5.2 Folgerungen aus den Korpereigenschaften . . . . . . . . . . . . . . . . . . . 33

5.3 Potenzen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

5.4 Elementare Ungleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

5.5 Absolutbetrag, Minimum und Maximum . . . . . . . . . . . . . . . . . . . 42

ii

Page 4: Vorlesungsskript zur Analysis 1 -

5.6 Supremum und Infimum. Vollstandigkeit . . . . . . . . . . . . . . . . . . . 45

5.7 Ausblick: Zum Archimedischen Axiom . . . . . . . . . . . . . . . . . . . . 49

6 Funktionen 50

6.1 Der Funktionsbegriff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

6.2 Eigenschaften von Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . 52

6.3 Die Umkehrfunktion. Wurzeln . . . . . . . . . . . . . . . . . . . . . . . . . 53

6.4 Komposition von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 56

7 Die komplexen Zahlen 59

7.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

7.2 Definition und elementare Eigenschaften komplexer Zahlen . . . . . . . . . 59

7.3 Nachbemerkung und Ausblick . . . . . . . . . . . . . . . . . . . . . . . . . 63

8 Folgen 65

8.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

8.2 Folgen und Grenzwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

8.3 Rechenregeln fur Grenzwerte . . . . . . . . . . . . . . . . . . . . . . . . . . 70

8.4 Vertraglichkeit von Grenzwert und Ungleichungen . . . . . . . . . . . . . . 71

8.4.1 Montone Folgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

8.5 Uneigentliche Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

8.6 Der Satz von Bolzano-Weierstraß . . . . . . . . . . . . . . . . . . . . . . . 75

8.6.1 Teilfolgen und Haufungspunkte . . . . . . . . . . . . . . . . . . . . 75

8.7 Limes superior und Limes inferior . . . . . . . . . . . . . . . . . . . . . . . 77

8.8 Vollstandigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

8.9 Folgen komplexer Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

8.10 Bonusmaterial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

9 Reihen 85

9.1 Motivation und grundlegende Begriffe . . . . . . . . . . . . . . . . . . . . . 85

9.2 Absolute Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

9.3 Weitere Konvergenzkriterien . . . . . . . . . . . . . . . . . . . . . . . . . . 91

9.4 Alternierende Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

9.5 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

9.6 Reihenprodukte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

9.7 Bemerkungen und Ausblicke . . . . . . . . . . . . . . . . . . . . . . . . . . 103

iii

Page 5: Vorlesungsskript zur Analysis 1 -

10 Stetige Funktionen 106

10.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

10.2 Grundlegende Begriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

10.3 Satze uber stetige Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . 110

10.4 Uneigentliche Grenzwerte von Funktionen . . . . . . . . . . . . . . . . . . 114

10.5 Monotone Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

10.6 Anmerkungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118

11 Exponentialfunktion, trigonometrische Funktionen, Logarithmus 119

11.1 Die Exponentialfunktion im Reellen . . . . . . . . . . . . . . . . . . . . . . 121

11.2 Die Exponentialfunktion im Komplexen. Trigonometrische Funktionen . . . 123

11.3 Polarkoordinaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

11.4 Die Kreiszahl π . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

11.5 Tangens und hyperbolische Funktionen . . . . . . . . . . . . . . . . . . . . 129

11.6 Logarithmen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130

11.7 Die allgemeine Potenzfunktion . . . . . . . . . . . . . . . . . . . . . . . . . 132

12 Differenzierbarkeit reeller Funktionen 135

12.1 Kontext. Definition der Differenzierbarkeit . . . . . . . . . . . . . . . . . . 135

12.2 Rechenregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139

12.3 Eigenschaften differenzierbarer Funktionen . . . . . . . . . . . . . . . . . . 144

12.4 Umkehrfunktionen der trigonometrischen Funktionen . . . . . . . . . . . . 147

12.5 Hohere Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149

12.6 Konvexe Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153

12.7 Schlussbemerkung: Nicht differenzierbare Funktionen . . . . . . . . . . . . 154

13 Folgen von Funktionen 156

13.1 Punktweise Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156

13.2 Gleichmaßige Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . 157

14 Das Integral 162

14.1 Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162

14.2 Der Hauptsatz der Differential- und Integralrechnung . . . . . . . . . . . . 170

14.3 Integrationsregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173

14.4 Integrationspraxis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176

14.4.1 Integration rationaler Funktionen . . . . . . . . . . . . . . . . . . . 177

iv

Page 6: Vorlesungsskript zur Analysis 1 -

14.4.2 Integrale von Verkettungen rationalen Funktionen . . . . . . . . . . 184

14.5 Weitere Charakterisierungen von Regelfunktionen . . . . . . . . . . . . . . 186

14.6 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187

14.7 Anwendung: Wallis’sches Produkt . . . . . . . . . . . . . . . . . . . . . . . 190

14.8 Ausblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192

15 Vertauschungssatze 193

15.1 Punktweise Konvergenz: Drei Enttauschungen . . . . . . . . . . . . . . . . 193

15.2 Vertauschungssatze fur gleichmaßige Konvergenz . . . . . . . . . . . . . . . 195

16 Potenzreihen und Taylorreihen 198

16.1 Gleichmaßige Konvergenz von Potenzreihen . . . . . . . . . . . . . . . . . 198

16.2 Taylorreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203

16.3 Bonusmaterial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209

17 Einfuhrung in Differentialgleichungen 211

17.1 Separable Differentialgleichungen erster Ordnung . . . . . . . . . . . . . . 212

17.2 Inhomogene Gleichungen erster Ordnung . . . . . . . . . . . . . . . . . . . 215

17.2.1 Integrierende Faktoren . . . . . . . . . . . . . . . . . . . . . . . . . 216

17.2.2 Variation der Konstanten . . . . . . . . . . . . . . . . . . . . . . . 219

17.3 Anwendung: Coffeingehalt im Blut . . . . . . . . . . . . . . . . . . . . . . 221

18 Unendliche Mengen 223

v

Page 7: Vorlesungsskript zur Analysis 1 -

1 Aussagen

1.1 Grundlagen

In der Mathematik befassen wir uns mit Aussagen. Ein einfaches Beispiel ist die Aussage

12 ist durch 3 teilbar. (1.1)

Wir wissen, dass (1.1) wahr ist, da 12/3 = 4 gilt und kein Rest bleibt.

Eine mathematische Aussage ist ein Satz, der entweder wahr oder falsch ist. Es kannsich auch um mehrere Satze handeln, und

”Satz“ ist hier als grammatikalischer Satz zu ver-

stehen. Wir machen es uns einfach und nehmen an, dass eindeutig und unwiderspruchlichfestgestellt werden kann, ob eine Aussage wahr oder falsch ist. So ist

”Mathematik macht

Spaß“ keine Aussage, da es hier (leider!) widerspruchliche Ansichten gibt. Ebenfalls ist”es

gibt unendlich viele Primzahlzwillinge“ keine Aussage — es ist unbekannt, ob es endlichoder unendlich viele Primzahlzwillinge gibt (also Primzahlen, deren nachfolgende unge-rade Zahl wieder eine Primzahl ist, wie 3 und 5, 5 und 7, 11 und 13).

Wir betrachten als nachstes eine kompliziertere Aussage:

Jede durch 6 teilbare naturliche Zahl ist auch durch 3 teilbar. (1.2)

Wahrend in (1.1) nur von zwei ganz bestimmten Zahlen die Rede ist, handelt (1.2) vonbeliebigen naturlichen Zahlen. Da es unendlich viele durch 6 teilbare Zahlen gibt, werdenwir in Kurze einen Weg angeben, wie man beim Nachweis alle diese Zahlen auf einmalbehandeln kann.

Beide Aussagen (1.1) und (1.2) sind Beispiele fur ganz einfache mathematische Satze. Einmathematischer Satz oder kurz Satz ist eine wahre Aussage, die aus einer Voraus-setzung und einer Behauptung besteht. Die Voraussetzung kann evtl. entfallen, wennsie nur bekanntes Vorwissen umfasst, wie etwa in (1.1). Dort ist

”12 ist durch 3 teilbar“

die Behauptung1.

Typischer ist Beispiel (1.2), das so umformuliert werden kann:

Voraussetzung: n ist eine durch 6 teilbare naturliche Zahl.Behauptung: n ist durch 3 teilbar.

(1.3)

Sowohl Voraussetzung als auch Behauptung enthalten eine Variable, hier mit n bezeichnet.Statt

”Voraussetzung: X, Behauptung: Y“ schreibt man meistens

”Sei X, dann gilt Y“.

Je nachdem, welche Zahl n man in (1.3) betrachtet, konnen Voraussetzung und Behaup-tung – fur sich genommen – wahr sein oder auch nicht. Entscheidend ist, dass ein ma-thematischer Satz wahr ist (man sagt auch: richtig): Dass

”aus der Voraussetzung die

Behauptung folgt“. Das heißt, die Aussage

Immer wenn die Voraussetzung wahr ist, ist auch die Behauptung wahr (1.4)

1Fuhrt man eine Variable ein, kann man (1.1) aber auch mit nichtleerer Voraussetzung schreiben:Wenn n = 12, dann gilt 3|n.

1

Page 8: Vorlesungsskript zur Analysis 1 -

muss zutreffen.

Um einen Satz als wahr zu erkennen, fuhrt man einen Beweis. Beweise konnen unter-schiedliche Strukturen haben. Wir besprechen zuerst den direkten Beweis. Ein direkterBeweis besteht darin, durch schrittweises logisches Schließen von der Voraussetzung zurBehauptung zu gelangen. Hier ist ein direkter Beweis fur den Satz (1.3):

Sei n eine beliebige durch 6 teilbare naturliche Zahl. Wir setzen m = n/6. Dan nach Voraussetzung durch 6 teilbar ist, ist m ebenfalls eine naturliche Zahl.Es folgt n = (n/6) · 6 = 6m und weiter n/3 = (6m)/3 = (6/3) ·m = 2m. Da2m eine naturliche Zahl ist, ist auch n/3 eine naturliche Zahl. Also ist n durch3 teilbar.

Der Beweis zeigt, dass (1.4) fur (1.2) zutrifft; damit ist dieser mathematische Satz bewie-sen. Wie weiter oben angekundigt, ist es uns gelungen, in unserem Beweis unendlich vielenaturliche Zahlen n gleichzeitig zu behandeln.

Hier ein Beispiel fur eine falsche Aussage:

Jede durch 6 teilbare naturliche Zahl ist auch durch 5 teilbar. (1.5)

Betrachten wir namlich die Zahl 6, so ist sie zwar durch 6, aber nicht durch 5 teilbar.Die Aussage (1.4) ist also fur (1.5) falsch. Indem wir ein sogenanntes Gegenbeispielangegeben haben, namlich die Zahl 6, haben wir also bewiesen, dass die Aussage (1.5)falsch ist. (Ein einziges Gegenbeispiel genugt; wir mussen nicht mehrere davon angeben; imvorliegenden Fall gabe es unendlich viele davon). Es gibt auch unendlich viele naturlicheZahlen, die sowohl durch 6 als auch durch 5 teilbar sind (namlich jedes n = 30m mit einernaturlichen Zahl m) und daher sowohl Voraussetzung als auch Behauptung erfullen, aberdie Aussage (1.5) ist trotzdem falsch.

Werden Variablen in Satzen verwendet, wie etwa n in (1.3), kann der Variablenname freigewahlt werden. Statt n hatten wir beispielsweise auch k verwenden konnen. Erstaunlichoft gehen einem in der Mathematik sinnvolle Variablennamen aus. Gerne benutzt mangriechische Buchstaben α, β, γ. . . . Außerdem ist es oft praktisch, Variablen zu indizieren:Statt fur die Summe s von zehn Zahlen die Variablen a, . . . , j einzufuhren und zu schreiben

s = a+ b+ c+ d+ e+ f + g + h+ i+ j ,

ist es praktischer, die 10 einzelnen Variablen

a1, a2, a3, . . . , a10 ,

zu nennen. Ein Vorteil ist, dass man sieht, dass es sich um vergleichbare Objekte handelt(namlich Zahlen, die addiert werden konnen). Hier ist die kte Variable

ak ,

wobei k Werte zwischen 1 und 10 annimmt; k ist der Index von ak, und a eine mit kindizierte Variable. Die Summe kann dann geschickter geschrieben werden als

s = a1 + a2 + a3 + a4 + a5 + a6 + a7 + a8 + a8 + a10 , (1.6)

2

Page 9: Vorlesungsskript zur Analysis 1 -

und wir werden in Kapitel 2 dafur eine elegante, auf der Indexnotation basierende kom-pakte Schreibweise kennenlernen.

Das Aufstellen von mathematischen Satzen ist die zentrale Aufgabe der Mathematik. DaSatze definitionsgemaß wahre Aussagen sind, ist ein Beweis unabdingbar, der die Wahrheitder Aussage zeigt. Wir werden in Kapitel 4 verschiedene Beweistechniken besprechen.

1.2 Verknupfung von Aussagen

Beim Umgang mit Aussagen wird eine Reihe von logischen Verknupfungen verwendet.Fur uns sind die folgenden funf Verknupfungen wesentlich:

(i) Wir beginnen mit der Negation. Die Negation von”das Glas ist voll“ ist

”das Glas

ist nicht voll“. Die Negation einer Aussage A ist genau dann wahr, wenn A falsch ist.Die Aussage

”das Glas ist leer“ ist also nicht die Negation von

”das Glas ist voll“,

denn es ist auch moglich, dass das Glas weder voll noch leer ist. Man bezeichnet dieNegation von A mit ¬ A. Man kann das Verhaltnis zwischen A und ¬ A ubersichtlichmit einer Wahrheitstafel ausdrucken. Die Wahrheitstafel fur die Negation hat dieForm

A ¬ AW FF W

Auf der linken Seite stehen die beiden moglichen Wahrheitswerte von A (mit W furwahr und F fur falsch), auf der rechten Seite die zugehorigen Wahrheitswerte von¬ A.

(ii) Als nachstes kommt die Und-Verknupfung zweier Aussagen A und B, im ZeichenA ∧ B. Die Aussage

”das Glas ist voll und der Eimer ist leer“

ist genau dann wahr, wenn beide Teilaussagen wahr sind. So sind wir das auch imAlltag gewohnt. Die zugehorige Wahrheitstafel ist

A B A ∧ BW W WW F FF W FF F F

Hier hat die linke Seite zwei Spalten. Ihre Zeilen enthalten alle moglichen Kombina-tionen der Wahrheitswerte von A und B. In der rechten Spalte stehen die zugehorigenWerte von A ∧ B.

Hier wie auch in allen anderen Fallen gilt: Der Wahrheitswert der durch die Ver-knupfung erzeugten Aussage A ∧ B ist durch den Wahrheitswert der an der Ver-knupfung beteiligten Aussagen A und B eindeutig festgelegt.

3

Page 10: Vorlesungsskript zur Analysis 1 -

(iii) Die Oder-Verknupfung, geschrieben als A ∨ B) bedeutet in der Mathematik im-mer das einschließende Oder. Sagt man

”das Glas ist voll oder der Eimer ist voll“,

so kann auch der Fall vorliegen, dass beide voll sind. Die zugehorige Wahrheitstafelist

A B A ∨ BW W WW F WF W WF F F

Meint man in einem mathematischen Text”oder, aber nicht beides“, so muss man

explizit”entweder – oder“ sagen. Meistens umschreibt man eine solche Situation

besser mit”Genau einer der folgenden Falle tritt ein“.

(iv) Die Implikation (”Aus A folgt B“,

”A impliziert B“,

”A ⇒ B“) beschreibt das,

was in einem mathematischen Satz passiert, denn

mathematische Satze sind wahre Aussagen der Form”A ⇒ B“.

Wir fragen uns nun, wann”A ⇒ B“ gelten soll. Einleuchtend ist, dass

”A ⇒ B“

falsch sein muss, wenn A wahr und B falsch ist, denn B soll ja aus A folgen. Dieanderen drei Falle kann man sich am Beispiel der Aussage

”fur alle naturliche Zahlen n gilt: Aus n < 3 folgt n < 5“

klarmachen. Die Wahrheitswerte von”A ⇒ B“ sollen so festgelegt werden, dass

diese Aussage wahr ist, egal welche Zahl man fur n einsetzt. Wahlen wir n = 2, 4, 6,so erhalten wir gerade die drei ausstehenden Falle. Die Wahrheitstafel ergibt sichals

A B A ⇒ BW W WW F FF W WF F W

In der dritten und vierten Zeile wird der Wahrheitswert der Aussage”A⇒B“ auch

fur den Fall festgelegt, dass A falsch ist. Das kommt einem zunachst merkwurdigvor, es passt aber dazu, wie man die Implikation normalerweise verwendet: Nehmenwir an, wir wissen, dass

”A⇒B“ wahr ist. Es sind zwei Falle moglich:

• A ist wahr. Dann ist B auch wahr.

• A ist falsch. Dann konnen wir nichts daruber sagen, ob B wahr oder falsch ist.Auf lateinisch: ex falso (sequitur) quodlibet : Aus Falschem folgt jede beliebigeAussage.

Das entspricht gerade den drei Zeilen der Wahrheitstafel, in denen rechts W steht.

Zur Notation: Die Aussage”B ⇐ A“ bedeutet dasselbe wie

”A ⇒ B“.

4

Page 11: Vorlesungsskript zur Analysis 1 -

Ist”A ⇒ B“ wahr, dann ist A hinreichend fur B und B ist notwendig fur A.

Sprachlich genauer ware: Die Gultigkeit von A ist eine hinreichende Bedingung furdie Gultigkeit von B, bzw. die Gultigkeit von B ist eine notwendige Bedingung furdie Gultigkeit von A.

(v) Die Aquivalenz zweier Aussagen A und B bedeutet einfach: Wenn wir wissen, dassA gilt, so wissen wir auch, dass B gilt, und umgekehrt. Wir sagen:

”A gilt genau

dann, wenn B gilt“ oder”A und B sind aquivalent“, und schreiben dafur A ⇔ B.

Die Wahrheitstafel der Aquivalenz entsteht, indem wir die beiden Spalten fur”A⇒

B“ und”B ⇒ A“ mit

”und“ verknupfen. Das Ergebnis ist

A B A ⇔ BW W WW F FF W FF F W

Aquivalente Aussagen tauchen beim Umformen von Ausdrucken standig auf. So giltetwa fur beliebige naturliche Zahlen n

7n = 3 ⇔ 21n = 9 .

Aquivalente Aussagen ergeben sich auch beim Umformen von zusammengesetztenAussagen. Wir suchen etwa die Negation von

”das Essen ist heiß und scharf“. (1.7)

Sie lautet

”das Essen ist nicht heiß oder nicht scharf“. (1.8)

Dass (1.8) die Negation von (1.7) ist, basiert auf der Regel, dass die Negation einerAussage der Form A ∧ B dasselbe ist wie die (genauer: aquivalent ist zur) Aussage(¬A) ∨ (¬B). Oder, vollstandig in Formeln ausgedruckt,

¬(A ∧ B) ⇔ (¬A) ∨ (¬B) . (1.9)

Dass (1.9) wirklich fur beliebige Aussagen A und B richtig ist, kann man nachprufen,indem man die Wahrheitstafeln fur die beiden Aussagen ¬(A∧B) und (¬A) ∨ (¬B)aufstellt und feststellt, dass sie gleich sind. Man bezeichnet (1.9) oft als zweite DeMorgansche Regel, nach Augustus De Morgan (1806–1871).

Man beachte: Die Aussage

”das Essen ist nicht heiß und nicht scharf“

(also weder heiß noch scharf) ist nicht die Negation von (1.7)!

Die Negation einer durch eine Oder-Verknupfung entstandenen Aussage ist analogeine Aussage mit Und-Verknupfung (erste De Morgansche Regel):

¬(A ∨ B) ⇔ (¬A) ∧ (¬B) .

5

Page 12: Vorlesungsskript zur Analysis 1 -

Tautologien sind Aussagen, die immer wahr sind. Dass folgende Aussagen Tautologiensind, kann man durch Aufstellen der zugehorigen Wahrheitstafeln kontrollieren:

A ∨ ¬A (Satz vom ausgeschlossenen Dritten,lateinisch: tertium non datur)

¬(A ∧ ¬A) (Satz vom Widerspruch)¬(¬A)⇔ A (Negation der Negation)

¬(A ∨ B)⇔ (¬A) ∧ (¬B) (Erste De Morgansche Regel)¬(A ∧ B)⇔ (¬A) ∨ (¬B) (Zweite De Morgansche Regel)

A ∧ (B ∨ C)⇔ (A ∧ B) ∨ (A ∧ C) (Distributivgesetz)A ∨ (B ∧ C)⇔ (A ∨ B) ∧ (A ∨ C) (Distributivgesetz)

(A⇒ B)⇔ (¬B⇒ ¬A) (Kontraposition)(A⇒ B)⇔ (¬A ∨ B)(A⇒ B) ∧ A⇒ B (Modus ponens)(A⇒ B) ∧ ¬B⇒ ¬A (Modus tollens)(A⇒ B) ∧ (B⇒ C)⇒ (A⇒ C) (Modus barbara)

1.3 Quantoren

Quantoren liefern weitere Bausteine zur Formulierung mathematischer Aussagen. Es han-delt sich dabei um den Existenzquantor

∃ (”es gibt“)

und den Allquantor∀ (

”fur alle“) .

Beispiel: Die Aussage

es gibt eine naturliche Zahl, die großer ist als 1000 (1.10)

ist wahr. Wir fassen das kurzer. Zum einen schreiben wir in diesem Kapitel”n ∈ N“ fur

”n

ist eine naturliche Zahl“; diese Schreibweise wird in Kapitel 3 in großerer Allgemeinheiteingefuhrt. Zudem benutzen wir den Existenzquantor und schreiben damit (1.10) als

∃ n ∈ N mit n > 1000

oder noch kurzer als∃ n ∈ N : n > 1000 .

In der zu Beginn dieses Kapitels besprochenen Aussage (1.2),

Jede durch 6 teilbare naturliche Zahl ist auch durch 3 teilbar (1.11)

taucht der Allquantor auf: Schreiben wir”6 teilt n“ (in Zeichen: 6|n) statt

”n ist durch 6

teilbar“, so wird (1.11) zu∀ n ∈ N : 6|n ⇒ 3|n .

Bei Negation gehen ∃ und ∀ ineinander uber. Die Negation von (1.10) ist die (falsche!)Aussage

6

Page 13: Vorlesungsskript zur Analysis 1 -

”Fur alle n ∈ N gilt n ≤ 1000“, oder kurzer

”∀n ∈ N: n ≤ 1000“ .

Zwei Beispiele fur eine falsche Bildung der Negation von (1.10) sind

”es gibt ein n ∈ N mit n ≤ 1000“,

”alle naturlichen Zahlen sind großer als 1000“.

Ebenso geht der Existenzquantor unter Negation in einen Allquantor uber.

Mit”es gibt ein“ ist in der Mathematik immer

”es gibt mindestens ein“ gemeint. Will

man ausdrucken, dass es auch nicht mehr als eines geben kann, sagt man”es gibt genau

ein“, und verwendet als Symbol ∃! oder ∃1, bisweilen auch ∃|.Aussagen konnen mehrere Quantoren enthalten. Zum Beispiel:

∀n ∈ N ∃p ∈ N mit p > n und p ist Primzahl. (1.12)

In Worten:”Fur jede naturliche Zahl n gibt es eine naturliche Zahl p, die großer als n

und Primzahl ist“. Die Negation dieser Aussage ist

∃n ∈ N ∀p ∈ N mit p ≤ n oder p ist keine Primzahl,

oder als Text

”es gibt eine naturliche Zahl n, so dass fur alle naturlichen Zahlen p gilt, dassp kleiner als oder gleich n ist oder dass p nicht Primzahl ist“.

Man konnte die ursprungliche Aussage kurzer auch so schreiben:

∀n ∃p > n mit p ist Primzahl.

Allerdings muss dann klar sein, dass fur n und p nur naturliche Zahlen in Frage kommen.

Liest man eine Aussage, die zwei Quantoren enthalt, so erfasst man ihre Bedeutung oftnicht auf den ersten Blick. Man muss erstmal in Ruhe nachdenken, was gemeint ist. Esgilt: Verstandnis ist wichtiger als Geschwindigkeit!

Treten mehrere Quantoren auf, so ist deren Reihenfolge wesentlich. Die Aussage

∃p ∈ N ∀n ∈ N mit p > n und p ist Primzahl (1.13)

ist eine andere Aussage als (1.12). Insbesondere ist (1.12) wahr und (1.13) falsch! SolcheSituationen treten auch in der Umgangssprache auf. Zum Beispiel:

Fur jede Bundesligamannschaft gibt es eine Person, die der Trainer dieserMannschaft ist

ist zumindest zeitweise wahr (namlich in den Momenten, in denen kein Trainer gefeuertist – dann hat jedes Team einen eigenen Trainer);

Es gibt eine Person, die fur jede Bundesligamannschaft der Trainer ist

ist definitiv falsch, denn eine solche Person ware in Personalunion der Trainer aller Bun-desligamannschaften gleichzeitig.

7

Page 14: Vorlesungsskript zur Analysis 1 -

2 Vollstandige Induktion

2.1 Summen- und Produktnotation

Um Summen effizient aufzuschreiben, etwa die Summe s der ersten zehn Quadratzahlen

s = 12 + 22 + 32 + 42 + 52 + 62 + 72 + 82 + 92 + 102 ,

kann man abkurzend schreiben

s = 12 + 22 + · · ·+ 102 .

Noch praktischer ist das Summenzeichen

s =10∑

k=1

k2 . (2.1)

Es bedeutet, dass der nach dem Summenzeichen stehende Ausdruck fur jedes k ∈ Nzwischen 1 und 10 (jeweils einschließlich) ausgewertet wird und alle so entstehenden Aus-drucke addiert werden. Die Zahl 1 heißt untere Grenze, die Zahl 10 obere Grenze, und kdie Laufvariable der Summe.

In (2.1) taucht die Laufvariable im Summanden auf. Es konnen aber auch weitere Varia-blen vorkommen, etwa in den Grenzen, beispielsweise

s =n∑

k=m

k2 . (2.2)

In diesem Fall wird von m bis n summiert. Der Wert von s hangt also davon ab, wie großm und n sind. Die Summe (1.6) kann mit dieser Notation kompakt geschrieben werdenals

s =10∑

k=1

ak .

Hier heißt k der Index von ak, und a eine mit k indizierte Variable. Wir erhalten dasBeispiel (2.1), wenn wir ak = k2 setzen.

Wie in (2.2) konnen wir die Grenzen variabel gestalten, etwa

s =n∑

k=m

ak .

Formeln dieser Bauart, mit Variablen an unterschiedlichen Stellen sowie Indizes, tretenin der Mathematik standig auf. Am Anfang ist das ungewohnt, da ihr Abstraktionslevelhoher ist als der von vielen Dingen des Alltags. Es ist unabdingbar, sich damit vertrautmachen – sowohl durch passives Lernen, also Wiederholen und Bemuhen um Verstandnis,als auch aktives Lernen, also selbstandiges Arbeiten.

Man kann die Laufvariable im Summenzeichen anpassen. So bedeuten die Ausdrucke

10∑

k=1

ak und10∑

j=1

aj

8

Page 15: Vorlesungsskript zur Analysis 1 -

dasselbe, namlich a1 + a2 + · · ·+ a10, ebenso

10∑

k=1

ak und12∑

k=3

ak−2 .

Im letzteren Fall spricht man von Indexverschiebung.

Falls im Ausdruckn∑

k=m

ak

die obere Grenze kleiner ist als die untere, also n < m, so nennt man ihn die leereSumme, sie hat den Wert 0. Dies ist eine Konvention, die sich als praktisch erweisenwird.

Vollig analog wie bei Summen geht man bei Produkten vor. Statt des Summenzeichensverwendet man das Produktzeichen ∏

.

Das Produkt der ersten 10 naturlichen Zahlen beispielsweise ist gegeben durch

10∏

k=1

k .

Man bezeichnet es auch mit 10!, gesprochen”10 Fakultat“. Fur beliebiges n ∈ N ist die

Fakultat definiert durch

n! =n∏

k=1

k .

Im Falle n = 0 soll gelten0! = 1 .

Diese Vereinbarung passt zur der Konvention, dass das leere Produkt den Wert 1 hat.

2.2 Die Beweismethode der vollstandigen Induktion

Vollstandige Induktion ist eine Methode, um Aussagen zu beweisen, die sich auf allenaturlichen Zahlen beziehen. Das geht folgendermaßen: Sei A(n) eine Aussage, die n alsVariable fur eine naturliche Zahl enthalt (meist kurz beschrieben als

”n ist eine naturliche

Zahl“).

(i) Man nimmt sich eine naturliche Zahl n0 und beweist, dass A(n0) wahr ist (Induktions-verankerung oder Induktionsanfang).

(ii) Man beweist, dass fur beliebiges naturliches n mit n ≥ n0 aus der Gultigkeit vonA(n) auch die Gultigkeit von A(n + 1) folgt (Induktionsschritt). Die AussageA(n) heißt die Induktionsannahme, die Aussage A(n + 1) die Induktionsbe-hauptung.

Das Beweisprinzip der vollstandigen Induktion besagt: Hat man diese beiden Schrit-te erfolgreich ausgefuhrt, so hat man damit bewiesen

9

Page 16: Vorlesungsskript zur Analysis 1 -

A(n) gilt fur alle naturlichen Zahlen n mit n ≥ n0.

Wir wenden das Beweisprinzip der vollstandigen Induktion an.

Satz 2.1Fur alle naturlichen Zahlen n gilt

n∑

k=1

k =n(n+ 1)

2. (2.3)

Beweis: Durch vollstandige Induktion. Die Formel (2.3) entspricht der Aussage A(n). Wirsetzen n0 = 1. Zum Induktionsanfang: Es gilt

1∑

k=1

k = 1 =1(1 + 1)

2,

also ist A(1) wahr. Wir fuhren jetzt den Induktionsschritt aus. Sei A(n) wahr fur einbeliebiges gegebenes naturliches n, es gelte also

n∑

k=1

k =n(n+ 1)

2. (2.4)

Das ist die Induktionsannahme. Die zu beweisende Induktionsbehauptung A(n+1) ergibtsich, indem wir n in (2.4) durch n+ 1 ersetzen, also

n+1∑

k=1

k =(n+ 1)(n+ 2)

2.

Wir rechnenn+1∑

k=1

k =n∑

k=1

k + (n+ 1) =n(n+ 1)

2+ n+ 1

=n(n+ 1) + 2(n+ 1)

2=

(n+ 2)(n+ 1)

2,

(2.5)

also ist A(n + 1) wahr. (Beim zweiten Gleichheitszeichen wurde die InduktionsannahmeA(n) verwendet.) Gemaß Beweisprinzip der vollstandigen Induktion ist also A(n) wahrfur alle n ≥ 1. Fur n = 0 gilt (2.3) gemaß der Konvention uber die leere Summe. �

Das Zeichen � bedeutet: Hier ist der Beweis zu Ende. Man findet auch Q.E.D. (quod eratdemonstrandum – lateinisch fur

”was zu beweisen war“) bzw. q.e.d., QED oder qed.

Die wesentliche Idee des Beweises steckt in der ersten Gleichheit in (2.5): Die Summe bisn+ 1, uber die etwas bewiesen werden muss, wird aufgespalten in die Summe bis n, derenWert nach Induktionsannahme bereits bekannt ist, und den Summanden (n+ 1).

Wir haben den Induktionsanfang fur n0 = 1 durchgefuhrt und die Aussage fur n = 0separat gepruft. Etwas kurzer hatten wir auch bei n0 = 0 starten konnen. Wir habendas nur nicht gemacht, weil in diesem Beispiel die vollstandige Induktion im Fokus stehtund das Auftreten einer leeren Summe dabei nicht ablenken sollte. Normalerweise ist der

10

Page 17: Vorlesungsskript zur Analysis 1 -

Induktionsschritt deutlich schwieriger als der Induktionsanfang. Trotzdem darf man denInduktionsanfang nicht aus den Augen verlieren: Wir betrachten als Beispiel die Aussage

Fur alle n ≥ 1 gilt 1n = 0, (2.6)

wobei 1n die n-te Potenz von 1 ist wie aus der Schule bekannt; wir werden Potenzen in Ab-schnitt 5.3 definieren. Wir wissen, dass die Aussage (2.6) falsch ist. Aber der Induktions-schritt funktioniert: Falls wir annehmen, dass 1n = 0 gilt, so folgt 1n+1 = 1 ·1n = 1 ·0 = 0.Der Induktionsanfang hingegen geht schief, jedenfalls nicht fur n0 = 1, denn 11 = 1 6= 0.Man kann auch kein anderes n0 nehmen, denn man kann andererseits mit vollstandigerInduktion den Satz

Fur alle n ≥ 1 gilt 1n 6= 0

beweisen. Denn 11 = 1 6= 0, und aus 1n 6= 0 folgt 1n+1 = 1 · 1n = 1n 6= 0.

Lemma 2.2Es gilt fur naturliches n

1 + 3 + 5 + · · ·+ (2n− 1) = n2 ,

1 + 4 + 9 + · · ·+ n2 =1

6n(n+ 1)(2n+ 1) .

Konnen Sie fur diese Aussagen einen Induktionsbeweis geben? Es gibt fur diese Aussagendaruber hinaus andere Beweise ohne vollstandige Induktion. Konnen sie auch solche Be-weise finden? Skript und Vorlesung werden nicht alle Beweise ausarbeiten, sondern Ihneneinige zum Training uberlassen. Mathematik lernt man nur durch Uben. Im Sport wirdman ja nicht dadurch gut, dass man anderen Sportlern zuschaut und daraus zu lernenversucht – man muss stattdessen selbst aktiv werden. In der Mathematik ist das genauso!Wir bieten drei Formen von Ubungen an:

(i)”Hausaufgaben“ werden korrigiert, so dass Sie Ruckmeldungen zu Ihren Losungen

erhalten;

(ii)”Ubung“ im Skript und in der Vorlesung bedeutet, dass diese Aufgabe in Zentral-

oder Gruppenubungen oder Hausaufgaben behandelt wird;

(iii)”SUPER“ steht fur

”Selber Uberlegen, Prasentieren und ERklaren“. Hier wol-

len wir, dass Sie sich die Antwort selber uberlegen. Wenn Sie Ihre Losung danneinem Kommilitonen oder einer Kommilitonin erklaren, lernen Sie auch gleich zuprasentieren, was eine wichtige Fahigkeit fur den Arbeitsmarkt ist. Zudem konnenSie so diskutieren, ob Ihre Antwort stimmt.

2.3 Verallgemeinerungen des Induktionsprinzips

Oft verwendet man geeignete Verallgemeinerungen und Modifikationen des Prinzips dervollstandigen Induktion. Wir erwahnen das starke Prinzip der vollstandigen Induk-tion. Hier ist der Induktionsanfang wie gehabt der Nachweis, dass A(n0) wahr ist fur

11

Page 18: Vorlesungsskript zur Analysis 1 -

ein n0 ∈ N. Der Induktionsschritt zeigt hier aber, dass aus der Gultigkeit aller von Aus-sagen A(n0), . . . , A(n) die Gultigkeit von A(n + 1) folgt. Man sieht leicht, dass diesesscheinbar strengere Kriterium auf das in diesem Kapitel besprochene Induktionsprinzipzuruckgefuhrt werden kann. Dies wird in den Ubungen gezeigt, ebenso die Anwendung desstarken Prinzips der Induktion zum Beweis des Assoziativgesetzes fur endliche Summen.Zunachst ist die Addition als Operation definiert, die genau zwei Zahlen miteinander ver-knupft, wie wir in Kapitel 5 sehen werden. Fur jede Summe von mehr als zwei Summandenmussen daher streng genommen Klammern gesetzt werden, etwa

(a+ ((b+ c) + d)) + e .

Ein Induktionsbeweis erlost uns hier vom Klammersetzen, wir durfen also

a+ b+ c+ d+ e

schreiben. Das starke Prinzip der vollstandigen Induktion ist hier hilfreich, weil wir nichtnur Klammerungen der Form

”n Summanden treffen auf einen weiteren Summanden“

betrachten mussen, also etwa

(a+ ((b+ c) + d)) + e .

In der Tat mussen wir auch Summen der Art

((a+ b) + c) + (d+ e)

verarzten, also hier, mit geeignet formuliertem A(n) als Aussage fur n Summanden, A(5)daraus folgern mussen, dass A(2) und A(3) gelten.

Weiter benotig man bisweilen eine Mehrfachinduktion, d.h. eine Induktion nach meh-reren Variablen, etwa m und n. Auf diese Weise kann man das in einer Weile behandelteDistributivgesetz (5.2) beweisen.

2.4 Bonusmaterial und Anmerkungen

Wir haben das Prinzip der vollstandigen Induktion in diesem Kapitel postuliert. Intuitivist dieses Prinzip wie eine unendliche Kette von Dominosteinen: Fallt der erste Stein um,und stoßt jeder Stein den folgenden Stein um, dann fallen alle Steine um. Das Prinzip dervollstandigen Induktion basiert auf genau diesem Prinzip.

Dahinter steckt die Tatsache, dass die naturlichen Zahlen”wie auf der Perlenschnur auf-

gereiht sind“: jede naturliche Zahl n hat genau einen Nachfolger n+ 1, und verschiedenenaturliche Zahlen m 6= n haben verschiedene Nachfolger m + 1 6= n + 1. In der Analogieder Dominokette verhindert dies, dass sich eine Schleife bildet und beim Umfallen nichtalle Steine (Zahlen) erreicht werden.

Wir haben die naturlichen Zahlen ganz zu Beginn von Kapitel 1 als gegeben voraus-gesetzt. Man kann sie jedoch auch axiomatisch einfuhren. Dies leisten die Peanoaxiome(Giuseppe Peano, 1858–1932). Insbesondere formalisieren diese Axiome obiges Perlen-schnurargument. Hat man die naturlichen Zahlen auf diese Weise sauber eingefuhrt, kannman das Prinzip der vollstandigen Induktion beweisen, statt es nur zu postulieren. Wirverweisen auf die in Abschnitt 3.6 aufgefuhrte Literatur.

12

Page 19: Vorlesungsskript zur Analysis 1 -

3 Mengen

Ich weiß nicht, was in Cantors Theorie vorherrscht – Philosophie oder Theologie,aber ich bin sicher, dass es keine Mathematik gibt.

Leopold Kronecker (1823–1891)

Aus dem Paradies, das Cantor uns geschaffen hat, soll uns niemand vertreibenkonnen.

David Hilbert (1862–1943)

3.1 Grundbegriffe der Mengenlehre

Mathematische Gegenstande werden in der Sprache der Mengenlehre formuliert. Der Be-grunder der Mengenlehre, Georg Cantor (1845–1918), hat im Jahre 1895 den Begriff einerMenge so definiert:

Unter einer Menge verstehen wir eine Zusammenfassung von bestimmten,wohlunterschiedenen Objekten unserer Anschauung oder unseres Denkens zueinem Ganzen.

Etwas moderner formuliert: Eine Menge ist dadurch charakterisiert, dass jedes (reale oderabstrakte) Objekt entweder zu dieser Menge gehort oder nicht.

Die Objekte, aus denen sich eine Menge zusammensetzt, heißen Elemente der Menge.Ist M eine Menge, so schreiben wir

x ∈M (”x ist Element von M“) ,

falls x Element von M ist, andernfalls

x /∈M (”x ist nicht Element von M“) .

Ein Beispiel ist die Menge aller Wochentage. Sie hat sieben Elemente. Weiter gibt es dieleere Menge, geschrieben

∅ ,welche kein Element enthalt. Es gilt also ∅ = {}. Zu beachten ist, dass wir zwischen einemElement x und der einelementigen Menge {x} sauber unterscheiden mussen.

Uber die Natur der einzelnen Objekte wird im allgemeinen Mengenbegriff nichts voraus-gesetzt. Beispiel: Wir konnen ohne weiteres die Zahl 2, den Flughafen Munchen, undden Nordpol als eine Menge mit drei Elementen betrachten. Eine Menge muss lediglichwohldefiniert sein in dem Sinn, dass es sich zu jedem Objekt x eindeutig sagen lasst, obx zur Menge gehort oder nicht. Normalerweise haben die Elemente einer Menge aber ir-gend etwas gemeinsam (etwa, Wochentage zu sein, oder Verbindungslinien zwischen zweiPunkten zu sein); sonst hat man kein Motiv, sie zu einer Menge zusammenzufassen.

Mengen kann man auf verschiedene Weise angeben und erhalten. Eine Moglichkeit ist,dass man ihre Elemente einzeln aufschreibt und in geschweifte Klammern setzt. Beispiel:

13

Page 20: Vorlesungsskript zur Analysis 1 -

{1, 3, 5, 7}. Oft markiert man Auslassungen mit Punktchen, sofern der Leserschaft klarist, was gemeint ist; hier etwa {1, 2, 3, . . . , 100}. So verfahrt man insbesondere auch beiMengen mit unendlich vielen Elementen, etwa bei der Menge N der naturlichen Zahlen

N = {0, 1, 2, 3, 4, . . . } ,

und der Menge Z der ganzen Zahlen

Z = {0, 1,−1, 2,−2, 3,−3, . . . } ,

oderZ = {. . . ,−2,−1, 0, 1, 2, . . . } .

Wir schreiben N>0 fur die Menge der positiven naturlichen Zahlen. Diese etwas umstand-liche Notation ist der Preis dafur, dass wir 0 zu den naturlichen Zahlen dazuzahlen.Das ist keine universelle Konvention, manche Autoren lassen die naturlichen Zahlen beider 1 beginnen. Fur uns ist unsere Festsetzung praktischer; Puristen wurden außerdemanfuhren, dass unsere Notation direkt der Definition der naturlichen Zahlen durch Johnvon Neumann (1903–1957) entspricht, die am Ende des Kapitels in Abschnitt 3.6 kurzbesprochen wird.

Eine weitere Moglichkeit, neue Mengen zu erhalten, ist die Bildung von Teilmengen bereitsbekannter Mengen. Eine Menge N heißt Teilmenge einer Menge M , geschrieben

N ⊂M ,

wenn jedes Element von N auch Element von M ist; in diesem Fall nennt man M eineObermenge von N . Beispiele:

{1, 3} ⊂ {0, 1, 2, 3, 4} , N ⊂ Z , G ⊂ N ,

falls wir mit G die Menge aller geraden naturlichen Zahlen bezeichnen. Diese Definitionverlangt nicht, dass N und M verschieden sind, also gilt z.B. {1, 3} ⊂ {1, 3}. (MancheAutoren schreiben deshalb A ⊆ B, wenn wir A ⊂ B schreiben.)

Teilmengen kann man dadurch angeben, dass man eine sie definierende Eigenschaft for-muliert. Beispiel:

G :={n∣∣ n ∈ N, n/2 ∈ N

}

liefert die Menge der geraden Zahlen als Teilmenge von N; dabei bedeutet”:= “, dass die

linke Seite durch die rechte definiert wird. Dieselbe Menge erhalten wir, wenn wir setzen

G ={n∣∣ n ∈ N, es gibt ein m ∈ N mit n = 2m

}.

Eine solche Beschreibung hat die allgemeine Form

N ={x∣∣ x ∈M, A(x) ist wahr

}

wobei A(x) eine Aussage ist, die die Variable x enthalt. Man kann auch schreiben N ={x ∈M

∣∣ A(x) ist wahr}

.

Zwei Mengen M und N heißen gleich, geschrieben M = N , wenn sie dieselben Elementeenthalten. Das ist gleichbedeutend mit

N ⊂M und M ⊂ N .

14

Page 21: Vorlesungsskript zur Analysis 1 -

Beispiel:{1, 3, 5, 7} = {1, 5, 7, 3} = {1, 3, 5, 7, 5} .

Im rechts stehenden Ausdruck taucht 5 zweimal auf. Damit ist nicht gemeint, dass dieMenge zweimal die 5 enthalt, denn alle Elemente mussen

”wohlunterschieden“ (Can-

tor) sein, das muss auch in ihrer Bezeichnung zum Ausdruck kommen. Die zweite 5 in{1, 3, 5, 7, 5} ist uberflussig, und es gibt normalerweise keinen Grund, ein Element (hierdie 5) mehrfach aufzulisten. Beschreibt man die Menge aber anders als durch expliziteAufzahlung, kann eine solche Situation durchaus auftreten. Zum Beispiel: Wir beschreibendie rationalen Zahlen Q durch

Q =

{p

q

∣∣ p, q ∈ Z, q 6= 0

}.

Als Ergebnis von p/q tauchen alle rationalen Zahlen mehrfach (sogar unendlich oft) auf,die Zahl 3 beispielsweise nicht nur als 3/1, sondern auch in den Verkleidungen 6/2, 9/3,(−3)/(−1) . . . . Hier wie im Allgemeinen ware es sehr unzweckmaßig, nur solche Beschrei-bungen von Mengen zuzulassen, in denen jedes Element genau einmal aufgefuhrt wird.

Es kann sehr wohl passieren, dass eine Beschreibung einer Menge dazu fuhrt, dass diesekeine Elemente enthalt. Beispiel:

N ={n∣∣ n ∈ N , n = n+ 1

}

enthalt keine Elemente, N = ∅.Falls N ⊂M und N 6= M , so gibt es mindestens ein Element von M , welches nicht in Nliegt. Wir sagen dann, dass N eine echte Teilmenge von M ist, und schreiben

N $M .

Abschließend weisen wir noch kurz darauf hin, dass eine widerspruchsfreie Definition, waseine Menge genau ist, durchaus schwierig ist. Dies sieht man an folgendem Beispiel (Rus-sellsche Antinomie, 1903): Angenommen, man kann die Menge aller Mengen definieren,sie heiße Y . Die Menge aller Mengen, die sich nicht selbst enthalten, also

R ={A∣∣ A ∈ Y, A /∈ A

}, (3.1)

ist dann eine Teilmenge von Y . Nun ist R aber nicht widerspruchsfrei definiert. Denn daR eine Menge von Mengen ist, musste fur die Menge R selbst ja entweder R ∈ R oderR /∈ R gelten, beides fuhrt jedoch auf einen Widerspruch.

Aus der Russellschen Antinomie konnen wir lernen, dass die Wahl eines der Mathematikzugrundeliegenden Axiomensystems sehr gut bedacht sein muss. Der bedeutende LogikerGottfried Frege (1848–1925) hatte quasi als Axiom verwendet, dass fur jede EigenschaftE die Menge

M = {x∣∣ x hat die Eigenschaft E} (3.2)

definiert werden kann. Das sieht auch hochst plausibel aus, aber die Antinomie (3.1) isteine auf diese Weise definierte Menge, die direkt auf den Widerspruch R ∈ R ⇔ R /∈ Rfuhrt. Dies kam als volliger Schock fur Frege, der dadurch sein Lebenswerk zerstort sah.Was die Antonomie wirklich zeigt, ist aber, dass eine naiver Mengenbegriff, der belie-bige Definitionen der Form (3.2) zulasst, nicht tragfahig genug ist. Die Mengenbildung

15

Page 22: Vorlesungsskript zur Analysis 1 -

durch definierende Eigenschaften darf nur so erlaubt sein, dass keine Widerspruche wiedie Russellsche Antinomie auftreten konnen. Grob gesagt erreicht die Zermelo-Fraenkel-Axiomatik dies, indem man dort nur zu jeder schon bekannten Menge M als weitereMenge

{x ∈M∣∣ x hat die Eigenschaft E}

fur”jede“ (in Wirklichkeit nicht ganz jede) Eigenschaft E bilden darf.

3.2 Mengenoperationen und ihre Rechenregeln

Sind M und N Mengen, so definieren wir

M ∪N ={x∣∣ x ∈M oder x ∈ N

}(Vereinigung) ,

M ∩N ={x∣∣ x ∈M und x ∈ N

}(Durchschnitt) .

Falls die Mengen M und N kein gemeinsames Element haben, gilt

M ∩N = ∅ .In diesem Fall heißen M und N disjunkt.

Beispiele:N ∪ Z = Z , N ∩ Z = N .

Das Komplement einer Menge N in einer Menge M ist definiert als

M \N ={x∣∣ x ∈M und x /∈ N

}.

Beispiel:Z \ N = {−1,−2,−3, . . . } .

Satz 3.1 (Rechenregeln fur Mengen)Seien M,N,P Mengen. Dann sind folgende Gesetze erfullt:

(i) Transitivitat: Aus M ⊂ N und N ⊂ P folgt M ⊂ P .

(ii) Assoziativitat der Vereinigung: Es gilt

(M ∪N) ∪ P = M ∪ (N ∪ P ) .

(iii) Assoziativitat des Durchschnitts: Es gilt

(M ∩N) ∩ P = M ∩ (N ∩ P ) .

(iv) Kommutativgesetze: Es gilt

M ∪N = N ∪M und M ∩N = N ∩M .

(v) Distributivgesetze: Es gilt

M ∪ (N ∩ P ) = (M ∪N) ∩ (M ∪ P )

und

M ∩ (N ∪ P ) = (M ∩N) ∪ (M ∩ P ) .

16

Page 23: Vorlesungsskript zur Analysis 1 -

Beweis: Zu (i): Ist x ∈M , so ist x ∈ N wegen M ⊂ N und weiter x ∈ P wegen N ⊂ P .

Zu (ii): Es gilt

x ∈ (M ∪N) ∪ P ⇔ x ∈M ∪N oder x ∈ P⇔ (x ∈M oder x ∈ N) oder x ∈ P⇔ x ∈M oder (x ∈ N oder x ∈ P )

⇔ x ∈M oder x ∈ N ∪ P⇔ x ∈M ∪ (N ∪ P ) .

Die zweite und dritte Zeile sind aquivalent, da fur die logische Verknupfung”oder“ das

Assoziativgesetz gilt. (Wenn man das beweisen will, vergleicht man die Wahrheitstafelnbeider Aussagen.) Analog zeigt man (iii).

Die Beweise der Kommutativ- und Distributivgesetze sind zur Ubung uberlassen (SUPER).�

Aufgrund der Assoziativitat kann man Klammern weglassen und schreibt einfach

M ∪N ∪ P beziehungsweise M ∩N ∩ P .

3.3 Indizierte Mengen

Auch bei Mengen ist es oft sinnvoll, Indizes zu verwenden. Als Beispiel betrachten wirsogenannte Intervalle

Mj :=

[0,

1

j

], j ∈ N , j ≥ 1 .

Fur diese Mengen gilt

Mj+1 =

[0,

1

j + 1

]⊂[0,

1

j

]= Mj ,

sie sind also ineinander geschachtelt,

Mn ⊂Mn−1 ⊂ · · · ⊂M2 ⊂M1 = [0, 1] .

Wir bilden den Durchschnitt dieser Mengen mit einer Notation analog zur Summennota-tion. Aufgrund der Schachtelung ergibt sich

n⋂

j=1

Mj = Mn =

[0,

1

n

].

Wir konnen auch den Durchschnitt aller solcher Mengen bilden. Er ist definiert als⋂

j∈Nj>0

Mj ={x∣∣ x ∈Mj fur alle j ≥ 1

};

oft schreibt man dafur auch⋂∞j=1Mj. Das Ergebnis ist

j∈Nj>0

Mj = {0} ,

17

Page 24: Vorlesungsskript zur Analysis 1 -

da 0 zu jedem Mj gehort, aber x /∈Mj falls x > 0 und j > 1/x.

Die Indizes mussen keine naturlichen Zahlen sein. Zu h ∈ R, h > 0 definieren wir bei-spielsweise

Mh = [0, 1 + h] .

Es gilt ⋂

h∈Rh>0

Mh ={x∣∣ x ∈Mh fur alle h > 0

}= [0, 1] .

Die allgemeine Situation ist die folgende. Sei J eine beliebige Menge. Zu jedem j ∈ J seieine Menge Mj gegeben. In diesem Kontext heißt J eine Indexmenge. Die Gesamtheitder Mengen Mj nennen wir eine Mengenfamilie und bezeichnen sie mit (Mj)j∈J odermit {Mj}j∈J . Ist beispielsweise J =

{h∣∣ h ∈ R, h > 2

}und Mh = [2, h], so ist (Mh)h∈J

die Familie aller abgeschlossener beschrankter Intervalle, deren linker Randpunkt gleich2 ist.

Ist (Mj)j∈J eine Familie von Mengen, so definieren wir⋃

j∈J

Mj ={x∣∣ es gibt ein j ∈ J mit x ∈Mj

},

und ⋂

j∈J

Mj ={x∣∣ fur alle j ∈ J gilt x ∈Mj

}.

Ein weiteres Beispiel: Sei J = N>0, sei fur n ∈ J

Mn ={pn

∣∣ p ∈ Z}

=

{. . . ,− 3

n,− 2

n,− 1

n, 0,

1

n,

2

n,

3

n, . . .

}.

Dann ist ⋃

n∈N>0

Mn = Q .

Fur solche Vereinigungen und Durchschnitte nehmen die Distributivgesetze die Form an

N ∪⋂

j∈J

Mj =⋂

j∈J

(N ∪Mj) ,

N ∩⋃

j∈J

Mj =⋃

j∈J

(N ∩Mj) .

Eine Vereinigung ∪j∈JMj heißt disjunkt, wenn alle beteiligten Mengen paarweise disjunktsind, das heißt, wenn Mj ∩Mk = ∅ fur alle j, k ∈ J mit j 6= k. Es genugt nicht, dass

j∈J

Mj = ∅ .

Beispielsweise ist die Vereinigung der Intervalle [j, j + 2] mit j ∈ N keine disjunkte Ver-einigung, da [0, 2] ∩ [1, 3] = [1, 2] 6= ∅. In diesem Fall gilt

j∈N

[j, j + 2] = ∅

(benachbarte Intervalle haben nichtleeren Schnitt, aber weiter entfernte Intervalle gebenleeren Schnitt).

18

Page 25: Vorlesungsskript zur Analysis 1 -

3.4 Mengen von Mengen

Die Elemente einer Menge konnen ohne weiteres selbst wieder Mengen sein. Ein Beispielist die Menge {

[a, b]∣∣ a, b ∈ R , a < b

}

aller abgeschlossenen beschrankten Intervalle (siehe Abschnitt 5.6 fur diese Begriffe).

Ist M eine Menge, so heißt die Menge P(M) aller Teilmengen von M ,

P(M) ={N∣∣ N ⊂M

}

die Potenzmenge von M . Wir verabreden, dass ∅ ⊂ M gilt fur jede Menge M , also∅ ∈ P(M). (Die Negation von

∀x ∈ ∅ gilt x ∈M

liefert die Aussage

∃x ∈ ∅ mit x /∈M ,

welche wir als falsch ansehen wollen.) Die Potenzmengenbildung lasst sich wiederholen:So sind auch

P(P(M)) , P(P(P(M))) , . . .

Mengen. Beispiel: Ist [a, b] ein beschranktes Intervall wie oben, so ist

[a, b] ⊂ R , also [a, b] ∈ P(R) .

Fur die Menge aller solcher Intervalle gilt{

[a, b]∣∣ a, b ∈ R, a < b

}⊂ P(R) , also

{[a, b]

∣∣ a, b ∈ R, a < b}∈ P(P(R)) .

Der allgemeine Mengenbegriff ermoglicht es einerseits, in ganz unterschiedlichen Situa-tionen (die nichts mit Zahlen und Funktionen zu tun haben brauchen) mathematischeTheorien zu entwickeln und zum Einsatz zu bringen.

Es hat sich aber andererseits sehr bald herausgestellt, dass der schrankenlose Umgang mitdem Mengenbegriff zu Widerspruchen fuhrt. So ist es z.B. nicht von vornherein ausge-schlossen, dass eine Menge sich selbst als Element enthalt (obwohl das zugegebenermaßenetwas merkwurdig klingt). Damit hat Bertrand Russell (1872–1970) ein Beispiel (Russell-sche Antinomie) konstruiert, das wir schon in Abschnitt 3.1 kurz angesprochen hatten.Der Versuch, solche sogenannte Antinomien (es gibt noch mehr davon) in den Griff zubekommen, hat zu Beginn des 20. Jahrhunderts eine Grundlagenkrise der Mathematikausgelost. Wir werden uns in dieser Vorlesung aber mit diesen schweren Problemen nichtweiter beschaftigen.

Fur jede beliebige Menge M definiert die Inklusion ⊂ eine Ordnungsrelation auf derPotenzmenge P(M); dieser Begriff wird in Definition 5.13 eingefuhrt. Kurz gesagt be-deutet Ordnungsrelation, dass es sich um eine reflexive, transitive und antisymmetrischeRelation handelt. Dabei heißt eine Relation ⊂ reflexiv, wenn A ⊂ A gilt. Weiter ist dieseRelation transitiv, wenn A ⊂ B und B ⊂ C implizieren, dass A ⊂ C gilt. Schließlich istdie Relation antisymmetrisch, wenn A ⊂ B und B ⊂ A implizieren, dass A = B gilt.

19

Page 26: Vorlesungsskript zur Analysis 1 -

3.5 Geordnete Paare. Das Produkt zweier Mengen

Punkte in der Ebene konnen wir als ein Zahlenpaar (x, y) darstellen. Die Reihenfolge derbeiden Zahlen ist wesentlich, die Punkte (1, 2) und (2, 1) beispielsweise sind verschieden.(Im Gegensatz dazu spielt es bei einer Menge keine Rolle, in welcher Reihenfolge dieElemente angegeben werden, es ist {1, 2} = {2, 1}.) Man nennt

(x, y)

ein geordnetes Paar. Die allgemeine Situation ist die folgende:

Seien M und N zwei Mengen. Wir definieren die Produktmenge (auch als kartesischesProdukt oder kurz als (Mengen-)Produkt bezeichnet) M ×N durch

M ×N ={

(x, y)∣∣ x ∈M, y ∈ N

}, (3.3)

also als Menge aller geordneten Paare, fur die die erste Komponente ein Element von Mund die zweite Komponente ein Element von N ist. Die Mengen M und N heißen dieFaktoren von M ×N .

Aus der Zahlengerade R erhalten wir auf diese Weise die Ebene R×R, und darin Z×Z alsdas Gitter der Punkte mit ganzzahligen Koordinaten. (Die mit diesem Beispiel verbundeneVorstellung eines rechten Winkels zwischen den Faktoren ist aber nicht Bestandteil derDefinition (3.3)!)

Eine Nebenbemerkung: Wenn man will, kann man den Begriff des geordneten Paares aufden Mengenbegriff zuruckfuhren, indem man setzt

(x, y) = {{x} , {x, y}} .

Dadurch erreicht man, dass (x, y) 6= (y, x) gilt, falls x 6= y.

In analoger Weise kann man Produkte von mehr als zwei Mengen definieren: Ist n ∈ N,n ≥ 2, und sind n Mengen M1, . . . ,Mn gegeben, dann ist die Produktmenge dieser Mengendefiniert durch

M1 ×M2 × · · · ×Mn ={

(x1, x2, . . . , xn)∣∣ x1 ∈M1, x2 ∈M2, . . . , xn ∈Mn

}.

Man nennt (x1, . . . , xn) ein n-Tupel. Geordnete Paare sind also 2-Tupel.

3.6 Schlussbemerkungen

3.6.1 Cantors Werk und seine Rezeption

Cantor wurde zu Lebzeiten stark angegriffen und sein Werk wurde seinerzeit sehr kon-trovers gesehen, wie die Zitate am Beginn des Kapitels verdeutlichen. Arthur MoritzSchoenflies (1853—1928) schrieb

”Es ubersteigt nicht das erlaubte Mass, wenn ich sage,

dass die Kroneckersche Einstellung den Eindruck hervorbringen musste, als sei Cantor inseiner Eigenschaft als Forscher und Lehrer ein Verderber der Jugend“ (S.2 in

”Die Kri-

sis in Cantor’s mathematischem Schaffen“, Acta. Math. 50, 1927, 1–23). Woher kamendie starken Reaktionen? Cantor hat etwas Radikales geschaffen, namlich das Studium

20

Page 27: Vorlesungsskript zur Analysis 1 -

unendlicher Mengen und der Unendlichkeit an sich. Seine Erkenntnisse waren damalssehr uberraschend. Etwa, dass es

”verschiedene Unendlichkeiten“ gibt – wir werden se-

hen, dass die naturlichen und rationalen Zahlen abzahlbar sind; das ist in gewisser Weiseeine kontrollierte Unendlichkeit. Von den reellen Zahlen hingegen kann man zeigen, dasssie nicht abzahlbar sind; so werden wir in Satz 18.12 beweisen, dass die reellen Zahlenuberabzahlbar sind. Außerdem zeigte Cantor, dass die Strecke [0, 1]

”gleich viele“ Punkte

enthalt wie ein Quadrat mit dieser Strecke als Seite. Genauer gesagt konstruierte Cantoreine Abbildung, die die Punkte einer Strecke S der Lange 1 auf die Punkte eines QuadratsQ der Seitenlange 1 abbildet. So zeigte er, dass diese beiden Mengen S und Q die gleicheKardinalitat haben; dieser Begriff wird in der Mengenlehre eingefuhrt. Dieses Ergebnisscheint kontraintuitiv, da wir als Strecke die Kante des Quadrats wahlen konnen, alsoeine echte Teilmenge.

Zudem herrschte damals oft noch die Vorstellung, dass uber ein mathematisches Objekterst dann sinnvoll gesprochen werden kann, wenn es endlich oder zumindest abzahlbar ist;in der Philosophie der Mathematik nennt man diese Stromung Finitismus, und Kroneckerwar ein Vertreter dieser Richtung.

Aus diesem Disput konnen wir etwas Wichtiges lernen. Sowohl von Kroneckers als auchCantors Warte aus lasst sich sinnvoll Mathematik treiben. Schwierigkeiten treten auf,wenn man unbewusst Vorstellungen einfließen lasst, ob bestimmte Resultate

”sein durfen“

– etwa ob man eine Seite eines Quadrats auf das Quadrat selbst abbilden kann. Umdies zu verhindern, werden wir die Mathematik axiomatisch aufbauen, insbesondere alleSchlussfolgerungen aus Axiomen herleiten. Die Axiome der reellen Zahlen werden in Ka-pitel 5 eingefuhrt. Wenn eine Aussage aus diesen Axiomen hergeleitet werden kann, giltsie, unabhangig davon, ob sie uns plausibel erscheint oder nicht. Zur Ehrenrettung derVertreter des Finitismus sei erwahnt, dass sie durchaus in diesem Sinne argumentieren:Sie schrieben nur vor, dass alle Objekte endlich oder abzahlbar sein mussen; wir werdendas nicht tun.

Wie profitabel es sein kann, kontraintuitive Resultate nicht abzulehnen, zeigt das Bei-spiel von Cantors Resultat fur ein Quadrat und dessen Kante, also einer Strecke: DiesesResultat motivierte den italienischen Mathematiker Guiseppe Peano, eine raumfullendeKurve zu konstruieren, also eine Kurve (Strecke), die auf eine Flache, etwa ein Quadrat,abgebildet werden kann, und zwar in einer stetigen Weise. (Stetigkeit wird in Kapitel 10besprochen; intuitiv bedeutet das hier, dass die Kurve gezeichnet werden kann, ohne denStift abzusetzen). Weitere Konstruktionen solcher Kurven stammen unter anderem vonHilbert [2]. Und bemerkenswerterweise finden diese

”raumfullenden Kurven“ in der Infor-

matik in der Parallelisierung Anwendung. Es lohnt sich also, das Cantorsche Paradies zuerkunden!

In der BBC-Podcastserie A Brief History of Mathematics von Marcus du Sautoy findetsich ein horenswertes Portrait von Cantor und seinem Werk [1] (sowie weitere interessantePodcasts).

3.6.2 Zur Definition der naturlichen Zahlen

Wir haben in dieser Vorlesung die naturlichen Zahlen als bekannt vorausgesetzt. Aber wasist etwa

”1“? Diese Frage ist durchaus schwierig. Ein Zugang ist das Axiomensystem von

21

Page 28: Vorlesungsskript zur Analysis 1 -

Peano. Wir besprechen dieses System und einen alternativen Zugang durch das Systemvon Zermelo-Fraenkel nicht und verweisen den interessierten Leser etwa auf [3]. Johnvon Neumann gab ein mengentheoretisches Modell der naturlichen Zahlen. Er setzte alsStartelement 0 die leere Menge, also 0 := ∅. Weiter ist 1 die Menge, die genau ein Elemententhalt, 1 := {∅}. Allgemein ist die Nachfolgermenge ist definiert als die Vereinigung derVorgangermenge und der Menge, die die Vorgangermenge enthalt. So gilt etwa

2 := {∅, {∅}}

und3 := {∅, {∅}, {∅, {∅}}} .

Das Bildungsgesetz ist alsoMn+1 := Mn ∪ {Mn} ,

startend mit M0 := ∅. Es gilt Mn ⊂Mn+1, was der Ungleichung n ≤ n+ 1 fur naturlicheZahlen entspricht.

Erganzendes Material zu diesem Kapitel

[1] 2010. url: https://www.bbc.co.uk/programmes/b00srz5b/episodes/downloads.

[2] D. Hilbert. Ueber die stetige Abbildung einer Line auf ein Flachenstuck. Math. Ann.38.3 (1891), 459–460. issn: 0025-5831. doi: 10.1007/BF01199431. url: https:

//link.springer.com/article/10.1007/BF01199431.

[3] R. Winkler. Wir zahlen bis drei — und sogar daruber hinaus. Didaktikhefte der OMG40 (2008), 129–141. url: https://dmg.tuwien.ac.at/winkler/pub/zaehlen.pdf.

22

Page 29: Vorlesungsskript zur Analysis 1 -

4 Einige Beweistechniken

Wir haben bereits zwei wichtige Beweistechniken kennengelernt: Unser erster Beweis furden Satz

Jede durch 6 teilbare naturliche Zahl ist auch durch 3 teilbar

war ein sogenannter direkter Beweis. Man diese Methode so beschreiben: Wir schreibenden Satz in der Form

A⇒ B

und finden Zwischenbehauptungen C1, . . . , Cn, so dass eine Kette von Implikationen

A⇒ C1 , C1 ⇒ C2 , . . . , Cn−1 ⇒ Cn , Cn ⇒ B

entsteht, die jede fur sich als wahr erkannt wird.

Weiter haben wir in Kapitel 2 Induktionsbeweise besprochen, die insbesondere fur Aus-sagen mit naturlichen Zahlen hilfreich sind.

4.1 Kontraposition und Widerspruchsbeweis

Wir stellen eine Methode vor, einen Satz zu beweisen, den wir in der Form A⇒ B schrei-ben, mit Voraussetzung A und Behauptung B. Die Kontraposition aus den Tautologienin Abschnitt 1.2 zeigte, dass die Aussagen

A ⇒ B und ¬ B ⇒ ¬ A

aquivalent sind. Also konnen wir den Satz beweisen, indem wir ¬ B ⇒ A zeigen, bei-spielsweise durch einen direkten Beweis. Diese Beweismethode nennt man, der Tautologieentsprechend, Kontraposition.

Wir betrachten als Beispiel folgenden Satz, wobei n ∈ N.

Ist n2 gerade, so ist auch n gerade. (4.1)

Er hat die Form A ⇒ B, wobei A die Aussage”n2 ist gerade“ und B die Aussage

”n ist

gerade“ ist. Wir fuhren folgenden Beweis durch Kontraposition:

Sei n ungerade. Dann ist n − 1 gerade. Wir setzen k = (n − 1)/2, dann istk ∈ N und n− 1 = 2k, n = 2k + 1. Weiter ist n2 = (2k + 1)2 = 4k2 + 4k + 1,also n2 − 1 = 2(2k2 + 2k) gerade und damit n2 ungerade.

Eine weitere Beweismethode fur den Satz”A⇒ B“ ist der Widerspruchsbeweis, auch

indirekter Beweis genannt. Dieser lauft darauf hinaus, zu zeigen, dass die Aussagen Aund ¬ B nicht beide wahr sein konnen. (Dann ist es unmoglich, dass A wahr und B falschist, und somit ist die Aussage

”A⇒ B“ wahr, das heißt, der Satz

”A⇒ B“ ist bewiesen.)

Als Beispiel fur einen Widerspruchsbeweis betrachten wir den beruhmten Beweis vonEuklid fur den Satz

Satz 4.1√2 ist irrational, also: Es gibt keine rationale Zahl x mit x2 = 2.

23

Page 30: Vorlesungsskript zur Analysis 1 -

Die Aussage in Satz 4.1 steht fur die Behauptung B; die Rolle der Voraussetzung A wirdvon den bekannten Rechenregeln fur Zahlen und Bruche ubernommen. Der Beweis gehtso:

Wir nehmen an, dass ¬ B gilt. Dann gibt es ein x ∈ Q mit x2 = 2. Da dannauch (−x)2 = 2 gilt, konnen wir x ≥ 0 annehmen. Seien p ∈ N und q ∈ N,q ≥ 1, mit x = p/q. Nach Auskurzen des Bruchs erhalten wir Zahlen r, s ∈ N,s 6= 0, mit x = r/s, und fur diese Zahlen gilt

r und s sind teilerfremd. (Aussage C)

Da 2 = x2 = (r/s)2, folgt 2s2 = r2, also ist 2 ein Teiler von r2 und damitnach (4.1) auch von r, also gibt es ein m ∈ N mit r = 2m. Es folgt weiter2s2 = 4m2, also s2 = 2m2, also ist 2 auch ein Teiler von s und damit gilt

r und s sind nicht teilerfremd. (Aussage ¬ C)

Wir haben einen Widerspruch hergestellt (C und ¬ C konnen nicht gleichzeitigwahr sein). Also ist der behauptete Satz 4.1 wahr. �

Fur diejenigen, denen die vor dem Beweis von Satz 4.1 gegebene Erlauterung des Prinzipseines Widerspruchsbeweises nicht formal genug ist: Ein Widerspruchsbeweis zeigt, dassdie Implikation

A ∧ (¬ B) ⇒ C ∧ (¬ C)

wahr ist, wobei C eine weitere Aussage ist. Wir setzen X := A ∧ (¬ B) und Y := C ∧ (¬C). Da C ∧ (¬ C) immer falsch ist, die Implikation aber wahr ist, ergibt sich zunachstfolgende Wahrheitstafel:

X Y X ⇒ Y? F W

Ein Vergleich mit der Wahrheitstafel fur die Implikation zeigt, dass die Aussage X falschsein muss: Ist X wahr und Y falsch, dann ist die Implikation X⇒ Y falsch, was hier nichtgegeben ist. Also muss die Aussage A ∧ (¬ B) falsch sein. Nun zeigt ein Vergleich derWahrheitstafeln, dass die Aussagen

A ∧ (¬ B) und ¬ (A⇒ B)

aquivalent sind, und somit ist”A⇒ B“ wahr. (Dies konnen wir unter Benutzung der

Tautologien so sehen: Diese Aquivalenz gilt, wenn A⇒ B aquivalent ist zu ¬(A ∧ (¬ B));mit der zweiten De Morganschen Regel ist der letzte Ausdruck aquivalent zu ¬ A ∨ B; inden Tautologien in Abschnitt 1.2 war dieser Ausdruck in der Tat als aquivalent zu A⇒ Bangegeben.)

Haufig zeigt man eine der folgenden Varianten:

(i) A ∧ (¬ B) ⇒ ¬ A

(ii) A ∧ (¬ B) ⇒ B

24

Page 31: Vorlesungsskript zur Analysis 1 -

(iii) A ∧ (¬ B) ⇒ beliebige (immer) falsche Aussage

Der Fall (i) entspricht C = A, denn es gilt auch A ∧ (¬ B) ⇒ A. Der Fall (ii) entsprichtC = B, denn es gilt auch A ∧ (¬ B) ⇒ ¬ B. Fall (iii) entspricht einer beliebigen Wahlvon C.

4.2 Zum axiomatischen Aufbau der Mathematik

Ein Satz kann auf verschieden Weisen bewiesen werden. Zum Beispiel (wir verwenden hierSchulwissen uber reelle Zahlen, Ungleichungen und Wurzeln, die in den Kapiteln 5 und 6prazise eingefuhrt werden):

Satz 4.2 (Ungleichung zwischen arithmetischen und geometrischem Mittel)Fur relle Zahlen a, b ≥ 0 gilt

√ab ≤ 1

2(a+ b) ;

hier ist√ab das geometrische Mittel aus a und b und 1

2(a+ b) deren arithmetisches

Mittel.

Dies wichtige Ungleichung wird oft kurz als AGM-Ungleichung bezeichnet.

Beweis: Dies folgt aus der binomischen Formel durch Umstellen, denn

0 ≤(√

a−√b)2

= a− 2√ab+ b

impliziert2√ab ≤ a+ b ,

woraus die AGM-Ungleichung durch Division durch 2 folgt. �

Wir skizzieren in Abb. 4.1 einen zweiten Beweis fur Satz 4.2, der geometrische Hilfsmit-tel verwendet, insbesondere den Hohensatz. (Viele solcher geometrischen Beweise

”ohne

Worte“ finden sich in [3].) Es wird empfohlen (SUPER), diesen Beweis sauber als Text

a+b2

√ab

ba

Abbildung 4.1: Ein geometrischer Beweis der AGM-Ungleichung.

25

Page 32: Vorlesungsskript zur Analysis 1 -

aufzuschreiben. Insbesondere muss man sich (hier und bei jedem Beweis) uberlegen, wiesehr man ins Detail gehen kann, sprich: Welche Aussagen offensichtlich sind und welcheeiner Erlauterung bedurfen. Insbesondere am Anfang ist es hilfreich, eher zu vorsichtigzu sein und auch elementar scheinende Schritte zu erklaren – damit vermeidet man dasRisiko, versehentlich einen falschen Schluss zu verwenden, weil man nicht sorgfaltig genuggearbeitet hat.

R1 R2

R1

R2

Abbildung 4.2: Zu den Kirchhoffschen Gesetzen: Reihenschaltung (links) und Parallel-schaltung (rechts).

a b

b a

Abbildung 4.3: Ein”elektrischer Beweis“ der AGM-Ungleichung.

Zum Schluss noch ein”elektrischer“ Beweis fur Satz 4.2. Wir betrachten den Stromkreis

in Abb. 4.3 und benutzen folgende Gesetze, die aus den Kirchhoffschen Gesetzen folgen,siehe Abb. 4.2:

(i) Fur eine Reihenschaltung zweier Widerstande R1 und R2 ist der Gesamtwiderstand

R = R1 +R2 . (4.2)

(ii) Fur eine Parallelschaltung zweier Widerstande ist der resultierende Gesamtwider-stand gegeben durch

1

R=

1

R1

+1

R2

. (4.3)

26

Page 33: Vorlesungsskript zur Analysis 1 -

In Abb. 4.3 sind vier Widerstande gegeben, zwei mit Widerstand a und und zwei mitWiderstand b. Damit hat die obere Leitung nach (4.2) den Widerstand a + b als Rei-henschaltung von zwei Widerstanden, und die untere Leitung genauso. Zunachst sei derSchalter offen. Dann handelt es sich bei dem gesamten Schaltkreis um eine Parallellschal-tung zweier Widerstande a+ b. Nach (4.3) gilt fur den Gesamtwiderstand

1

R=

1

a+ b+

1

a+ b=

2

a+ b;

der Gesamtwiderstand ist also bei offenem Schalter durch das arithmetische Mittel

1

2(a+ b) (4.4)

gegeben.

Jetzt schließen wir den Schalter. Dann liegen zwei Widerstande in Reihe geschaltet vor,die jeweils aus einer Parallelschaltung bestehen. Jeder einzelne dieser Widerstande hatnach (4.3) als inversen Widerstand

1

a+

1

b=a+ b

ab;

damit ist fur jeden Einzelwiderstand der Widerstand gegeben durch

(1

a+

1

b

)−1

=ab

a+ b.

Der Gesamtwiderstand ist, da zwei Widerstande in Reihe geschaltet sind, doppelt so hoch,also

2ab

a+ b. (4.5)

Wir benutzen die intuitiv plausible Tatsache, dass das Schließen des Schalters den Wi-derstand nur reduzieren kann. Also folgt aus Vergleich von (4.4) und (4.5)

2ab

a+ b≤ 1

2(a+ b) ,

woraus die AGM-Ungleichung leicht durch Umordnen und Wurzelziehen folgt.

Fuhlen Sie sich unwohl, wenn Ihnen diese Argumentation als Beweis verkauft wird? Dasware gut, denn zum einen gibt es eine Lucke – wird der Widerstand beim Schließen desSchalters tatsachlich kleiner, weil der Strom jetzt

”mehr Wahl“ hat? Diese Lucke kann man

schließen, wie in [2] gezeigt. Aber der Beweis basiert auf physikalischen Regeln, namlichden Kirchhoffschen Gesetzen. Gelten diese Gesetze (und damit die AGM-Ungleichung)universell, etwa auch auf dem Mars oder in einem Paralleluniversum?

Diese Frage zeigt: Wir mussen uns klar werden, von welchen Annahmen wir ausgehen wol-len. Die Mathematik geht hier einen extrem bemerkenswerten Weg. Um die Frage nachder Gultigkeit der zugrundeliegenden Annahmen (wie den Kirchhoffschen Gesetze) zuentscharfen, einigen wir uns auf eine kleine Menge grundlegender Regeln, der sogenann-ten Axiome. Wir werden im nachsten Kapitel die Axiomen der reellen Zahlen zusam-menstellen. Aus diesen Axiomen werden dann alle weiteren Aussagen hergeleitet, etwa

27

Page 34: Vorlesungsskript zur Analysis 1 -

die binomischen Formeln in Kapitel 5. Damit wird der erste Beweis wasserdicht. Mit et-was mehr Arbeit lasst sich aus den Axiomen der Hohensatz herleiten, und damit dergeometrische Beweis rigoros machen.

Den”elektrischen“ Beweis sehen wir anders: Der interessante Punkt ist, dass aus den ab-

strakten Axiomen des kommenden Kapitels 5 die AGM-Ungleichung hergeleitet werdenkann. Diese Ungleichung ist also nicht abstrakt, sondern besitzt auch eine geometrischeund eine elektrische Interpretation. Selbst als gestandener Mathematiker kommt man im-mer wieder ins Staunen, wenn man sieht, welche (oft unerwarteten) Anwendungen dieMathematik hat. Das schone Buch [2] beispielsweise interpretiert mathematische Resul-tate in physikalischem Kontext (das Schaltkreisargument ist daraus entnommen).

Man kann die in dem nachsten Kapitel beginnende mathematische Axiomatik nur als Ge-niestreich bezeichnen. Denn zunachst sehen die Axiome und auch die Folgerungen wie dieAGM-Ungleichung abstrakt aus; in Wirklichkeit sind sie aber fur Anwendungen hochstrelevant. So tritt beispielsweise die AGM-Ungleichung nicht nur – wie gezeigt – in elek-trischen Schaltkreisen auf, sondern kann auch als zweiter Hauptsatz der Thermodynamikgedeutet werden [1]. Der Nobelpreistrager Eugene Wigner (1902–1995) hat solche uner-warteten Zusammenhange in dem lesenswerten Artikel The unreasonable effectiveness ofmathematics in the natural sciences diskutiert [4], etwa

The first point is that the enormous usefulness of mathematics in the naturalsciences is something bordering on the mysterious and that there is no rationalexplanation for it.

Ein Erklarungsversuch fur die Bedeutung der Mathematik in den Anwendungswissen-schaften ist, dass die Axiome, die wir in Kapitel 5.1 studieren werden, außerordentlichgeschickt gewahlt sind – obwohl sie abstrakt sind, kommt man von dort relativ schnellzu Aussagen wie der AGM-Ungleichung, die in Anwendungen auftauchen. Wie gut dieseBrucke von Abstraktion zu Anwendung funktioniert, ist aber tatsachlich bordering on themysterious.

4.3 Bonusmaterial: Die Jagd nach dem kleinsten Verbrecher

Manchmal”funktioniert“ ein Standardinduktionsbeweis nicht, weil die Induktionsannah-

me A(n) zu schwach ist, um A(n+ 1) zu folgern. Das”Prinzip des kleinsten Verbrechers“

erlaubt es bisweilen dennoch, die Aussage A(n) fur alle n ∈ N zu beweisen. Dieses Prinzipbasiert auf dem folgenden Satz.

Satz 4.3Jede nichtleeres M ⊂ N besitzt ein kleinstes Element.

Beweis: Wir fuhren einen Widerspruchsbeweis. Angenommen, M besitzt kein kleinstesElement. Wir beweisen dann durch Induktion

0, . . . , n /∈M

fur alle n ∈ N. Induktionsanfang: Da M kein kleinstes Element besitzt, gilt 0 /∈ M .Induktionsschritt: Seien 0, 1, . . . , n /∈ M . Dann kann auch n + 1 nicht in M liegen, da es

28

Page 35: Vorlesungsskript zur Analysis 1 -

sonst das kleinste Element ware. Damit folgt M = ∅. �

Mit diesem Resultat konnen wir jetzt auf Verbrecherjagd gehen. Dazu betrachten wir dieMenge

M :={n ∈ N

∣∣ A(n) gilt nicht}.

Um zu zeigen, dass M = ∅ gilt, nehmen wir an, dass M 6= ∅ gilt. Dann existiert nachSatz 4.3 ein

”kleinster Verbrecher“, namlich das kleinste Element von M . Damit aus-

gerustet versuchen wir, einen Widerspruch herzuleiten. Zum Beispiel:

Satz 4.4Jede naturliche Zahl n ≥ 2 ist ein Produkt von Primfaktoren.

Beweis: Angenommen, das ist falsch. Dann gibt es eine kleinste naturliche Zahl m ≥ 2,die kein Produkt von Primfaktoren ist. Entweder ist m selber Primzahl oder nicht –aber ersteres ist nicht moglich, da m dann ein (triviales) Produkt von Primzahlen ware.Letzteres geht aber auch nicht, denn in diesem Fall wurde m faktorisieren, etwa m =nk mit n, k ≥ 2 und n, k < m. Dann waren aber sowohl n als auch k Produkte vonPrimzahlen. Dann ware m nicht der kleinste Verbrecher. �

Literatur fur dieses Kapitel

[1] C. Graham und T. Tokieda. An entropy proof of the arithmetic mean–geometricmean inequality. Amer. Math. Monthly 127.6 (2020), 545–546. issn: 0002-9890. doi:10.1080/00029890.2020.1738827. url: https://www.tandfonline.com/doi/full/10.1080/00029890.2020.1738827.

[2] M. Levi. The mathematical mechanic: using physical reasoning to solve problems.Princeton University Press, Princeton, NJ, 2009, x+186. isbn: 978-0-691-14020-9.doi: 10.1515/9781400830473. url: https://doi.org/10.1515/9781400830473.

[3] R. B. Nelsen. Proofs Without Words: Exercises in Visual Thinking. Classroom re-source materials. Mathematical Association of America, 1993. isbn: 9780883857007.url: https://bookstore.ams.org/clrm-1.

[4] E. P. Wigner. The unreasonable effectiveness of mathematics in the natural sciences[Comm. Pure Appl. Math. 13 (1960), 1–14; Zbl 102, 7]. Comm. Pure Appl. Math.XIII (1960), 1–14. url: https://onlinelibrary.wiley.com/doi/abs/10.1002/cpa.3160130102.

29

Page 36: Vorlesungsskript zur Analysis 1 -

5 Reelle Zahlen

5.1 Axiomatische Charakterisierung

Man konnte auch an ein Lexikon denken, das (nahezu) alle Begriffe, die es zurDefinition von Begriffen benutzt, an der entsprechenden Stelle selbst definiert undnur ausnahmsweise Referenzen auf undefinierbare Begriffe zulasst.

Niklas Luhmann, Okologische Kommunikation, Westdeutscher Verlag

5.1.1 Korperaxiome

Geht man davon aus, dass die naturlichen Zahlen N als Menge ebenso bekannt sind wie dieAddition und Multiplikation in N, so lassen sich daraus sukzessive die ganzen Zahlen Z,die rationalen Zahlen Q und die reellen Zahlen R erhalten. Dieser Konstruktionsprozessist interessant, aber aber auch recht langwierig und fur das Verstandnis der modernenAnalysis nicht zentral. Wir behandeln ihn daher in dieser Vorlesung nicht.

Die Alternative ist, die reellen Zahlen R axiomatisch als Menge mit charakterisierendenEigenschaften einzufuhren. Dieses Vorgehen geht auf David Hilbert zuruck.

Die axiomatisch verlangten Eigenschaften von R zerfallen in drei Kategorien. Die ersteKategorie enthalt die sogenannten Korpereigenschaften: Es gibt eine Addition und eineMultiplikation, die aus zwei Zahlen x, y ∈ R deren Summe x+ y ∈ R und deren Produktx·y ∈ R erzeugen, und zwar so, dass (R,+, ·) ein Korper ist. Eine Menge K heißt Korper,wenn folgendes gilt: K enthalt mindestens zwei verschiedene Elemente, genannt 0 und 1,und fur beliebige Elemente x, y ∈ K sind zwei Operationen definiert, die sogenannteAddition x + y und die Multiplikation x · y, die jeweils wieder ein Element in Kerzeugen. Weiterhin wird gefordert:

(K1) Die Addition hat folgende Eigenschaften.

(i) Das Assoziativgesetz gilt:

(x+ y) + z = x+ (y + z) , fur alle x, y, z ∈ K . (A+)

(ii) Das Kommutativgesetz ist erfullt:

x+ y = y + x , fur alle x, y ∈ K . (K+)

(iii) Weiter ist 0 neutrales Element :

x+ 0 = x , fur alle x ∈ K . (N+)

(iv) Jedes Element ist invertierbar : Zu jedem x ∈ K existiert ein Element in y ∈ K,fur das gilt

x+ y = 0 . (I+)

Man bezeichnet y als inverses Element von x bezuglich der Addition undschreibt dafur oft (−x).

30

Page 37: Vorlesungsskript zur Analysis 1 -

(K2) Die Multiplikation hat folgende Eigenschaften.

(i) Das Assoziativgesetz gilt:

(x · y) · z = x · (y · z) , fur alle x, y, z ∈ K . (A·)

(ii) Das Kommutativgesetz ist erfullt:

x · y = y · x , fur alle x, y ∈ K . (K·)

(iii) Weiter ist 1 neutrales Element :

x · 1 = x , fur alle x ∈ K . (N·)

(iv) Jedes von 0 verschiedene Element ist invertierbar : Zu jedem x ∈ K \ {0}existiert ein Element in y ∈ K, fur das gilt

x · y = 1 . (I·)

Man bezeichnet y als inverses Element von x bezuglich der Multiplikation undschreibt dafur oft x−1.

(K3) Es gilt das Distributivgesetz

x · (y + z) = x · y + x · z , fur alle x, y, z ∈ K . (D)

Aus diesen Axiomen lassen sich unmittelbar eine Reihe leicht beweisbarer weiterer Eigen-schaften ableiten. Wir erwahnen wichtige Folgerungen und Konventionen:

Dank Assoziativitat und Kommutativitat ist das Setzen von Klammern in reinen Summensowie die Reihung der Summanden irrelevant, analog zu Durchschnitten und Vereinigun-gen von Mengen (siehe Satz 3.1 und die starke Induktion in Abschnitt 2.3). Wir konnenalso (a+ d) + (e+ (c+ b)) auch schreiben als a+ b+ c+ d+ e; entsprechendes gilt fur dieMultiplikation. Das haben wir stillschweigend schon so gemacht, etwa in Kapitel 1 in (1.6)und indirekt bei der Definition des Summen- und Produktzeichens. Jetzt ist gerechtfer-tigt, dass dies erlaubt war. Außerdem wird – sofern keine Missverstandnisse zu befurchtensind – das Multiplikationsymbol · oft weggelassen: Statt (a · d) · (e · (c · b)) schreiben wirabcde.

Um Klammern zu reduzieren, vereinbaren wir weiter, dass Multiplikation und Divisionstets Vorrang vor Addition und Subtraktion haben, also

”Punkt vor Strich“. So ist etwa

x+ yz die Kurzschreibweise von x+ (yz), und nicht von (x+ y)z.

Die Annahme, dass 0 und 1 zwei verschiedene Element sind, ist ubrigens wesentlich. Sonstware die Menge {0} mit der ublichen Addition und Multiplikation, aber der Festsetzung1 := 0, ein von R verschiedener Korper, der alle in diesem Kapitel eingefuhrten Axiomezur Charakterisierung der reellen Zahlen erfullt.

31

Page 38: Vorlesungsskript zur Analysis 1 -

Bemerkung zur Eindeutigkeit von der neutralen und inversen Elemente: Mankann aus (K1) ableiten, dass es genau ein y ∈ K gibt mit x+y = x fur alle x ∈ K, namlichy = 0, d.h. das Nullelement 0 ist eindeutig. Ebenso kann man mithilfe von (K1) zeigen,dass es zu jedem x ∈ K genau ein y ∈ K gibt mit x + y = 0, namlich y = −x. Also gilt:Das Negative (−x) von x ist eindeutig. Analog kann man aus (K2) folgern, dass es genauein y ∈ K, y 6= 0, gibt mit y ·x = x fur alle x ∈ K, namlich y = 1, d.h. das Einselement 1ist eindeutig. Zudem folgt aus (K2), dass es zu jedem x ∈ K mit x 6= 0, genau ein y ∈ Kgibt mit x · y = 1, namlich y = x−1. Also: Das Inverse x−1 von x ist eindeutig bestimmt.

5.1.2 Anordnungsaxiome

Ein Korper K ist angeordnet (oder: besitzt eine Anordnung), falls es eine TeilmengeP ⊂ K, den sogenannten Positivbereich, mit folgenden Eigenschaften gibt.

(A1) Trichotomie: Fur jedes x ∈ K ist genau eine der folgenden drei Aussagen wahr:

x ∈ P , x = 0 , −x ∈ P .

(A2) Invarianz: P ist unter Addition und Multiplikation abgeschlossen, d.h. aus x, y ∈P folgt x+ y ∈ P und x · y ∈ P .

Mithilfe des Positivbereichs P kann man die folgenden Vergleichssymbole einfuhren, dieuns im Zusammenhang mit reellen Zahlen bereits bekannt sind:

x > y bedeutet x− y ∈ P ,x ≥ y bedeutet x > y oder x = y ,

x < y bedeutet y − x ∈ P ,x ≤ y bedeutet x < y oder x = y .

Insbesondere ist x > 0 gleichbedeutend mit x ∈ P . Mit R+ bezeichnen wir die nichtnega-tiven reellen Zahlen, also R+ =

{x∣∣ x ∈ R, x ≥ 0

}.

5.1.3 Vollstandigkeit

Auch die rationalen Zahlen Q bilden einen angeordneten Korper, erfullen also sowohldie Korperaxiome (K1)–(K3) als auch die Anordnungsaxiome (A1)–(A2). Es ist dahernicht moglich, allein aus diesen Axiomen die Existenz der Zahl

√2 zu beweisen, denn

der Euklidische Satz 4.1 zeigt ja, dass√

2 nicht rational sein kann. Wir brauchen alsoeine zusatzliche Charakterisierung, die R im Vergleich zu Q auszeichnet. Dafur gibt esverschiedene aquivalente Moglichkeiten. In dieser Vorlesung verwenden wir das sogenannteSupremumsaxiom. Wir beschaftigen uns mit diesem Axiom am Ende des Kapitels inAbschnitt 5.6 genauer.

Hier die zentralen Begriffe im Vorgriff auf Definition 5.22: Ist K ein angeordneter Korper,und ist M ⊂ K eine Teilmenge, dann heißt jedes s ∈ K mit der Eigenschaft, dass fur allex ∈M gilt x ≤ s, eine obere Schranke von M .

Das Vollstandigkeitsaxiom lautet:

32

Page 39: Vorlesungsskript zur Analysis 1 -

(V) Besitzt eine Teilmenge M ⊂ K irgendeine obere Schranke, dann besitzt sie aucheine kleinste obere Schranke s ∈ K. Das heißt: Ist s ∈ K eine beliebige obereSchranke fur M , dann gilt s ≥ s.

Um die Rolle dieses Axioms zu verstehen, und um Schlusse daraus ziehen zu konnen, istzunachst einige Vorarbeit notwendig. Wir werden daher das Studium der Vollstandigkeitzuruckstellen.

Die axiomatische Einfuhrung der reellen Zahlen basiert auf folgendem Postulat.

Axiom 5.1Es existieren eine Menge R versehen mit einer Addition und einer Multiplikation, eineTeilmenge P ⊂ R und Elemente 0, 1 ∈ R, so dass (R,+, ·) ein angeordneter Korper ist(also die Korperaxiome (K1)–(K3) und die Anordnungsaxiome (A1)–(A2) erfullt), derzudem dem Supremumsaxiom (V) genugt.

Man kann beweisen, dass die reellen Zahlen durch die im Axiomensystem 5.1 genanntenEigenschaften eindeutig charakterisiert werden. Wir gehen nicht genau darauf ein, wasdas genau bedeutet und wie man das beweist. Eindeutigkeit ist zu verstehen in dem Sinn,in dem man sagt, dass das Schachspiel eindeutig charakterisiert ist durch das Schachbrettmit 8 mal 8 Quadraten, der Anfangsstellung und den Zugregeln fur die einzelnen Figuren– obwohl Bretter und Figuren unterschiedliche Große und Form haben konnen.

Ebenso kann man beweisen (was wir auch nicht tun werden), dass die reellen Zahlen

0, 0 + 1, 0 + 1 + 1, . . .

die bekannten naturlichen Zahlen sind, genauer: dass die naturlichen Zahlen in die reellenZahlen eingebettet werden konnen.

Das weitere Vorgehen ist wie folgt. Wir besprechen als erstes Eigenschaften von R, diesich nicht auf das Supremumsaxiom beziehen, und sind dann in der Lage, eine Fulle vonmathematischen Objekten studieren zu konnen. Am Ende des Kapitels stellen wir dasSupremumsaxiom und seine Folgerungen vor.

5.2 Folgerungen aus den Korpereigenschaften

Wir fuhren die Subtraktion auf die Addition und die Division auf die Multiplikationzuruck, indem wir definieren

x− y := x+ (−y) , ∀x, y ∈ R ,x

y:= xy−1 , ∀x, y ∈ R mit y 6= 0 .

Fur die vier Grundrechenarten gelten eine ganze Reihe von Rechenregeln, die aus denKorperaxiomen hergeleitet werden konnen und spater standig verwendet werden. Wirstellen eine kleine Auswahl zusammen und verweisen auf die Vorlesung

”Lineare Algebra“,

in der die Korperaxiome und ihre Konsequenzen ausfuhrlich diskutiert werden.

Zunachst ein paar ganz elementare Feststellungen uber die Inversenbildung bezuglich derAddition.

33

Page 40: Vorlesungsskript zur Analysis 1 -

Lemma 5.2Seien x, y ∈ R beliebig. Dann gilt:

(i) 0 · x = 0.

(ii) (−1) · x = −x.

(iii) −(−x) = x.

(iv) (−x)y = −(xy).

(v) −(x+ y) = −x− y.

Beweis: Wir beweisen die erste Aussage (i) in aller Ausfuhrlichkeit, wie das anfangs auchvon Ihnen in den Hausaufgaben erwartet wird:

0 · x (N+)= 0 + (0 · x)

(K+)= (0 · x) + 0

(I+)= 0 · x+ (x+ (−x))

(A+)= (0 · x+ x) + (−x)

(N·)= ((0 · x) + 1 · x)) + (−x)

(D)= ((0 + 1) · x) + (−x)

(N+)= (1 · x) + (−x)

(N·)= x+ (−x)

(I+)= 0 .

Zum Beweis von Aussage (ii) konnen wir die gerade bewiesene Aussage nutzen:

x+ ((−1) · x)(N·)= (1 · x) + ((−1) · x)

(D)= (1 + (−1)) · x (i)

= 0 .

Bei Beweisen ist es wichtig, die Intuition nicht zu vergessen. Als Beispiel geben wir einArgument fur (iii): Von der Anschauung der Zahlengerade her ist klar, dass x herauskom-men muss, da der Ubergang zum Negativen einer Spiegelung am Nullpunkt entspricht.Um das praziser zu machen, argumentieren wir so: Gemaß (I+) ist −(−x) diejenige Zahlz, fur die (−x) + z = 0 gilt. Das ist aber fur z = x der Fall. Also ist −(−x) = x. Imnachsten Schritt machen wir diese Argument ganz wasserdicht, indem wir es komplett aufdie Korperaxiome zuruckfuhren:

(−x) + x(K+)= x+ (−x)

(I+)= 0 .

Sobald man mit einer genauen Beweisfuhrung vertraut genug ist und genug Ubung hat,wird man die Beweise normalerweise etwas kurzer fassen und nicht im Detail ausarbeitenwie hier in mehreren Schritten vorgefuhrt. Insbesondere wenn man sich unsicher fuhlt,sind ausfuhrliche und detaillierte Beweise aber sicherer und besser.

Der Beweis von (v) ist eine SUPER-Ubung. Der Beweis von (iv) ist den Ubungsaufgabenuberlassen, ebenso wie die folgenden elementare Feststellungen zur Inversenbildung bezuglichder Multiplikation. �

Lemma 5.3Seien x, y ∈ R \ {0}. Dann gilt:

(i) (x−1)−1

= x.

34

Page 41: Vorlesungsskript zur Analysis 1 -

(ii) (xy)−1 = x−1y−1.

(iii) (−x)−1 = −(x−1).

Eine (fast) triviale Konsequenz aus den Axiomen ist außerdem:

Lemma 5.4Seien x, y ∈ R beliebig. Dann gilt die Nullteilerfreiheit:

xy = 0 impliziert, dass x = 0 oder y = 0 .

Auch dieser Beweis ist den Ubungsaufgaben uberlassen; algebraische Aussagen wie diesewerden zudem in der Vorlesung

”Lineare Algebra“ studiert.

Wir betrachten als nachstes die (affine) Gleichung ax + b = 0, wobei a, b ∈ R gegebensind und x ∈ R gesucht wird.

Lemma 5.5Seien a, b ∈ R mit a 6= 0. Dann hat die Gleichung

ax+ b = 0 (5.1)

genau eine Losung, namlich x = − ba.

Beweis: Zum Beweis benutzen wir die aus der Schule bekannte Technik der aquivalentenUmformung von Gleichungen. An der Gultigkeit einer Gleichung andert sich nichts, wennman auf beiden Seiten dieselbe Zahl addiert. Wir addieren (−b) zu (5.1) und erhalten

ax+ b = 0 ⇔ ax = −b .Ebenso andert sich gemaß Axiom (I·) nichts an der Gultigkeit, wenn man auf beidenSeiten mit derselben von 0 verschiedenen Zahl multipliziert. (Multiplikation mit 0 erzeugtstets die triviale Gleichung 0 = 0; diese ist naturlich wahr, das sagt aber nichts uber dieGultigkeit der ursprunglichen Gleichung aus.)

Da a 6= 0, ist auch a−1 6= 0 (Ubung), und wir konnen schließen:

ax+ b = 0 ⇔ ax = −b ⇔ x = − ba.

Also gibt es eine eindeutige Losung, namlich x = − ba. �

Das Assoziativgesetz (A+) erlaubt, Summen aufspalten: Fur p ∈ Z, m− 1 ≤ p ≤ n gilt

n∑

k=m

ak =

p∑

k=m

ak +n∑

k=p+1

ak.

Wir haben hier die Sonderfalle p = m−1 und p = n hinzugenommen. Das hilft manchmal,um Fallunterscheidungen zu vermeiden. Fur p = m− 1 ist die erste Summe leer und hatdaher den Wert 0, fur p = n ist die zweite Summe leer.

Wie bereits erwahnt, sind dank der Assoziativitat von Addition und Multiplikation sindbeliebige endliche Summen und Produkte

n∑

k=m

xk ,n∏

k=m

xk , xk ∈ R fur m ≤ k ≤ n ,

35

Page 42: Vorlesungsskript zur Analysis 1 -

auch ohne das Setzen von Klammern wohldefiniert. Dieser Sachverhalt findet im Falle einerDoppelsumme haufig Anwendung. Als Beispiel betrachten wir das folgende Tableau vonZahlen (

3 5 82 4 6

).

Wir wollen die Summe aller dieser Zahlen bestimmen. Addieren wir zuerst zeilenweiseund anschließend die Zeilensummen, so ergibt sich

(3 + 5 + 8) + (2 + 4 + 6) = 16 + 12 = 28 .

Dasselbe kommt naturlich heraus, wenn wir spaltenweise vorgehen,

(3 + 2) + (5 + 4) + (8 + 6) = 5 + 9 + 14 = 28 .

Der allgemeine Fall wird mit einer doppelt indizierten Variablen beschrieben. Wir be-trachten xjk ∈ R, wobei j die Zahlen 1, . . . ,m und k die Zahlen 1, . . . , n durchlauft,

x11 x12 · · · x1n

x21 x22 · · · x2n...

......

...xm1 xm2 · · · xmn

.

Die Summe der j-ten Zeile ist gleichn∑

k=1

xjk ,

zeilenweises Addieren entspricht der Doppelsummem∑

j=1

n∑

k=1

xjk ,

spaltenweises Addieren der Doppelsummen∑

k=1

m∑

j=1

xjk .

Beide Doppelsummen sind gleich,m∑

j=1

n∑

k=1

xjk =n∑

k=1

m∑

j=1

xjk ,

da die Addition kommutativ ist. Bewiesen wird dies mit vollstandiger Induktion (SUPER).

Produkte behandelt man vollig analog, mit dem Ergebnism∏

j=1

n∏

k=1

xjk =n∏

k=1

m∏

j=1

xjk .

Das Distributivgesetz fur endliche Summen lautet(

n∑

j=1

xj

)·(

m∑

k=1

yk

)=

n∑

j=1

m∑

k=1

xjyk . (5.2)

Auch diese Formel wird mit vollstandiger Induktion bewiesen (Ubung).

36

Page 43: Vorlesungsskript zur Analysis 1 -

5.3 Potenzen

Fur jede naturliche Zahl n ∈ N und jede reelle Zahl x ∈ R definieren wir die n-te Potenzvon x durch

x0 = 1 , xn =n∏

j=1

x = x · x · · ·x︸ ︷︷ ︸n mal

. (5.3)

Insbesondere gilt damit definitionsgemaß 00 = 1. Weiter setzen wir

x−n = (x−1)n , ∀x ∈ R mit x 6= 0, n ∈ N .

Aus den Eigenschaften der Multiplikation folgt fur alle x, y ∈ R und n,m ∈ Z (beinegativen Exponenten wird naturlich x 6= 0 bzw. y 6= 0 vorausgesetzt)

xnxm = xn+m , (xn)m = xnm , xnyn = (xy)n .

Definition 5.6 (Binomialkoeffizient)Fur k, n ∈ N definieren wir den Binomialkoeffizienten

(n

0

)= 1 ,

(n

k

)=

k∏

j=1

n− j + 1

j=n(n− 1) · · · (n− k + 1)

1 · 2 · · · k , falls k ≥ 1.

Direkt aus der Definition folgt

(n

k

)= 0 , falls k > n ,

(n

k

)=

n!

k!(n− k)!=

(n

n− k

), 0 ≤ k ≤ n .

Lemma 5.7Fur alle n, k ∈ N mit 1 ≤ k ≤ n gilt

(n

k

)=

(n− 1

k − 1

)+

(n− 1

k

). (5.4)

Beweis: Ubungsaufgabe.

Beweis: Siehe Ubungsaufgabe. �

Satz 5.8 (Binomische Formel)Fur alle x, y ∈ R und alle n ∈ N gilt

(x+ y)n =n∑

k=0

(n

k

)xkyn−k .

Beweis: Mit vollstandiger Induktion uber n. Induktionsanfang: Fur n = 0 gilt fur allex, y ∈ R

0∑

k=0

(0

k

)xky0−k = 1 = (x+ y)0 .

37

Page 44: Vorlesungsskript zur Analysis 1 -

Jetzt zum Induktionsschritt: Die Behauptung sei richtig fur ein gegebenes n ∈ N. Wirzeigen ihre Richtigkeit fur n+ 1. Seien x, y ∈ R beliebig, dann gilt

(x+ y)n+1 = (x+ y)(x+ y)n = (x+ y)n∑

k=0

(n

k

)xkyn−k

=n∑

k=0

(n

k

)xk+1yn−k +

n∑

k=0

(n

k

)xkyn−k+1

= xn+1 +n−1∑

k=0

(n

k

)xk+1yn−k +

n∑

k=1

(n

k

)xkyn−k+1 + yn+1 .

Nun fuhren wir im ersten Summenzeichen eine Indexverschiebung von k nach k−1 durchund benutzen (5.4):

=

(n+ 1

n+ 1

)xn+1 +

n∑

k=1

[(n

k − 1

)+

(n

k

)]xkyn−k+1 +

(n+ 1

0

)yn+1

=n+1∑

k=0

(n+ 1

k

)xkyn+1−k .

Dies ist die Induktionsbehauptung. �

5.4 Elementare Ungleichungen

Bisher hatten wir nur die Korperaxiome (K1)–(K3) benutzt. Nun nehmen wir die Anord-nungsaxiome (A1)–(A2) hinzu.

Ahnlich wie in den vorangegangenen Abschnitten, wo wir solche scheinbar offensichtlichenAussagen wie 0 · x = 0 mithilfe der Korperaxiome bewiesen haben, werden wir auch hierUngleichungen, an die wir aus der Schule gewohnt sind, aus den Anordnungsaxiomenherleiten. Beispielsweise muss selbst eine scheinbar triviale Behauptung wie 1 > 0 erstbewiesen werden.

Lemma 5.9Seien x, y ∈ R. Dann gilt

x > 0 und y ≥ 0 ⇒ x+ y > 0 , (5.5)

x ≥ 0 und y ≥ 0 ⇒ x+ y ≥ 0 . (5.6)

Beweis: Falls y > 0, folgt (5.5) direkt aus Eigenschaft (A2); falls y = 0, so gilt x + y =x > 0. Damit ist (5.5) gezeigt. Falls x = y = 0, so ist auch x + y = 0. In den restlichenFallen ist x > 0 oder y > 0 und (5.6) folgt dann aus (5.5). �

Wir halten nun drei ganz wesentliche Eigenschaften der Relation ≥ fest.

Satz 5.10Es gilt:

(i) Reflexivitat: x ≥ x fur alle x ∈ R.

38

Page 45: Vorlesungsskript zur Analysis 1 -

(ii) Transitivitat: Fur alle x, y, z ∈ R gilt

x ≥ y und y ≥ z ⇒ x ≥ z .

(iii) Antisymmetrie: Fur alle x, y ∈ R gilt

x ≥ y und y ≥ x ⇒ x = y . (5.7)

Beweis: Aussage (i) folgt sofort wegen x = x.

Fur (ii) gilt im Fall x > y und y > z, dass x− y ∈ P und y − z ∈ P , also nach (A2)

x− z = (x− y) + (y − z) ∈ P ,

und damit x > z. Die anderen Falle x = y bzw. y = z werden analog diskutiert.

Zu (iii): Aus x 6= y folgt x − y 6= 0, also nach der Trichotomie (A1) x − y > 0 odery − x > 0. Damit haben wir die Kontraposition von (5.7) bewiesen, namlich

x 6= y ⇒ x < y oder y < x .

Als nachstes beweisen wir die Stabilitat von Ungleichungen unter Addition.

Lemma 5.11Seien x, x′, y, y′ ∈ R. Dann gilt

x > y und x′ ≥ y′ ⇒ x+ x′ > y + y′ ,

x ≥ y und x′ ≥ y′ ⇒ x+ x′ ≥ y + y′ .

Beweis: Dies folgt direkt aus Lemma 5.9, angewendet auf x− y und x′ − y′. �

Wir stellen nun eine Verbindung zwischen (Un-)gleichungen und Mengen her.

Definition 5.12Sind M und N Mengen, so heißt jede Teilmenge R von M × N eine Relation. Statt(x, y) ∈ R schreiben wir auch xR y.

Meist ≤ oder > oder so statt R geschrieben, ist also alter Bekannter!

Beispiel: Die Gleichheitsbeziehung

∆ :={

(x, y)∣∣ x, y ∈M, x = y

}={

(x, x)∣∣ x ∈M

}

definiert fur eine beliebige Menge M (etwa M = R) eine Relation R auf der ProduktmengeM ×M , und zwar uber

xR y ⇔ (x, y) ∈ ∆ ={

(z, z)∣∣ z ∈M

}⇔ x = y .

Sind – wie in diesem Beispiel – M und N gleich, so spricht man auch von einer Relationauf M (anstatt auf M ×M).

Wir betrachten nun Ungleichheitsbeziehungen als Relationen, die bestimmte Zusatzeigen-schaften haben.

39

Page 46: Vorlesungsskript zur Analysis 1 -

Definition 5.13Sei M eine Menge. Eine Relation R auf M (also R ⊂M×M) heißt Ordnungsrelation,wenn gilt

(i) Reflexivitat: xRx fur alle x ∈M ;

(ii) Transitivitat: Aus xR y und y R z folgt xR z, fur alle x, y, z ∈M ;

(iii) Antisymmetrie: Aus xR y und y Rx folgt x = y, fur alle x, y ∈M .

Satz 5.10 besagt also, dass ≥ eine Ordnungsrelation auf R definiert. Ebenso definiert ≤eine Ordnungerelation. Durch > und < werden keine Ordnungsrelationen definiert, da dieReflexivitat nicht erfullt ist.

Die Stabilitat der Ordnungsrelationen unter Multiplikation ist komplizierter als im Fallder Addition. Das sieht man an einem einfachen Beispiel: Es ist 0 > −1, aber 0 · 0 = 0 <1 = (−1) · (−1). Also kann eine zu Lemma 5.11 analoge Stabilitat der Multiplikation derForm

x > y und x′ ≥ y′ ⇒ x · x′ > y · y′ ,im allgemeinen nicht stimmen. Zusatzliche Annahmen sind erforderlich.

Lemma 5.14Seien x, x′, y, y′, z ∈ R. Dann gilt

x > y und z > 0 ⇒ xz > yz , (5.8)

x ≥ y und z ≥ 0 ⇒ xz ≥ yz , (5.9)

x > y und z < 0 ⇒ xz < yz , (5.10)

x ≥ y und z ≤ 0 ⇒ xz ≤ yz , (5.11)

x > y ≥ 0 und x′ ≥ y′ > 0 ⇒ xx′ > yy′ , (5.12)

x ≥ y ≥ 0 und x′ ≥ y′ ≥ 0 ⇒ xx′ ≥ yy′ . (5.13)

Beweis: Zur ersten Ungleichung 5.8: Aus x > y folgt 0 < x − y, also nach Axiom (A2)0 < (x − y)z = xz − yz, also xz > yz. Behauptung (5.9) folgt durch eine zusatzlicheFallunterscheidung fur die Falle x = y und z = 0. Behauptungen (5.10) und (5.11) sindden Leserinnen und Lesern als Ubungsaufgabe uberlassen.

Zum Beweis von (5.12) gilt x > y und x′ ≥ y′. Ist y ≥ 0, so ist nach Transitivitat auchx ≥ 0. Wir wenden (5.8) (mit z := y′) an und erhalten xy′ > yy′. Wiederum durchTransitivitat folgt dann xx′ > yy′; der Fall xx′ = yy′ ist wegen xy′ > yy′ ausgeschlossen.

Der Beweis von (5.13) erfolgt analog, wobei (5.9) statt (5.8) benutzt wird. �

Lemma 5.15Seien x, y ∈ R.

(i) Wenn x ≥ 0 und y ≥ 0, dann gilt xy ≥ 0.

(ii) Es gilt x2 ≥ 0 fur alle x ∈ R, und x2 = 0 ist nur fur x = 0 erfullt.

(iii) Es gilt x > y ⇔ (−x) < (−y).

40

Page 47: Vorlesungsskript zur Analysis 1 -

(iv) Es gilt x > 0 ⇔ x−1 > 0.

(v) Es gilt xy > 0 ⇔ (x > 0 und y > 0) oder (x < 0 und y < 0).

Beweis: Behauptung (i) folgt direkt aus (5.9) und 0 · y = 0.

Behauptung (ii) folgt fur x ≥ 0 wegen x2 = x · x ≥ 0 nach (i). Fur x < 0 ist (−x) > 0und daher x2 = x · x = (−x) · (−x) > 0 nach Axiom (A2). Weiter gilt damit nach (A1)entweder x2 > 0 oder x2 = 0. Letzeres ist nach Lemma 5.4 gleichbedeutend mit x = 0.

Zu (iii): Wegen x − y = x + (−y) = −((−x) − (−y)) ist x − y > 0 gleichbedeutend mit−((−x)− (−y)) > 0, also ist x > y gleichbedeutend mit (−x) < (−y).

Aussage (iv): Ware x−1 < 0, so folgt 1 = x · x−1 < 0; dies widerspricht aber (ii), da1 = 1 · 1 > 0. Die umgekehrte Richtung folgt durch Vertauschung der Rollen von x undx−1, denn es gilt (x−1)

−1= x nach Lemma 5.3 (i).

Aussage (v) sind zwei Implikationen, die wir einzeln beweisen. Sei zunachst xy > 0. Damitist x 6= 0, also nach (A1) entweder x > 0 oder x < 0. Also gilt nach (iv) entweder x−1 > 0oder (−x)−1 > 0. Im ersten Fall folgt dann mit (A2) y = x−1xy > 0, und im zweiten Fall−y = (−x)−1(−x)(−y) = (−x)−1xy > 0, wie gewunscht.

Die umgekehrte Richtung kann so gezeigt werden: Falls x > 0 und y > 0 gilt, folgt xy > 0nach (A2). Falls x < 0 und y < 0, folgt xy = (−x)(−y) > 0 ebenfalls nach (A2). �

Lemma 5.16Fur alle x, y ∈ R gilt: Aus 0 < x < y folgt x−1 > y−1.

Beweis: Es ist 0 < xy, also auch 0 < (xy)−1 = y−1x−1. Es folgt weiter

y−1 = x(x−1y−1) < y(x−1y−1) = x−1 .

Lemma 5.17Fur alle x, y ∈ R gilt: Aus 0 ≤ x < y folgt 0 ≤ xn < yn fur alle n ∈ N mit n ≥ 1.

Beweis: Ubungsaufgabe. �

Wir beenden diesen Abschnitt mit einer nutzlichen Ungleichung.

Satz 5.18 (Bernoullische Ungleichung)Es gilt

(1 + x)n ≥ 1 + nx (5.14)

fur alle n ∈ N und alle x ∈ R mit x ≥ −1.

Beweis: Sei x ≥ −1 beliebig. Wir zeigen mit vollstandiger Induktion, dass (5.14) fur allen ∈ N gilt. Fur n = 0 ist dies klar. Der Induktionsschritt n→ n+ 1 verlauft so:

(1 + x)n+1 = (1 + x)n(1 + x) ≥ (1 + nx)(1 + x)

(richtig nach Induktionsvoraussetzung und wegen x ≥ −1)

= 1 + nx+ x+ nx2 ≥ 1 + (n+ 1)x .

41

Page 48: Vorlesungsskript zur Analysis 1 -

5.5 Absolutbetrag, Minimum und Maximum

Definition 5.19 (Betrag, Maximum und Minimum zweier Zahlen)Ist x ∈ R, so heißt

|x| ={x , x ≥ 0

−x , x < 0

der Betrag von x. Fur x, y ∈ R definieren wir

max{x, y} =

{x , x ≥ y ,

y , y > x ,min{x, y} =

{x , x ≤ y ,

y , y < x .

-3 -2 -1 1 2 3

0.5

1.0

1.5

2.0

2.5

3.0

Abbildung 5.1: Der Betrag |x|.

(Siehe Abb. ??.) Es gilt offensichtlich

min{x, y} ≤ x ≤ max{x, y} , min{x, y} ≤ y ≤ max{x, y} , ∀x, y ∈ R ,

und|x| = max{x,−x} = | − x| , ∀x ∈ R .

Der Betrag |x − y| der Differenz zweier Zahlen x, y ∈ R misst deren Abstand auf derZahlengerade. So haben etwa die Zahlen 5 und −2 den Abstand |5− (−2)| = |7| = 7. DieMenge

M ={x∣∣ x ∈ R , |x− 4| ≤ 2

}

ist die Menge aller Punkte, die vom Punkt 4 nicht weiter als 2 entfernt sind; dies ist dasIntervall [2, 6].

Lemma 5.20Fur alle x, y ∈ R gilt

|x| ≥ 0 , sowie |x| = 0 ⇔ x = 0 , (5.15)

|xy| = |x| · |y| , (5.16)

|x+ y| ≤ |x|+ |y| . (5.17)

||x| − |y|| ≤ |x− y| . (5.18)

42

Page 49: Vorlesungsskript zur Analysis 1 -

Die Ungleichung (5.17) heißt Dreiecksungleichung, wie in Kapitel 7 motiviert wird.Ungleichung (5.19) wird oft als umgekehrte Dreiecksungleichung bezeichnet.

Beweis: Zu (5.15): Aus der Definition folgt |x| ≥ 0 und |0| = 0. Ist x 6= 0, so ist |x| =max{x,−x} > 0. Zu (5.16): Man unterscheidet die moglichen unterschiedlichenVorzeichen von x und y. Ist etwa x ≥ 0 und y ≤ 0, so ist xy ≤ 0 und

|xy| = −(xy) = x(−y) = |x| · |y| ,

analog argumentiert man fur die anderen Falle.

Zu (5.17): Es gilt

x+ y ≤ |x|+ |y| , −(x+ y) = (−x) + (−y) ≤ |x|+ |y| ,

also|x+ y| = max{x+ y,−(x+ y)} ≤ |x|+ |y| .

Ungleichung (5.18) folgt aus der Dreiecksungleichung (5.17) (Ubung). �

Aus (5.16) erhalt man wegen

|x| =∣∣∣∣x

y· y∣∣∣∣ =

∣∣∣∣x

y

∣∣∣∣ · |y|

die Regel ∣∣∣∣x

y

∣∣∣∣ =|x||y| , fur alle x, y ∈ R mit y 6= 0 . (5.19)

Wir haben bereits das Maximum und das Minimum zweier Zahlen definiert. Als nachstesbetrachten wir beliebige Teilmengen von R.

Definition 5.21 (Maximum und Minimum einer Menge reeller Zahlen)Sei M ⊂ R. Ein x ∈ R heißt Maximum von M , bzw. Minimum von M , falls gilt

x ∈M , x ≥ y fur alle y ∈M ,

bzw.x ∈M , x ≤ y fur alle y ∈M ,

Wir schreibenx = maxM oder x = max

y∈My ,

analog fur das Minimum.

Ist M = {x1, . . . , xn} eine endliche Menge reeller Zahlen, so hat M ein Maximum undein Minimum. Man kann die Berechnung des Maximums (und analog des Minimums)zuruckfuhren auf das Maximum zweier Zahlen vermittels der rekursiven Definition

max {x1, . . . , xn} = max {max {x1, . . . , xn−1} , xn} .

Ist M eine unendliche Teilmenge von R, so braucht es weder ein Maximum noch einMinimum von M zu geben. So hat Z weder ein Maximum noch ein Minimum; N hat ein

43

Page 50: Vorlesungsskript zur Analysis 1 -

Minimum, namlich 0, aber kein Maximum. Das uberrascht nicht, da sich N und Z”ins

Unendliche erstrecken“. Bei der Menge

M =

{1

n

∣∣ n ∈ N, n > 0

}(5.20)

liegt eine subtilere Situation vor. Sie hat ein Maximum, namlich 1, aber kein Minimum,denn zu jedem Element von M gibt es eines, das kleiner ist: Ist 1/n ein beliebiges Elementvon M , so gilt fur jedes m ∈ N mit m > n, dass

1

m∈M ,

1

m<

1

n.

Zu jedem Element von M gibt es also sogar unendlich viele kleinere Elemente von M .Der mogliche erste Gedanke, dass vielleicht 0 das Minimum von M sein konnte, ist falsch,da 0 /∈M und das Minimum einer Menge definitionsgemaß selbst ein Element der Mengesein muss.

Definition 5.22 (Obere und untere Schranke)Sei M eine Teilmenge von R.

• Eine Zahl b ∈ R heißt obere Schranke fur (oder: von) M , wenn b ≥ x fur allex ∈M .

• Eine Zahl a ∈ R heißt untere Schranke fur (oder: von) M , wenn a ≤ x fur allex ∈M .

M heißt nach oben (unten) beschrankt, falls es eine obere (untere) Schranke fur Mgibt. M heißt beschrankt, falls M nach oben und nach unten beschrankt ist. M heißtunbeschrankt, wenn M nicht beschrankt ist.

Ist b eine obere Schranke von M , so ist jedes c mit c ≥ b ebenfalls eine obere Schrankevon M .

Hat M ein Maximum (bzw. Minimum), so ist dieses eine obere (bzw. untere) Schrankevon M .

N ist nach unten beschrankt, jede Zahl x ≤ 0 (auch das Minimum 0 von N) ist eine untereSchranke von N. Allerdings ist N nicht nach oben beschrankt (das ist anschaulich klarund wird spater in Satz 5.28 bewiesen).

Z ist weder nach oben noch nach unten beschrankt; ware x eine untere Schranke fur Z,so ware −x eine obere Schranke fur N.

Die Menge M aus (5.20) ist beschrankt. Jedes x ≥ 1 ist eine obere Schranke, jedes x ≤ 0eine untere Schranke von M .

Lemma 5.23Eine Teilmenge M von R ist beschrankt genau dann, wenn es ein C > 0 gibt mit |x| ≤ Cfur alle x ∈M .

Beweis: Ist a eine untere und b eine obere Schranke fur M , so hat C = max{|a|, |b|} dieverlangte Eigenschaft. Umgekehrt ist −C eine untere und C eine obere Schranke fur M ,falls |x| ≤ C fur alle x ∈M . �

44

Page 51: Vorlesungsskript zur Analysis 1 -

5.6 Supremum und Infimum. Vollstandigkeit

Definition 5.24Sei M eine Teilmenge von R.

• Ein s ∈ R heißt Supremum von M , wenn s eine obere Schranke fur M ist unds ≤ b gilt fur alle oberen Schranken b von M .

• Ein s ∈ R heißt Infimum von M , wenn s eine untere Schranke fur M ist und s ≥ agilt fur alle unteren Schranken a von M .

Lemma 5.25Sei M ⊂ R mit M 6= ∅. Dann hat M hochstens ein Supremum und hochstens ein Infimum.

Beweis: Sind z1, z2 Suprema von M , so gilt z1 ≤ z2, da z2 obere Schranke von M ist.Ebenso gilt z2 ≤ z1, da z1 obere Schranke von M ist. Es folgt z1 = z2. Der Beweis fur dasInfimum verlauft analog. �

Es macht daher Sinn, von dem Supremum von M und dem Infimum von M zu sprechen.Wir bezeichnen es mit

supM , sup(M) , oder supx∈M

x ,

beziehungsweiseinf M , inf(M) , oder inf

x∈Mx .

Es gilt beispielsweisesup([0, 1]) = 1 = sup([0, 1))

(wobei [0, 1] := {x∣∣ 0 ≤ x ≤ 1} und [0, 1) := {x

∣∣ 0 ≤ x < 1}, vergleiche das Ende diesesAbschnitts fur die Definition allgemeiner Intervalle), da in beiden Fallen jedes b ≥ 1 eineobere Schranke ist und 1 die kleinste solche Zahl ist. Das Maximum von [0, 1] ist ebenfalls1, aber [0, 1) hat kein Maximum.

Die Existenz eines reellwertigen Supremums fur jede nach oben beschrankte und nichtleereTeilmenge von R ist genau die Aussage des Vollstandigkeitsaxioms (V), das wir zu Beginndes Kapitels postuliert haben. Mit den soeben eingefuhrten Begriffen konnen wir (V) kurzund bundig so formulieren:

(V) Jede nichtleere nach oben beschrankte Teilmenge von R besitzt ein Supremums ∈ R.

Diese Eigenschaft wird auch als die Ordnungsvollstandigkeit von R bezeichnet. Wirerinnern daran, dass die reellen Zahlen axiomatisch charakterisiert ist durch das Trio derKorperaxiome (K1)–(K3), die Anordnungsaxiome (A1)–(A2) und das Vollstandigkeits-axiom (V). Die rationalen Zahlen erfullen die Korperaxiome (K1)–(K3) und die Anord-nungsaxiome (A1)–(A2), aber nicht das Vollstandigkeitsaxiom: Wir betrachten als Bei-spiel die Menge

M ={x∣∣ x ∈ R, x2 < 2

}.

45

Page 52: Vorlesungsskript zur Analysis 1 -

Sie ist nichtleer, nach oben beschrankt (z.B. ist 2 eine obere Schranke), und hat daher eineindeutig bestimmtes Supremum supM ∈ R. Diese reelle Zahl werden wir spater als

√2

identifizieren. Beachte, dass

M ={x∣∣ x ∈ Q, x2 < 2

}.

kein Supremum in Q hat: Vollstandigkeit bedeutet insbesondere, dass das Supremum inder gegebenen Menge liegt, hier also in Q. In Satz 4.1 hatten wir aber gezeigt, dass eskeine rationale Zahl x ∈ Q geben kann mit x2 = 2. Somit ist (V) fur Q nicht erfullt.Im nachsten Kapitel werden wir hingegen die Existenz von Wurzeln zeigen (Satz 6.2).Insbesondere sehen wir dann

√2 ∈ R. Der Beweis verwendet nur Hilfsmittel, die wir

schon kennengelernt haben, insbesondere das Supremumsaxiom.

Die wichtige Supremumsdefinition 5.24 kann so formuliert werden:

Das Supremum von M ist die kleinste obere Schranke von M ,

falls M eine obere Schranke hat.

Wir vereinbaren weiter

supM = +∞ , falls M nicht nach oben beschrankt ist,

undsup ∅ = −∞ . (5.21)

Damit haben wir supM definiert fur alle M ⊂ R, und

supM ∈ R ∪ {−∞,+∞} .

Analog vereinbaren wir

inf M = −∞ , falls M nicht nach unten beschrankt ist,

undinf ∅ = +∞ .

Wir setzen die auf R bereits definierte Ordnungsrelation ≥ auf R∪{−∞,+∞} fort, indemwir setzen

−∞ < x < +∞ fur alle x ∈ R .

Man pruft leicht nach, dass wir auf diese Weise tatsachlich eine Ordnungsrelation ≥ aufR ∪ {−∞,+∞} erhalten.

Lemma 5.26Sind M,N ⊂ R mit M ⊂ N , so gilt

supM ≤ supN , (5.22)

inf M ≥ inf N .

46

Page 53: Vorlesungsskript zur Analysis 1 -

Beweis: Falls supN ∈ R, so ist supN obere Schranke fur N und wegen M ⊂ N auchobere Schranke fur M , also gilt (5.22) nach Definition von supM (falls M = ∅, verwendenwir (5.21)). Falls supN = −∞, so ist N = ∅, also auch M = ∅, also auch supM = −∞.Falls supN = +∞, ist (5.22) auf jeden Fall erfullt. Der Beweis fur das Infimum verlauftanalog. �

Ist M ⊂ R und a ∈ R, so definieren wir die Menge aM ⊂ R durch

aM :={ax∣∣ x ∈M

}.

Fur a = −1 schreiben wir auch −M statt (−1)M . Wir vereinbaren weiter

−(+∞) = −∞ , −(−∞) = +∞ .

Satz 5.27Sei M ⊂ R. Dann gilt

inf M = − sup(−M) . (5.23)

Beweis: Ist M = ∅, so steht auf beiden Seiten +∞. Sei nun M 6= ∅. Wir behaupten, dassfur x ∈ R gilt:

x ist untere Schranke von M ⇔ −x ist obere Schranke von −M . (5.24)

In der Tat gilt

x ≤ y ∀ y ∈M ⇔ −x ≥ −y ∀ y ∈M ⇔ −x ≥ z ∀ z ∈ −M .

Wegen (5.24) ist M nach unten beschrankt genau dann, wenn −M nach oben beschranktist. Falls M nicht nach unten beschrankt ist, steht also −∞ auf beiden Seiten von (5.23).Ist M nach unten beschrankt, so hat −M nach (V) ein Supremum sup(−M) ∈ R, undwegen (5.24) ist − sup(−M) eine untere Schranke von M . Ist x eine beliebige untereSchranke von M , so gilt wegen (5.24) auch sup(−M) ≤ −x, also auch − sup(−M) ≥ x,und damit folgt (5.23) wegen der Eindeutigkeit des Infimums. �

Eine weitere wichtige Folgerung des Vollstandigkeitsaxioms (V) ist, dass der Korper Rarchimedisch angeordnet ist. Dies bedeutet, dass zu jedem Element x dieses Korperseine naturliche Zahl n existiert mit x < n.

Satz 5.28N ist nicht nach oben beschrankt, d.h. fur alle x ∈ R gibt es ein n ∈ N mit n > x.

Beweis: Wir nehmen an, dass N nach oben beschrankt ist. Dann hat N nach Supre-mumsaxiom ein Supremum s = supN ∈ R. Wegen s−1 < s ist s−1 keine obere Schrankevon N, also gibt es ein n ∈ N mit s− 1 < n. Es folgt weiter s < n + 1 ∈ N, also ist auchs keine obere Schranke. Dies ist ein Widerspruch. �

Folgerung 5.29Fur alle ε ∈ R mit ε > 0 gibt es ein n ∈ N mit

0 <1

n< ε .

47

Page 54: Vorlesungsskript zur Analysis 1 -

Beweis: Dies folgt aus Satz 5.28 mit x = ε−1. �

Aus Folgerung 5.29 konnen wir schließen, dass

inf

{1

n

∣∣ n ∈ N, n > 0

}= 0 .

Eine alternative Schreibweise ist

infn∈N,n>0

1

n= 0 , oder inf

n∈Nn>0

1

n= 0 .

Folgerung 5.30Fur alle x, y ∈ R mit x > 0 gibt es ein n ∈ N mit nx > y.

Beweis: Falls y > 0, wahlen wir n ∈ N mit n > y/x, sonst konnen wir n = 1 setzen. �

Folgerung 5.31Fur alle x, y ∈ R mit x > 1 gibt es ein n ∈ N mit xn > y.

Beweis: Siehe Ubungsaufgabe. �

Oft verwendet wird die folgende Eigenschaft des Supremums.

Satz 5.32Sei M ⊂ R nichtleer und nach oben beschrankt und sei s = supM . Dann gibt es zu jedemε > 0 ein x ∈M mit

s− ε < x ≤ s .

Beweis: Ubungsaufgabe. �

Wir schließen dieses Kapitel mit einigen haufig verwendeten Begriffen. Ein Intervall kannunterschiedliche Formen haben. Seien a, b ∈ R gegeben. Wir definieren

[a, b] ={x∣∣ x ∈ R, a ≤ x ≤ b

},

(a, b) ={x∣∣ x ∈ R, a < x < b

},

(a, b] ={x∣∣ x ∈ R, a < x ≤ b

},

[a, b) ={x∣∣ x ∈ R, a ≤ x < b

},

[a,∞) ={x∣∣ x ∈ R, a ≤ x

},

(a,∞) ={x∣∣ x ∈ R, a < x

},

(−∞, b] ={x∣∣ x ∈ R, x ≤ b

},

(−∞, b) ={x∣∣ x ∈ R, x < b

}.

Intervalle der Form [a, b], [a,∞) und (−∞, b] heißen abgeschlossen, Intervalle der Form(a, b), (a,∞) und (−∞, b) heißen offen, die verbleibenden Typen [a, b) und (a, b] heißenhalboffen.

48

Page 55: Vorlesungsskript zur Analysis 1 -

5.7 Ausblick: Zum Archimedischen Axiom

Alternativ zum Supremumsaxiom kann man die Aussage von Satz 5.28 als Axiom nehmen,man nennt es dann das Archimedesaxiom. Allerdings benotigt man dann noch ein weiteresAxiom, um die Existenz der irrationalen Zahlen zu sichern, denn der Korper Q erfulltebenfalls das Archimedesaxiom.

Die Nichtstandardanalysis arbeitet mit nichtarchimedisch angeordneten Korpern. Dabeiwerden zusatzlich zu den reellen Zahlen sogenannte hyperreale Zahlen eingefuhrt, diedas Archimedische Axiom verletzen (also großer sind als jede naturliche Zahl, und damitgroßer als jede reelle Zahl). Eine Motivation ist, dass es damit durch Inversenbildung auchZahlen gibt, die naher bei Null liegen als jede reelle Zahl x 6= 0, sogenannte Infinitesimal-zahlen. Weil wir diese Zahlen nicht zur Verfugung haben, werden wir im Folgenden denGrenzwertbegriff einfuhren, der Aussagen um einen Punkt x durch Vergleich mit Punk-ten x + ε fur beliebiges (kleines) ε > 0 erzielt, wie wir in Kapitel 8 sehen werden. In derNichtstandardanalysis kann man stattdessen auf Infinitesimalzahlen zuruckgreifen und soauch ohne den Grenzwertbegriff etwa Ableitungen und Integrale einfuhren. Wir werdenin dieser Vorlesung aber beim

”Standardweg“ bleiben – unter anderem, da dieser Zugang

wenig technisch ist. Interessierte Horerinnen und Horer sind jedoch auf die Einfuhrung [1]in die Infinitesimalzahlen verwiesen.

Erganzende Literatur zu diesem Kapitel

[1] H. J. Keisler. Aug. 2020. url: http://www.math.wisc.edu/~keisler/calc.html.

49

Page 56: Vorlesungsskript zur Analysis 1 -

6 Funktionen

6.1 Der Funktionsbegriff

Eine Funktion ist durch drei Bestandteile charakterisiert:

• Der Definitionsbereich (oder Definitionsgebiet). Dies ist eine Menge M , in derdie Argumente der Funktion liegen.

• Der Wertebereich oder die Wertemenge ist eine Menge N , in der die Werteder Funktion liegen. (Nicht jedes Element der Wertemenge muss von der Funktionangenommen werden!)

• Die Funktionsvorschrift, symbolisiert durch den Zuordnungspfeil →; diese gibtan, dass jedes Element aus M auf ein Element aus N abgebildet wird.

Statt Funktion sagt man auch Abbildung. Die Bestandteile einer Funktion finden sichalle wieder in der Notation

f : M → N ;

hier ist f der (frei wahlbare) Funktionsname.

Eine Funktionsvorschrift (oder Abbildungsvorschrift) muss folgende Eigenschaft ha-ben:

Jedem x ∈M wird genau ein Element von N zugeordnet. (6.1)

Das einem x ∈ M eindeutig zugeordnete Element von N wird mit f(x) bezeichnet. Esheißt das Bild von x unter f , oder der Wert von f an der Stelle x. Man verwendet denPfeil 7→, um die Zuordnung von f(x) zu x auszudrucken, schreibt also x 7→ f(x).

Die freie Wahlbarkeit des Namens bedeutet z.B., dass die Beschreibungen

f : R→ R , f(x) = x2 ,

g : R→ R , g(x) = x2 ,

dieselbe Funktion definieren.

Zum Sprachgebrauch: Mit f bezeichnen wir die Funktion, mit f(x) den Wert der Funktionan der Stelle x. Innerhalb der Mathematik ist das der allgemein akzeptierte Standard. DieSinusfunktion heißt dann sin, der Wert der Sinusfunktion an der Stelle x heißt sin(x) odersinx. Der Vorteil dieser Sprachregelung ist, dass man zweifelsfrei weiß, ob die Funktionoder der Funktionswert gemeint ist.

Wir vereinbaren außerdem: Jede Menge M , die als Definitionsbereich einer Funktion auf-tritt, wird bei uns als nichtleer vorausgesetzt, M 6= ∅, ohne dass man das explizit dazusagt.

Eine Funktionsvorschrift kann eine Fallunterscheidung beinhalten, beispielsweise

f : R→ R , f(x) =

{x2 , x ≥ 0 ,

−1 , x < 0 .

50

Page 57: Vorlesungsskript zur Analysis 1 -

(Siehe Abb. 6.1.) Man muss auf die Abgrenzung der Falle achten. So definiert

f(x) =

{x2 , x ≥ 0 ,

−1 , x ≤ 0 ,

keine Funktion f : R→ R, da f(0) zweimal definiert wird (f(0) = 0 und f(0) = −1). DieDefinition

f(x) =

{x2 , x ≥ 0 ,

0 , x ≤ 0 ,

ware nicht empfohlen, aber in Ordnung, da f(0) zwar zweimal vorkommt, aber beide Maleauf denselben Wert, namlich 0, gesetzt wird.

-1.0 -0.5 0.5 1.0 1.5 2.0

-1

1

2

3

4

Abbildung 6.1: Eine stuckweise definierte Funktion.

Funktionsvorschriften konnen neben Formeln auch andere Ausdrucke enthalten. Die Vor-schrift

f(n) = Anzahl der Ziffern (im Dezimalsystem) des großten Primfaktors von n

definiert eine Funktion f : N \ {0, 1} → N, aber den Wert f(n) zu berechnen ist fur großen nicht so einfach.

Die uns fur Funktionen f : R → R bekannte graphische Darstellung in der Zahlenebenehat eine allgemeine Entsprechung. Ist f : M → N eine Abbildung, so ist der Graph vonf definiert als die Menge {

(x, f(x))∣∣ x ∈M

}.

Sie ist eine Teilmenge der Produktmenge M × N , ihre Elemente sind geordnete Paare(zuerst x, dann f(x)).

Gemaß Definition 5.12 ist der Graph einer Funktion also eine Relation. Wir stellen nun dieumgekehrte Frage: Welche Relationen konnen wir als Graphen einer Funktion erhalten?

Sei R ⊂M ×N eine Relation. Gibt es dann eine Funktion f : M → N mit

R ={

(x, f(x))∣∣ x ∈M

}? (6.2)

Dabei mussen wir die Bedingung (6.1) beachten, die wir an jede Funktionsvorschrift stel-len. Falls R zwei Elemente (x, y1) und (x, y2) enthalt mit y1 6= y2, so ist ⊂ in (6.2) nicht

51

Page 58: Vorlesungsskript zur Analysis 1 -

erfullbar, da es zu gegebenem x ∈ M nur einen Funktionswert f(x) geben darf. Falls esein x ∈ M gibt fur welches kein y ∈ N existiert mit (x, y) ∈ R, so gilt (x, f(x)) /∈ R furjede Funktion f : M → N , also ist ⊃ in (6.2) nicht erfullbar. Die Relation R muss alsodie Eigenschaft

zu jedem x ∈M gibt es genau ein y ∈ N mit xR y (6.3)

erfullen. Hat R diese Eigenschaft, so konnen wir f : M → N definieren, indem wir jedemx ∈M das entsprechende y aus (6.3) zuordnen.

Mit der soeben hergestellten Beziehung kann man den Funktionsbegriff auf den Mengen-begriff zuruckfuhren. Eine Funktion von M nach N ist eine Teilmenge R der Produkt-menge M ×N , welche die Eigenschaft (6.3) hat. Die Frage

”Was ist denn eigentlich eine

Funktionsvorschrift?“ erledigt sich dann mit der Antwort: Wir ordnen jedem x ∈ M dasentsprechende y ∈ N aus (6.3) zu.

6.2 Eigenschaften von Abbildungen

Sei f : M → N eine Abbildung. Ist A eine Teilmenge von M , so definieren wir eine Mengef(A) durch

f(A) ={f(x)

∣∣ x ∈ A}.

Sie heißt die Bildmenge (oder einfach Bild) von A unter f , es gilt f(A) ⊂ f(M) ⊂ N .Man nennt f(M) auch den Bildbereich von f . Ist y ∈ N , so heißt jedes x ∈ M mitf(x) = y ein Urbild von y.

Zu gegebenem y kann es ein, mehrere oder auch kein Urbild geben. Im Beispiel f : R→ R,f(x) = x2, hat 0 ein Urbild, namlich 0, jedes y < 0 hat kein Urbild. Jedes y > 0 hat zweiUrbilder, da mit x2 = y auch (−x)2 = y gilt.

Ist f : M → N und B ⊂ N , so heißt

f−1(B) ={x∣∣ x ∈M, f(x) ∈ B

}

die Urbildmenge (oder das Urbild) von B unter f . Im Beispiel f : R → R, f(x) = x2

giltf−1([0, 4]) = [−2, 2] .

Anschaulich ist das klar; mathematisch sauber werden wir dies durch das Studium derUmkehrfunktion zeigen (siehe Abschnitt 6.3 und Satz 10.30 in Kombination mit Folge-rung 10.31).

Zwei Abbildungen f, g : M → N heißen gleich, geschrieben f = g oder f ≡ g, falls

f(x) = g(x) fur alle x ∈M . (6.4)

Mit f 6= g ist die Negation von (6.4) gemeint, das heißt,

es gibt ein x ∈M mit f(x) 6= g(x).

Definition 6.1Eine Abbildung f : M → N heißt

52

Page 59: Vorlesungsskript zur Analysis 1 -

• surjektiv, wenn jedes y ∈ N mindestens ein Urbild hat. Aquivalent dazu ist:f(M) = N .

• injektiv, wenn jedes y ∈ N hochstens ein Urbild hat. Aquivalent dazu ist: Sindx1, x2 ∈ M beliebig mit x1 6= x2, so muss auch f(x1) 6= f(x2) gelten. Ebenfallsaquivalent ist: Sind x1, x2 ∈M beliebig mit f(x1) = f(x2), so muss x1 = x2 gelten.

• bijektiv, wenn sie surjektiv und injektiv ist, das heißt, wenn jedes y ∈ N genau einUrbild hat.

Die folgenden Beispiele zeigen, dass Injektivitat und Surjektivitat einer Abbildung nichtnur von der Funktionsvorschrift, sondern auch von der Wahl von Definitions- und Werte-bereich abhangen.

• Wir betrachten die Funktionsvorschrift f(x) = x+ 1, f : M → N , mit unterschied-lichen Teilmengen M und N von R. In jedem Fall ist f injektiv: Ist f(x1) = f(x2),so ist x1 + 1 = x2 + 1, also auch x1 = x2. Im Fall f : N → N ist f nicht surjektiv,da 0 kein Urbild in N hat. Im Fall f : Z→ Z ist f surjektiv (also auch bijektiv), dajedes x ∈ Z das Urbild x− 1 hat. Aus dem gleichen Grund ist f : R→ R ebenfallssurjektiv und damit bijektiv.

• Wir betrachten die Funktionsvorschrift f(x) = x2, f : M → N , mit unterschiedli-chen Teilmengen M und N von R. Im Fall f : N→ N ist f injektiv (aus x1 6= x2 folgtx2

1 6= x22), aber nicht surjektiv (zum Bild von N gehoren nur die Quadratzahlen).

In den Fallen f : Z → Z und f : R → R ist f weder injektiv (da f(−x) = f(x))noch surjektiv (da keine negative Zahl im Bild von f liegt). Im Fall f : R+ → R+ istf injektiv und surjektiv also auch bijektiv (dies zeigen wir in Satz 6.2, siehe auchSatz 10.30 und die Diskussion nach Folgerung 10.31).

6.3 Die Umkehrfunktion. Wurzeln

Ist fur eine f : R→ R ein Funktionswert f(x) gegeben, konnen wir daraus x zuruckgewinnen,also f quasi umkehren? Ist f : M → N eine bijektive Abbildung von einer Menge M aufeine Menge N , so konnen wir durch die Vorschrift

y 7→ das eindeutig bestimmte x ∈M mit f(x) = y

eine Abbildung definieren. Sie heißt die Umkehrfunktion zu f und wird mit f−1 be-zeichnet. Es ist dann

f−1 : N →M .

Fur Funktionen von R nach R erhalten wir den Graphen der Umkehrfunktion f−1, indemwir den Graphen von f an der Diagonale x = y spiegeln, siehe Abb. 6.2. (SUPER)

Betrachten wir f(x) = x2. Als Abbildung f : R → R ist sie nicht bijektiv, daher hat siekeine Umkehrabbildung von R nach R. Aber als Abbildung f : R+ → R+ ist sie bijektiv,und die Umkehrabbildung f−1 : R+ → R+ sollte gegeben sein durch

f−1(y) =√y ;

53

Page 60: Vorlesungsskript zur Analysis 1 -

0.0 0.5 1.0 1.5 2.0

0.5

1.0

1.5

2.0

x2

x

x

Abbildung 6.2: Der Graph der Umkehrfunktion entsteht dem der Funktion durch Spiege-lung an der Diagonalen y = x.

dies definiert die nichtnegative Wurzel.

Vorsicht: Die Notation f−1 ist in der Mathematik leider mehrfach belegt, also”uberladen“:

(i) Die Umkehrfunktion von f wird mit f−1 bezeichnet, falls sie existiert.

(ii) Die Urbildmenge von einer Menge A wird als f−1(A) notiert.

(iii) Unglucklicherweise ist f−1 auch eine naturliche Bezeichnung fur 1f

(wobei der Nenner

von 0 verschieden sein muss).

Wir mussen mit dieser notationellen Verwirrung leben und aus dem Kontext erschließen,was gemeint ist. Man muss sich im Klaren sein, dass diese drei Objekte sich fundamentalunterscheiden: So ist fur f : R+ → R+, x 7→ x2 die Umkehrfunktion durch die Wurzelgegeben, wie gerade gesehen. Die Funktion 1

f= 1

x2ist eine ganz andere Funktion! Weiter

existiert die Urbildmenge fur jede Menge bei jeder Funktion, aber nicht jede Funktion hateine Umkehrfunktion.

Allgemein erhalten wir die k-te Wurzel als Umkehrfunktion der k-ten Potenz

f(x) = xk , f : R+ → R+ ,

durch den folgenden Satz.

Satz 6.2Sei k ∈ N mit k ≥ 1. Dann gibt es zu jedem y ∈ R+ genau ein x ∈ R+ mit xk = y.

Beweis: Sei y ∈ R+. Es gibt hochstens ein x mit xk = y, wegen Lemma 5.17. Das gesuchtex wollen wir als Supremum erhalten,

x := sup(M) , wobei M :={t∣∣ t ≥ 0 , tk ≤ y

}.

Das Supremum von M existiert nach Supremumsaxiom (V): M ist nichtleer, da 0 ∈ M ,und nach oben beschrankt, da 1 + y eine obere Schranke fur M ist. Wir zeigen nun, dass

54

Page 61: Vorlesungsskript zur Analysis 1 -

weder xk < y noch xk > y richtig sein kann. Zu diesem Zweck betrachten wir ein ε > 0und berechnen mit Hilfe der binomischen Formel

(x+ ε)k =k∑

j=0

(k

j

)εjxk−j = xk + ε

k∑

j=1

(k

j

)εj−1xk−j .

Ist außerdem ε < 1, so gilt εj−1 ≤ 1 und daher

(x+ ε)k ≤ xk + εC , mit C =k∑

j=1

(k

j

)xk−j .

Ware nun xk < y, so folgt(x+ ε)k ≤ xk + εC < y ,

falls wir ε so klein wahlen, dass εC < y − xk. Damit folgt, dass x + ε ∈ M . Daher istx keine obere Schranke fur M , ein Widerspruch. Eine analoge Rechnung fur 0 < ε < 1zeigt, dass

(x− ε)k ≥ xk − εC , wieder mit C =k∑

j=1

(k

j

)xk−j .

Ware xk > y, so ware x − ε eine obere Schranke von M , falls ε hinreichend klein ist,im Widerspruch dazu, dass x die kleinste obere Schranke fur M ist. Also gilt insgesamtxk = y. �

Nach Satz 6.2 istf : R+ → R+ , f(x) = xk ,

bijektiv. Wir definieren

f−1 : R+ → R+ , k√y = f−1(y) .

Der Beweis von Satz 6.2 war relativ aufwendig. Wir werden spater einen einfacherenBeweis geben (siehe Satz 10.30), der zudem deutlich allgemeiner ist. Dies wird durch einstarkeres mathematisches Instrumentarium ermoglicht, das wir im Folgenden erarbeiten.Es ist aber oft nutzlich und instruktiv, erst in einer konkreten Situation einen Beweis

”zu

Fuß“ auszuarbeiten, wie eben durch eine explizite Rechnung mit der binomischen Formel.

Satz 6.2 ist ein Beispiel fur einen sogenannten Existenz- und Eindeutigkeitssatz, da erExistenz und Eindeutigkeit eines Objekts, hier der k-ten Wurzel liefert. Oft, und auch hier,liefert ein solcher Satz aber keine effiziente Handhabe fur die Berechnung des Objekts.

Da die k-te Wurzel die Umkehrfunktion der k-ten Potenz ist, gilt fur x ≥ 0

( k√x)k = x .

Es folgt fur x, y ≥ 0( k√x k√y)k = ( k

√x)k · ( k

√y)k = xy ,

also gilt fur alle x, y ≥ 0 die Rechenregel

k√x k√y = k√xy .

Es gilt k√y > k

√x fur alle y > x ≥ 0. Dies folgt aus yk > xk fur alle y > x ≥ 0 in

Verbindung mit der folgenden Beobachtung.

55

Page 62: Vorlesungsskript zur Analysis 1 -

Bemerkung Seien M,N ⊂ R und f : M → N bijektiv. Weiter sei f monoton wachsend,d.h. fur alle x1, x2 ∈M mit x1 ≤ x2 gelte f(x1) ≤ f(x2).

Dann ist die Umkehrabbildung f−1 : N →M streng monoton wachsend, d.h.

Fur alle y1, y2 ∈ N mit y1 < y2 gilt f−1(y1) < f−1(y2).

Beweis: Siehe Ubungsaufgabe. �

Wir konnen jetzt Potenzen mit rationalen Exponenten definieren.

Definition 6.3Sei a > 0. Wir definieren fur rationale Potenzen r = p

qmit p, q ∈ Z und q > 0

ar := q√xp . (6.5)

Dann gilt fur r, s ∈ Qaras = ar+s . (6.6)

Beweis: Man muss einen Moment nachdenken, ob diese Definition sinnvoll ist: r hat

unendlich viele Darstellungen r = kpkq

, aber wegen (ap)1/q =(akp)1/(kq)

ist (6.5) unabhangigvon der getroffenen Wahl.

Weiter schreiben wir r = m/q und s = n/q mit gleichem Nenner; dann sieht man durchPotenzieren mit q, dass (6.6) gilt. �

Ein Plot einiger Potenzfunktionen findet sich in Abb. 6.3.

0.0 0.5 1.0 1.5 2.0 2.5 3.0

1

2

3

4

a2

a

a3

1

a2

Abbildung 6.3: Potenzfunktionen fur verschiedene Exponenten.

6.4 Komposition von Funktionen

Seien f und g definiert durch

f(x) = x+ 1 , g(x) = x2 . (6.7)

56

Page 63: Vorlesungsskript zur Analysis 1 -

Wir wollen f und g hintereinander ausfuhren:

xf7→ x+ 1

g7→ (x+ 1)2 .

Das Argument von g wird ersetzt durch den Ausdruck, der sich durch Auswertung von fergeben hat. Die resultierende Funktion ist

x 7→ (x+ 1)2 . (6.8)

Hier kann die Tatsache Verwirrung stiften, dass wir in (6.7) das Argument von f und gbeidesmal mit x bezeichnet haben; betrachtet man f und g unabhangig voneinander, sohat man zunachst keinen Grund, verschiedene Buchstaben fur die beiden Argumente zuverwenden. Hatten wir jedoch statt (6.7) geschrieben

f(x) = x+ 1 , g(y) = y2 ,

so hatten wir y durch x+ 1 ersetzt, mit demselben Ergebnis wie in (6.8).

Die allgemeine Situation ist die folgende. Seien

f : M → N und g : N → P , (6.9)

Abbildungen zwischen Mengen M , N und P . Die Komposition von f und g ist eineAbbildung von M nach P , sie wird bezeichnet mit g ◦ f und definiert durch

g ◦ f : M → P , (g ◦ f)(x) = g(f(x)) fur alle x ∈M .

Zuerst wird f ausgefuhrt, dann g (im Unterschied dazu, dass beim Lesen von links nachrechts man zuerst den Buchstaben g und dann den Buchstaben f liest). Aus der Definitionfolgt direkt, dass die Komposition assoziativ ist, so alle auftretenden Ausdrucke definiertsind: (f ◦ g)◦h = f ◦(g ◦ h). Wir durfen daher auch ohne Klammerung f ◦g◦h schreiben.

In Beispiel (6.7) hatten wir stillschweigend M = N = P = R angenommen; im allgemei-nen Fall muss man allerdings auf Definitions- und Wertebereiche achten, denn man kannden Wert f(x) nur dann in g einsetzen, wenn er im Definitionsbereich von g liegt. Das ist inder Situation (6.9) garantiert; um sie herzustellen, muss man u.U. den Definitionsbereichvon f geeignet wahlen. Sei beispielsweise

f(x) = x− 4 , g(x) =1

x2 − 9.

Zunachst ist R eine naturliche Wahl des Definitionsgebiets von f , also f : R → R. Willman aber die Komposition g ◦ f betrachten, so muss man den Definitionsbereich von fso einschranken, dass die Werte f(x) = ±3 nicht auftreten. Ein naturlicher Kandidat furdie Menge M in (6.9) ist R \ {1, 7} oder eine Teilmenge davon.

Die Reihenfolge bei der Komposition ist wesentlich. Fur f(x) = x + 1, g(x) = x2 mitf, g : R → R sind sowohl g ◦ f : R → R als auch f ◦ g : R → R definiert, aber es gilteinerseits, wie wir gesehen haben, (g◦f)(x) = (x+1)2, und andererseits (f ◦g)(x) = x2+1,also g ◦ f 6= f ◦ g.

Sei f : M → N bijektiv und f−1 : N →M die Umkehrabbildung. Es gilt

f−1(f(x)) = x fur alle x ∈M ,

f(f−1(y)) = y fur alle y ∈ N .

57

Page 64: Vorlesungsskript zur Analysis 1 -

Das konnen wir auch schreiben als

f−1 ◦ f = idM , f ◦ f−1 = idN ,

wobei id die identische Abbildung bezeichnet,

idM : M →M , idM(x) = x fur alle x ∈M .

Lemma 6.4Sei f : M → N eine Abbildung. Sind A,B ⊂M , so gilt

f(A ∪B) = f(A) ∪ f(B) , f(A ∩B) ⊂ f(A) ∩ f(B) . (6.10)

Sind C,D ⊂ N , so gilt

f−1(C ∪D) = f−1(C) ∪ f−1(D) , f−1(C ∩D) = f−1(C) ∩ f−1(D) .

Beweis: Wir beweisen die zweite Regel in (6.10). Aus A ∩B ⊂ A folgt f(A ∩B) ⊂ f(A).Ebenso erhalt man f(A ∩ B) ⊂ f(B). Beide Aussagen zusammengenommen ergebenf(A ∩B) ⊂ f(A) ∩ f(B). �

Die umgekehrte Inklusion ⊃ in (6.10) gilt im Allgemeinen nicht. Dies sieht man leichtfur den Extremfall A ∩ B = ∅. Dann gilt f(A ∩ B) = f(∅) = ∅, aber es kann durchausf(A) ∩ f(B) 6= ∅ sein, wie man sich leicht an Beispielen uberlegt.

58

Page 65: Vorlesungsskript zur Analysis 1 -

7 Die komplexen Zahlen

7.1 Motivation

Die Gleichungx2 + 1 = 0 (7.1)

hat keine reelle Losung x ∈ R. Die allgemeine Losungsformel fur quadratische Gleichungen(oder einfaches Hinsehen) liefert jedoch formal die beiden Losungen

±√−1 .

Der Geniestreich, der hinter komplexen Zahlen steckt, ist, diese Losungen nicht als Unfug(Wurzeln aus einer negativen Zahl) abzutun, und stattdessen mutig zu definieren

i :=√−1 . (7.2)

Dann hat die quadratische Gleichung (7.1) zwei Losungen, namlich ±i, und kann dannumgeschrieben werden als

i2 = −1 .

Die Einfuhrung komplexer Zahlen stammt aus langjahrigen und oft fruchtlosen Versuchen,eine Losungsformel fur Nullstellen von Polynomen zu finden. Damit haben sich GirolamoCardano (1501–1576) und Rafael Bombelli (1526–1572) im 16. Jahrhundert beschaftigt.In ihren Rechnungen tauchen immer wieder Wurzeln aus negativen Zahlen auf. Es hataber mehr als 200 Jahre gedauert, bis solche Ausdrucke als vollwertige Zahlen anerkanntwurden.

In diesem Kapitel werden wir zeigen, dass Definition (7.2) sinnvoll ist, sprich: nicht aufWiderspruche fuhrt, sondern einen neuen Zahlenkorper definiert, namlich den Korper derkomplexen Zahlen. Wie wir sehen werden, umfasst dieser Korper den der reellen Zah-len. Im Verlauf der Vorlesung werden wir sehen, dass komplexen Zahlen extrem nutzlichsind. So lassen sich Schwingungsvorgange und damit verbunden die spater betrachtetenSinus- und Cosinusfunktionen im Komplexen viel einfacher verstehen. Daher sind kom-plexe Zahlen etwa bei Untersuchung von Wechselstromen in der Elektrotechnik gar nichtmehr wegzudenken.

7.2 Definition und elementare Eigenschaften komplexer Zahlen

Wir interpretieren komplexe Zahlen

z := x+ iy , i =√−1 , x, y ∈ R , (7.3)

als Punkte (x, y) in der Ebene, siehe Abb. 7.1.

Addition und Multiplikation komplexer Zahlen sind so definiert, dass sie zu (7.3) passen,also

(x1 + iy1) + (x2 + iy2) = (x1 + x2) + i(y1 + y2) ,

und

(x1 + iy1) · (x2 + iy2) = x1x2 + ix1y2 + iy1x2 + i2y1y2 = (x1x2 − y1y2) + i(x1y2 + x2y1) .

59

Page 66: Vorlesungsskript zur Analysis 1 -

x

iy

1−1

i

−i

−3 −2 2 3

2i

3i

4i

z = 2 + 3i

z1

z2

z1 + z2

Abbildung 7.1: Die komplexe Ebene und Addition komplexer Zahlen.

Definition 7.1 (Komplexe Zahlen)Wir definieren

C ={z∣∣ z = (x, y), x ∈ R, y ∈ R

}

als die Menge aller geordneten Paare reeller Zahlen. Wir definieren eine Addition +: C×C→ C durch

(x1, y1) + (x2, y2) = (x1 + x2, y1 + y2)

und eine Multiplikation · : C× C→ C durch

(x1, y1) · (x2, y2) = (x1x2 − y1y2, x1y2 + x2y1) .

Im Sinne der Gleichheit von Mengen ist also C = R × R = R2. Die Addition in C ent-spricht der ublichen Vektoraddition im R2, siehe Abb. 7.1. Auch die Multiplikation werdenwir geometrisch interpretieren, sobald wir in Abschnitt 11.3 die Exponentialfunktion imKomplexen kennengelernt haben. Im Spezialfall y1 = 0 gilt

(x1, 0) · (x2, y2) = (x1x2, x1y2) = x1(x2, y2) ,

dies entspricht der Skalarmultiplikation des Vektors (x2, y2) ∈ R2 mit dem Skalar x1 ∈ R.

Die reelle Zahlengerade ist in die komplexe Zahlenebene eingebettet vermittels der Ab-bildung j : R→ C,

j(x) = (x, 0) .

Offensichtlich ist j injektiv. Es gilt fur alle x1, x2 ∈ R

j(x1 + x2) = (x1 + x2, 0) = (x1, 0) + (x2, 0) = j(x1) + j(x2) ,

j(x1x2) = (x1x2, 0) = (x1, 0) · (x2, 0) = j(x1) · j(x2) .

Diese Gleichungen bedeuten, dass es fur die Addition und Multiplikation reeller Zahlengleichgultig ist, ob wir sie als reelle oder als komplexe Zahlen auffassen.

Wir werden im Folgenden x und j(x) identifizieren, d.h. x je nach Kontext als eine reelleZahl x oder als die komplexe Zahl j(x) auffassen. Der Grund fur diese Identifikation ist,

60

Page 67: Vorlesungsskript zur Analysis 1 -

dass zwar ein mengentheoretischer Unterschied zwischen x und j(x) besteht; algebraischverhalten sich diese Objekte jedoch gleich. Insbesondere ist jetzt offensichtlich, dass dieMenge der komplexen Zahlen als echte Obermenge der reellen Zahlen aufgefasst werdenkann.

Das die Definition komplexer Zahlen sinnvoll (nicht zu Widerspruchen fuhrend) ist, zeigtder folgende Satz, den man durch Nachrechnen direkt verifizieren kann. Lediglich die dieBestimmung des Inverses z−1 fur z 6= 0 erfordert etwas Uberlegung und wird spater indiesem Kapitel besprochen.

Satz 7.2Mit der in Definition 7.1 vereinbarten Addition und Multiplikation ist (C,+, ·) ist einkommutativer Korper, erfullt also die Korperaxiome (K1)–(K3).

Dieser Satz liefert eine Begrundung, dass die Einfuhrung der komplexen Zahlen genial ist:Alle auf den Korperaxiomen basierenden Resultate gelten auch fur komplexe Zahlen. Sogelten etwa die binomischen Formeln (Satz 5.8) auch in C, mit demselben Beweis wie inR.

Einen Preis muss man allerdings zahlen: Es gibt fur komplexe Zahlen keine Ordnungs-relation (Definition 5.13). Denn gabe es eine Ordnungsrelation, konnte man wie in Lem-ma 5.15 (ii) zeigen, dass x2 ≥ 0 fur jedes Korperelement x gilt. Bei komplexen Zahlen istdas aber wegen i2 = −1 offensichtlich falsch. Die komplexen Zahlen sind also ein Korper,aber kein angeordneter Korper.

Das Nullelement in C ist (0, 0), das Einselement (1, 0), beide identifizieren wir wie ver-einbart mit der reellen 0 und der reellen 1. Die komplexe Zahl (0, 1) heißt imaginareEinheit und wird mit i bezeichnet. Eine komplexe Zahl z = (x, y) ∈ C konnen wir alsoschreiben als

z = (x, y) = x · (1, 0) + y · (0, 1) = x+ iy .

Es isti2 = −1 , i3 = −i , i4 = 1 , in+4 = in fur alle n ∈ Z .

Definition 7.3Sei z = x + iy mit x, y ∈ R. Die Darstellung z = x + iy wird Standarddarstellungoder kartesische Darstellung von z genannt. Wir definieren den Realteil Re (z) undden Imaginarteil Im (z) durch

Re (z) = x , Im (z) = y ,

die zu z konjugiert komplexe Zahl z ∈ C durch

z = x− iy ,

und den Betrag |z| von z durch

|z| =√zz =

√x2 + y2 . (7.4)

Die Konjugation z 7→ z entspricht der Spiegelung an der reellen Achse. Der Betrag |z|einer Zahl z ∈ C ist reell und nichtnegativ, er liefert den Abstand des Punktes z vom

61

Page 68: Vorlesungsskript zur Analysis 1 -

Nullpunkt in der komplexen Ebene. Der Abstand zweier Punkte z, w ∈ C ist gegebendurch |z − w|.Es folgen unmittelbar die Rechenregeln

Re (z) =1

2(z + z) , Im (z) =

1

2i(z − z) , ∀ z ∈ C ,

sowie

z = z , ∀ z ∈ C ,z1 + z2 = z1 + z2 , ∀ z1, z2 ∈ C ,z1z2 = z1 · z2 , ∀ z1, z2 ∈ C .

Aus (7.4) erhalten wir eine Formel fur das multiplikative Inverse. Es ist |z|2 = zz, also furz 6= 0

1

z=

z

|z|2 , (7.5)

also, falls z = x+ iy ∈ C \ {0},

z−1 =1

z=

(x

x2 + y2,−y

x2 + y2

). (7.6)

Die Formel (7.5) ist jedoch einfacher zu merken als (7.6).

Ist z = (x, 0) ∈ C, so ist |z| =√x2 = |x|. Weiter gilt

Re (z) ≤ |z| , Im (z) ≤ |z| , ∀ z ∈ C ,

sowie|z| = |z| , ∀ z ∈ C .

Die Eigenschaften der Betragsfunktion aus Lemma 5.20 gelten auch in C:

Lemma 7.4Es gilt

|z| ≥ 0 , |z| = 0⇔ z = 0 , ∀ z ∈ C , (7.7)

|z1z2| = |z1| |z2| , ∀ z1, z2 ∈ C , (7.8)

sowie die Dreiecksungleichung

|z1 + z2| ≤ |z1|+ |z2| , ∀ z1, z2 ∈ C . (7.9)

Beweis: (7.7) ist klar wegen |z| =√x2 + y2 fur z = (x, y). Zu (7.8): Fur alle z1, z2 ∈ C

gilt|z1z2|2 = (z1z2) · (z1z2) = z1z2z1z2 = z1z1z2z2 = |z1|2|z2|2 ,

also folgt|z1z2| =

√|z1|2|z2|2 =

√|z1|2

√|z2|2 = |z1||z2| .

Zu (7.9): Fur alle z1, z2 ∈ C gilt

Re (z1z2) ≤ |z1z2| = |z1||z2| ,

62

Page 69: Vorlesungsskript zur Analysis 1 -

Re (z)

Im (z)

1−1

i

−i−1−2 2 3 4 5 6

2i

3i

4i

w

w

z1

|z1|

z2

z1 + z2|z2|

|z1 + z2|

Abbildung 7.2: Komplexe Konjugation und die Dreiecksungleichung.

also

|z1 + z2|2 = (z1 + z2)(z1 + z2) = z1z1 + z1z2 + z2z1 + z2z2

= |z1|2 + 2Re (z1z2) + |z2|2 ≤ |z1|2 + 2|z1||z2|+ |z2|2 = (|z1|+ |z2|)2 ,

also folgt (7.9) wieder durch Wurzelziehen. �

Die geometrische Bedeutung der Dreiecksungleichung sieht man an dem aus den Punkten0, z1 und z1 + z2 gebildete Dreieck, siehe Abb. 7.2.

7.3 Nachbemerkung und Ausblick

Der Weg zur Einfuhrung komplexer Zahlen war lang und steinig; dies liegt daran, dass invergangenen Jahrhunderten Mathematiker unbewusst annahmen, dass zwei Zahlen ver-gleichbar sein mussen, also der zugrundeliegende Korper den Ordnungsaxiomen genugt.Wie in diesem Kapitel gezeigt, ist das fur komplexe Zahlen unmoglich.

Wir haben nicht gezeigt, dass (C,+, ·) der (bis auf Isomorphie) eindeutig bestimmte klein-ste Korper ist, der die reellen Zahlen umschließt. Dies ist jedoch korrekt und beispielsweisein [1] ausgefuhrt.

Wir haben in diesem Kapitel gesehen, dass das quadratische Polynom x2 + 1 zwei Null-stellen hat, die sich im Komplexen (auf der imaginaren Achse)

”verstecken“. Man kann

nachrechnen, dass die Gleichung z3 = 1 drei Losungen hat, namlich z1 = 1, z2 = −12

+√

32i

und z3 = z2 (siehe Abb. 7.3). Dieser Sachverhalt gilt allgemeiner, namlich besagt derFundamentalsatz der Algebra: Jedes Polynom p(z) = a0 + a1z + · · · + anz

n mit komple-xen Koeffizienten a0, . . . , an vom Grad n hat genau n Nullstellen, wenn deren Vielfachheitgezahlt wird. Fur diesen Satz gibt es schone Beweise, die teilweise mit Methoden der Ana-lysis des ersten Studienjahres auskommen, siehe etwa [3, Abschnitt 7.6]. Fur Polynomevom Grad n ≤ 4 gibt es Losungsformeln (fur n = 2 ist dies die

”Mitternachtsformel“, die

auch im Komplexen gilt, da die Herleitung auf Korperaxiomen basiert. Fur n = 3 und

63

Page 70: Vorlesungsskript zur Analysis 1 -

-1.0 -0.5 0.5 1.0Re(z)

-1.0

-0.5

0.5

1.0

Im(z)

Abbildung 7.3: Die drei Losungen der Gleichung z3 = 1.

n = 4 sind dies die Formeln von Cardano bzw. Ferrari). Galois zeigte, dass es keine allge-meine Losungsformel fur Polynome vom Grad n ≥ 5 geben kann; die genaue Formulierungdieses spektakularen Satzes ist Bestandteil der Algebravorlesung in hoheren Semestern.Da der Fundamentalsatz der Algebra zwar die Faktorisierung beliebiger Polynome garan-tiert, es aber keine allgemeine Formel zur Bestimmung der Nullstellen geben kann, mussman effiziente Naherungsverfahren zur Nullstellenbestimmung bereitstellen. Dies ist eineAufgabe der Numerischen Mathematik, die Ihnen in hoheren Semestern begegnen wird.

Da die komplexen Zahlen die reellen Zahlen erweitern, kann man sich fragen, ob es sinnvol-le Erweiterungen der komplexen Zahlen gibt. Dem ist so: Insbesondere sind Quaternionenein die komplexen Zahlen umfassende Menge von Zahlen, fur die die Multiplikation im all-gemeinen nicht kommutativ ist. Man spricht in dieser Situatiuon von einem Schiefkorper ;in einem Schiefkorper gelten die Korperaxiome mit Ausnahme von (K·). Interessierte Leserund Leserinnen sind auf [2] verwiesen.

Erganzende Literatur zu diesem Kapitel

[1] C. Blatter. Analysis. I. Third. Bd. 151. Heidelberger Taschenbucher [Heidelberg Pa-perbacks]. Springer-Verlag, Berlin-New York, 1980, xvii+223. isbn: 3-540-09483-0.url: https://people.math.ethz.ch/~blatter/dlp.html.

[2] H.-D. Ebbinghaus u. a. Zahlen. Bd. 1. Grundwissen Mathematik [Basic Knowledgein Mathematics]. Edited and with an introduction by K. Lamotke. Springer-Verlag,Berlin, 1983, xii+291. isbn: 3-540-12666-X. doi: 10.1007/978-3-642-96783-2.url: https://doi.org/10.1007/978-3-642-96783-2.

[3] K. Konigsberger. Analysis. 1. Springer-Lehrbuch. [Springer Textbook]. Springer-Verlag,Berlin, 2004, xiv+412. isbn: 3-540-40371-X. doi: 10.1007/978-3-642-18490-1.url: https://doi.org/10.1007/978-3-642-18490-1.

64

Page 71: Vorlesungsskript zur Analysis 1 -

8 Folgen

8.1 Motivation

In diesem Kapitel begegnen wir dem zentralen Konzept der Analysis, namlich dem Grenz-wert (lateinisch limes). Sehr viele Ideen und Konzepte in der Analysis beinhalten irgendei-ne Art von Approximation. In der Schule hatte man das am (spater in Kapitel 12 genauerstudierten) Begriff der Ableitung gesehen. Konzeptionell ist die Ableitung einer Funktionf in einem Punkt x die Steigung der Tangente des Graphen am Punkt P = (x, f(x)). Zurpraktischen Berechnung hilft das aber nur in den seltensten Fallen. Stattdessen approxi-mieren wir, wie in Abb. 8.1 skizziert, diese Steigung durch immer

”genauere“ Sekanten

zwischen P und einem benachbarten Punkt (die Begriffe Sekante und Steigung sind inDefinition 10.19 definiert, falls sie bei Ihnen in der Schule nicht vorkamen). Sei etwa diem1 die Steigung der Sekante durch P und einen Punkt Q1, und m2 die Steigung der Se-kante durch P und einen naher an P gelegenen Punkt Q2, und so weiter. Damit erhaltenwir eine Folge, namlich die Folge der Sekantensteigungen

m1,m2,m3, . . . ,

und hoffen, dass diese Folge”gegen einen Grenzwert strebt“, namlich die Ableitung m

der Funktion in P .

In diesem Kapitel fuhren wir zunachst das Konzept der Folge ein. Dann untersuchen wirdie Frage, ob und wann Folgenglieder, wie hier die Sekantensteigungen m1,m2,m3, . . . ,gegen einen

”Grenzwert“, hier die Ableitung m, streben. Anschließend werden wir wichtige

Rechenregeln und Resultate fur Grenzwerte herleiten.

Ableitung mP

Q1

Steigung m1

Q2

Steigung m2

Q3

Steigung m3

Q4Steigung m4

Abbildung 8.1: Eine Folge von Sekantensteigungen approximiert den Grenzwert, namlichdie Tangentensteigung (Ableitung) in einem Punkt.

8.2 Folgen und Grenzwerte

Definition 8.1 (Folge)Sei M eine Menge. Eine Abbildung von N nach M heißt Folge in M . Im Fall M = Rsprechen wir von einer reellen Folge oder reellen Zahlenfolge. Im Fall M = C handeltes sich um eine komplexe Folge.

65

Page 72: Vorlesungsskript zur Analysis 1 -

5 10 15 20

0.1

0.2

0.3

0.4

0.5

5 10 15 20

-1.0

-0.5

0.5

1.0

Abbildung 8.2: Die ersten Folgenglieder fur Beispiel 8.2 (i) (links), und Beispiel 8.2 (ii)(rechts).

Folgen werden durch Auflistung beschrieben. Ist f(n) = an, schreiben wir die Folge als

a0, a1, a2, a3, . . . , oder als (an)n∈N oder kurz (an).

Das Element an ∈M heißt dann das n-te Glied oder Element der Folge (an)n∈N.

In Erweiterung von Definition 8.1 spricht man auch von Folgen, wenn die Nummerierungder Folgenglieder nicht bei 0 anfangt, sondern bei einer anderen ganzen Zahl. Um eineZahl n0 ∈ Z als Anfang festzulegen, schreiben wir

(an)n≥n0

und meinen damit die Abbildung f : N →M , N ={n∣∣ n ∈ Z, n ≥ n0

}.

Beispiel 8.2(i) Die Festlegung an = 1

nfur n ∈ N>0 definiert die Folge

(1, 1

2, 1

3, 1

4, . . .

), auch geschrie-

ben als(

1n

)n≥1

.

(ii) ((−1)n)n∈N ist die Folge (1,−1, 1,−1, . . . )

(iii) Die rekursive Definition f0 = 1, f1 = 1 und fn = fn−1 + fn−2 fur n ≥ 2 definiertdie Fibonacci-Folge

(1, 1, 2, 3, 5, 8, 13, 21, . . . )

die in dieser Folge auftretenden Zahlen heißen Fibonaccizahlen.

Wir kommen nun zum Begriff des Grenzwerts. Wir behandeln zuerst Grenzwerte von Fol-gen. Spater, in Beispiel 8.16 und Kapitel 13, werden wir auch Grenzwerte von Funktionenbesprechen.

Wir betrachten die Folge in (i) im Beispiel. Je großer n ist, desto naher liegt an = 1/n ander 0. Einerseits ist an 6= 0 fur alle n, andererseits

”strebt an gegen 0“. Wie kann man das

prazise fassen? Der entscheidende Trick ist, nicht aus dem Blickwinkel der Folgengliederzu schauen. Wir wechseln die Perspektive und betrachten die Situation vom Punkt 0 alsvermutetem Grenzwert aus. Legt man ein Intervall (−ε, ε) um 0, mit ε > 0, so liegen dieFolgenglieder an zunachst außerhalb des Intervalls (sofern ε < 1), aber von einem gewis-sen Index n0 an innerhalb des Intervalls. Verkleinert man ε, so bleibt diese Eigenschafterhalten, falls man n0 geeignet vergroßert.

66

Page 73: Vorlesungsskript zur Analysis 1 -

Aus dieser Uberlegung entsteht der Grenzwertbegriff, so wie er sich im 19. Jahrhundertdurchgesetzt hat und seither verwendet wird.

Definition 8.3 (Grenzwert einer Folge)Sei (an)n∈N eine reelle Folge. Ein a ∈ R heißt Grenzwert (oder Limes) von (an)n∈N,falls es zu jedem ε > 0 ein n0 ∈ N gibt mit

|an − a| < ε fur alle n ∈ N mit n ≥ n0. (8.1)

Falls (an)n∈N einen Grenzwert a hat, so sagt man auch:”(an) konvergiert gegen a“ oder

”(an) ist konvergent“. Falls (an)n∈N keinen Grenzwert hat, so sagt man:

”(an) divergiert“

oder”(an) ist divergent“. Konvergiert (an)n∈N mit Grenzwert 0, spricht man von einer

Nullfolge.

Der springende Punkt dieser Definition ist: Eine konvergente Folge kommt einem Grenz-wert beliebig nahe, wenn genugend große Indizes n betrachtet werden.

Beispiel 8.4(i) Die Folge an = 1/n konvergiert gegen 0: Zu ε > 0 wahlen wir n0 ∈ N so groß, dass

n0 >1

ε.

Es gilt dann fur alle n ≥ n0

∣∣∣∣1

n− 0

∣∣∣∣ =1

n≤ 1

n0

< ε ,

damit erfullt 0 die in Definition 8.3 verlangte Bedingung.

(ii) Die durch an = n√a definierte Folge konvergiert fur festes a > 0 gegen 1, und

dasselbe gilt fur die Folge (bn) mit bn := n√n (siehe Ubungsaufgabe).

(iii) Die Folge an = (−1)n divergiert: Angenommen, a ∈ R sei ein Grenzwert der Folge.Fur ε = 1 finden wir daher gemaß Definition ein n0 ∈ N mit |an − a| < 1 fur allen ≥ n0. Dann gilt

2 = |an0+1 − an0 | ≤ |an0+1 − a|+ |an0 − a| < 1 + 1 = 2 ,

ein Widerspruch. Also kann es ein solches a nicht geben.

Eine zu Definition 8.3 aquivalente Definition des Grenzwerts erhalt man, wenn manin (8.1)

”<“ durch

”≤“ ersetzt, es also heißt: Zu jedem ε > 0 gibt es ein n0 ∈ N mit

|an − a| ≤ ε fur alle n ∈ N mit n ≥ n0.

Diese Aquivalenz zu zeigen, ist eine SUPER-Aufgabe.

67

Page 74: Vorlesungsskript zur Analysis 1 -

5 10 15 20

1000

2000

3000

4000

Abbildung 8.3: Die ersten Folgenglieder derFibonaccifolge, Beispiel 8.2 (iii).

Definition 8.3 erfordert etwas Nachdenken– wie jede Definition, die ein Objekt de-finiert. In solchen Situationen stellt sichdie Frage der Existenz : Obige Beispiele zei-gen, dass ein Grenzwert existieren kannoder nicht, abhangig von der betrachte-ten Folge. Im Falle der Existenz stellt sichaber die Frage der Eindeutigkeit : Ist dasdefinierte Objekt eindeutig festgelegt odernicht? Sprich: Kann im Kontext von Defi-nition 8.3 eine Folge mehrere verschiedeneGrenzwerte haben oder nicht? Intuitiv er-warten wir, dass der Grenzwert, sofern erexistiert, eindeutig ist. Aber wir haben bisher sorgsam vermieden, zu sagen, dass derGrenzwert, etwa 0 fur die Folge ( 1

n)n∈N, eindeutig bestimmt ist. Das ist zwar richtig, aber

wir mussen das zeigen:

Satz 8.5Jede reelle Folge (an)n∈N hat hochstens einen Grenzwert.

Beweis: Angenommen, a und b sind Grenzwerte von (an) mit a 6= b. Wir definieren

ε =|b− a|

2.

Dann ist ε > 0. Wahle n1, n2 ∈ N mit

|an − a| < ε , fur alle n ≥ n1 ,

|an − b| < ε , fur alle n ≥ n2 .

Dies ist moglich, da a und b Grenzwerte sind. Fur ein beliebiges n ≥ max{n1, n2} folgtnun

|a− b| ≤ |a− an|+ |an − b| < ε+ ε = |b− a| .Wir haben einen Widerspruch erhalten. Also kann a 6= b nicht richtig sein, und a = bmuss gelten. �

Nach Satz 8.5 ist es sinnvoll, von dem Grenzwert einer Folge zu sprechen. Ist eine Folge(an) konvergent, so bezeichnet

limn→∞

an (8.2)

ihren Grenzwert. Konvergiert (an) gegen a, so gilt also

a = limn→∞

an . (8.3)

Wir schreiben auchan → a fur n→∞ ,

wobei die Information”n→∞“ entfallen kann, wenn klar ist, welcher Grenzwert gebildet

wird. Die Gleichung (8.3) beinhaltet zwei Aussagen: Erstens, der Grenzwert von (an)existiert, und zweitens, er ist gleich a.

68

Page 75: Vorlesungsskript zur Analysis 1 -

Die Konvergenz einer Folge direkt mit Definition 8.3 nachzuweisen, ist moglich, aber oftmuhsam. Wir werden im Folgenden eine

”Werkzeugkiste“ zusammenstellen, deren Inhalt

verschiedene Methoden zur Grenzwertbestimung ist. Als Vorbereitung formulieren wir einResultat, das von eigenstandigem Interesse ist.

Definition 8.6 (Beschrankte Folge)Eine reelle Folge (an)n∈N heißt beschrankt, wenn die Menge

{an∣∣ n ∈ N

}beschrankt ist.

Gemaß Lemma 5.23 ist eine Folge (an)n∈N beschrankt genau dann, wenn es ein C > 0gibt mit |an| ≤ C fur alle n ∈ N.

Satz 8.7Jede konvergente reelle Folge ist beschrankt.

Beweis: Sei (an) eine reelle Folge mit an → a. Der springende Punkt ist, dass sich wegender Konvergenz unendlich viele Folgenglieder im beschrankten Intervall [a − 1, a + 1]befinden, und außerhalb dieses Intervalls hochstens endlich viele Glieder liegen konnen.Um dies prazise aufzuschreiben, wahlen wir ein n0 mit |an − a| < 1 fur alle n ≥ n0. Setze

C = max {|a0|, . . . , |an0−1|, |a|+ 1} ,

dann gilt |an| ≤ C fur alle n ∈ N. �

Eine ubliche Sprechweise ist”fast alle“; damit ist in der Mathematik gemeint

”alle bis

auf hochstens endlich viele Ausnahmen“. Im Alltag kann diese Sprechweise verwirrendsein (so sind fast alle Zuhorer dieser Vorlesung Seehunde), aber in der Mathematik ist siepraktisch: Gerade haben wir bewiesen, dass fast alle Folgenglieder im Intervall [a−1, a+1]liegen (namlich mindestens die mit Index n ≥ n0).

Eine beschrankte Folge braucht nicht konvergent zu sein, wie man am Beispiel an = (−1)n

sieht. Es gilt also fur reelle Folgen

konvergent =⇒6⇐=

beschrankt.

Aus Satz 8.7 folgt, dass unbeschrankte Folgen nicht konvergent sein konnen. So kannzum Beispiel die Fibonaccifolge (fn) aus Beispiel 8.2 (iii) nicht gegen eine reelle Zahlkonvergieren: ein Induktionsbeweis zeigt, dass fn ≥ n fur n ≥ 2 gilt, die Folge ist alsounbeschrankt. In Abschnitt 8.5 werden wir fur solche Falle den Begriff der Konvergenzgegen Unendlich einfuhren.

Bemerkenswerterweise konvergiert jedoch die Folge der Quotienten benachbarter Fibo-naccizahlen, qn := fn+1

fn, und zwar gegen den goldenen Schnitt,

limn→∞

qn =1

2

(1 +√

5).

Wir skizzieren nur die Beweisidee: Die Folge (qn) genugt

qn = 1 +1

qn−1

. (8.4)

69

Page 76: Vorlesungsskript zur Analysis 1 -

Sofern man zeigen kann, dass der Grenzwert q existiert, darf man in (8.4) auf beidenSeiten zum Limes ubergehen und erhalt

q = 1 +1

q;

dies fuhrt zu einer quadratischen Gleichung, deren positive Wurzel der goldene Schnittist.

8.3 Rechenregeln fur Grenzwerte

Satz 8.8Seien (an)n∈N, (bn)n∈N reelle Folgen mit an → a ∈ R, bn → b ∈ R. Dann ist auch dieFolge (an + bn)n∈N konvergent, und es gilt

limn→∞

(an + bn) = a+ b . (8.5)

Beweis: Ubung. �

Die Aussage von Satz 8.8 lasst sich auch als Rechenregel

limn→∞

(an + bn) = limn→∞

an + limn→∞

bn (8.6)

schreiben. Sie ist allerdings nur anwendbar, wenn beide Grenzwerte auf der rechten Seiteexistieren. Beispiel:

limn→∞

n+ 1

n= lim

n→∞

(1 +

1

n

)= lim

n→∞1 + lim

n→∞

1

n= 1 + 0 = 1 .

Satz 8.9Seien (an)n∈N, (bn)n∈N reelle Folgen mit an → a, bn → b. Dann ist auch die Folge (anbn)n∈Nkonvergent, und es gilt

limn→∞

(anbn) = ab . (8.7)

Beweis: Zunachst gilt fur alle n ∈ N

|anbn − ab| = |an(bn − b) + b(an − a)| ≤ |an||bn − b|+ |b||an − a| .

Wir wahlen C so, dass C ≥ |b| und C ≥ |an| fur alle n ∈ N (dies ist nach Satz 8.7moglich). Sei nun ε > 0 beliebig. Wir wahlen n1 ∈ N mit

|an − a| <ε

2C, fur alle n ≥ n1 ,

sowie n2 ∈ N mit

|bn − b| <ε

2C, fur alle n ≥ n2 .

Dann gilt fur alle n ≥ max {n1, n2}

|anbn − ab| ≤ C|bn − b|+ C|an − a| < Cε

2C+ C

ε

2C= ε .

70

Page 77: Vorlesungsskript zur Analysis 1 -

Satz 8.10Sei (an)n∈N eine reelle Folge mit an → a, a 6= 0. Dann gibt es ein n0 ∈ N mit an 6= 0 furalle n ≥ n0, und es gilt

limn→∞

1

an=

1

a. (8.8)

Beweis: Ubungsaufgabe. �

Folgerung 8.11Seien (an)n∈N, (bn)n∈N reelle Folgen mit an → a, bn → b, und es gelte b 6= 0. Dann gibt esn0 ∈ N mit bn 6= 0 fur alle n ≥ n0, die Folge (an/bn)n∈Nn≥n0

ist konvergent, und es gilt

limn→∞

anbn

=a

b. (8.9)

Beweis: Aus Satz 8.9 und Satz 8.10 folgt

anbn

= an ·1

bn→ a · 1

b=a

b.

Die vorstehenden Satze lassen sich zur Berechnung von Grenzwerten algebraischer Aus-drucke verwenden. Beispielsweise gilt fur alle k ∈ N>0

limn→∞

1

nk= lim

n→∞

k∏

i=1

1

n=

k∏

i=1

limn→∞

1

n= 0k = 0 .

Als nachstes Beispiel wollen wir den Grenzwert der Folge an = 18n3−4n2+87n3+4n

berechnen. DerVersuch

limn→∞

18n3 − 4n2 + 8

7n3 + 4n=

limn→∞ 18n3 − 4n2 + 8

limn→∞ 7n3 + 4n

geht schief, denn die Folgen im Zahler und Nenner der rechten Seite besitzen keinen reellenGrenzwert. Damit ist Folgerung 8.11 nicht anwendbar. Stattdessen konnen wir so rechnen:

18n3 − 4n2 + 8

7n3 + 4n=

18− 4n

+ 8n3

7 + 4n2

→ 18

7.

8.4 Vertraglichkeit von Grenzwert und Ungleichungen

Ein nutzliches Werkzeug fur Konvergenzuntersuchungen ist das folgende Kriterium, manch-mal aus als Sandwichkriterium bezeichnet.

Lemma 8.12 (Einschließungskriterium)Seien (an), (cn) konvergente Folgen in R mit

limn→∞

an = a = limn→∞

cn.

Sei (bn) eine reelle Folge mit an ≤ bn ≤ cn fur alle n ∈ N. Dann ist auch (bn) konvergent,und es gilt lim

n→∞bn = a.

71

Page 78: Vorlesungsskript zur Analysis 1 -

Beweis: Dies folgt unmittelbar, da fur gegebenes ε fur genugend großes n die Einschließunga− ε < an ≤ bn ≤ cn < a+ ε gilt. �

Lemma 8.13Seien (an)n∈N, (bn)n∈N reelle Folgen mit an → a, bn → b, es gelte an ≤ bn fur alle n ∈ N.Dann ist a ≤ b.

Beweis: Wir nehmen an, dass a > b. Wir wahlen n0 so, dass

|an − a| <a− b

2und |bn − b| <

a− b2

gilt fur alle n ≥ n0. Dann gilt fur alle solche n, dass

bn − an = (bn − b) + (b− a) + (a− an)

<a− b

2+ (b− a) +

a− b2

= 0

im Widerspruch zur Voraussetzung an ≤ bn. �

8.4.1 Montone Folgen

Definition 8.14 (Monotone Folge)Eine reelle Folge (an) heißt monoton wachsend, wenn an ≤ an+1 fur alle n ∈ N gilt.Ferner sagen wir, dass (an) streng monoton wachsend ist, wenn an < an+1 fur allen ∈ N erfullt ist. Wir sagen, dass (an) (streng) monoton fallend ist, wenn (−an)(streng) monoton wachsend ist. Schließlich heißt (an) (streng) monoton, wenn (an)(streng) monoton wachsend oder (streng) monoton fallend ist.

Satz 8.15 (Monotoniesatz)Jede nach oben beschrankte, monoton wachsende reelle Folge (an)n∈N ist konvergent, undes gilt

limn→∞

an = supn∈N

an . (8.10)

Jede nach unten beschrankte, monoton fallende reelle Folge (an)n∈N ist konvergent, undes gilt

limn→∞

an = infn∈N

an . (8.11)

Beweis: Sei a = supn∈N an. Sei ε > 0. Nach Satz 5.32 konnen wir ein n0 ∈ N finden mit

a− ε < an0 ≤ a .

Da (an) monoton wachsend ist, gilt fur alle n ≥ n0

a− ε < an0 ≤ an ≤ a ,

also folgt an → a und damit (8.10). Zum Beweis von (8.11) wenden wir (8.10) auf dieFolge (−an) an und erhalten

limn→∞

(−an) = supn∈N

(−an) = − infn∈N

an ,

72

Page 79: Vorlesungsskript zur Analysis 1 -

woraus (8.11) folgt wegen lim(−an) = − lim an. �

Als Anwendung betrachten wir das Heron-Verfahren (nach Heron von Alexandria, ca. 10–70 n. Chr.), auch bekannt unter dem Namen Babylonisches Wurzelziehen. Dies ist einiteratives Verfahren zur Approximation von Quadratwurzeln. Sei b > 0 die Zahl, derenWurzel wir approximieren wollen. Folgendes Verfahren leistet dies: Sei a0 > 0 ein beliebigerStartwert. Dann definieren wir rekursiv eine Folge durch

an+1 =1

2

(an +

b

an

)fur n ∈ N . (8.12)

In den Ubungen wird folgender Satz bewiesen.

Satz 8.16Fur jeden beliebigen (!) Startwert a0 > 0 konvergiert die durch (8.12) definierte Folge

gegen√b.

Ein weiterer Beweis wird in Analysis 2 gegeben; dort besprechen wir auch, wie man insystematischer Weise auf die Iterationsvorschrift (8.12) kommen kann.

Dieses Verfahren ist in mehrfacher Weise bemerkenswert. Erstens ist es ungewohnlich,dass ein Algorithmus fur jeden beliebigen Startwert funktioniert, daher

”(!)“ im Satz.

Zweitens konvergiert die Folge nicht nur, sondern man kann auch eine Fehlerabschatzungangeben: Wir sehen in den Ubungen, dass in jedem Schritt

b

an≤√b ≤ an

gilt. Drittens ist der Algorithmus selbst-korrigierend : Selbst wenn man sich verrechnetoder Rundungsfehler auftreten, fuhrt der Algorithmus immer noch zum Ergebnis, auchwenn sich die Konvergenz verzogern kann.

Beispiel: Mit b = 2 und Startwert a0 = 1 sind die nachsten Folgenglieder

3

2,17

12,577

408,665857

470832,886731088897

627013566048,1572584048032918633353217

1111984844349868137938112;

ein weiterer Bonus ist also, dass die Approximation durch rationale Zahlen erfolgt. AlsDezimalzahlen geschrieben sind die ersten funf Werte auf 20 Nachkommastellen

1.5, 1.416, 1.4142156862745098039, 1.4142135623746899106, 1.4142135623730950488

(√

2 ≈ 1.4142135623730950488). Wie schnell dieses Verfahren konvergiert, zeigt Abb. 8.4.

8.5 Uneigentliche Konvergenz

Die Folgen0, 1, 2, 3, 4, 5, . . . (8.13)

und0, 1, 0, 2, 0, 3, 0, 4, 0, 5, 0, . . .

sind beide divergent und nach oben unbeschrankt. Im Falle der Folge (8.13) mochte manaber ausdrucken, dass sie

”gegen +∞ strebt“.

73

Page 80: Vorlesungsskript zur Analysis 1 -

2 4 6 8

5

10

15

20

Abbildung 8.4: Konvergenz des Verfahrens zur Approximation von√

2, fur die beidenStartwerte a1 = 1 und (als ziemlich ungeschickte Wahl) a1 = 20.

Definition 8.17 (Uneigentliche Konvergenz)Eine reelle Folge (an)n∈N heißt uneigentlich konvergent gegen +∞, wenn es zu jedemC > 0 ein n0 ∈ N gibt mit

an ≥ C , fur alle n ≥ n0 .

Eine reelle Folge (an)n∈N heißt uneigentlich konvergent gegen −∞, wenn (−an) un-eigentlich konvergent gegen +∞ ist. Eine reelle Folge (an)n∈N heißt uneigentlich kon-vergent, wenn sie uneigentlich konvergent gegen +∞ oder uneigentlich konvergent gegen−∞ ist.

Fur die uneigentliche Konvergenz einer Folge (an) verwendet man die Notation

limn→∞

an = +∞ bzw. limn→∞

an = −∞ .

Bisweilen spricht man von eigentlicher Konvergenz, wenn die Konvergenz gegen eine reelleZahl gemeint ist.

Wir mussen uns aber im Klaren sein, dass uneigentliche Konvergenz ein Spezialfall vonDivergenz ist und daher die Satze aus Abschnitt 8.3 im Allgemeinen nicht anwendbarsind! Mehr dazu in den Ubungen.

Satz 8.18Jede monotone reelle Folge (an)n∈N ist entweder konvergent oder uneigentlich konvergent.

Beweis: Sei (an) monoton wachsend. Ist (an) nach oben beschrankt, so ist sie nach demMonotoniesatz 8.15 konvergent. Sei nun (an) nach oben unbeschrankt, sei C > 0 beliebig.Wir wahlen ein n0 ∈ N mit an0 ≥ C, dann gilt an ≥ an0 ≥ C fur alle n ≥ n0, also ist(an) uneigentlich konvergent gegen +∞. Ist (an) monoton fallend, so wenden wir das ebenBewiesene auf die Folge (−an) an. �

74

Page 81: Vorlesungsskript zur Analysis 1 -

8.6 Der Satz von Bolzano-Weierstraß

8.6.1 Teilfolgen und Haufungspunkte

Eine Teilfolge entsteht aus einer Folge, indem man sukzessive Folgenglieder auswahlt,etwa alle Glieder mit geradem Index, und alle anderen Folgenglieder ignoriert.

Definition 8.19 (Teilfolge)Sei M Menge und (an)n∈N eine Folge in M . Ist (nk)k∈N eine streng monoton wachsendeFolge in N, so heißt die Folge (ank)k∈N eine Teilfolge von (an)n∈N.

Als Beispiel betrachten wir

an =1

n, nk = 3k , ank =

1

3k.

Diese Teilfolge enthalt jedes dritte Element der ursprunglichen Folge, ist also gegebendurch

(13, 1

6, 1

9, . . .

). Jede Folge ist eine Teilfolge von sich selbst (fur nk = k). Fur jede

streng monoton wachsende Folge (nk) in N gilt

k ≤ nk , (8.14)

wie wir leicht mit Induktion sehen: Offensichtlich ist 0 ≤ n0, und k ≤ nk impliziertk + 1 ≤ nk + 1 ≤ nk+1, denn aus n > m in N folgt n ≥ m+ 1.

Satz 8.20Sei (an)n∈N eine konvergente reelle Folge. Dann ist jede Teilfolge (ank) konvergent, undes gilt

limk→∞

ank = limn→∞

an . (8.15)

Beweis: Sei an → a und ε > 0 beliebig. Wahle n0 ∈ N mit |an − a| < ε fur alle n ≥ n0,dann gilt wegen nk ≥ k nach (8.14) auch

|ank − a| < ε fur alle k ≥ n0 .

Satz 8.21Jede reelle Folge (an)n∈N hat eine monotone Teilfolge.

Beweis: Wir nennen in diesem Beweis Folgenglieder Spitzen, wenn sie zumindest so großsind wie alle nachfolgenden Glieder, und definieren

N ={n∣∣ n ∈ N, an ≥ ak fur alle k ≥ n

}.

als die Indexmenge der Spitzen.

Fall 1: N ist unendlich. Dann bilden wir die Teilfolge aus den Spitzen. Wir wahlen dazun0 ∈ N beliebig. Ist nk ∈ N bereits definiert, so wahlen wir ein nk+1 ∈ N mit nk+1 > nk.Nach Definition von N gilt ank ≥ ank+1

. Die hierdurch definierte Folge (ank)k∈N ist alsomonoton fallend.

75

Page 82: Vorlesungsskript zur Analysis 1 -

Fall 2:N ist endlich. Dann finden sich fur jeden Index n im Komplement vonN ein m > n,so dass an < am ist, da an nicht Spitze ist. Wenn m /∈ N gilt, konnen wir das Verfahreniterieren und gewinnen eine streng monoton wachsende Folge. Prazise aufgeschrieben: Seim das großte Element von N (falls N = ∅, wahlen wir m = −1.). Wir setzen n0 = m+ 1.Ist nk bereits definiert, so wahlen wir ein nk+1 > nk mit ank < ank+1

. (Ein solches nk+1

gibt es, da nk /∈ N .) Die hierdurch definierte Folge (ank)k∈N ist streng monoton wachsend.�Definition 8.22 (Haufungspunkt)Sei (an)n∈N eine reelle Folge. Eine Zahl a ∈ R heißt Haufungspunkt von (an), wenn eseine Teilfolge (ank) von (an) gibt mit ank → a.

Der folgende Satz von Bolzano-Weierstraß ist ein grundlegender Satz der Analysis. Erbesagt: Ist eine reelle Folge beschrankt, so besitzt sie zumindest einen Haufungspunkt.Dieser Haufungspunkt kann zugleich Grenzwert sein, muss es aber nicht sein.

Satz 8.23 (Bolzano-Weierstraß)Jede beschrankte reelle Folge (an)n∈N besitzt eine konvergente Teilfolge.

Beweis: Nach Satz 8.21 hat (an) eine monotone Teilfolge (ank). Als Teilfolge einer be-schrankten Folge ist sie ebenfalls beschrankt. Nach dem Monotoniesatz 8.15 ist (ank)damit konvergent. �

Aus Satz 8.23 folgt also, dass jede beschrankte Folge mindestens einen Haufungspunktbesitzt. Eine konvergente Folge hat wegen (8.15) genau einen Haufungspunkt, namlichihren Grenzwert. Die divergente Folge

an = (−1)n

besitzt (siehe Abb. 8.2 Mitte) die beiden Haufungspunkte

1 = limk→∞

a2k , −1 = limk→∞

a2k+1 .

Beispiel 8.24Wir untersuchen die Konvergenz der durch

an = rn (8.16)

definierten Folge (an), wobei r ∈ R fest ist. Es sind verschiedene Falle zu unterscheiden.Fall 1: r > 1. Wegen rn+1 = r · rn > 1 · rn = rn ist (an) streng monoton wachsend, wegenFolgerung 5.31 ist (an) unbeschrankt und damit wegen Satz 8.18 uneigentlich konvergentgegen +∞. Fall 2: 0 < r < 1. Wegen 0 < rn+1 = r · rn < 1 · rn = rn ist (an) strengmonoton fallend und nach unten beschrankt. Also ist (an) konvergent und

limn→∞

an = infn∈N

an .

Zu jedem ε > 0 gibt es ein n ∈ N mit rn < ε (wahle n mit (r−1)n > ε−1), also ist

0 ≤ infn∈N

an ≤ 0 ,

und damit folgt an → 0. Fall 3: −1 < r < 0. Nach Fall 2 gilt |an| → 0, also auch an → 0,denn |an − 0| = ||an| − 0|. Fall 4: r < −1. Dann ist an = (−1)n|r|n divergent. Fall 5:r = 0 oder r = 1. Dann ist (an) konstant (im Fall r = 0 ab n = 1). Fall 6: r = −1. Wieschon gesehen, ist an = (−1)n divergent.

76

Page 83: Vorlesungsskript zur Analysis 1 -

8.7 Limes superior und Limes inferior

Sei (an)n∈N eine beliebige reelle Folge. Ist (an) nach oben beschrankt, gilt dies auch fur

bn := supk≥n

ak ∈ R

mit n ∈ N. Wegen

bn = supk≥n

ak = max

{an, sup

k≥n+1ak

}= max {an, bn+1}

ist (bn) eine monoton fallende Folge, also nach Satz 8.18 entweder konvergent oder unei-gentlich konvergent gegen −∞.

Definition 8.25Fur eine nach oben beschrankte Folge (an) ist der Limes superior

lim supn→∞

an := limn→∞

bn = limn→∞

supk≥n

ak .

Ist (an) nach oben unbeschrankt, so gilt bn = +∞ fur alle n ∈ N; wir verabreden in diesemFall, dass

lim supn→∞

an = +∞ .

Analog setzen wir fur eine nach unten beschrankte Folge (an)

cn := infk≥n

ak

und definieren als Limes inferior

lim infn→∞

an := limn→∞

cn = limn→∞

infk≥n

ak .

Falls (an) nach unten unbeschrankt ist, setzen wir

lim infn→∞

an = −∞ .

Auf diese Weise erreichen wir, dass fur jede beliebige reelle Folge (an) der Limes superiordefiniert ist, mit

lim supn→∞

an ∈ R ∪ {−∞,+∞}

und analog fur den Limes inferior

lim infn→∞

an ∈ R ∪ {−∞,+∞}

fur jede beliebige reelle Folge (an). Oft schreibt man R := R ∪ {−∞,+∞}.Beispiel: Fur an = (−1)n gilt bn = 1 fur alle n ∈ N, also

lim supn→∞

(−1)n = limn→∞

1 = 1 .

77

Page 84: Vorlesungsskript zur Analysis 1 -

Weiter gilt cn = −1 fur alle n ∈ N, also

lim infn→∞

(−1)n = −1 .

Die Folge1,−1, 0, 1,−1, 0, 1,−1, 0, . . .

hat die drei Haufungspunkte -1, 0 und 1; ihr Limes superior ist 1, ihr Limes inferior ist-1.

Die Folge0, 1, 0, 1, 2, 0, 1, 2, 3, 0, 1, 2, 3, 4, 0, 1, 2, 3, 4, 5 . . .

hat unendlich viele Haufungspunkte (jede naturliche Zahl ist Haufungspunkt), ihr Limessuperior ist +∞, ihr Limes inferior ist 0.

Satz 8.26Sei (an)n∈N eine beliebige reelle Folge. Dann ist der Limes superior der großte Haufungspunktdieser Folge und der Limes inferior der kleinste Haufungspunkt. Es gilt

lim infn→∞

an ≤ lim supn→∞

an ,

wobei Gleichheit genau dann vorliegt, wenn die Folge (im eigentlichen oder uneigentlichenSinn) konvergiert.

Beweis: Dies wird in den Ubungen behandelt. �

8.8 Vollstandigkeit

Definition 8.27 (Cauchyfolge)Eine reelle Folge (an)n∈N heißt Cauchyfolge, wenn es zu jedem ε > 0 ein n0 ∈ N gibtmit

|an − am| < ε , fur alle n,m ≥ n0 .

Der Begriff der Cauchyfolge ist nach August-Louis Cauchy (1789–1857) benannt.

Es folgen zwei wichtige Aussagen: Konvergente Folgen sind Cauchyfolgen, und die Um-kehrung gilt fur Folgen in einem vollstandigen Raum, hier der reellen Zahlen.

Satz 8.28Sei (an)n∈N eine konvergente reelle Folge. Dann ist (an) eine Cauchyfolge.

Beweis: Sei an → a, sei ε > 0 beliebig. Wir wahlen n0 ∈ N mit

|an − a| <ε

2

fur alle n ≥ n0. Dann gilt fur alle n,m ≥ n0

|an − am| ≤ |an − a|+ |am − a| <ε

2+ε

2= ε ,

also ist (an) Cauchyfolge. �

78

Page 85: Vorlesungsskript zur Analysis 1 -

Satz 8.29Sei (an)n∈N eine reelle Cauchyfolge. Dann ist (an) konvergent.

Beweis: Wir wahlen ein n0 ∈ N mit |an − an0 | < 1 fur alle n ≥ n0 und setzen

C = max {|a0|, . . . , |an0−1|, |an0|+ 1} .

Dann gilt |an| ≤ C fur alle n ∈ N, also ist (an) beschrankt. Sei (ank) eine konvergenteTeilfolge – eine solche existiert nach Satz 8.23 – und a ihr Grenzwert, ank → a. Sei nunε > 0 beliebig. Wir wahlen m1,m2 ∈ N mit

|ank − a| <ε

2, fur alle k ≥ m1 ,

|an − am| <ε

2, fur alle n,m ≥ m2 .

Wir setzen m3 = max {m1,m2}. Dann gilt fur alle k ≥ m3 wegen nk ≥ k

|ak − a| ≤ |ak − ank |+ |ank − a| <ε

2+ε

2= ε ,

also folgt an → a. �

Um die Konvergenz einer reellen Folge (an) nachzuprufen, genugt es also festzustellen,dass (an) eine Cauchyfolge ist. Der Vorteil dabei ist, dass wir dabei den Grenzwert nichtzu kennen brauchen.

Die zentrale Aussage von Satzen 8.28 und 8.29 lautet in etwas allgemeinerer Formulierung:

Eine konvergente Folge ist eine Cauchyfolge. Umgekehrt ist eine Cauchyfolgekonvergent, falls der zugrundeliegende Raum vollstandig ist.

Um dies zu verstehen, betrachten wir die Folge der partiellen Dezimalbruchentwicklungvon√

2 (die Folgenglieder sind hier der leichteren Lesbarkeit halber ausnahmsweise ohnetrennendes Komma geschrieben),

1 1, 4 1, 41 1, 414 1, 4142 1, 41421 . . . .

Nehmen wir wie ublich R als zugrundeliegenden Raum, ist diese Folge sowohl eine Cauchy-folge als auch konvergent, in Einklang mit obigen Satzen. Legen wir aber als Raum Qzugrunde, ist diese Folge eine Cauchyfolge, die nicht konvergiert, da

√2 /∈ Q. Es lohnt

sich, sich mit dieser Einsicht die Beweise der Satze 8.28 und 8.29 nochmals anzusehen:Der Beweis von Satz 8.28 funktioniert auch uber Q, der Beweis von Satz 8.29 benotigthingegen den Satz von Bolzano-Weierstraß, der auf der Vollstandigkeit der reellen Zahlen(Axiom (V)) basiert.

8.9 Folgen komplexer Zahlen

Entsprechend unserer allgemeinen Definition 8.1 definiert jede Abbildung von N nach Ceine Folge von komplexen Zahlen. In Analogie zu Definition 8.3 heißt eine Folge (zn)n∈Nin C konvergent gegen z ∈ C, falls es zu jedem ε > 0 ein n0 ∈ N gibt mit

|zn − z| < ε fur alle n ≥ n0 (8.17)

79

Page 86: Vorlesungsskript zur Analysis 1 -

-0.4 -0.2 0.2 0.4 0.6 0.8

-0.2

0.2

0.4

0.6

Abbildung 8.5: Die ersten Glieder der Folge (0.9 + 0.25i)n.

Wir betonen, dass dies genau die Definition wie im Reellen ist und der Unterschied ledig-lich darin besteht, dass in (8.17) der Betrag im Komplexen genommen wird. Wir schreibenfur eine konvergente Folge wieder

limn→∞

zn = z oder zn → z .

Konvergenz in C kann auf Konvergenz in R zuruckgefuhrt werden.

Lemma 8.30Sei (zn)n∈N eine Folge in C und z ∈ C. Dann gilt

limn→∞

zn = z ⇔ limn→∞

|zn − z| = 0 .

Beweis: Dies folgt direkt aus der Definition. �

Es kommt also darauf an, dass die Folge der Abstande zum Grenzwert gegen 0 konvergiert.Als Beispiel betrachten wir

zn = (0.9 + 0.25i)n .

Es gilt zn → 0, da |zn| = 0.934077 < 1. Die Folge (zn) konvergiert spiralformig gegen 0,siehe Abb. 8.5.

Der folgende Satz liefert eine weitere Methode, Konvergenz im Komplexen auf Konvergenzim Reellen zuruckzufuhren.

Satz 8.31Sei (zn)n∈N eine Folge in C. Dann sind aquivalent:

(i) Die Folge (zn) ist konvergent in C.

(ii) Die Folgen (Re (zn)) und (Im (zn)) sind konvergent in R.

Ist (zn) konvergent, so gilt

limn→∞

zn = limn→∞

Re (zn) + i limn→∞

Im (zn) . (8.18)

80

Page 87: Vorlesungsskript zur Analysis 1 -

Beweis: (i) ⇒ (ii): Es gilt

0 ≤ |Re (zn)− Re (z)| ≤ |zn − z| und 0 ≤ |Im (zn)− Im (z)| ≤ |zn − z| .

Hieraus und aus den Lemmata 8.30 und 8.12 schließen wir

zn → z ⇒ |zn − z| → 0

⇒ |Re (zn)− Re (z)| → 0 und |Im (zn)− Im (z)| → 0

und weiterRe (zn)→ Re (z) , Im (zn)→ Im (z) .

Hieraus folgt (8.18) wegen

limn→∞

Re (zn) + i limn→∞

Im (zn) = Re (z) + i Im (z) = z = limn→∞

zn .

(ii) ⇒ (i): Wir schreiben Re (zn)→ x, Im (zn)→ y und setzen z = x+ iy. Dann ist

0 ≤ |zn − z| = |(Re (zn) + i Im (zn))− (x+ i y)|≤ |Re (zn)− x|+ |Im (zn)− y| → 0 ,

also |zn − z| → 0 und daher zn → z. �Beispiel:

zn =1

n+ i

n+ 1

n→ 0 + i · 1 = i .

Satz 8.32Seien (zn)n∈N und (wn)n∈N konvergente Folgen in C. Dann sind auch (zn+wn) und (znwn)konvergent, und es gilt

limn→∞

(zn + wn) = limn→∞

zn + limn→∞

wn , (8.19)

limn→∞

(znwn) =(

limn→∞

zn

)·(

limn→∞

wn

).

Ist außerdem limn→∞wn 6= 0, so ist auch (zn/wn) konvergent, und

limn→∞

znwn

=limn→∞ znlimn→∞wn

. (8.20)

Außerdem ist auch (zn) konvergent, und

limn→∞

zn = limn→∞

zn . (8.21)

Beweis: Fur (8.19)–(8.20) lassen sich die Beweise fur den reellen Fall wortlich ubertragen.Ist zn → z, so folgt (8.21) aus

zn = Re (zn)− i Im (zn)→ Re (z)− i Im (z) = z .

81

Page 88: Vorlesungsskript zur Analysis 1 -

Definition 8.33Eine Folge (zn)n∈N in C heißt Cauchyfolge, wenn fur alle ε > 0 ein n0 ∈ N existiert mit

|zn − zm| < ε , fur alle n,m ≥ n0 .

Lemma 8.34Eine Folge (zn)n∈N in C ist Cauchyfolge genau dann, wenn die Folgen (Re (zn))n∈N und(Im (zn))n∈N reelle Cauchyfolgen sind.

Beweis: Analog zum Beweis von Satz 8.31. �

Satz 8.35Eine Folge (zn)n∈N in C ist konvergent genau dann, wenn sie eine Cauchyfolge ist.

Beweis: Nach den Satzen 8.28 und 8.29 sind die reellen Folgen (Re (zn))n∈N und (Im (zn))n∈Ngenau dann konvergent, wenn sie Cauchyfolgen sind. Die Behauptung folgt nun ausSatz 8.31. �

Wir nennen eine komplexe Folge (zn)n∈N beschrankt, wenn es ein C > 0 gibt mit |zn| ≤ Cfur alle n ∈ N. (Vergleiche die Bemerkung nach Definition 8.6 fur den reellen Fall.)

Satz 8.36 (Bolzano-Weierstraß, komplexe Version)Jede beschrankte komplexe Folge (zn)n∈N besitzt eine konvergente Teilfolge.

Beweis: Dies folgt aus der reellen Version, Satz 8.23, durch Auswahl gemeinsamer Teil-folgen fur Real- und Imaginarteil. �

8.10 Bonusmaterial

Zunachst etwas zur Fibonaccifolge. Diese Folge tritt oft in der Natur auf. Ein Beispielsind die Schuppen eines Pinienzapfens; diese Schuppen treten in Ringen der Vielfach-heit 1, 2, 3, 5, 8, . . . auf, siehe Abb. 8.6. – Das Auftreten der Fibonaccifolge in der Naturbeschaftigte den großen Mathematiker Alan Turing (1912–1954) in seinen letzten Leben-jahren, siehe [1].

Ein weiterer Begriff: Zwei Folgen (an)n∈N und (bn)n∈N mit an 6= 0 und bn 6= 0 fur alleIndizes n ≥ n0 mit geeignetem n0 ∈ N heißen asymptotisch gleich, in Zeichen an ∼= bn,falls

limn→∞

anbn

= 1

gilt.

Ein besonders schones Beispiel asymptotischer Gleichheit betrifft die Folge mit Gliedern

an :=2

1· 4

3· 6

5· . . . · 2n

2n− 1fur n ≥ 1 ; (8.22)

es gilt namlich, wie wir mit Methoden der Integralrechnung in Abschnitt 14.7 zeigenwerden,

an ∼=√π · √n . (8.23)

82

Page 89: Vorlesungsskript zur Analysis 1 -

Abbildung 8.6: Die Schuppen eines Pinienzapfens: Der innerste Ring besteht aus einemSchuppen (rot), der zweite aus zwei (gelb), der dritte aus drei (blau), der vierte aus funf(weiß), der funfte aus 8 Schuppen (grun). Quelle: Christoph Zimmer.

Wir haben in diesem Kapitel stillschweigend angenommen, dass die Vorschrift zur Bildungvon Folgengliedern leicht auswertbar ist. Das muss jedoch nicht so sein. Betrachten wiretwa das

”Damenproblem“. Hier ist eine Folge wachsender Schachbretter der Große n×n

gegeben. Dann versuchen wir, so viele weiße und ebensoviele schwarze Damen wie moglichso auf diesem Feld zu platzieren, dass Figuren verschiedener Farbe sich nicht schlagenkonnen. Sei an diese Zahl. Man sieht leicht, dass die Folge beginnt mit

a1 = 0, a2 = 0, a3 = 1, a4 = 2, a5 = 4, a6 = 5 ,

aber die Berechnung der Folgenglieder wird rasch anspruchsvoll. Konnen Sie die nachstenFolgenglieder bestimmen?

Zur Kontrolle: Die On-Line Encyclopedia of Integer Sequences (OEIS), http://oeis.org,ist eine Fundgrube fur ganzzahlige Folgen, wie sie beispielsweise in der Kombinatorik oftauftreten. Die Eingabe des Folgenanfangs oben als

”0,0,1,2,4,5“ liefert aktuell 40 Folgen

mit diesem Beginn; die gesuchte Folge ist A250000. Hier sind die Werte der Folge schon furrelativ kleines n unbekannt. In solchen Fallen versucht man, eine Asymptotik anzugeben,also das Wachstumsverhalten im Sinne der eben eingefuhrten asymptotischen Konvergenz,oder zumindest geeignete Schranken fur große n. Fur das Damenproblem findet sich in

83

Page 90: Vorlesungsskript zur Analysis 1 -

11 Z0Z0lql0Z0l10 0Z0ZqlqZ0l09 Z0Z0lqZ0Z0Z8 0Z0ZqZ0Z0Zq7 Z0Z0Z0l0Zql6 0Z0Z0l0Z0l05 Z0LQZ0Z0Z0Z4 0LQZ0Z0Z0Z03 LQZQZ0ZQZ0Z2 QZQL0Z0LQZ01 ZQL0Z0ZQL0Z

a b c d e f g h i j k

Abbildung 8.7: Das Damenproblem fur n = 11.

http://oeis.org/A250000 fur n ≥ 16

an > d9n2/64e ;

hierbei ist dxe die zu x nachstgroßere ganze Zahl, etwa d3.14159e = 4. Abb. 8.7 zeigt,dass a11 ≥ 17 gelten muss (und in der Tat ist a11 = 17).

Literatur zu diesem Kapitel

[1] J. Swinton. Watching the daisies grow: Turing and Fibonacci phyllotaxis. In: AlanTuring: life and legacy of a great thinker. Springer, Berlin, 2004, S. 477–498.

84

Page 91: Vorlesungsskript zur Analysis 1 -

9 Reihen

9.1 Motivation und grundlegende Begriffe

Wie zu Beginn von Kapitel 8 geschildert, ist die Approximation eine Grundidee der Ana-lysis. So wird spater das Integral durch Approximation durch einfache Folgen definiert,siehe Abb. 9.1. Wir approxieren das Integral durch die Flache der Rechtecke. Dazu bestim-men wir die Flachen f1, f2, f3, . . . . Wenn wir diese von links nach rechts aufsummieren,erhalten wir

f1, f1 + f2, f1 + f2 + f3,

und im Falle von ∞ als obere Integralgrenze ist dies eine Folge. Sofern das Integraldefiniert und endlich ist, muss diese Folge fur genugend kleine

”Schrittweiten“ xj − xj−1

konvergieren. (Dieser Punkt ist etwas subtil, da wir im Integralbegriff diese Schrittweitegegen Null schicken, also einen zweiten Grenzprozess durchfuhren. Im Moment ignorierenwir dieses Problem, auf das wir am Ende das Kapitels wieder zuruckkommen und inKapitel 14 rigoros behandeln.)

Diese Situation ist sehr typisch: Oft ist eine Folge (an) gegeben, deren Folgenglieder wiraufsummieren wollen und so eine neue Folge erhalten,

a0, a0 + a1, a0 + a1 + a2, a0 + a1 + a2 + a3, . . .

y = f(x)

f1 f2 fj

x1 xj−1 xj

x

y

Abbildung 9.1: Approximation des Integrals durch Aufsummierung der skizziertenFlachen.

85

Page 92: Vorlesungsskript zur Analysis 1 -

Definition 9.1 (Reihe)Sei n0 ∈ Z und (an)n≥n0 eine Folge in C. Wir definieren

sn :=n∑

k=n0

ak , n ≥ n0 .

Die Folge (sn)n≥n0 heißt unendliche Reihe oder einfach Reihe, und sn ist die n-tePartialsumme. Wir bezeichnen die Reihe mit

∞∑

k=n0

ak . (9.1)

Die Reihe (9.1) heißt konvergent, falls die Folge (sn) konvergent ist, andernfalls heißtsie divergent. Der Grenzwert der Reihe ist definiert als der Grenzwert der Folge (sn).Wir bezeichnen ihn ebenfalls mit

∞∑

k=n0

ak .

Vorsicht: Der Ausdruck∑∞

k=n0ak bedeutet also zweierlei! Zum einen die Folge der Parti-

alsummen (unabhangig davon, ob sie konvergent ist oder nicht), und zum anderen derenGrenzwert, falls er existiert.

Fur z ∈ C definieren wirz0 = 1 ;

wir erinnern an die Vereinbarung 00 = 1 in (5.3).

Beispiel 9.2 (Geometrische Reihe)Fur z ∈ C betrachten wir die Reihe

∞∑

k=0

zk . (9.2)

Fur die Partialsummen sn gilt

(1− z)sn = (1− z)n∑

k=0

zk = (1− z) + (z − z2) + . . .+ (zn − zn+1) = 1− zn+1 ,

also ist

sn =1− zn+1

1− z .

Fur |z| < 1 gilt |z|n+1 → 0, also auch zn+1 → 0 und damit sn → 11−z . Daher ist die

Reihe (9.2) fur |z| < 1 konvergent, und es gilt

∞∑

k=0

zk =1

1− z .

86

Page 93: Vorlesungsskript zur Analysis 1 -

Beispielsweise ergibt sich fur z = 910

eine hubsche Identitat,

∞∑

k=0

(9

10

)k=

1

1− 910

= 10 .

Ferner ist 9∑∞

k=0

(110

)k= 10, also 9

∑∞k=1

(110

)k= 1. Schreiben wir dabei die geometrische

Reihe in Dezimaldarstellung, erklart diese Gleichheit, weshalb 0, 9 := 0, 999 · · · = 1 gilt.

Beispiel 9.3 (Harmonische Reihe)Die Reihe

∞∑

k=1

1

k(9.3)

heißt harmonische Reihe. Sie ist divergent: Fur beliebiges k ∈ N und n ≥ 2k giltnamlich fur die Folge der Partialsummen

sn = 1 +1

2+

1

3+ . . .+

1

n

≥ 1 +1

2+

(1

3+

1

4

)+

(1

5+ · · ·+ 1

8

)+ . . .+

(1

2k−1 + 1+ . . .+

1

2k

)

≥ 1 +1

2+ 2 · 1

4+ 4 · 1

8+ . . .+ 2k−1 · 1

2k

≥ 1 +k

2.

Damit folgt sn →∞ fur n→∞. (Siehe dazu auch Abschnitt 9.7).

Fur die Frage, ob eine Reihe konvergiert, ist (genauso wie bei einer Folge) das Verhaltenam Anfang gleichgultig: Fur beliebiges m ≥ n0 gilt, dass

∞∑

k=n0

ak

konvergent ist genau dann, wenn∞∑

k=m

ak

konvergent ist (Beweis: Siehe Ubungsaufgabe). Der Grenzwert der Reihe andert sich abernaturlich, wenn wir bei m > n0 anfangen und von Null verschiedene Terme a0, . . . , am−1

ignorieren. Zum Beispiel:

3

2=∞∑

k=0

(1

3

)k= 1 +

1

3+∞∑

k=2

(1

3

)k, und

∞∑

k=2

(1

3

)k=

1

6.

Satz 9.4Seien

∑∞k=n0

ak,∑∞

k=n0bk konvergente Reihen in C, sei c ∈ C. Dann sind auch die Reihen∑∞

k=n0(ak + bk) und

∑∞k=n0

cak konvergent, und fur die Grenzwerte gilt

∞∑

k=n0

(ak + bk) =∞∑

k=n0

ak +∞∑

k=n0

bk ,

∞∑

k=n0

cak = c

∞∑

k=n0

ak .

87

Page 94: Vorlesungsskript zur Analysis 1 -

Beweis: Dies folgt aus Satz 8.32, angewandt auf die Folgen der Partialsummen

sn =n∑

k=n0

ak , σn =n∑

k=n0

bk .

Als Beispiel betrachten wir die Umwandlung einer rationalen Zahl von periodischer Dezi-maldarstellung in eine Darstellung als Bruch, etwa

0.017 = 10−2 + 7 · 10−3 + 7 · 10−4 + . . . = 10−2 +∞∑

k=0

7 · 10−3 ·(

1

10

)k

=1

100+

7

1000· 1

1− 110

=4

225.

Das nachste Kriterium ist aus theoretischer Sicht wichtig, weil damit weitere Konver-genzkriterien bewiesen werden; in konkreten Fallen ist dieses Kriterium jedoch selten derpraktischste Konvergenznachweis.

Satz 9.5 (Cauchy-Kriterium)Sei

∑∞k=n0

ak eine Reihe in C. Dann sind aquivalent:

(i)∑∞

k=n0ak ist konvergent.

(ii) Zu jedem ε > 0 gibt es ein N ∈ N, so dass∣∣∣∣∣n∑

k=m

ak

∣∣∣∣∣ < ε fur alle n ≥ m ≥ N .

Beweis: Fur die Partialsummen gilt nach Definition

sn − sm−1 =n∑

k=m

ak .

Die Bedingung (ii) ist also aquivalent dazu, dass (sn) eine Cauchyfolge in C ist. NachSatz 8.35 ist dies aquivalent dazu, dass (sn) konvergiert. �

Folgerung 9.6Fur jede konvergente Reihe

∑∞k=n0

ak in C gilt

limk→∞

ak = 0 . (9.4)

Beweis: Nach Satz 9.5 finden wir zu jedem ε > 0 ein N mit

|am| =∣∣∣∣∣m∑

k=m

ak

∣∣∣∣∣ < ε fur alle m ≥ N ,

also gilt |ak| → 0 und damit auch ak → 0. �

Die Umkehrung von Folgerung 9.6 gilt nicht: Aus Bedingung (9.4) folgt nicht, dass die Rei-he∑∞

k=n0ak konvergent ist. Die harmonische Reihe ist ein Gegenbeispiel. Man sagt: Fur

die Konvergenz einer Reihe ist es eine notwendige Bedingung, dass die zugrundeliegendeFolge eine Nullfolge ist; diese Bedingung ist aber nicht hinreichend.

88

Page 95: Vorlesungsskript zur Analysis 1 -

9.2 Absolute Konvergenz

Definition 9.7Eine Reihe

∑∞k=n0

ak in C heißt absolut konvergent, falls die Reihe∑∞

k=n0|ak| konver-

gent ist.

Ist die zugrundeliegende Folge reell mit ak ≥ 0 fur alle k, so sind Konvergenz und absoluteKonvergenz offensichtlich aquivalent.

Beispiel: Die geometrische Reihe∞∑

k=0

zk

ist absolut konvergent fur |z| < 1, denn es gilt ja

∞∑

k=0

|z|k =1

1− |z| .

Der folgende Satz verallgemeinert die Dreiecksungleichung auf Reihen.

Satz 9.8Ist eine Reihe

∑∞k=n0

ak in C absolut konvergent, so ist sie auch konvergent, und

∣∣∣∣∣∞∑

k=n0

ak

∣∣∣∣∣ ≤∞∑

k=n0

|ak| . (9.5)

Beweis: Sei∑∞

k=n0ak in C absolut konvergent. Dann gibt es nach Satz 9.5 zu jedem ε > 0

ein N ∈ N mit ∣∣∣∣∣n∑

k=m

|ak|∣∣∣∣∣ < ε fur alle n,m ≥ N ,

also gilt auch∣∣∣∣∣n∑

k=m

ak

∣∣∣∣∣ ≤n∑

k=m

|ak| =∣∣∣∣∣n∑

k=m

|ak|∣∣∣∣∣ < ε fur alle n,m ≥ N ,

damit erfullt auch∑∞

k=n0ak das Cauchy-Kriterium und ist nach Satz 9.5 konvergent. Da

∣∣∣∣∣n∑

k=n0

ak

∣∣∣∣∣ ≤n∑

k=n0

|ak|

fur alle n ≥ n0 gilt, folgt (9.5) mit Grenzubergang n→∞. �

Die Umkehrung von Satz 9.8 gilt nicht: Die alternierende harmonische Reihe

∞∑

k=1

(−1)k−1 1

k

ist nicht absolut konvergent (da die harmonische Reihe divergiert), aber konvergent, wiewir spater als Anwendung von Satz 9.19 sehen werden.

89

Page 96: Vorlesungsskript zur Analysis 1 -

Satz 9.9Sei

∑∞k=n0

ak eine Reihe in C. Dann sind aquivalent:

(i) Die Reihe∑∞

k=n0ak ist absolut konvergent.

(ii) Fur n ≥ n0 ist die reelle Folge (sn) der Partialsummen von∑∞

k=n0|ak|,

sn =n∑

k=n0

|ak| ,

beschrankt.

Beweis: (i) ⇒ (ii): (sn) ist konvergent, also beschrankt.

(ii) ⇒ (i): (sn) ist beschrankt und monoton wachsend, also konvergent nach dem Mono-toniesatz 8.15. �

Reihen in C konnen wir in Real- und Imaginarteil zerlegen: Zu

∞∑

k=n0

zk

betrachten wir die aus den Real- und Imaginarteilen xk = Re (zk) und yk = Im (zk)gebildeten Reihen

∞∑

k=n0

xk und∞∑

k=n0

yk .

Satz 9.10Sei

∑∞k=n0

zk eine Reihe in C und seien xk = Re (zk), yk = Im (zk). Dann gilt:

(i)∑∞

k=n0zk ist konvergent genau dann, wenn

∑∞k=n0

xk und∑∞

k=n0yk konvergent sind.

In diesem Fall gilt∞∑

k=n0

zk =∞∑

k=n0

xk + i∞∑

k=n0

yk .

(ii)∑∞

k=n0zk ist absolut konvergent genau dann, wenn

∑∞k=n0

xk und∑∞

k=n0yk absolut

konvergent sind.

Beweis: Fur die Partialsummen

sn :=n∑

k=n0

zk , rn :=n∑

k=n0

xk und pn :=n∑

k=n0

yk

gilt sn = rn+ipn. Es folgt Behauptung (i), da (sn) nach Satz 8.31 genau dann konvergiert,wenn (rn) und (pn) konvergieren. Weiter folgt Behauptung (ii) mit Satz 9.9, da (sn)n≥n0

mit sn :=∑n

k=n0|zk| genau dann beschrankt ist, wenn (rn)n≥n0 und (pn)n≥n0 mit rn :=∑n

k=n0|xk| und pn :=

∑nk=n0|yk| beschrankt sind. �

Als Beispiel betrachten wir die geometrische Reihe

∞∑

k=0

(i

2

)k= 1 +

i

2− 1

4− i

8+

1

16· · · = 1

1− i2

=1 + i

2

12 + (12)2

=4

5

(1 +

i

2

).

90

Page 97: Vorlesungsskript zur Analysis 1 -

Die Reihe der Realteile ist

1 + 0− 1

4+ 0 +

1

16· · · =

∞∑

j=0

(i

2

)2j

=∞∑

j=0

(−1

4

)j=

1

1 + 14

=4

5.

Die Reihe der Imaginarteile ist

0 +1

2+ 0− 1

8· · · = 1

2

∞∑

j=0

(−1

4

)j=

2

5.

9.3 Weitere Konvergenzkriterien

Das folgende Majorantenkriterium ist oft sehr nutzlich; es fuhrt die Konvergenz einergegebenen Reihen auf die Konvergenz bereits bekannter Reihen zuruck.

Definition 9.11 (Majorante)Sei

∑∞k=n0

ak eine Reihe in C. Eine reelle Reihe∑∞

k=n0bk mit |ak| ≤ bk fur alle k ≥ n0

heißt Majorante der Reihe∑∞

k=n0ak.

Satz 9.12 (Majorantenkriterium)Sei

∑∞k=n0

ak eine Reihe in C, welche eine konvergente Majorante∑∞

k=n0bk besitzt. Dann

ist∑∞

k=n0ak absolut konvergent.

Beweis: Da bk ≥ 0 fur alle k, ist∑∞

k=n0bk absolut konvergent, also gibt es nach Satz 9.9

ein C > 0 mit

C ≥n∑

k=n0

bk ≥n∑

k=n0

|ak|

fur alle n ≥ n0, also ist∑∞

k=n0ak absolut konvergent, ebenfalls nach Satz 9.9. �

Das Majorantenkriterium liefert allerdings keinen Hinweis darauf, wie man den Grenzwertder Reihe

∑ak berechnet.

Beispiel 9.13(i) Wir betrachten

∞∑

k=1

1

k2. (9.6)

Die Reihe∞∑

k=2

1

(k − 1)k(9.7)

ist eine Majorante von∞∑

k=2

1

k2. (9.8)

Wir zeigen nun, dass sie sogar eine konvergente Majorante ist: Fur die Partialsum-men von (9.7) gilt namlich

sn =n− 1

n. (9.9)

91

Page 98: Vorlesungsskript zur Analysis 1 -

Der Beweis von (9.9) erfolgt mit Induktion: s2 = 12

ist der Induktionsanfang, undder Induktionsschritt ist

sn+1 = sn +1

n(n+ 1)=n− 1

n+

1

n(n+ 1)=

n

n+ 1.

Wegen sn → 1 fur n→∞ ist (9.7) konvergent, also auch (9.8) und damit auch (9.6).

(ii) Die Reihe∞∑

k=1

1

ks

ist fur festes s ≥ 2 ebenfalls konvergent, da sie die konvergente Majorante (9.6) hat.

Bemerkung 9.14Es gilt: Die Reihe

∞∑

k=1

1

ks

ist divergent fur s ∈ [0, 1]; sie ist konvergent fur s > 1. Der Fall s = 1 ist die harmonischeReihe (9.3), deren Divergenz in Beispiel 9.3 gezeigt wurde. Der Fall s ≥ 2 wurde eben mitdem Majorantenkriterium gezeigt. Der Fall s ∈ (1, 2) wird spater in Beispiel 14.45 mitHilfsmitteln der Integralrechung behandelt.

Ein beliebter Fehler ist, aus einer divergenten Majorante entweder Konvergenz oder Di-vergenz der majorisierten Reihe herleiten zu wollen; das geht naturlich nicht! Richtig istaber folgendes:

Folgerung 9.15 (Divergente Minorante)Seien

∑∞k=n0

ak und∑∞

k=n0bk Reihen in R mit 0 ≤ ak ≤ bk fur alle k ≥ n0. Ist

∑∞k=n0

akdivergent, so ist auch

∑∞k=n0

bk divergent.

Beweis: Angenommen,∑∞

k=n0bk sei konvergent. Dann ware nach Satz 9.12 auch

∑∞k=n0

akkonvergent, Widerspruch. �

In der Situation von Folgerung 9.15 heißt∑∞

k=n0ak eine divergente Minorante von∑∞

k=n0bk.

Satz 9.16 (Quotientenkriterium)Sei

∑∞k=n0

ak eine Reihe in C mit ak 6= 0 fur fast alle k ≥ n0. Wenn der Grenzwert

q := limk→∞

∣∣∣∣ak+1

ak

∣∣∣∣ .

existiert, dann gilt:

(i) Falls q < 1, so ist∑∞

k=n0ak absolut konvergent.

(ii) Falls q > 1, so ist∑∞

k=n0ak divergent.

(iii) Im Fall q = 1 ist keine Aussage moglich.

92

Page 99: Vorlesungsskript zur Analysis 1 -

Beweis: Behauptung (i) folgt aus dem Majorantenkriterium. Angenommen, es wurde im-mer gelten, dass |ak+1| ≤ q |ak|. Dann folgt durch Induktion |ak| ≤ |an0|qk−n0 fur k ≥ n0;daher ware die Reihe

∞∑

k=n0

|an0|qk−n0

eine konvergente Majorante von∑∞

k=n0|ak|. Allerdings folgt aus der Konvergenz

∣∣∣ak+1

ak

∣∣∣ →q nur, dass |ak+1| ≤ q |ak| fur hohere Indizes immer besser erfullt wird (oder gleichbleibendgut im langweiligen Fall eines konstanten Quotienten). Wir verschaffen uns daher etwasLuft: Mit einem etwas uber q liegenden Wert p, etwa p = 1/2(q + 1), werden obigeAussagen richtig. Dann gilt nach der Definition des Grenzwerts mit ε := 1

2(p − q), dass

|ak+1| ≤ p |ak|. Ein Induktionsargument zeigt dann, dass

∞∑

k=n0

|an0|pk−n0

eine konvergente Majorante ist. Es lohnt sich, die Details des Beweises im Selbststudiumauszufuhren. Im Fall (ii) zeigt man mit vollstandiger Induktion, dass fur genugend großeIndizes |ak+1| > |ak| > 0 gilt; daher ist (ak) keine Nullfolge, und die Reihe

∑∞k=n0

akdivergiert.

Zu (iii): Sowohl fur die nach (9.6) konvergente Reihe∑∞

k=11k2

als auch fur die divergenteharmonische Reihe

∑∞k=1

1k

gilt q = 1. �

Die Vorgehensweise, aus der wir im Beweis des Quotientenkriteriums aus einem intuitiven,aber nicht ganz richtigen Argument ein korrektes gebaut haben, ist ganz typisch fur dieAnalysis. Das falsche Argument wurde richtig, sobald wir etwas mehr Spiel gelassen haben,indem wir von q zu dem etwas großeren p gewechselt haben. Jedes q + η < 1 mit festemη > 0 anstelle von p hatte gereicht. Diese Methode ist so zentral in der Analysis, dass derFieldsmedaillist Terence Tao die Buchveroffentlichung seines Blogs

”An epsilon of room“

genannt hat [4].

Als Beispiel fur einen Konvergenznachweis mit dem Quotientenkriterium betrachten wirdie Exponentialreihe, die in der Analysis zentral ist. Wir werden spater in Kapitel 11 dieExponentialfunktion durch die folgende Reihe definieren.

Beispiel 9.17 (Exponentialreihe)Wir betrachten die sogenannte Exponentialreihe

∞∑

k=0

zk

k!, (9.10)

wobei z ∈ C eine feste komplexe Zahl ist. Mit ak = zk/k! gilt

|ak+1||ak|

=|z|k+1

(k + 1)!· k!

|z|k =|z|k + 1

,

also|ak+1||ak|

≤ 1

2, fur alle k ≥ 2|z| − 1 ,

damit ist (9.10) absolut konvergent.

93

Page 100: Vorlesungsskript zur Analysis 1 -

Ein weiteres Konvergenzkriterium, das Wurzelkriterium, basiert ebenfalls auf dem Ver-gleich mit der geometrischen Reihe.

Satz 9.18 (Wurzelkriterium)Sei

∑∞k=n0

ak eine Reihe in C, und

w := lim supk→∞

k√|ak| .

Ist w < 1, so konvergiert die Reihe absolut; ist w > 1, so divergiert sie.

Beweis: Ist w > 1, so gibt es unendlich viele k mit k√|ak| > 1, also auch |ak| > 1 fur

diese k. Daher konvergiert (ak) nicht gegen Null, und gemaß Folgerung 9.6 ist die Reihedivergent.

Sei nun w < 1. Wahle q mit w < q < 1. Dann gibt es nach Definition des Limes superiorein N mit k

√|ak| ≤ q fur alle k ≥ N . Es folgt |ak| ≤ qk fur alle k ≥ N . Die geometrische

Reihe∑

k≥N qk ist also eine konvergente Majorante der Reihe

∑k≥N |ak|, also ist

∑k≥n0

akabsolut konvergent. �

Im Fall w = 1 kann sowohl Konvergenz als auch Divergenz vorliegen. Beispiele sind wiebeim Quotientenkriterium die nach (9.6) konvergente Reihe

∑∞k=1

1k2

und die divergente

harmonische Reihe∑∞

k=11k. Fur beide Reihen gilt w = 1 (Ubung).

9.4 Alternierende Reihen

Eine reelle Reihe∑∞

k=n0ak heißt alternierend, wenn die Folgenglieder ak abwechselnd

positives und negatives Vorzeichen haben. So ist etwa

1− 1 + 1− 1 + 1− 1 + . . .

eine alternierende Reihe. Sie ist divergent, da ihre Partialsummen abwechselnd 1 und 0sind. Bei der alternierenden harmonischen Reihe

1− 1

2+

1

3− . . .

hofft man hingegen auf Konvergenz. Das ist tatsachlich der Fall; der folgende Satz garan-tiert das fur jede alternierende Reihe, deren Folgenglieder gegen 0 konvergieren.

Satz 9.19 (Leibnizkriterium)Sei (an)n≥n0 eine monoton fallende reelle Nullfolge. Dann konvergiert die Reihe

∞∑

k=n0

(−1)kak ,

und es gilt fur alle n ≥ n0 die Fehlerabschatzung

∣∣∣∣∣∞∑

k=n0

(−1)kak − sn∣∣∣∣∣ =

∣∣∣∣∣∞∑

k=n0

(−1)kak −n∑

k=n0

(−1)kak

∣∣∣∣∣ ≤ an+1 .

94

Page 101: Vorlesungsskript zur Analysis 1 -

s19

s17s15s13s11

s9s7

s5s3

s20s18s16s14s12s10s8s6

s4

s2

a19

a18a16a14a12a10a9a8

a7a6

a5a4

a3

a2

5 10 15 20

0.2

0.4

0.6

0.8

1.0

Abbildung 9.2: Zur Konvergenz der Reihe∑∞

k=0(−1)kak anhand des Beispiels ak = 1k+1

.Gezeigt sind die monoton fallende Nullfolge (ak) und die dazugehorigen Folgen der Par-tialsummen (s2k) und (s2k−1).

Dieses Kriterium ist nach Gottfried Wilhelm Leibniz (1646–1716) benannt.

Beweis: Sei zunachst n0 = 0. Siehe Abb. 9.2 zur Veranschaulichung anhand eines Beispiels.Fur k ≥ 1 ist a2k−1 ≥ a2k ≥ a2k+1 ≥ 0, also

s2k = s2k−2 − a2k−1 + a2k ≤ s2k−2 ,

s2k+1 = s2k−1 + a2k − a2k+1 ≥ s2k−1 ,

also ist (s2k)k∈N monoton fallend, (s2k−1)k∈N monoton wachsend. Es gilt

s1 ≤ s2k−1 = s2k − a2k ≤ s2k ≤ s0

fur alle k, und weiter fur alle m ≥ k

s1 ≤ s2k−1 ≤ s2m−1 ≤ s2m ≤ s2k ≤ s0 .

Also sind beide Teilfolgen (s2k) und (s2k−1) beschrankt, damit konvergent nach dem Mo-notoniesatz 8.15, und

s2k−1 ≤ limm→∞

s2m−1

︸ ︷︷ ︸=:b

≤ s2k , s2k−1 ≤ limm→∞

s2m

︸ ︷︷ ︸=:c

≤ s2k (9.11)

gilt fur alle k ∈ N. Aus (9.11) folgt fur die beiden Grenzwerte b = limm→∞ s2m+1 undc = limm→∞ s2m

0 ≤ |c− b| ≤ |s2k − s2k−1| = a2k ,

und wegen a2k → 0 gilt c = b. Da fur alle n entweder sn ≤ b ≤ sn+1 (falls n ungerade ist)oder sn ≥ b ≥ sn+1 (falls n gerade ist) gilt, folgt

0 ≤ |b− sn| ≤ |sn − sn+1| = an+1 .

95

Page 102: Vorlesungsskript zur Analysis 1 -

Der allgemeine Fall n0 ∈ Z kann durch Umnummerieren und Multiplikation mit −1 daraufzuruckgefuhrt werden. �

Als Beispiel: Die alternierende harmonische Reihe

∞∑

k=1

(−1)k−1 1

k

ist nach dem Leibnizkriterium konvergent. Ihr Grenzwert ist, wie sich spater herausstellenwird, die Zahl ln(2). Sie ist aber nicht absolut konvergent, wie wir bereits gesehen haben.

9.5 Potenzreihen

Die Exponentialreihe (9.10) ist nur der prominenteste Vertreter einer wichtigen Klassevon Reihen. Eine allgemeine Potenzreihe hat die Form

f(z) =∞∑

k=0

ck(z − a)k , (9.12)

mit dem Entwicklungspunkt a ∈ C und Koeffizienten ck ∈ C.

Es stellt sich die Frage: Fur welche z ∈ C ist (9.12) konvergent, oder anders formuliert,was ist der Definitionsbereich der durch

f(z) =∞∑

k=0

ck(z − a)k

definierten Funktion? Die Antwort ist: Eine Kreisscheibe.

Notation 9.20Sei a ∈ C, r > 0. Dann heißt

B(a, r) :={z∣∣ z ∈ C, |z − a| < r

}

die offene Kreisscheibe um a mit Radius r, und

K(a, r) :={z∣∣ z ∈ C, |z − a| ≤ r

}

die abgeschlossene Kreisscheibe um a mit Radius r.

Definition 9.21 (Konvergenzradius)Der Konvergenzradius der Potenzreihe (9.12) ist definiert durch

r :=1

lim supk→∞k√|ck|∈ [0,∞]. (9.13)

Die Werte r = 0 bzw. r =∞ entsprechen lim supk→∞

k√|ck| =∞ bzw. lim sup

k→∞

k√|ck| = 0.

Der folgende Satz rechtfertigt die Bezeichnung Konvergenzradius.

96

Page 103: Vorlesungsskript zur Analysis 1 -

Satz 9.22Seien (ck) eine Folge in C und a ∈ C, sei r die in (9.13) definierte Zahl. Die Potenzreihe∑∞

k=0 ck(z − a)k

(i) konvergiert absolut, falls |z − a| < r,

(ii) divergiert, falls |z − a| > r.

Beweis: Der Beweis verwendet das Wurzelkriterium aus Satz 9.18 fur die Konvergenzeiner Reihe

∞∑

k=n0

ak .

Zur Erinnerung: Dieses Kriterium besagt folgendes. Ist die durch

w := lim supk→∞

k√|ak|

definierte Zahl kleiner als 1, so konvergiert die Reihe absolut; ist w großer als 1, so di-vergiert die Reihe. Wir wenden diesen Satz an mit ak := ck(z − a)k. Es gilt k

√|ak| =

k√|ck| · |z − a|, also

w = lim supk→∞

k√|ak| = |z − a| · lim sup

k→∞

k√|ck| ,

Sei S := lim supk→∞k√|ck|. Im Fall S ∈ (0,∞) gilt daher:

w < 1 ⇔ |z − a| < 1

lim supk→∞k√|ck|

,

w > 1 ⇔ |z − a| > 1

lim supk→∞k√|ck|

,

Ist S = 0, dann gilt w < 1 fur alle z ∈ C. Ist S = ∞, dann gilt w > 1 genau dann,wenn z ∈ C, |z − a| > 0 und w < 1 gilt genau dann, wenn z = a. Daraus folgen dieBehauptungen. �

Aus Satz 9.22 ergeben sich einige Folgerungen. Sei∑∞

k=0 ck(z−a)k eine Potenzreihe. Danngilt:

(i) Der Konvergenzradius ist genau jenes r ∈ [0,∞], fur das (i) und (ii) gelten.

(ii) Ist z ∈ C ein Punkt, in dem die Potenzreihe konvergiert, dann erfullt der Konver-genzradius r ≥ |z − a| (Kontraposition von (ii)).

(iii) Ist z ∈ C ein Punkt, in dem die Potenzreihe divergiert (es reicht sogar: nicht absolutkonvergiert), dann erfullt der Konvergenzradius r ≤ |z−a| (Kontraposition von (i)).

97

Page 104: Vorlesungsskript zur Analysis 1 -

9.6 Reihenprodukte

Wir beginnen mit dem Beispiel des Produkts zweier Polynome

(1− 2x+ 3x2)(2 + x) = (2− 4x+ 6x2) + (x− 2x2 + 3x3) = 2− 3x+ 4x2 + 3x3 .

Das Ergebnis entsteht durch Ausmultiplizieren und Zusammenfassen der Terme mit glei-chen Exponenten. Sind nun p und q zwei beliebige Polynome,

p(x) =n∑

k=0

αkxk , q(x) =

m∑

k=0

βkxk ,

so hat deren Produkt die Form

(pq)(x) =

(n∑

k=0

αkxk

)·(

m∑

j=0

βjxj

)=

n∑

k=0

m∑

j=0

αkβjxk+j .

Der Koeffizient von x` im Produkt ergibt sich also als Summe der Produkte αkβj mitk + j = `.

k

j

0 1 2 30

1

2

3

∆3

Abbildung 9.3: Summation der Terme bei der Multiplikation zweier Polynome.

• Der Koeffizient fur ` = 0 ergibt sich Produkt α0β0, .

• Der Koeffizient fur ` = 1 ergibt sich als Summe zweier Produkte, α1β0 + α0β1, +.

• Der Koeffizient fur ` = 2 ist die Summe dreier Produkte α2β0 +α1β1 +α0β2, also+ + .

Zwei Beobachtungen sind wesentlich:

(i) Wir summieren”langs Diagonalen“.

98

Page 105: Vorlesungsskript zur Analysis 1 -

(ii) Trivial, aber wichtig: Ist ` der hochste auftretende Grad (3 in Abb. 9.3), sind dieEintrage zu hoheren Graden, in der Abbildung markiert als ∆3, alle Null.

Als Beispiel:

• Der Koeffizient fur ` = 0 ergibt sich Produkt α0β0, in Abb. 9.3.

• Der Koeffizient fur ` = 1 ergibt sich als Summe zweier Produkte, α1β0 + α0β1, inAbb. 9.3 + .

• Der Koeffizient fur ` = 2 ist die Summe dreier Produkte α2β0 + α1β1 + α0β2, alsoin der Abbildung + + .

Zwei Beobachtungen sind hier wesentlich:

(i) Wir summieren”langs Diagonalen“, wie wir in Abb. 9.3 sehen.

(ii) Ist ` der hochste auftretende Grad (3 in Abb. 9.3), sind die Eintrage zu hoherenGraden, in der Abbildung markiert als ∆3, alle Null. (Dies ist eine Trivialitat, aberbei der Diskussion von Reihenprodukten wird das anders sein.)

So gerustet stellen wir uns der Frage, ob das Produkt zweier Potenzreihen

∞∑

k=0

αkxk und

∞∑

j=0

βjxj

ebenfalls eine Potenzreihe ist, und ob diese sich ebenfalls mit der Vorgehensweise”Aus-

multiplizieren und Zusammenfassen“ berechnen lasst. Wir wurden gerne folgendermaßenrechnen:

(∞∑

k=0

αkxk

)·(∞∑

j=0

βjxj

)=

∞∑

k,j=0

αkβjxk+j =

∞∑

`=0

k,j∈Nk+j=`

αkβj

x`

=∞∑

`=0

(∑

j=0

α`−jβj

)x` .

(9.14)

Fur fest gewahltes x setzen wir

ak = αkxk , bj = βjx

j , c` =

(∑

j=0

α`−jβj

)x` =

j=0

a`−jbj

(hier mussen wir den Ubergang von griechischen zu lateinischen Buchstaben beachten unduns klarmachen, dass die Summe im Ausdruck c` genau der Summation der

”Diagonalen“

` entspricht, vergleiche Abb. 9.3).

Der Rechnung in (9.14) entspricht dann die Formel(∞∑

k=0

ak

)·(∞∑

j=0

bj

)=∞∑

`=0

c` , (9.15)

99

Page 106: Vorlesungsskript zur Analysis 1 -

wobei

c` =∑

j=0

a`−jbj .

Damit diese Formel gultig ist, muss erstens die Reihe auf der rechten Seite von (9.15)konvergieren, und zweitens der Wert dieser Reihe gleich dem Produkt auf der linkenSeite sein. Der folgende Satz zeigt, dass das so ist, wenn die Reihen auf der linken Seitevon (9.15) absolut konvergieren.

Satz 9.23 (Cauchy-Produkt)Seien

∑∞k=0 ak und

∑∞j=0 bj absolut konvergente Reihen in C. Wir setzen fur ` ∈ N

c` :=∑

j=0

a`−jbj .

Dann ist auch die Reihe∑∞

`=0 c` absolut konvergent, und es gilt

∞∑

`=0

c` =

(∞∑

k=0

ak

)·(∞∑

j=0

bj

). (9.16)

Zur Intuition des etwas anspruchsvolleren Beweises: Die zu beweisende Gleichheit (9.16)ist eine Identitat von (Produkten von) Reihen. Da scheint es naheliegend, die entspre-chenden Partialsummen zu betrachten, also fur die linke Seite von (9.16)

sn :=n∑

`=0

c` ,

und fur die rechte Seite

s∗n :=

(n∑

k=0

ak

)·(

n∑

j=0

bj

).

Dann wollen wir zeigen, dass die Differenz |s∗n− sn| im limes n→∞ verschwindet; damitist die Behauptung gezeigt.

Unsere Voruberlegungen zur Polynommultiplikation lassen diese Strategie aber ziemlichirrsinnig erscheinen: sn ist eine

”Dreieckssumme“(durchgezogene grune Linien in Fig. 9.4).

Der Ausdruck s∗n ist aber das Produkt zweier Polynome von Grad n und hat damit alshochste Potenz n2, sprich: Alle Koeffizienten im in Abb. 9.4 gezeichneten Quadrat konnennichtverschwindend sein. Wir vergleichen also Apfel (Quadrate) mit Birnen (Dreiecken)und hoffen, dass die Differenz klein wird. Diese Differenz enthalt als Eintrage genau dieProdukte auf den gestrichelten Linien in Abb. 9.4 auf gelbem Grund, gekennzeichnet mit∆n. Anders als bei der Polynommultiplikation verschwinden diese Terme im Allgemeinenbei Reihen nicht. Wir mussen also zeigen, dass die zugehorigen Terme klein werden, so-gar aufsummiert. Hier kommt die Annahme der absoluten Konvergenz ins Spiel: Ist diesgegeben, werden die Terme betragsmaßig klein, sofern ihr Index groß genug wird.

Mit dieser Vorbereitung konnen wir in den Beweis einsteigen.

Beweis: Wir benutzen die Notation sn und s∗n der Voruberlegungen und setzen ferner

p∗n :=

(n∑

k=0

|ak|)·(

n∑

j=0

|bj|).

100

Page 107: Vorlesungsskript zur Analysis 1 -

k

j

m 2m n

m

2m

n

∆nΓn

Abbildung 9.4: Zum Beweis des Cauchyschen Produktsatzes.

Nach der Produktregel fur Folgen (Satz 8.9) gilt

limn→∞

s∗n =

(∞∑

k=0

ak

)·(∞∑

j=0

bj

)und lim

n→∞p∗n =

(∞∑

k=0

|ak|)·(∞∑

j=0

|bj|).

Zum Beweis von (9.16) genugt es daher wie oben skizziert zu zeigen, dass

limn→∞

(sn − s∗n) = 0 . (9.17)

Sei ε > 0 beliebig. Wir wahlen m ∈ N mit

|p∗n − p∗m| < ε , fur alle n ≥ m.

Sei n ≥ m, dann gilt

|p∗n − p∗m| =∑

(k,j)∈Γn

|akbj| ,

mitΓn :=

{(k, j)

∣∣ 0 ≤ k, j ≤ n, k > m oder j > m}.

In Abb. 9.4 ist Γn durch einen farbigen Hintergrund (gelb und blau) markiert. Weiter ist

s∗n =n∑

k,j=0

akbj , sn =n∑

`=0

n∑

k,j=0k+j=`

akbj =n∑

k,j=0k+j≤n

akbj ,

also|s∗n − sn| ≤

(k,j)∈∆n

|akbj| ,

101

Page 108: Vorlesungsskript zur Analysis 1 -

mit∆n :=

{(k, j)

∣∣ 0 ≤ k, j ≤ n, k + j > n},

das gelb hinterlegte Dreieck in Abb. 9.4. Fur n ≥ 2m gilt ∆n ⊂ Γn (vergleiche Abb. 9.4!),da

(k, j) ∈ ∆n ⇒ (0 ≤ k, j ≤ n) ∧ (k + j > n ≥ 2m)

⇒ (0 ≤ k, j ≤ n) ∧ (k > m ∨ j > m) ⇒ (k, j) ∈ Γn .

Es folgt

|s∗n − sn| ≤∑

(k,j)∈∆n

|akbj| ≤∑

(k,j)∈Γn

|akbj| = |p∗n − p∗m| < ε .

Damit ist gezeigt, dass (9.17) gilt. Die absolute Konvergenz von∑∞

`=0 c` folgt wegen

n∑

`=0

|c`| ≤n∑

k,j=0k+j≤n

|akbj| ≤ p∗n ≤ liml→∞

p∗l

aus Satz 9.9. �

Wir wenden den vorangehenden Satz auf das Produkt zweier Exponentialreihen an. Derfolgende Satz liefert eine wesentliche Grundlage fur das Rechnen mit der Exponential-funktion.

Satz 9.24Es gilt fur alle z, w ∈ C

(∞∑

k=0

zk

k!

)·(∞∑

j=0

wj

j!

)=∞∑

`=0

(z + w)`

`!.

Beweis: Gemaß Beispiel 9.17 ist die Exponentialreihe absolut konvergent. Wir konnendaher Satz 9.23 anwenden auf

ak =zk

k!, bj =

wj

j!und c` =

j=0

a`−jbj .

Wir rechnen(∞∑

k=0

zk

k!

)·(∞∑

j=0

wj

j!

)=

(∞∑

k=0

ak

)(∞∑

j=0

bj

)=∞∑

`=0

c` =∞∑

`=0

j=0

a`−jbj

=∞∑

`=0

j=0

z`−j

(`− j)!wj

j!=∞∑

`=0

1

`!

j=0

(`

j

)z`−jwj

=∞∑

`=0

(z + w)`

`!.

Beim letzten Gleichheitszeichen wurde die binomische Formel verwendet (Satz 5.8; wienach Satz 7.2 angemerkt, sind diese Formeln auch im Komplexen gultig). �

102

Page 109: Vorlesungsskript zur Analysis 1 -

9.7 Bemerkungen und Ausblicke

Die absolute Konvergenz spielt auch fur die Umordnung von Reihen eine wichtige Rol-le. Man kann zeigen: Ist

∑∞k=0 ak eine absolut konvergente Reihe und σ : N → N eine

Permutation (also bijektiv), dann ist die umgeordnete Reihe∑∞

k=0 aσ(k) ebenfalls abso-lut konvergent mit dem gleichen Grenzwert. Der Beweis dieses Umordnungssatzes findetsich beispielsweise in [3, Abschnitt 6.3]. Ohne die Annahme der absoluten Konvergenzist ein Umordnen im Allgemeinen nicht erlaubt. Tatsachlich kann eine reelle konvergente,aber nicht absolut konvergente Reihe so umgeordnet werden, dass sie jeden beliebigenGrenzwert annehmen kann (Ubung).

Eine interessante Reihe ist auch

∞∑

n=1

2(−1)n−n =1

22+

1

21+

1

24+

1

23+

1

26+

1

25+ . . . ; (9.18)

hier gilt lim supn→∞an+1

an= 8 und lim infn→∞

an+1

an= 1

8. Diese Reihe konvergiert, obwohl

das Quotientenkriterium nicht anwendbar ist. Dies gilt sogar fur eine verfeinerte Fassungdes Quotientenkriteriums, die besagt:

•∑∞

k=n0ak konvergiert, sofern lim supn→∞

an+1

an< 1 und

•∑∞

k=n0ak divergiert, sofern lim infn→∞

an+1

an> 1.

Das Wurzelkriterium liefert jedoch Konvergenz fur (9.18), da

lim supk→∞

k√|ak| = lim sup

k→∞2

(−1)k−kk =

1

2< 1 .

Diese Reihe ist [2] entnommen, einer Schatzsammlung schoner (Gegen-)Beispiele.

Weiter ist der Vergleich der geometrischen und harmonischen Reihe (Beispiele 9.2 und 9.3)lehrreich: Die zugrundeliegenden Folgen zn mit q := |z| < 1) beziehungsweise 1

nsind

jeweils Nullfolgen. Entscheidend ist aber die Konvergenzgeschwindigkeit : Da der Quoti-enten qn/n−1 = nqn fur n → ∞ gegen 0 strebt, ist qn fur großes n viel kleiner als 1/n.Die harmonische Reihe divergiert, da die zugrundeliegende Folge zu langsam gegen Nullkonvergiert.

Kurioserweise reicht schon eine verhaltnismaßig kleine Anderung, um aus der harmoni-schen Reihe eine konvergente Reihe zu gewinnen. Betrachtet man namlich nicht die Summeder Reziproken aller positiven naturlichen Zahlen, sondern nur die Summe der Reziprokenaller naturlichen Zahlen, deren Dezimaldarstellung keine 0 enthalt, so konvergiert dieseReihe, mit einem Grenzwert unter 90 (Siehe Ubungsaufgabe).

Ein weiteres Zubrot zur harmonischen Reihe. Zum Thema Konvergenz bzw. Divergenzvon

∑∞k=1

1ks

kam aus dem Studentenkreis die Frage”Ich kann den Beweis [der Divergenz

fur s = 1 bzw. Konvergenz fur s = 2] dafur nachvollziehen, aber ich kann mir nichtvorstellen, warum

∑∞k=1

1k

nicht konvergiert, aber∑∞

k=11k2

plotzlich schon. Gibt es dafureine intuitive Vorstellung?“

Insbesondere mit unserem aktuellen Kenntnisstand, in dem wir den Fall s ∈ (1, 2) nochnicht behandelt haben, ist das eine berechtigte Frage. Im Prinzip ist es a priori ja moglich,

103

Page 110: Vorlesungsskript zur Analysis 1 -

dass wir in diesem Fall geeignet viele Terme durch Klammern zusammenfassen wie imFall s = 1 der harmonischen Reihe, und dann durch eine Abschatzung zeigen, dass diezugehorige Reihe divergieren muss. Beispiel 14.45 wird indirekt zeigen, dass dies prinzipiellunmoglich ist. Das ist aber ein sehr indirektes Argument – konnen wir sehen, dass dieharmonische Reihe der Grenzfall zwischen Konvergenz und Divergenz in der Familie mitFolgengliedern ks ist, und selber divergiert?

Ein Student am California Institute of Technology hat in den 1980ern mit etwas Experi-mentieren eine positive Antwort gefunden [1]. Sein erster Versuch war, die Folgengliederzu plotten, also die Abbildung k 7→ 1

ks, siehe Abb. 9.5 links. Man sieht unterschiedlich

schnelles Abklingverhalten fur verschiedene Exponenten s. Aus dieser Abbldung wird aberkeinesfalls klar, dass s = 1 tatsachlich der Grenzfall ist.

Um besser zu sehen, wie schnell die Folgenglieder abklingen, plottete der Student alsnachstes Experiment die Funktion 1

k7→ 1

ks, siehe Abb. 9.5 rechts. Das ist sehr instruktiv:

Fur s = 2 schmiegt sich der Plot nahe des Ursprungs der horizontalen Achse, der soge-nannten Ordinate, an. Man kann sehen, dass dies fur jedes s > 1 der Fall ist. Verkleinernwir s, ist s = 1 der erste Exponent, bei dem sich dieses Verhalten qualitativ andert: DerPlot liegt fur s = 1 auf der Diagonalen und schmiegt sich nicht mehr der Ordinate an. Furkleinere Werte von s liegt erst recht kein Anschmiegen an die Ordinate vor. Hier sehenwir also einen grundlegenden Unterschied zwischen s ≤ 1 und s > 1! Damit kann mandie Vermutung aufstellen, dass dieses unterschiedliche Verhalten der Funktion 1

k7→ 1

ksdas

Konvergenzverhalten von∑∞

k=11ks

charakterisiert. Genau dies hat der Student in [1] getanund folgenden schonen Satz aufgestellt (fur die auftretende erste und zweite Ableitungapellieren wir an Schulwissen bzw. verweisen auf Kapitel 12).

Satz 9.25Sei

∑∞k=0 ak eine reelle Reihe. Sei f : R→ R eine beliebige Funktion mit

f

(1

k

)= ak fur alle k ∈ N>0 ,

so dass f ′′(0), die zweite Ableitung im Ursprung, existiert. Dann ist∑∞

k=0 ak absolutkonvergent genau dann, wenn f(0) = f ′(0) = 0; andernfalls ist

∑∞k=0 ak divergent.

Der Beweis findet sich in [1]; er basiert auf dem Satz 12.25 von de l’Hospital, den wirin Kapitel 12 besprechen. Bemerkenswert ist, dass Satz 9.25 ein hinreichendes und not-wendiges Kriterium fur die Reihenkonvergenz liefert. Man sieht an diesem Resultat auchschon, wie fruchtbar Experimentieren mit den gegebenen Großen in der Mathematik ist,so wie hier die Idee, die Funktion 1

k7→ 1

kszu plotten. Und: Die Analysis 1 (wie die ganze

Mathematik) ist kein abgeschlossenes Gebiet – Studierende, die Aussagen kritisch hinter-fragen und ein tiefes Verstandnis erreichen wollen (wie hier zur Konvergenz von

∑∞k=1

1ks

),konnen neue Resultate entdecken. Lassen Sie uns wissen, wenn Ihnen das gelungen ist!

Wir schließen dieses Kapitel mit einem kurzen Ruckblick zur Motivation am Eingang(siehe Abb. 9.1). Wir haben dort nur einen Grenzwert diskutiert, namlich den der Reiheaus unendlich vielen approximierenden Segmenten, fur eine gegebene Schrittweite. ZurDefinition des Integral mussen wir jedoch einen weiteren Grenzwert betrachten, namlichden einer verschwindenden Schrittweite. Diese Situation ist typisch in der Analysis: Sehr

104

Page 111: Vorlesungsskript zur Analysis 1 -

5 10 15 20

0.2

0.4

0.6

0.8

1.0

0.1 0.2 0.3 0.4 0.5

0.1

0.2

0.3

0.4

0.5

0.6

0.7

Abbildung 9.5: Zur Konvergenz bzw. Divergenz von∑∞

k=11ks

. Links: Die Abbildung k 7→1ks

fur s = 2 (unterste Funktion, in gelb), fur s = 1 (Mitte, blau) und s = 12

(rot, oben).Rechts: Die Funktion 1

k7→ 1

ksfur s = 2 (gelb, unten), s = 1 (blau, Mitte) und s = 1

2(rot,

oben).

oft treten Grenzwerte in Kombination auf, und dann stellt sich die Frage, in welcherReihenfolge sie auszufuhren sind. Ein Beispiel zu Reihen ist

∞∑

n=1

∞∑

m=1

anm?=

∞∑

m=1

∞∑

n=1

anm .

Ein weiteres Beispiel ist die Vertauschbarkeit von Grenzwert und Funktionsanwendung:Gilt fur eine konvergente Folge (xn) und eine Funktion f

limn→∞

f(xn)?= f

(limn→∞

xn

)?

Dies ist die Charakterisierung der Stetigkeit, die wir im kommenden Kapitel besprechen.Fur Unstetigkeiten ist die letzte Gleichung also verletzt.

Erganzende Literatur zu diesem Kapitel

[1] Y. S. Abu-Mostafa. A Differentiation Test for Absolute Convergence. Math. Mag.57.4 (1984), 228–231.

[2] B. R. Gelbaum und J. M. H. Olmsted. Counterexamples in analysis. Corrected reprintof the second (1965) edition. Dover Publications, Inc., Mineola, NY, 2003, xxiv+195.isbn: 0-486-42875-3.

[3] K. Konigsberger. Analysis. 1. Springer-Lehrbuch. [Springer Textbook]. Springer-Verlag,Berlin, 2004, xiv+412. isbn: 3-540-40371-X. doi: 10.1007/978-3-642-18490-1.url: https://doi.org/10.1007/978-3-642-18490-1.

[4] T. Tao. An epsilon of room, I: real analysis. Bd. 117. Graduate Studies in Mathema-tics. Pages from year three of a mathematical blog. American Mathematical Society,Providence, RI, 2010, xii+349. isbn: 978-0-8218-5278-1. doi: 10.1090/gsm/117.

105

Page 112: Vorlesungsskript zur Analysis 1 -

10 Stetige Funktionen

10.1 Motivation

Was ist sin(√

2)? Ein Taschenrechner mit 8 Stellen liefert die Antwort 0.9877659. Das istnaturlich falsch – ein Taschenrechner hat nur eine endliche Speicherkapazitat und

√2 ist

irrational, besitzt also keine abbrechende Dezimaldarstellung. Der springende Punkt istaber, dass die Antwort des Taschenrechners nur

”ein bisschen falsch“ ist: Zunachst wird

im Taschenrechner√

2 durch eine endliche Dezimalzahl approximiert, etwa 1, 4142135.Dann wird folgendes Prinzip ausgenutzt: Fur die Funktion sin gilt

benachbarte Eingaben, hier√

2 und 1, 4142135↓

benachbarte Ausgaben sin(√

2) und sin(1, 4142135)

Das Ergebnis ist also”falsch, aber nicht sehr falsch“ (es gilt sin(

√2) − sin(1.4142135) ≈

0.00000000972669, also ist in diesem Fall auf die ersten 8 Nachkommastellen genau).Die Eigenschaft

”Kleine Anderungen im Input bewirken kleine Anderungen im Output“

heißt Stetigkeit. Sie ist eine sehr naturliche Eigenschaft, die viele Funktionen (aber nichtalle, und auch nicht jede Funktion uberall!) haben. In diesem Kapitel wird der Begriffsauber eingefuhrt. Insbesondere mussen wir klaren, was

”benachbart“ oder

”klein“ genau

bedeuten soll.

Intuitiv konnen wir aber schon jetzt sehen, dass Stetigkeit im Alltag eine zentrale Rollespielt: Bei jeder Messung tritt ein Messfehler auf – so wird bei einem Quecksilberthermo-meter die Ausdehnung der Saule nicht exakt der richtigen Ausdehnung fur den Messpunktentsprechen, sondern durch die Umgebung leicht verfalscht sein. Damit ist auch die Um-rechnung in die Temperatur leicht verfalscht. Da aber die Funktion, die der Ausdehnungder Quecksilbersaule die Temperatur zuordnet, stetig ist, ist das Endergebnis aber nurleicht falsch, etwa auf irrelevante Nachkommastellen.

10.2 Grundlegende Begriffe

In diesem Abschnitt betrachten wir Funktionen

f : D → K , D ⊂ K . (10.1)

Hier steht K fur R oder fur C. Also ist (10.1) eine Kurzform dafur, dass wir sowohlFunktionen

f : D → R , D ⊂ R ,

als auch Funktionenf : D → C , D ⊂ C ,

betrachten.

Typische Definitionsgebiete D ⊂ R sind Intervalle.

106

Page 113: Vorlesungsskript zur Analysis 1 -

Definition 10.1 (Abschluss)Sei D ⊂ K. Wir definieren den Abschluss D von D durch

D ={a∣∣ a ∈ K, es gibt eine Folge (xn) in D mit xn → a

}.

Es gilt D ⊂ D, da jede konstante Folge xn = a ∈ D den Grenzwert a hat.

Beispiel 10.2(i) In R:

[a, b] = (a, b) = (a, b] = [a, b) = [a, b] .

(ii) In C: Fur r > 0 istBr =

{z∣∣ z ∈ C , |z| < r

}

die offene Kreisscheibe um 0 mit Radius r. Es gilt (Ubung)

Br ={z∣∣ z ∈ C , |z| ≤ r

}.

(iii) In R: Es gilt Q = R. Ist namlich a ∈ R, a > 0, so setzen wir fur n ≥ 1

xn =m

n, m = sup

{k∣∣∣ kn≤ a , k ∈ N

}.

Es ist dann xn ∈ Q und

xn ≤ a < xn +1

nund daher xn → a sowie −xn → −a fur n→∞.

Definition 10.3 (Grenzwert einer Funktion)Sei D ⊂ K, f : D → K und a ∈ D. Die Zahl c ∈ K heißt Grenzwert von f an der Stellea (oder: in a), falls eine der beiden aquivalenten Bedingungen erfullt sind:

(i) Fur jede Folge (xn) in D mit xn → a gilt

limn→∞

f(xn) = c . (10.2)

(ii) Zu jedem ε > 0 gibt es δ > 0 mit

|f(x)− c| < ε fur alle x ∈ D mit |x− a| < δ. (10.2’)

Beweis: Wir zeigen die Aquivalenz der beiden Bedingungen:

(ii) ⇒ (i): Sei (xn) eine Folge in D mit xn → a und ε > 0 beliebig. Dann gibt es δ > 0, sodass (10.2’) erfullt ist. Weiter gibt es wegen xn → a ein n0 ∈ N mit |xn − a| < δ fur allen ≥ n0. Aus (10.2’) folgt nun |f(xn)− c| < ε fur alle n ≥ n0. Dies zeigt, dass (10.2) gilt.

(i) ⇒ (ii): Wir nehmen an, dass (ii) nicht erfullt ist. Dann ist wahr:

∃ ε > 0 ∀ δ > 0 ∃ x ∈ D mit |x− a| < δ : |f(x)− c| ≥ ε.

Daher gibt es ε > 0 und xn ∈ D mit |xn − a| < 1/n und |f(xn) − c| ≥ ε fur alle n ≥ 1.Damit haben wir D 3 xn → a, aber f(xn) 6→ c und daher gilt (10.2) nicht. �

Da Grenzwerte von Folgen eindeutig bestimmt sind (Satz 8.5), kann es keine zwei ver-schiedenen Werte von c geben, welche die Bedingung in Definition 10.3 erfullen. Darausfolgt die Eindeutigkeit des Grenzwerts einer Funktion in einem Punkt:

107

Page 114: Vorlesungsskript zur Analysis 1 -

Lemma 10.4Sei D ⊂ K, f : D → K und a ∈ D. Dann hat f hochstens einen Grenzwert in a. �

Notation 10.5Ist c der Grenzwert von f : D → R in a, so schreiben wir

limx→a

f(x) = c , oder auch limx→ax∈D

f(x) = c ,

oder auchf(x)→ c fur x→ a .

Beispiel 10.6(i) Die durch

f(x) =

{1 , x > 0 ,

0 , x ≤ 0 ,

definierte Funktion f : R → R hat in Punkten a < 0 den Grenzwert 0, in Punktena > 0 den Grenzwert 1, aber im Punkt a = 0 keinen Grenzwert, da f(xn) = 0gilt fur Folgen xn → 0, die aus negativen Zahlen bestehen, und f(xn) = 1 gilt furFolgen, die aus positiven Zahlen bestehen.

(ii) Die durch

f(x) =

{1 , x ∈ Q ,

0 , x /∈ Q ,

definierte Dirichletsche Sprungfunktion (Peter Gustav Lejeune Dirichlet, 1805–1859) f : R → R hat in keinem Punkt a ∈ R einen Grenzwert, da es fur jedes asowohl Folgen xn → a gibt, die in Q verlaufen (also mit f(xn) = 1 fur alle n), alsauch Folgen xn → a, die in R \Q verlaufen (also mit f(xn) = 0 fur alle n).

Definition 10.7 (Stetigkeit)Sei D ⊂ K, f : D → K. Ist a ∈ D, so heißt f stetig in a, falls fur jedes ε > 0 ein δ > 0existiert, so dass fur alle x ∈ D mit |x− a| < δ gilt

|f(x)− f(a)| < ε . (10.3)

Eine Funktion f heißt stetig, oder deutlicher stetig in D, falls f in jedem Punkt a ∈ Dstetig ist. Man spricht dann von Stetigkeit in D.

Es ist eine gute Ubung, im Selbststudium sauber zu definieren, was es bedeutet, wenneine Funktion f in einem gegebenen Punkt a nicht stetig ist (man sagt dann, dass f in aunstetig ist). Die Hilfsmittel wurden in Abschnitt 1.3 bereitgestellt (SUPER).

Zum Nachweis der Stetigkeit ist es meist praktisch, mit Folgen zu arbeiten, wie es dernachste Satz ermoglicht.

Satz 10.8 (Charakterisierung der Stetigkeit durch Folgen)Sei D ⊂ K. Eine Funktion f : D → K ist in a ∈ D genau dann stetig, wenn fur alleFolgen (xn) in D mit xn → a gilt

limn→∞

f(xn) = f(a) . (10.4)

108

Page 115: Vorlesungsskript zur Analysis 1 -

Beweis: Die Aquivalenz der Folgenstetigkeit (10.4) zur sogenannten ε − δ-Formulierung(10.3) ist im Beweis von Definition 10.3 gezeigt. �

Die Charakterisierung durch Folgen zeigt optisch, dass es sich bei Stetigkeit um einenVertauschungsprozess handelt, wie am Ende von Kapitel 9 erwahnt: Aus Satz 10.8 folgt,dass f genau dann stetig auf D ist, falls

limn→∞

f(xn) = f(

limn→∞

xn

)

gilt fur jede Folge (xn) in D, welche gegen einen Grenzwert in D konvergiert.

Beispiel 10.9(i) Die sogenannte Signums-Funktion sgn: R→ R,

sgn(x) =

1 , x > 0

0 , x = 0

−1 , x < 0

ist unstetig in a = 0. Denn |f(0)− f(x)| = 1 fur jedes x 6= 0; also gibt es kein δ > 0,mit dem |f(x)− f(0)| < 1

2fur alle x ∈ (−δ, δ) gilt.

(ii) Die in Beispiel 10.6 definierte Dirichletsche Sprungfunktion f : R→ R,

f(x) =

{1 , x ∈ Q ,

0 , x /∈ Q ,

ist in keinem Punkt a ∈ R stetig.

Ist D ⊂ K, so bezeichnen wir mit C(D;K) die Menge aller auf D definierten und stetigenFunktionen, also

C(D;K) :={f∣∣ f : D → K, f stetig auf D

}.

Im Fall K = R schreiben wir auch einfach C(D), und fur den Fall, dass D = [a, b] einabgeschlossenes Intervall ist, noch kurzer C[a, b].

Wir wissen bereits, dass Summen und skalare Vielfache von stetigen Funktionen ebenfallsstetig sind. Es folgt:

Lemma 10.10Sei D ⊂ K. Dann ist C(D;K) ein Vektorraum uber K. �

Ein Vektorraum, dessen Elemente Funktionen sind, heißt Funktionenraum. Der damitverbundene Abstraktionsschritt (wir fassen Funktionen als Punkte, sprich: Elemente, ineinem Vektorraum auf) ist etwa seit dem Beginn des 20. Jahrhunderts eine fur die Analysisgrundlegende Sichtweise. In den Lehrveranstaltungen des ersten Studienjahrs steht sie eherim Hintergrund, wird aber spater zunehmend wichtig.

109

Page 116: Vorlesungsskript zur Analysis 1 -

10.3 Satze uber stetige Funktionen

Sind f, g : D → K und λ ∈ K, so sind

f + g, f · g, λf : D → K

definiert durch

(f + g)(x) := f(x) + g(x) , (f · g)(x) := f(x) · g(x) , (λf)(x) := λf(x) ,

undf

g: D \

{x∣∣ g(x) = 0

}→ K

durch (f

g

)(x) :=

f(x)

g(x).

Satz 10.11Seien D ⊂ K, f, g : D → K, a ∈ D und λ ∈ K. Sind f und g stetig in a, so sind auchf + g, fg und λf stetig in a; ist g(a) 6= 0, so ist auch f/g stetig in a.

Beweis: Dies folgt aus den entsprechenden Satzen fur Grenzwerte von Folgen. Ist etwa(xn) eine Folge in D mit xn → a, so gilt

(fg)(a) = f(a)g(a) =(

limn→∞

f(xn))·(

limn→∞

g(xn))

= limn→∞

(f(xn)g(xn)) = limn→∞

(fg)(xn) .

Folgerung 10.12Alle rationalen Funktionen, d.h. alle Funktionen der Form

f(x) =p(x)

q(x),

wobei p und q Polynome sind, sind auf ihrem Definitionsbereich{x∣∣ x ∈ K, q(x) 6= 0

}

stetig.

Beweis: Dies folgt aus Satz 10.11 und der (trivial nachzuweisenden) Stetigkeit der Iden-titat sowie der konstanten Funktionen. �

Satz 10.13Seien D,E ⊂ K, a ∈ D, f : D → K, g : E → K und f(D) ⊂ E. Sind f stetig in a und gstetig in f(a), so ist auch g ◦ f stetig in a.

Beweis: Sei (xn) eine beliebige Folge in D mit xn → a. Da f stetig ist in a, gilt

limn→∞

f(xn) = f(a) .

Da f(xn) ∈ E fur alle n, und da g stetig in f(a) ist, folgt weiter

limn→∞

g(f(xn)) = g(f(a)) .

110

Page 117: Vorlesungsskript zur Analysis 1 -

a x

b

Abbildung 10.1: Zum Zwischenwertsatz 10.14.

Der nachste Satz ist intuitiv plausibel. Aber auch wenn er harmlos aussieht, soll manihn nicht unterschatzen! Dieser Satz wird große Bedeutung entfalten – wir werden damitdie Existenz von Wurzeln zeigen, den Mittelwertsatz der Integralrechnung (Satz 14.18)beweisen, und vieles mehr. Abb. 10.1 veranschaulicht den Sachverhalt.

Satz 10.14 (Zwischenwertsatz)Sei f : [a, b]→ R stetig, es gelte f(a)f(b) < 0. Dann gibt es ein x ∈ (a, b) mit f(x) = 0.

Beweis: Wir konnen f(a) < 0 annehmen; andernfalls betrachten wir −f . Wir definieren

G :={t∣∣ t ∈ [a, b], f(t) < 0

}.

Es ist a ∈ G, also ∅ 6= G ⊂ [a, b]. Wir setzen

x := supG .

Wir wahlen eine Folge (xn) in G mit xn → x, dann ist

f(xn) < 0 fur alle n ∈ N , limn→∞

f(xn) = f(x) ,

also f(x) ≤ 0. Zum Beweis der umgekehrten Ungleichung setzen wir xn = x+ 1n. Da x < b

wegen f(b) > 0, gilt xn ∈ [a, b] fur hinreichend große n. Es ist xn /∈ G fur alle n nachDefinition von x, also f(xn) ≥ 0 fur alle n. Wegen xn → x folgt f(x) ≥ 0. �

Folgerung 10.15Sei f : [a, b] → R stetig, sei y ∈ R mit f(a) ≤ y ≤ f(b) oder f(a) ≥ y ≥ f(b). Dann gibtes ein x ∈ [a, b] mit f(x) = y.

Beweis: Wir wenden Satz 10.14 auf die durch g(x) = f(x) − y definierte Funktiong : [a, b]→ R an. �

111

Page 118: Vorlesungsskript zur Analysis 1 -

Definition 10.16 (Beschrankte Funktion)Sei D ⊂ R. Eine Funktion f : D → R heißt nach oben beschrankt, wenn es ein M ∈ Rgibt mit f(x) ≤M fur alle x ∈ D. Eine Funktion f heißt nach unten beschrankt, wenn−f nach oben beschrankt ist. Schließlich heißt eine Funktion f beschrankt, wenn f nachoben und nach unten beschrankt ist.

Ob eine Funktion beschrankt ist oder nicht, hangt von der Funktionsvorschrift und demDefinitionsbereich ab. So ist etwa die durch f(x) = x definierte Funktion auf D = [0, 1]beschrankt, aber auf D = R nicht, ebensowenig auf D = [0,∞).

Die durch f(x) = 1/x definierte Funktion ist auf D = (0,∞) nach oben unbeschrankt, daf(x) → ∞ fur x → 0, aber nach unten durch 0 beschrankt, da f(x) > 0 fur alle x > 0.Dasselbe gilt fur D = (0, 1]. Die Sinusfunktion ist auf ganz R beschrankt, da ihre Wertezwischen −1 und 1 liegen.

Satz 10.17 (Satz vom Maximum)Sei [a, b] ein abgeschlossenes und und beschranktes Intervall, und f : [a, b] → R eine ste-tige Funktion. Dann ist f beschrankt, und f nimmt ihr Minimum und Maximum an: Esexistieren xmin, xmax ∈ [a, b] mit

f(xmax) = maxx∈[a,b]

f(x),

f(xmin) = minx∈[a,b]

f(x) .

Beweis: Wir nehmen zunachst an, f sei nach oben unbeschrankt. Dann gibt es eine Folge(xn) in [a, b] mit f(xn) ≥ n fur alle n ∈ N. Nach dem Satz 8.23 von Bolzano-Weierstraßbesitzt (xn) eine konvergente Teilfolge, also xnk → c ∈ [a, b]. Da f stetig ist, gilt f(xnk)→f(c), im Widerspruch zu f(xnk) ≥ nk. Also ist f nach oben beschrankt.

Sei M := supx∈[a,b] f(x) ∈ R. Zu n ≥ 1 wahlen wir ein xn ∈ [a, b] mit

M − 1

n≤ f(xn) ≤M .

Dann giltlimn→∞

f(xn) = M .

Da diese Folge beschrankt ist, besitzt sie wiederum nach dem Satz von Bolzano-Weierstraßeine konvergente Teilfolge xnk . Wir definieren limnk→∞ xnk =: xmax ∈ [a, b]. Wegen derStetigkeit gilt

f(xmax) = limnk→∞

f(xnk) = M ;

also ist f nach oben beschrankt und f nimmt in xmax ihr Maximum an.

Der Beweis fur das Minimum geht analog, oder eleganter durch Ubergang von f zu −f ,da dann die gerade bewiesene Aussage sofort das Resultat liefert. �

Solche Punkte xmax und xmin heißen Maximalstelle bzw. Minimalstelle von f auf [a, b].Maximal- und Minimalstellen brauchen nicht eindeutig bestimmt sein. Beispielsweise gilt

112

Page 119: Vorlesungsskript zur Analysis 1 -

fur konstante Funktionen, dass jedes x ∈ [a, b] sowohl Maximalstelle als auch Minimalstelleist.

Wir legen Ihnen ans Herz, sich zu uberlegen, dass man weder auf die Beschranktheit nochauf die Abgeschlossenheit des Definitionsbereichs [a, b] als Voraussetzung in Satz 10.17verzichten kann (SUPER).

Der nachste Satz zeigt, dass strikte Ungleichungen”f(a) > y“ erhalten bleiben, wenn f

stetig ist und man a nur wenig abandert.

Satz 10.18Sei D ⊂ R, f : D → R, a ∈ D. Ist f stetig in a und gilt f(a) > y (bzw. f(a) < y), so gibtes ein δ > 0 mit f(x) > y (bzw. f(x) < y) fur alle x ∈ D mit |x− a| < δ.

Beweis: Sei f(a) > y (andernfalls betrachten wir −f). Falls es kein δ wie im Satz be-hauptet gibt, konnen wir eine Folge (xn) in D wahlen mit |xn − a| ≤ 1

nund f(xn) ≤ y.

Da f stetig ist und xn → a, folgt f(xn)→ f(a) und damit f(a) ≤ y, im Widerspruch zurVoraussetzung. �

Definition 10.19Seien (x, f(x)) und (y, f(y)) zwei Punkte auf dem Graphen einer Funktion f : D → R,D ⊂ R. Die Gerade durch sie heißt Sekante. Ihre Steigung ist gegeben durch

f(x)− f(y)

x− y .

Der nachste Begriff ist nach Rudolf Lipschitz (1832–1903) benannt.

Definition 10.20 (Lipschitz-Stetigkeit)Sei D ⊂ K. Eine Funktion f : D → K heißt Lipschitz-stetig in D, falls es ein L > 0gibt mit

|f(x)− f(y)| ≤ L|x− y| , fur alle x, y ∈ D. (10.5)

Ein solches L heißt Lipschitz-Konstante fur f in D.

Die Bedingung (10.5) bedeutet geometrisch, dass alle Sekanten fur f eine Steigung haben,deren Betrag kleiner oder gleich L ist.

Die Betragsfunktion f : K→ R, f(x) = |x| ist Lipschitz-stetig, da

|f(x)− f(y)| = ||x| − |y|| ≤ |x− y|

(umgekehrte Dreiecksungleichung) gilt fur alle x, y ∈ K. Die Zahl 1 ist eine Lipschitz-Konstante fur die Betragsfunktion, und zwar die kleinstmogliche.

Satz 10.21Jede in D ⊂ K Lipschitz-stetige Funktion ist stetig in D.

Beweis: Ubungsaufgabe. �

113

Page 120: Vorlesungsskript zur Analysis 1 -

10.4 Uneigentliche Grenzwerte von Funktionen

Wir wollen Grenzwerte von Funktionen betrachten, bei denen die Argumente oder dieWerte gegen ±∞ uneigentlich konvergieren. Dabei treten eine Reihe verschiedener Falleauf.

Definition 10.22Sei D ⊂ R, f : D → R, a ∈ D. Wir sagen, dass

limx→a

f(x) =∞ , bzw. limx→a

f(x) = −∞ ,

fallslimn→∞

f(xn) =∞ , bzw. limn→∞

f(xn) = −∞

gilt fur jede Folge (xn) in D mit xn → a.

Wie gehabt schreiben wirlimx→ax∈D

f(x) =∞ ,

falls wir D explizit angeben wollen.

Beispiel 10.23Wir betrachten

f(x) =1

x.

Mit D = (0,∞) gilt

limx→0x∈D

1

x=∞ ,

mit D = (−∞, 0) gilt

limx→0x∈D

1

x= −∞ ,

mit D = R \ {0} existiert lim x→0x∈D

1x

nicht.

Wir betrachten nun den Fall, dass die Argumente uneigentlich gegen ∞ konvergieren.

Definition 10.24Sei D ⊂ R, f : D → R, es gelte D ∩ (M,∞) 6= ∅ fur alle M ∈ R. (Diese Voraussetzungstellt sicher, dass es eine Folge (xn) in D gibt mit xn →∞.)

(i) Wir sagen, dass fur c ∈ Rlimx→∞

f(x) = c

gilt, fallslimn→∞

f(xn) = c

fur jede Folge (xn) in D mit xn →∞ gilt.

114

Page 121: Vorlesungsskript zur Analysis 1 -

(ii) Wir sagen, dasslimx→∞

f(x) =∞ (10.6)

gilt, fallslimn→∞

f(xn) =∞

fur jede Folge (xn) in D mit xn →∞ gilt.

Im Falle (10.6) sind beide Grenzwerte (xn → ∞ und f(xn) → ∞) uneigentliche Grenz-werte.

Analog werden definiert

limx→−∞

f(x) = c , limx→∞

f(x) = −∞ , limx→−∞

f(x) =∞ , limx→−∞

f(x) = −∞ .

Beispiel 10.25Ist p ein Polynom der Form

p(x) = xn +n−1∑

k=0

akxk ,

mit n ≥ 1, so gilt (Ubungsaufgabe)

limx→∞

p(x) =∞ , limx→−∞

p(x) =

{∞ , falls n gerade,

−∞ , falls n ungerade.

Satz 10.26Sei D ⊂ R, f : D → R, es gelte D ∩ (M,∞) 6= ∅ fur alle M ∈ R. Gilt

limx→∞

f(x) =∞ ,

so gilt auch

limx→∞

1

f(x)= 0 . (10.7)

Beweis: Sei (xn) eine Folge in D mit xn →∞. Nach Voraussetzung gilt f(xn)→∞. Seinun ε > 0. Wir wahlen n0 ∈ N mit f(xn) ≥ 1/ε fur alle n ≥ n0. Es folgt

1

f(xn)≤ ε , fur alle n ≥ n0.

Da ε beliebig war, folgt 1/f(xn)→ 0. Da die Folge (xn) beliebig war, ist (10.7) gezeigt. �

10.5 Monotone Funktionen

Definition 10.27Sei D ⊂ R. Eine Funktion f : D → R heißt

• monoton wachsend, falls f(x) ≤ f(x) fur alle x, x ∈ D mit x ≤ x;

115

Page 122: Vorlesungsskript zur Analysis 1 -

• streng monoton wachsend, falls f(x) < f(x) fur alle x, x ∈ D mit x < x;

• (streng) monoton fallend ist, falls −f (streng) monoton wachsend ist;

• (streng) monoton, falls f (streng) monoton wachsend oder (streng) monotonfallend ist.

Satz 10.28Sei D ⊂ R und f : D → R streng monoton wachsend. Dann ist f : D → f(D) bijektiv,und f−1 : f(D)→ D ist streng monoton wachsend.

Beweis: Sind x, x ∈ D mit x 6= x, so ist x < x oder x < x. Im ersten Fall ist f(x) < f(x),andernfalls ist f(x) < f(x), also f(x) 6= f(x). Also ist f injektiv und damit f : D → f(D)bijektiv. Seien nun y, y ∈ f(D). Ist f−1(y) ≥ f−1(y), so ist auch

y = f(f−1(y)) ≥ f(f−1(y)) = y .

Aus y < y folgt daher f−1(y) < f−1(y). �

Folgerung 10.29Satz 10.28 gilt auch, wenn unter ansonsten gleichen Voraussetzungen f streng monotonfallend ist; f−1 : f(D)→ D ist dann ebenfalls streng monoton fallend.

Beweis: Nach Satz 10.28 ist −f : D → −f(D) bijektiv und (−f)−1 : − f(D)→ D strengmonoton wachsend. Sind y, y ∈ f(D) mit y < y, so ist −y > −y und

f−1(y) = (−f)−1(−y) > (−f)−1(−y) = f−1(y) .

Also ist f−1 streng monoton fallend. �

In Kapitel 6 hatten wir die k-te Wurzel als Umkehrfunktion der k-ten Potenz

f : R+ → R+ , f(x) = xk

erhalten. Da f streng monoton wachsend ist, existiert die Umkehrfunktion f−1 : f(R+)→R+. Damit die k-te Wurzel tatsachlich auf ganz R+ definiert ist, musste gezeigt werden,dass f(R+) = R+ gilt, dass also jedes y ≥ 0 als y = xk erhalten werden kann. Das war dieHauptschwierigkeit. Der Zwischenwertsatz ermoglicht es nun, fur stetige Funktionen f aufexplizite Konstruktionen wie im Beweis von Satz 6.2 zu verzichten. Zusatzlich erhaltenwir, dass auch die Umkehrfunktion stetig ist.

Satz 10.30Sei f : [a, b]→ R streng monoton wachsend und stetig. Dann ist

f([a, b]) = [f(a), f(b)] , (10.8)

undf−1 : [f(a), f(b)]→ [a, b]

ist ebenfalls streng monoton wachsend und stetig.

116

Page 123: Vorlesungsskript zur Analysis 1 -

Beweis: Aus a ≤ x ≤ b folgt f(a) ≤ f(x) ≤ f(b); ist y ∈ [f(a), f(b)], so gibt es wegenFolgerung 10.15 ein x ∈ [a, b] mit f(x) = y. Damit ist (10.8) bewiesen. Nach Satz 10.28 istf−1 streng monoton wachsend. Wir nehmen nun an, f−1 sei nicht stetig auf [f(a), f(b)].Dann gibt es ein y ∈ [f(a), f(b)], in dem f−1 unstetig ist; es gibt dann eine Folge (bn) in[f(a), f(b)] mit bn → y, aber f−1(bn) 6→ f−1(y). Also gibt es ein ε > 0 und eine Teilfolge(ynk) mit

|f−1(ynk)− f−1(y)| ≥ ε , fur alle k ∈ N . (10.9)

Da (f−1(ynk))k∈N eine Folge in [a, b] und also beschrankt ist, hat sie eine konvergenteTeilfolge (eine

”Teilteilfolge“ der ursprunglichen Folge (bn)), sei x ihr Grenzwert:

f−1(ynkl )→ x , x ∈ [a, b] .

Es gilt, da f stetig ist,

f(x) = f( liml→∞

f−1(ynkl )) = liml→∞

f(f−1(ynkl )) = liml→∞

ynkl = y ,

alsof−1(ynkl )→ x = f−1(y)

im Widerspruch zu (10.9). Also war die Annahme falsch, das heißt, f−1 ist stetig. �

Folgerung 10.31Satz 10.30 gilt auch, wenn unter ansonsten gleichen Voraussetzungen f streng monotonfallend ist; dann ist f−1 : [f(b), f(a)]→ [a, b] ebenfalls streng monoton fallend und stetig.

Beweis: Dies ergibt sich aus Folgerung 10.29, da aus der Stetigkeit von (−f)−1 auch dieStetigkeit von f−1 folgt. �

Wir wenden den Satz an auf die stetige und streng monoton wachsende Funktion

f : [0,M ]→ [0,Mk] , f(x) = xk , k ≥ 1 ,

mit einem festen M > 0. Aus (10.8) folgt, dass f([0,M ]) = [0,Mk] gilt und damitf(R+) = R+, da wir M beliebig groß wahlen konnen und Mk →∞ fur M →∞ gilt. DieUmkehrfunktion

f−1(y) = k√y

ist eine Funktionf−1 : R+ → R+ ,

die auf R+ stetig ist, da sie fur beliebiges M > 0 gemaß dem vorangegangenem Satz injedem Punkt y ∈ [0,Mk] stetig ist.

Die Wurzelfunktion ist ein Beispiel fur eine Funktion, die auf [0, 1] stetig, aber nichtLipschitz-stetig ist. Fur x > 0 gilt namlich

|x− 0| = x =√x · √x =

√x · |√x−

√0| ,

also

|√x−√

0| = 1√x· |x− 0| .

Da 1/√x→∞ fur x→ 0, kann es keine Zahl L geben mit

|√x−√

0| ≤ L|x− 0| fur alle x > 0.

117

Page 124: Vorlesungsskript zur Analysis 1 -

10.6 Anmerkungen

Bei Grenzwerten muss man genau schauen, wie sie in Computeralgebrapaketen definiertsind. Mathematica® gibt in der aktuellen Version fur Beispiel 10.23 die korrekte Antwort,

In[1]:= Limit [1 / x, x → 0, Direction → "FromBelow "]

Out[1]= -∞

In[2]:= Limit [1 / x, x → 0, Direction → "FromAbove "]

Out[2]= ∞

In[3]:= Limit [1 / x, x → 0, Direction → "TwoSided "]

Out[3]= Indeterminate

In[4]:= Limit [1 / x, x → 0]

Out[4]= Indeterminate

Bis zu Version 10 einschließlich war jedoch definiert, dass Grenzwerte standardmaßigimmer von rechts berechnet werden. Man muss also aufpassen – solche Pakete konnen sehrhilfreich sein, sofern man genug eigene Rechenfertigkeit erworben hat, um die Ergebnissekritisch evaluieren und ggfs. prufen zu konnen. Moderne Computeralgebrapakete sind sehrleistungsstark; folgendes Beispiel nach [1] zeigt, wie Stetigkeit in D nach (10.3) fur eineeinfache Beispielsfunktion in Mathematica® verifiziert werden kann:

In[1]:= Limit [1 / x, x → 0, Direction → "FromBelow "]

Out[1]= -∞

In[2]:= Limit [1 / x, x → 0, Direction → "FromAbove "]

Out[2]= ∞

In[3]:= Limit [1 / x, x → 0, Direction → "TwoSided "]

Out[3]= Indeterminate

Limit [1 / x, x → 0]

Out[4]= Indeterminate

In[7]:= f[x_] := x^2

In[8]:= Resolve [ForAll [{ϵ, a}, ϵ > 0,

Exists [δ, δ > 0, ForAll [{x}, Element [{x}, Reals ] && Abs [x - a] < δ, Abs [f[x] - f[a]] < ϵ ]]]]

Out[8]= True

Erganzende Literatur zu diesem Kapitel

[1] G. Filipuk und A. Koz lowski. Analysis with Mathematica®. Berlin, Boston: De Gruy-ter, 2019. isbn: 978-3-11-059014-2. doi: https://doi.org/10.1515/9783110590142.url: https://www.degruyter.com/view/title/537084.

118

Page 125: Vorlesungsskript zur Analysis 1 -

11 Exponentialfunktion, trigonometrische Funktionen,

Logarithmus

Die reelle Exponentialfunktionexp: R→ R

beschreibt Wachstumsprozesse. Wir betrachten als Beispiel eine Population, die sich proZeiteinheit um den Faktor x vergroßert. Ein diskretes Modell dafur ist folgendes. Seip0 > 0 die Anfangsgroße der Population zum Zeitpunkt t0 = 0, sei t1 = t0 + h mit derZeitschrittweite h > 0. Wir setzen

p1 = p0 + hxp0 = (1 + hx)p0 .

Die weiteren Zeitschritte verlaufen genauso,

pk+1 = (1 + hx)pk , tk+1 = tk + h .

Wir sind an der Große der Population zum Endzeitpunkt T = 1 interessiert. Ist h = 1/n,so sind dafur n Schritte notig, und

pn =(

1 +x

n

)pn−1 = · · · =

(1 +

x

n

)np0 .

Das Verhaltnis pn/p0 von End- und Anfangsgroße hangt vom Wachstumsfaktor x und derZeitschrittweite h = 1/n ab und ist gegeben durch

fn(x) =(

1 +x

n

)n.

Ist x > 0, so wachst die Population, ist x < 0, so schrumpft die Population. (Im Fallx < 0 macht das Modell nur Sinn, wenn n > |x| ist; nur dann ist pk > 0 fur alle k.) Hierein Zahlenbeispiel: Sei x = 12. Fur n = 2 ist h = 1/2, 1 + hx = 7 und f2(x) = 72 = 49.Analog erhalt man

f4(12) = 44 = 256 , f12(12) = 212 = 4096 , f48(12) =

(5

4

)48

≈ 44841.55 .

Aus diesem diskreten Wachstumsmodell erhalt man ein kontinuierliches Wachstumsmo-dell, indem man den Grenzubergang h→ 0 bzw. n→∞ durchfuhrt. Das Verhaltnis vonEnd- und Anfangsgroße hangt dann nur noch vom Wachstumsfaktor x ab und ist gegebendurch

limn→∞

(1 +

x

n

)n,

falls dieser Grenzwert existiert. Das ist, wie wir spater sehen werden, tatsachlich furbeliebiges x ∈ R der Fall; im obigen Beispiel mit x = 12 ist er ungefahr gleich 162754.79.

Eine Moglichkeit, die Exponentialfunktion zu definieren, ist

exp(x) = limn→∞

(1 +

x

n

)n.

119

Page 126: Vorlesungsskript zur Analysis 1 -

Eine andere Moglichkeit (und das ist die, die wir hier verwenden) ist die Definition durchdie Exponentialreihe (siehe (9.10))

exp(x) =∞∑

k=0

xk

k!.

Wir werden spater sehen, dass beide Definitionen zum gleichen Ergebnis fuhren, also

limn→∞

(1 +

x

n

)n=∞∑

k=0

xk

k!.

Gemaß Beispiel 9.17 konvergiert die Exponentialreihe absolut, und zwar auch fur komple-xe Argumente. Diese sind ebenfalls von Interesse, da mit ihnen Schwingungsphanomenebeschrieben werden konnen.

Definition 11.1 (Naturliche Exponentialfunktion)Die durch

exp(z) =∞∑

k=0

zk

k!

definierte Funktionexp: C→ C

heißt naturliche Exponentialfunktion oder meist schlicht Exponentialfunktion.Wir definieren die Eulersche Zahl e als

e = exp(1) .

Abb. 11.1 zeigt den Graph der Exponentialfunktion fur verschiedene Argumente.

Aus der Definition folgt unmittelbar, dass exp(z) ∈ R, falls z ∈ R, und

exp(0) = 1 .

Es iste = 2.718281828459045235 . . .

Satz 11.2Fur alle z, w ∈ C gilt die Funktionalgleichung der Exponentialfunktion

exp(z + w) = exp(z) exp(w) . (11.1)

Beweis: Dieses wichtige Resultat ist nur eine Verkleidung von Satz 9.24, denn dort hattenwir das Produkt zweier Exponentialreihen berechnet,

∞∑

k=0

(z + w)k

k!=

(∞∑

k=0

zk

k!

)·(∞∑

k=0

wk

k!

), z, w ∈ C .

120

Page 127: Vorlesungsskript zur Analysis 1 -

-2 -1 0 1 2

0.5

1.0

1.5

2.0

exp(x)

exp(2 x)

exp(-x)

12x

Abbildung 11.1: Zur Exponentialfunktion. Es ist(

12

)x= exp

(x ln

(12

))= exp(− ln(2)x),

wie wir sehen werden. Hier ist ln der naturliche Logarithmus, der in in Definition 11.17eingefuhrt wird.

Aus der Funktionalgleichung erhalten wir unmittelbar eine Reihe von Aussagen uber dieExponentialfunktion. Es gilt

exp(−z) =1

exp(z), fur alle z ∈ C , (11.2)

daexp(z) exp(−z) = exp(z − z) = exp(0) = 1 .

Insbesondere istexp(z) 6= 0 , fur alle z ∈ C .

Weiter giltexp(z) = exp(z) , fur alle z ∈ C ,

da (wir konnen gemaß (8.21) Konjugation und Grenzwerte vertauschen)

exp(z) = limn→∞

n∑

k=0

zk

k!= lim

n→∞

n∑

k=0

zk

k!= exp(z) .

11.1 Die Exponentialfunktion im Reellen

Fur Argumente x ∈ R sind alle Glieder der Exponentialreihe

exp(x) =∞∑

k=0

xk

k!

reell, also ist auch exp(x) ∈ R. Wir mochten exp(z) = ez schreiben, aber Vorsicht! DerAusdruck er ist fur rationales r schon in (6.5) definiert. Wir mussen also zeigen, das exp(r)mit dem dort definierten Wert ubereinstimmt.

121

Page 128: Vorlesungsskript zur Analysis 1 -

Lemma 11.3Fur r ∈ Q gilt exp(r) = er.

Beweis: Fur n ∈ N gilt

exp(n) = exp

(n∑

k=1

1

)=

n∏

k=1

exp(1) = en ,

und mit (11.2) folgtexp(n) = en fur alle n ∈ Z .

Analog gilt

e = exp(1) = exp

(n∑

k=1

1

n

)=

n∏

k=1

exp

(1

n

)=

(exp

(1

n

))n,

also

exp

(1

n

)= n√e fur alle n ∈ N.

Aus der Funktionalgleichung erhalten wir dann

(exp

(p

q

))q= exp

(q · p

q

)= exp(p) = ep ,

also wie gewunscht exp(pq

)= e

pq . �

Aus der Exponentialreihe erkennt man, dass exp(x) > exp(0) = 1 fur x > 0. Daexp(−x) = 1/ exp(x), gilt

exp(x) > 1 , falls x > 0,

0 < exp(x) < 1 , falls x < 0,(11.3)

und insgesamtexp(x) > 0 fur alle x ∈ R .

Lemma 11.4Die Exponentialfunktion ist auf R streng monoton wachsend.

Beweis: Dies folgt aus (11.3), denn x < x impliziert

exp(x) = exp(x− x) exp(x) < exp(x) .

Weiterhin giltlimx→∞

exp(x) =∞ ,

da wir aus der Exponentialreihe folgt exp(x) ≥ x ablesen konnen.

122

Page 129: Vorlesungsskript zur Analysis 1 -

Satz 11.5Die Exponentialfunktion wachst fur x→∞ schneller als jede Potenz von x,

limx→∞

exp(x)

xk=∞ , fur alle k ∈ N.

Beweis: Die Abschatzung exp(x) ≥ xk+1/(k + 1)! liefert unmittelbar die Behauptung. �

Gemaß Satz 10.26 gilt damit

limx→∞

xk

exp(x)= 0 , fur alle k ∈ N.

Da exp(−x) = 1/ exp(x), folgt weiter, indem wir in der letzten Gleichung x durch −xersetzen

0 = limx→−∞

(−x)k

exp(−x)= lim

x→−∞|x|k exp(x) = lim

x→−∞xk exp(x) , fur alle k ∈ N;

die letzte Gleichheit gilt, weil |an| → 0 impliziert, dass an → 0.

Das Wachstum der Exponentialfunktion ist sehr schnell, beispielsweise ist exp(100) un-gefahr gleich 2.69 · 1043 und exp(−100) ungefahr gleich 3.72 · 10−44. Letzteres ist ziemlichverbluffend, wenn man direkt die Definition

exp(−100) =∞∑

k=0

(−1)k100k

k!

betrachtet, denn die einzelnen Summanden wachsen zunachst sehr stark an, siehe Abb. 11.2.

20 40 60 80 100

2.0×1035

4.0×1035

6.0×1035

8.0×1035

1.0×1036

1.2×1036

Abbildung 11.2: Das Wachstum der Exponentialfunktion ist, nun ja, exponentiell.

11.2 Die Exponentialfunktion im Komplexen. TrigonometrischeFunktionen

Lemma 11.3 motiviert folgende Notation.

123

Page 130: Vorlesungsskript zur Analysis 1 -

Notation 11.6Wir vereinbaren

ez := exp(z) , z ∈ C .

Die Funktionalgleichung (11.1) wird dann zu

ez+w = ez · ew , z, w ∈ C .

Fur x ∈ R betrachten wir nun die komplexe Zahl eix. Es gilt eix = eix = e−ix, also

|eix|2 = eixeix = eixe−ix = eix−ix = e0 = 1 ,

also|eix| = 1 ,

das heißt, eix liegt auf dem Einheitskreis in der komplexen Ebene.

Definition 11.7 (Sinus und Cosinus)Wir definieren die Funktionen cos, sin : C→ C durch

cos(z) =1

2

(eiz + e−iz

), und sin(z) =

1

2i

(eiz − e−iz

).

Aus dieser Definition folgt unmittelbar die Eulergleichung

eiz = cos(z) + i sin(z) , fur beliebige z ∈ C .

und die Symmetrien

cos(−z) = cos(z) , sin(−z) = − sin(z) ,

der trigonometrische Pythagoras

cos2(z) + sin2(z) = 1 ,

sowiecos(0) = 1 , sin(0) = 0 .

Wie in der Mathematik ublich schreiben wir cos2(x) fur (cos(x))2; analog verfahrt manfur die anderen trigonometrischen Funktionen.

Weiter gelten folgende wichtige Rechenregeln fur Sinus und Cosinus.

Lemma 11.8Fur alle z, w ∈ C gelten die Additionstheoreme

cos(z + w) = cos(z) cos(w)− sin(z) sin(w) ,

sin(z + w) = sin(z) cos(w) + sin(w) cos(z) .(11.4)

Beweis: Aufgrund der Symmetrien und der Eulergleichung gilt

cos(z + w) + i sin(z + w) = ei(z+w) = eizeiw = (cos(z) + i sin(z))(cos(w) + i sin(w))

cos(z + w)− i sin(z + w) = e−i(z+w) = e−ize−iw = (cos(z)− i sin(z))(cos(w)− i sin(w)) ;

Die Additionstheoreme folgen nun durch Addition bzw. Subtraktion dieser beiden Glei-chungen. �

Fur z = w werden die Formeln (11.4) zu den haufig benotigten Formeln der Winkelver-dopplung,

cos(2z) = cos2(z)− sin2(z) , sin(2z) = 2 sin(z) cos(z) .

124

Page 131: Vorlesungsskript zur Analysis 1 -

Lemma 11.9Sinus und Cosinus lassen sich durch folgende Reihen mit unendlichem Konvergenzradiusdarstellen:

cos(z) = 1− z2

2!+z4

4!− · · · =

∞∑

k=0

(−1)kz2k

(2k)!(11.5)

und

sin(z) = z − z3

3!+z5

5!− · · · =

∞∑

k=0

(−1)kz2k+1

(2k + 1)!. (11.6)

Beweis: Dies folgt aus Addition bzw. Subtraktion der Potenzreihen fur eiz und e−iz. �

Der folgende Hilfssatz ist auf den ersten Blick intuitiv einleuchtend; aber man beachte,dass alle komplexen Nullfolgen zugelassen sind!

Lemma 11.10Es gilt

limz→0

ez = 1 .

Dieser Grenzwert ist als Grenzwert in C zu verstehen.

Beweis: Es ist

ez − 1 =∞∑

k=1

zk

k!= z

∞∑

k=1

zk−1

k!.

Fur |z| < 1 folgt, da k! ≥ 2k−1,

0 ≤ |ez − 1| ≤ |z|∞∑

k=1

1

k!≤ |z|

∞∑

k=1

21−k = |z|∞∑

l=0

(1

2

)l= 2|z| → 0 fur z → 0,

und damit die Behauptung. �

Satz 11.11Die Exponentialfunktion, Sinus und Cosinus sind stetig in C.

Beweis: Wir betrachten exp: C→ C. Fur jedes a ∈ C gilt

|ez − ea| = |ea(ez−a − 1)| = |ea| · |ez−a − 1| → 0 fur z → a

nach Lemma 11.10, und daherlimz→a

ez = ea .

Die Exponentialfunktion ist also stetig in C. Damit sind auch sin und cos als Kombina-tionen von Exponentialfunktionen stetig. �

Lemma 11.12 (Geometrische Definition von Sinus und Cosinus)Fur x ∈ R ist eix ein Punkt auf dem Einheitskreis und es gilt

cos(x) = Re(eix), und sin(x) = Im

(eix).

125

Page 132: Vorlesungsskript zur Analysis 1 -

Beweis: Durch gliedweise komplexe Konjugation sieht man eix = e−ix fur reelles Argu-ment x. Damit gilt (wir fuhren nur das Argument fur cos aus):

cos(x) =1

2

(eix + e−ix

)=

1

2

(eix + eix

)= Re (eix) ;

insbesondere ist cos fur reelles Argument reell. Fur ein Argument z ∈ C \ R stimmt dasnicht, da dann eiz 6= e−iz. �

11.3 Polarkoordinaten

Wir nutzen diese geometrische Interpretation zur Definition der Polarkoordinaten, dieeine Alternative zu den rechtwinkligen kartesischen Koordinaten sind. Sei z = x+ iy einvom Ursprung 0 verschiedener Punkt in der komplexen Ebene. Die von 0 ausgehendeHalbgerade durch z schneidet den Einheitskreis in einem Punkt eiϕ, wobei ϕ der imBogenmaß gemessene Winkel zwischen der Halbgerade und der positiven reellen Achseist. Es gilt dann

z = reiϕ (11.7)

mit r = |z|. Die Polarkoordinaten von z = reiϕ sind das Paar (r, ϕ). Wegen

eiϕ = ei(ϕ+2πk) , k ∈ Z ,

ist der Winkel zunachst nur bis auf ganzzahlige Vielfache von 2π eindeutig bestimmt. DieDarstellung wird eindeutig, wenn wir verlangen, dass ϕ ∈ [0, 2π) gelten muss. So werdenwir in dieser Vorlesung verfahren. Eine andere verbreitete Normierung ist ϕ ∈ (−π, π].(Die Kreiszahl π wird in diesem Kapitel in (11.9) definiert, indem gezeigt wird, dass eseine Nullstelle von cos gibt.)

Beispiele:Punkt 1 1 + i i −1 −i

Kartesisch (1, 0) (1, 1) (0, 1) (−1, 0) (0,−1)

Polar (1, 0) (√

2, π/4) (1, π/2) (1, π) (1, 3π/2)

Gemaß (11.7) erhalten wir die kartesischen Koordinaten aus den Polarkoordinaten durch

x = r cos(ϕ) ,

y = r sin(ϕ) .(11.8)

Losen wir (11.8) nach r und ϕ auf, so erhalten wir

r =√x2 + y2 ,

und fur x 6= 0 haben wiry

x=r sin(ϕ)

r cos(ϕ)= tan(ϕ).

(Der Tangens wird gleich in Abschnitt 11.5 eingefuhrt, und die Umkehrfunktion desTangens – den Arcustangens arctan: R → (−π/2, π/2) – werden wir in Abschnitt 12.4behandeln.)

Mit Hilfe der Polarkoordinaten konnen wir die Multiplikation zweier komplexer Zahlengeometrisch veranschaulichen. Ist

z = reiϕ , w = seiψ ,

126

Page 133: Vorlesungsskript zur Analysis 1 -

so giltz · w = reiϕ · seiψ = rsei(ϕ+ψ) .

Es werden also die Langen multipliziert und die Winkel addiert.

11.4 Die Kreiszahl π

Wir betrachten die Sinus- und Cosinusreihen (11.5) und (11.6) fur reelle Argumente x.Beide Reihen sind alternierend. Da sie konvergent sind, konvergieren die Folgen ihrerGlieder gegen 0. Fur die Sinusreihe gilt, falls 0 < x ≤

√6, dass ihre Glieder (ohne

Vorzeichen) eine monoton fallende Folge bilden: Fur k ≥ 1 und 0 < x <√

6 haben wir

0 <x2k+1

(2k + 1)!

(2k − 1)!

x2k−1=

x2

2k(2k + 1)<

6

6= 1 (sogar ≤ 6/20 fur k ≥ 2).

Wie beim Leibnizkriterium (Satz 9.19) erlautert, wird ihr Grenzwert von den Partialsum-men eingeschachtelt. Insbesondere gilt

0 < x(1− x2

6

)= x− x3

3!≤ sin(x) , falls 0 < x <

√6.

Daran erkennen wir, dass die Funktion x 7→ eix den Einheitskreis gegen den Uhrzeigersinndurchlauft, wenn x von 0 ausgehend monoton wachst.

Wir betrachten die Cosinusreihe fur 0 < x ≤ 2. Ihre Glieder (ohne Vorzeichen) sind abdem zweiten Glied x2/2! monoton fallend, da fur k ≥ 1 der Quotient zweier aufeinander-folgender Glieder

x2k+2

(2k + 2)!· (2k)!

x2k=

x2

(2k + 2)(2k + 1)≤ 4

4 · 3 =1

3

erfullt. Die Einschachtelung des Grenzwerts gemaß dem Leibnizkriterium zeigt nun

1− x2

2!≤ cos(x) ≤ 1− x2

2!+x4

4!.

Fur x = 2 bedeutet das

−1 ≤ cos(2) ≤ −1 +2

3= −1

3< 0 .

Da cos(0) = 1 und der Cosinus stetig ist, muss er nach dem Zwischenwertsatz eineNullstelle x ∈ [0, 2] haben. Fur sie gilt sin(x) = 1 und daher

eix = 0 + i · 1 = i .

Das entspricht dem obersten Punkt auf dem Einheitskreis. Lassen wir x von 0 ausgehendmonoton wachsen, so durchlauft eix den Einheitskreis stetig im mathematisch positivenSinn. Der obere Punkt i des Einheitskreises wird erreicht, wenn der Cosinus zum erstenMal 0 wird. Der zugehorige Kreisbogen ist ein Viertel des Einheitskreises. Im Bogenmaßhat der zugehorige rechte Winkel den Wert π/2 gemaß der geometrischen Definition vonπ.

127

Page 134: Vorlesungsskript zur Analysis 1 -

Definition 11.13 (Analytische Definition von π)Wir definieren

π = 2 · inf{x∣∣ x ≥ 0, cos(x) = 0

}. (11.9)

(Dass das Infimum angenommen wird, kann leicht mit Methoden gezeigt werden, die wirin Analysis 2 genauer untersuchen werden: Die Menge {0} ist abgeschlossen, daher istauch ihr Urbild unter der stetigen Funktion cos abgeschlossen, also wird das Infimumangenommen.)

Damit wird erreicht, dass die analytische Definition den”richtigen“ Wert von π liefert.

Nach dem Gesagten giltcos(π2

)= 0 , (11.10)

alsosin(π2

)= 1 . (11.11)

Aus (11.10) und (11.11) folgt

eiπ2 = cos

(π2

)+ i sin

(π2

)= i ,

eiπ =(eiπ2

)2= −1 = cos(π) + i sin(π) ,

alsocos(π) = −1 , sin(π) = 0 ,

und folgende wahrhaft (be-)merkenswerte Formeln, die e, π und i verknupfen:

ei3π2 = −i , e2πi = 1 .

Aus Lemma 11.8 folgt fur x ∈ R

cos(x+ π) = cos(x) cos(π)− sin(x) sin(π) = − cos(x) , (11.12)

analogsin(x+ π) = − sin(x) , (11.13)

und weiter die Periodizitatseigenschaften

cos(x+ 2π) = cos(x) , sin(x+ 2π) = sin(x) .

Wegenei(π/2−x) = eiπ/2e−ix = i(cos(−x) + i sin(−x)) = sin(x) + i cos(x)

giltcos(x) = sin

(π2− x), sin(x) = cos

(π2− x).

Berucksichtigen wir außerdem (11.12) und (11.13), so sehen wir, dass die trigonome-trischen Funktionen cos, sin : R → R bereits durch ihre Werte auf [0, π

2] festgelegt sind.

Insbesondere sind ihre Nullstellen gegeben durch

sin(x) = 0 ⇔ x = kπ , k ∈ Z bzw. cos(x) = 0 ⇔ x =π

2+ kπ , k ∈ Z .

128

Page 135: Vorlesungsskript zur Analysis 1 -

11.5 Tangens und hyperbolische Funktionen

Definition 11.14 (Tangens und Cotangens)Wir definieren die Funktionen

tan: R \{π

2+ kπ

∣∣ k ∈ Z}→ R und cot : R \

{kπ∣∣ k ∈ Z

}→ R

durch

tan(z) =sin(z)

cos(z), cot(z) =

cos(z)

sin(z).

(Man kann tan und cot als komplexe Funktionen definieren, etwa fur den Tangens durchtan: C \

{π2

+ kπ∣∣ k ∈ Z

}→ C, aber wir beschranken uns hier auf den reellen Fall.)

Abb. 11.3 zeigt die Graphen dieser Funktionen.

-6 -4 -2 2 4 6

-6

-4

-2

2

4

6

tan(x)

cot(x)

Abbildung 11.3: Ein Plot von tan(x) und cot(x).

Es gilt wegen (11.12) und (11.13)

tan(x+ π) = tan(x) , cot(x+ π) = cot(x) .

Wir konnen den Tangens so geometrisch am Einheitskreis interpretieren: Sei x ∈ R.Verlangern wir zu gegebenem x > 0 die Gerade durch 0 und eix bis zu ihrem Schnittpunktp mit der Senkrechten durch den Punkt 1, so betragt der Abstand von 1 und p geradetan(x). Ist x < 0, so liegt p unterhalb der reellen Achse, und tan(x) ist gleich −|1−p|. Andiesem Bild erkennen wir, dass der Tangens auf dem Intervall (−π/2, π/2) streng monotonwachsend ist; wir werden das spater durch Differenzieren beweisen. Weiterhin gilt

limx→−π/2

tan(x) = −∞ , limx→π/2

tan(x) =∞ ,

da der Cosinus Nullstellen in ±π/2 hat und sin(±π

2

)= ±1 gilt. Analog gilt, dass der

Cotangens auf (0, π) streng monoton fallend ist mit

limx→0

cot(x) =∞ , limx→π

cot(x) = −∞ .

129

Page 136: Vorlesungsskript zur Analysis 1 -

Definition 11.15 (Sinus hyperbolicus und Cosinus hyperbolicus)Wir definieren sinh, cosh: C→ C durch

sinh(z) =ez − e−z

2, cosh(z) =

ez + e−z

2.

Abb. 11.4 zeigt die Graphen dieser Funktionen fur reelle Argumente.

Lemma 11.16Fur beliebige z, w ∈ C gelten:

(i) Symmetrie: sinh(z) = − sinh(−z) und cosh(z) = cosh(−z).

(ii) Hyperbolischer Pythagoras: cosh2(z)− sinh2(z) = 1.

(iii) Additionstheoreme:

cosh(z + w) = cosh(z) cosh(w) + sinh(z) sinh(w) ,

sinh(z + w) = sinh(z) cosh(w) + sinh(w) cosh(z) .(11.14)

Beweis: Dies folgt durch Nachrechnen, oder aus den analogen Eigenschaften von sin undcos, da sinh(z) = −i sin(iz) und cosh(z) = cos(iz). �

-3 -2 -1 1 2 3

-10

-5

5

10

cosh(x)

sinh(x)

Abbildung 11.4: Ein Plot von cosh(x) und sinh(x).

Der Cosinus hyperbolicus heißt auch Kettenlinie, da sein Graph die Form einer an ihrenEnden aufgehangten Kette unter dem Einfluss der Schwerkraft beschreibt.

11.6 Logarithmen

Wir haben bereits gesehen, das die reelle Exponentialfunktion exp: R → R stetig undstreng monoton wachsend ist. Gemaß Satz 10.30 gilt

exp([−x, x]) = [exp(−x), exp(x)] , fur alle x > 0.

Wegenlim

x→−∞ex = 0 , lim

x→∞ex =∞ , (11.15)

130

Page 137: Vorlesungsskript zur Analysis 1 -

gilt exp(R) = (0,∞), und aus der strengen Monotonie folgt:

exp: R→ (0,∞) ist bijektiv.

Damit besitzt die Exponentialfunktion eine Umkehrfunktion.

Definition 11.17 (Logarithmus)Wir definieren den (naturlichen) Logarithmus

ln : (0,∞)→ R

als die Umkehrfunktion von exp: R→ (0,∞).

Aus Satz 10.30 folgt unmittelbar:

Satz 11.18Der Logarithmus ln : (0,∞)→ R ist stetig, streng monoton wachsend und bijektiv. �

Aus (11.15) folgtlimx→0x>0

ln(x) = −∞ , limx→∞

ln(x) =∞ .

Die Rechenregeln fur den Logarithmus erhalten wir aus der Funktionalgleichung fur dieExponentialfunktion. Wir erinnern an die Definition

xk =k∏

j=1

x , x0 = 1 , x−k =k∏

j=1

x−1 , falls k ∈ N>0 und x ∈ R,

wobei fur negativen Exponenten x 6= 0 gelte.

Satz 11.19Fur den Logarithmus ln : (0,∞)→ R gilt

ln(1) = 0 , ln(e) = 1 , (11.16)

ln(xy) = ln(x) + ln(y) , fur alle x, y > 0, (11.17)

ln (xy) = y ln(x) , fur alle y ∈ R, x > 0. (11.18)

Beweis: Da e0 = 1 und e1 = e, folgt (11.16). Weiter gilt fur alle x, y ∈ R

exp(ln(x) + ln(y)) = exp(ln(x)) · exp(ln(y)) = xy ,

ln(xy) = ln(exp(ln(x) + ln(y))) = ln(x) + ln(y) .

Wir beweisen (11.18) zunachst fur den Spezialfall y ∈ N, betrachten also ln(xk)

mitk ∈ N. Es gilt ln (x0) = ln(1) = 0 = 0 ln(x). Fur k ≥ 1 erhalten wir

exp(k ln(x)) = exp

(k∑

j=1

ln(x)

)=

k∏

j=1

exp(ln(x)) = xk ,

131

Page 138: Vorlesungsskript zur Analysis 1 -

alsok ln(x) = ln(exp(k ln(x))) = ln

(xk).

Weiter gilt0 = ln(1) = ln

(xx−1

)= ln(x) + ln

(x−1),

also

ln

(1

x

)= − ln(x) ,

damit fur k ≥ 1

ln(x−k)

= ln

((1

x

)k)= k ln

(1

x

)= −k ln(x) .

Der Fall y ∈ Q, also die Regel ln(xpq

)= p

qln(x), ergibt sich aus dieser Diskussi-

on, denn q ln(x

1q

)= ln

((x

1q

)q)= ln (x), woraus mit Division durch q folgt, dass

ln(x

1q

)= 1

qln(x) gilt. Damit ergibt sich ln

(xpq

)= ln

((x

1q

)p)= p ln

(x

1q

)= p

qln(x).

Die Behauptung fur y ∈ R schließlich folgt uber eine Approximation rn → y mit rn ∈ Q:Dann gilt wegen der Stetigkeit der beteiligten Funktionen und des eben Bewiesenen

ln (xy) = limn→∞

ln (xrn) = limn→∞

rn ln(x) = y ln(x).

Motiviert durch (11.18) definieren wir fur a > 0 und x ∈ R die Exponentialfunktionzur Basis a durch ax := exp(x ln(a)). Im Unterschied zu (6.5) ist jetzt also nicht nurx ∈ Q zugelassen, sondern x ∈ R. Fur x ∈ Q stimmen die Definitionen uberein, wie manleicht nachpruft (SUPER; siehe auch Lemma 11.3). Einige Logarithmen sind in Abb. 11.5abgebildet.

Die Definition des naturlichen Logarithmus basiert auf der Monotonie von ex. Da fur all-gemeines a > 0 die Potenzfunktion ax = exp(x ln(a)) monoton ist, gibt es eine Umkehr-funktion zu ax, die wir als Logarithmus zur Basis a bezeichnen und als loga(x) schreiben.Es gilt also

x = aloga(x) fur x > 0 .

Nehmen wir auf beiden Seiten den Logarithmus zur Basis b, erhalten wir

logb(x) = logb(a) · loga(x) ;

die Logarithmen zur Basis b und Basis a unterscheiden sich also nur um die multiplika-tive Konstante logb(a). Fur den naturlichen Logarithmus schreibt man auch of log(x) :=loge(x). Einige Logarithmen sind in Abb. 11.6 abgebildet.

11.7 Die allgemeine Potenzfunktion

Bisher kennen wir die Potenzenxr

fur positive x und rationale r ∈ Q. Wir konnen jetzt xr fur beliebige r ∈ R so definieren,so dass die bekannten Rechenregeln gultig bleiben.

132

Page 139: Vorlesungsskript zur Analysis 1 -

Abbildung 11.5: Einige Exponentialfunktionen zu allgemeinen Basen a > 0.

1 2 3 4 5

-6

-4

-2

2

4

6

log(x)

log2(x)

log1

2

(x)

Abbildung 11.6: Einige Logarithmusfunktionen. Hier bezeichnet log(x) den naturlichenLogarithmus.

Definition 11.20 (Allgemeine Potenzfunktion)Fur r ∈ C, x > 0 definieren wir die r-te Potenz von x durch

xr = exp(r ln(x)) .

Wie fur Lemma 11.3 pruft man nach, dass diese Definition im Fall r ∈ Q mit der in (6.5)ubereinstimmt (SUPER).

Satz 11.21Sei r ∈ R. Die durch

f(x) = xr

definierte Funktion f : (0,∞) → (0,∞) ist stetig, fur r 6= 0 bijektiv, fur r > 0 strengmonoton wachsend und fur r < 0 streng monoton fallend.

133

Page 140: Vorlesungsskript zur Analysis 1 -

Beweis: Die so definierte Funktion f entsteht als Komposition

(0,∞)ln−→ R pr−→ R exp−→ (0,∞) , (11.19)

wobei pr definiert ist durch pr(y) := ry. Alle drei Abbildungen sind mit den in (11.19)genannten Definitions- und Wertebereichen stetig und bijektiv, dasselbe gilt fur derenKomposition. Exponentialfunktion und Logarithmus sind streng monoton wachsend, dieAbbildung pr ist streng monoton wachsend fur r > 0 und streng monoton fallend furr < 0. Daraus folgt die Behauptung uber die Monotonie von f . �

Fur die allgemeine Potenzfunktion gelten die ublichen Rechenregeln. Seien r, s ∈ C undx, y > 0. Es gelten

xr+s = exp((r + s) ln(x)) = exp(r ln(x)) · exp(s ln(x)) = xrxs ,

(xr)s = exp (s ln (xr)) = exp(s ln(exp(r ln(x)))) = exp(sr ln(x)) = xrs ,

(xy)r = exp(r ln(xy)) = exp(r(ln(x) + ln(y))) = exp(r ln(x)) · exp(r ln(y)) = xryr .

134

Page 141: Vorlesungsskript zur Analysis 1 -

12 Differenzierbarkeit reeller Funktionen

12.1 Kontext. Definition der Differenzierbarkeit

Zu Beginn von Kapitel 8 hatten wir die Approximation einer Tangente in einem Punktdurch immer genauer approximierende Sekanten beschrieben. Das ist die Quintessenz derDifferenzierbarkeit: Man beschreibt Funktionen dabei durch Tangenten, oder – anders for-muliert – durch lineare/affine Abbildungen. Diese Idee wird im Folgenden exakt gemacht.

Bevor wir loslegen, eine Bemerkung: Die Beschrankung auf reelle Funktionen f : D → Reine Funktion mit D ⊂ R ist Absicht. Die Theorie der Differenzierbarkeit komplexerFunktionen f : C → C ist sehr schon und ist im Kern mit den hier beschriebenen Me-thoden im Einklang. Allerdings treten dort so viele erstaunliche Phanomene auf, dass dieBehandlung der komplexen Differenzierbarkeit eine eigene Disziplin (und Vorlesung) ist,namlich die Funktionentheorie.

Sei also f : D → R eine Funktion mit D ⊂ R sowie a ∈ D. Einen naheliegenden Kan-didaten fur eine gute Approximation von f in der Nahe des Punkts (a, f(a)) stellt dieTangente an den Graphen von f durch den Punkt (a, f(a)) dar. Wir erhalten die Tangentegeometrisch aus der Sekante an f durch die Punkte (a, f(a)) und (a+h, f(a+h)), indemwir den Grenzubergang h → 0 vornehmen. Die Sekante kann beschrieben werden durchdie Geradengleichung

gh(x) := f(a) +f(a+ h)− f(a)

h(x− a) .

Wir betrachten den Differenzenquotienten

da(h) :=f(a+ h)− f(a)

h,

welcher die Steigung der Sekante gh angibt, und wollen den Differentialquotienten (derdie Steigung der Tangente angibt) als Grenzwert

limh→0h6=0

f(a+ h)− f(a)

h

erhalten. Damit dieser Grenzwert Sinn macht, muss a+h in D liegen, falls h klein genugist. Das ist dann der Fall, wenn a ein innerer Punkt von D ist, das heißt, wenn es einδ > 0 gibt mit

(a− δ, a+ δ) ⊂ D .

Die Menge aller inneren Punkte von D heißt das Innere von D, bezeichnet mit int (D).Ist D ein Intervall, so gehoren nur dessen Randpunkte nicht zu int (D).

Eine Teilmenge D von R heißt offen, falls jeder Punkt von D ein innerer Punkt von D ist,also int (D) = D. Jedes offene Intervall ist offen, und auch jede Vereinigung von offenenIntervallen ist offen. So ist beispielsweise R \ {0} = (−∞, 0) ∪ (0,∞) offen.

Definition 12.1 (Differenzierbare Funktion)Sei D ⊂ R, f : D → R, sei a ∈ int (D). Wir sagen, dass f differenzierbar in a ∈ D ist,falls der Grenzwert

limh→0h 6=0

f(a+ h)− f(a)

h(12.1)

135

Page 142: Vorlesungsskript zur Analysis 1 -

existiert. In diesem Fall definieren wir die Ableitung f ′(a) von f in a durch

f ′(a) = limh→0h 6=0

f(a+ h)− f(a)

h.

Ist D offen, so heißt f in D differenzierbar, falls f in jedem Punkt a ∈ D differenzier-bar ist. Weitere Schreibweisen fur die Ableitung f ′ sind df

dxund d

dxf sowie – insbesondere

falls die Variable x die Zeit symbolisiert – f .

Statt (12.1) schreibt man oft

limh→0

f(a+ h)− f(a)

h

und setzt stillschweigend voraus, dass h = 0 ausgeschlossen ist. So werden wir es imFolgenden handhaben.

Beispiel 12.2(i) f : R→ R, f(x) = x2. Fur alle a ∈ R gilt

f(a+ h)− f(a)

h=

(a+ h)2 − a2

h=

2ah+ h2

h= 2a+ h ,

alsof ′(a) = 2a .

(ii) f : R \ {0} → R, f(x) = 1/x. Fur alle a ∈ R \ {0} gilt

f(a+ h)− f(a)

h=

1a+h− 1

a

h=

a−(a+h)(a+h)a

h=

−h(a+h)a

h= − 1

(a+ h)a,

also

f ′(a) = − 1

a2.

Wir betrachten nun die Exponentialfunktion.

Lemma 12.3Im Komplexen gilt

limz→0

ez − 1

z= 1 . (12.2)

Beweis: Siehe Ubungsaufgabe. �

Zur Untersuchung der Differenzierbarkeit beschranken wir uns nun auf reelle Argumente.Aus (12.2) folgt unmittelbar, dass die Exponentialfunktion exp: R→ R in 0 differenzier-bar ist mit

exp′(0) = 1 .

Die Ableitung in einem beliebigen Punkt a ∈ R wird darauf zuruckgefuhrt. Es ist

ea+h − eah

= ea · eh − 1

h.

136

Page 143: Vorlesungsskript zur Analysis 1 -

Aus (12.2) folgt nunexp′(a) = ea .

Fur den Sinus und den Cosinus kann man ahnlich argumentieren. Wir beginnen mit derRechnung

eix − 1

ix=

cos(x) + i sin(x)− 1

ix=

1

i

cos(x)− 1

x+

sin(x)

x=

sin(x)

x+ i

1− cos(x)

x. (12.3)

Lemma 12.4Sinus und Cosinus sind in 0 differenzierbar, und es gilt

sin′(0) = 1 und cos′(0) = 0 . (12.4)

Beweis: Aus Lemma 12.3 folgt

limx→0

eix − 1

ix= 1 .

(Der Grenzwert x→ 0 ist als reeller Grenzwert gemeint, es werden also Folgen zn = ixn →0 entlang der imaginaren Achse betrachtet. Das ist ein Spezialfall des Grenzwerts (12.2),in dem beliebige Folgen zn → 0 im Komplexen betrachtet werden.) Es folgt

Re

(eix − 1

ix

)→ Re (1) = 1 , Im

(eix − 1

ix

)→ Im (1) = 0 .

Real- und Imaginarteil sind in (12.3) berechnet worden, und daraus ergeben sich dieBehauptungen. �

Die Ableitungen von Sinus und Cosinus in beliebigen Punkten a ∈ R werden mit Hilfeder Additionstheoreme auf die Ableitungen in 0 zuruckgefuhrt. Fur den Sinus gilt

sin(a+ h)− sin(a)

h=

sin(a) cos(h) + cos(a) sin(h)− sin(a)

h

= sin(a)cos(h)− 1

h+ cos(a)

sin(h)

h.

Aus (12.4) folgt nunsin′(a) = cos(a) .

Analog gilt fur den Cosinus

cos(a+ h)− cos(a)

h=

cos(a) cos(h)− sin(a) sin(h)− cos(a)

h

= cos(a)cos(h)− 1

h− sin(a)

sin(h)

h,

also wegen (12.4)cos′(a) = − sin(a) .

Als nachstes betrachten wir die Betragsfunktion f(x) = |x|. Sie ist differenzierbar in allenPunkten a 6= 0, und

f ′(a) =

{1 , a > 0 ,

−1 , a < 0 .

137

Page 144: Vorlesungsskript zur Analysis 1 -

In a = 0 ist f nicht differenzierbar, denn fur die Folge

hn = (−1)n1

n

gilt|0 + hn| − |0|

hn= (−1)n ,

also existiert der in Definition 12.1 verlangte Grenzwert nicht.

Satz 12.5Sei D ⊂ R, f : D → R und a innerer Punkt von D. Dann gilt:

(i) Ist f differenzierbar in a und setzen wir

r(h) := f(a+ h)− f(a)− f ′(a)h ,

so gilt

limh→0

r(h)

h= 0 . (12.5)

(ii) Ist c ∈ R und gilt (12.5) fur die durch

r(h) := f(a+ h)− f(a)− ch (12.6)

definierte Funktion r, so ist f differenzierbar in a und f ′(a) = c.

Beweis: Ist r durch (12.6) definiert, so gilt

r(h)

h=f(a+ h)− f(a)

h− c .

Da der Limes auf der rechten Seite existiert und gleich Null ist genau dann, wenn f in adifferenzierbar ist und f ′(a) = c gilt, folgen beide Behauptungen. �

Wir konnen die Aussage von Satz 12.5 folgendermaßen interpretieren: Die Differenz

r(x− a) = f(x)− [f(a) + f ′(a)(x− a)]

zwischen den Werten der Funktion f und ihrer Linearisierung

g(x) = f(a) + f ′(a)(x− a) (12.7)

geht fur x→ a schneller gegen 0 als die Differenz x− a. Fur die Differenz

f(x)− [f(a) + c(x− a)]

ist dies aber nicht der Fall, wenn c 6= f ′(a). Wir konnen also die Linearisierung alsdie beste affin-lineare Approximation von f in der Nahe von a interpretieren. Die Glei-chung (12.7) ist nichts anderes als die Gleichung der Tangente an den Graphen von f imPunkt (a, f(a)).

138

Page 145: Vorlesungsskript zur Analysis 1 -

Satz 12.6Sei D ⊂ R, f : D → R, a ∈ int (D). Dann gilt: Ist f differenzierbar in a, so ist f stetigin a.

Beweis: Nach Satz 12.5 gilt

limh→0

r(h)

h= 0 ,

also auchlimh→0

r(h) = 0 .

Der Grenzubergang h→ 0 auf beiden Seiten von

f(a) + f ′(a)h+ r(h) = f(a+ h)

liefert alsof(a) = lim

h→0f(a+ h) = lim

x→af(x) .

12.2 Rechenregeln

Wir befassen uns nun mit den Rechenregeln fur Ableitungen.

Satz 12.7Seien D ⊂ R, f, g : D → R, a ein innerer Punkt von D und λ ∈ R. Dann gilt: Sind f undg differenzierbar in a, so sind auch f + g, λf und fg differenzierbar in a, und es gelten

(f + g)′(a) = f ′(a) + g′(a) , (λf)′(a) = λf ′(a) , (12.8)

sowie die Produktregel

(fg)′(a) = f ′(a)g(a) + f(a)g′(a) . (12.9)

Ist außerdem g(a) 6= 0, so ist auch f/g in a differenzierbar, und es gilt die Quotienten-regel (

f

g

)′(a) =

g(a)f ′(a)− f(a)g′(a)

(g(a))2.

Beweis: Wegen

(f + g)(a+ h)− (f + g)(a)

h=f(a+ h)− f(a)

h+g(a+ h)− g(a)

h,

(λf)(a+ h)− (λf)(a)

h= λ

f(a+ h)− f(a)

h,

folgt (12.8) aus den entsprechenden Grenzwertsatzen fur Folgen. Zum Beweis der Pro-duktregel betrachten wir

(fg)(a+ h)− (fg)(a)

h= f(a+ h)

g(a+ h)− g(a)

h+ g(a)

f(a+ h)− f(a)

h. (12.12)

139

Page 146: Vorlesungsskript zur Analysis 1 -

Da limh→0 f(a + h) = f(a) nach Satz 12.6, folgt (12.9) durch Grenzubergang h → 0in (12.12). Zum Beweis der Quotientenregel bemerken wir zunachst, dass wegen Satz 12.6und Folgerung 10.18 fur ein hinreichend kleines δ > 0

g(x) 6= 0

fur alle x ∈ D mit |x− a| < δ gilt. Wir betrachten nun den Spezialfall f = 1. Ist |h| < δund a+ h ∈ D, so gilt

1

h

(1

g(a+ h)− 1

g(a)

)= − 1

g(a+ h)g(a)· g(a+ h)− g(a)

h.

Der Grenzubergang h→ 0 liefert

(1

g

)′(a) = − g′(a)

(g(a))2. (12.13)

Ist nun f beliebig, so folgt aus (12.13) und der Produktregel

(f

g

)′(a) =

(f · 1

g

)′(a) = f ′(a)

1

g(a)+ f(a)

−g′(a)

(g(a))2=g(a)f ′(a)− f(a)g′(a)

(g(a))2.

Gleichung (12.8) zeigt, dass Differenzieren auf dem Raum der differenzierbaren Funktio-nen betrachtet eine lineare Operation ist. Das

”Objekt“, das differenzierbare Funktionen

als Eingabe nimmt und deren Ableitung ausgibt, nennt man Differentialoperator. Glei-chung (12.8) besagt also, dass der Differentialoperator linear ist.

Beispiel 12.8(i) (Summenregel) Sei f : R→ R, f(x) = 3 sin(x)− 4ex. Dann gilt fur jedes a ∈ R

f ′(a) = 3 cos(a)− 4ea .

(ii) (Produktregel) Sei fn : R→ R, fn(x) = xn, n ∈ N \ {0}. Dann gilt

f ′n(a) = nan−1 . (12.14)

Beweis durch Induktion. Der Induktionsanfang n = 1 ist klar, zum Induktionsschrittn→ n+ 1:

f ′n+1(a) = (f1fn)′(a) = f ′1(a)fn(a) + f1(a)f ′n(a) = 1 · an + a · nan−1 = (n+ 1)an .

(iii) (Quotientenregel) f : R \ {0} → R, f(x) = x−n, n ∈ N>0. Dann gilt

f ′(a) = −na−n−1 .

Wir wenden (12.14) und die Quotientenregel auf die Funktion x 7→ 1/xn an. Es folgt

f ′(a) =−nan−1

a2n= −na−n−1 .

140

Page 147: Vorlesungsskript zur Analysis 1 -

(iv) (Quotientenregel) f(x) = tan(x) = sin(x)cos(x)

. Es gilt

f ′(a) =cos(a) cos(a)− sin(a) · (− sin(a))

cos2(a)=

1

cos2(a). (12.15)

In a = π gilt tan(π) = 0−1

= 0 und tan′(π) = 1(−1)2

= 1.

Die Ableitung einer zusammengesetzten Funktion ergibt sich aus den einzelnen Ableitun-gen gemaß der sogenannten Kettenregel.

Satz 12.9 (Kettenregel)Seien D,E ⊂ R, f : D → R, f(D) ⊂ E, g : E → R, a ∈ int (D) und f(a) ∈ int (E). Sindf in a und g in f(a) differenzierbar, so ist auch g ◦ f in a differenzierbar, und es gilt

(g ◦ f)′(a) = g′(f(a))f ′(a) .

Beweis: Das naheliegende Argument,

g(f(x))− g(f(a))

x− a =g(f(x))− g(f(a))

f(x)− f(a)· f(x)− f(a)

x− azu betrachten und in den beiden Bruchen auf der rechten Seite einzeln zum Grenzwertuberzugehen, bereitet Schwierigkeiten, wenn f(x) = f(a) ist. Wir umgehen dieses Pro-blem, indem wir definieren

d(y) =

{g(y)−g(f(a))y−f(a)

, y 6= f(a) ,

g′(f(a)) , y = f(a) .

Es gilt dann fur alle x ∈ D mit x 6= a

g(f(x))− g(f(a))

x− a = d(f(x))f(x)− f(a)

x− a . (12.17)

Nach Definition von d gilt, da g in f(a) differenzierbar ist,

limy→f(a)

d(y) = g′(f(a)) ,

also folgt, da f stetig in a ist,

limx→a

d(f(x)) = g′(f(a)) .

Die Behauptung folgt nun durch Grenzubergang x→ a in (12.17). �

Beispiel 12.10(i) Wir betrachten f : (0,∞)→ R, f(x) = xc mit c 6= 0 fest. Es ist

f(x) = exp(c ln(x)) ,

also also (wir benutzen ln′(x) = 1/x fur x > 0, was gleich in (12.19) gezeigt wird)

f ′(x) = exp(c ln(x)) · cx

= xcc

x= cxc−1 .

141

Page 148: Vorlesungsskript zur Analysis 1 -

(ii) Wir betrachten f : (0,∞)→ R, f(x) = cx, wieder mit c > 0 fest. Es ist

f(x) = exp(x ln(c)) ,

alsof ′(x) = exp(x ln(c)) · ln(c) = cx ln(c) .

Die Ableitung einer Umkehrfunktion lasst sich auf die Ableitung der ursprunglichen Funk-tion zuruckfuhren. Das erkennt man, indem man die Tangentensteigungen am Graphenvon Funktion und Umkehrfunktion betrachtet. Die zugehorige Formel kann man aus derKettenregel erhalten. Wenn wir annehmen, dass f und f−1 differenzierbar sind, so folgtaus

f(f−1(y)) = y

durch Differenzieren beider Seiten

f ′(f−1(y)) · (f−1)′(y) = 1 ,

und damit

(f−1)′(y) =1

f ′(f−1(y)). (12.18)

Analysiert man die Situation genauer, so stellt es sich heraus, dass man nicht vorauszuset-zen braucht, dass f−1 differenzierbar ist; dies ergibt sich bereits aus der Differenzierbarkeitvon f .

Satz 12.11 (Ableitung einer Umkehrfunktion)Seien [a, b] ⊂ R, f : [a, b] → R stetig und streng monoton, und f differenzierbar inx ∈ (a, b) mit f ′(x) 6= 0. Dann ist die Umkehrfunktion f−1 : f([a, b]) → R in y = f(x)differenzierbar, und es gilt (12.18).

Beweis: Sei (hn) eine beliebige Folge mit hn 6= 0, n ∈ N, und hn → 0. Der Punkt y = f(x)liegt wegen der strengen Monotonie von f im Innern des Intervalls f([a, b]). Damit folgty + hn ∈ f([a, b]) fur alle hinreichend großen n. Wir konnen annehmen, dass dies fur allen ∈ N gilt. Wir setzen

xn = f−1(y + hn) .

Da f−1 stetig und streng monoton ist nach Satz 10.30, gilt

xn = f−1(y + hn)→ f−1(y) = x , xn 6= x ∀n ∈ N ,

undf−1(y + hn)− f−1(y)

hn=

xn − xf(xn)− f(x)

=1

f(xn)−f(x)xn−x

,

also

limn→∞

f−1(y + hn)− f−1(y)

hn=

1

f ′(x).

142

Page 149: Vorlesungsskript zur Analysis 1 -

Beispiel 12.12(i) Sei f : R → R, f(x) = x3. Fur x 6= 0 gilt f ′(x) = 3x2 6= 0, und Satz 12.11 ist

anwendbar. Es ist f(R) = R, und

f−1(y) =

3√y , y > 0 ,

− 3√−y , y < 0 ,

0 , y = 0 .

Gemaß (12.18) folgt fur y > 0

(f−1)′(y) =1

f ′(f−1(y))=

1

f ′( 3√y)

=1

3( 3√y)2

=1

3y−2/3 .

In y = 0 ist f−1 nicht differenzierbar: Fur hn → 0 mit hn 6= 0 gilt

f−1(0 + hn)− f−1(0)

hn=

3√|hn||hn|

=1

( 3√|hn|)2

,

und der rechts stehende Bruch konvergiert nicht gegen eine reelle Zahl (sondernuneigentlich gegen ∞).

(ii) Fur ln : (0,∞)→ R folgt aus Satz 12.11

(ln)′(y) =1

(exp)′(ln(y))=

1

exp(ln(y))=

1

y. (12.19)

Damit sieht man leicht, dass ln(|x|)′ = 1x

fur x 6= 0 gilt.

Damit sind wir in der Lage, eine wichtige Charakterisierung der Exponentialfunktion zubeweisen, die wir zu Beginn von Kapitel 11 schon angegeben hatten.

Folgerung 12.13Es gilt fur alle x ∈ R

limn→∞

(1 +

x

n

)n= ex .

Beweis: Fur x = 0 sind beide Seiten gleich 1. Fur x 6= 0 gilt

ln((

1 +x

n

)n)= n ln

(1 +

x

n

)= x · ln

(1 + x

n

)− ln(1)

xn

,

alsolimn→∞

ln((

1 +x

n

)n)= x · (ln)′(1) = x ,

also wegen der Stetigkeit der Exponentialfunktion (Satz 11.11)

ex = exp(x) = exp(

limn→∞

ln((

1 +x

n

)n))= lim

n→∞exp

(ln((

1 +x

n

)n))

= limn→∞

(1 +

x

n

)n.

143

Page 150: Vorlesungsskript zur Analysis 1 -

12.3 Eigenschaften differenzierbarer Funktionen

Definition 12.14 (Lokales und globales Extremum)Sei D ⊂ R, f : D → R. Ein x ∈ D heißt lokales Maximum (bzw. lokales Minimum)von f in D, falls es ein ε > 0 gibt mit

f(x) ≥ f(y) fur alle y ∈ D mit |y − x| < ε (12.20)

bzw.f(x) ≤ f(y) fur alle y ∈ D mit |y − x| < ε.

Ein x ∈ D heißt lokales Extremum von f in D, wenn x lokales Maximum oder lokalesMinimum von f in D ist. Ein x0 ∈ D heißt globales Maximum (bzw. globales Mi-nimum) von f in D, falls f(x) ≤ f(x0) (bzw. f(x) ≥ f(x0)) fur alle x ∈ D gilt. Einglobales Extremum ist ein globales Minimum oder ein globales Maximum.

Satz 12.15Sei a < b, f : (a, b) → R. Ist x ∈ (a, b) lokales Extremum von f in (a, b), und ist fdifferenzierbar in x, so gilt

f ′(x) = 0 .

Beweis: Sei x ein lokales Maximum und sei ε so gewahlt, dass (12.20) gilt mit D = (a, b)und (x− ε, x+ ε) ⊂ (a, b). Dann gilt fur alle n > ε−1

f(x+ 1n)− f(x)1n

≤ 0 ,

f(x− 1n)− f(x)

− 1n

≥ 0 .

Der Grenzubergang n → ∞ liefert f ′(x) ≤ 0 und f ′(x) ≥ 0, also f ′(x) = 0. Die Argu-mentation fur ein lokales Minimum verlauft analog. �

Die Umkehrung von Satz 12.15 gilt nicht. Zum Beispiel: Fur f(x) = x3 gilt f ′(0) = 0,aber 0 ist kein lokales Extremum.

a bx

Abbildung 12.1: Zum Satz von Rolle.

Der nachste Satz ist intuitiv einleuchtend, siehe Abb 12.1, hat aber weitreichende Konse-quenzen.

144

Page 151: Vorlesungsskript zur Analysis 1 -

Satz 12.16 (Satz von Rolle)Seien a < b, f stetig in [a, b] und differenzierbar in (a, b). Ist f(a) = f(b), so gibt es einx ∈ (a, b) mit f ′(x) = 0.

Beweis: Nach Satz 10.17 hat f in [a, b] eine Maximalstelle xmax und eine Minimalstellexmin. Ist f nicht konstant (andernfalls ist die Behauptung trivialerweise richtig), so giltf(xmax) > f(xmin), und mindestens einer der beiden Punkte xmax oder xmin muss in (a, b)liegen. Bezeichnen wir diesen Punkt als x, so gilt f ′(x) = 0 nach Satz 12.15. �

Satz 12.17 (Verallgemeinerter Mittelwertsatz)Seien f und g stetig in [a, b] und differenzierbar in (a, b), und ferner g′(x) 6= 0 fur allex ∈ (a, b). Dann ist g(a) 6= g(b), und es gibt ein ξ ∈ (a, b) mit

f(b)− f(a)

g(b)− g(a)=f ′(ξ)

g′(ξ).

Beweis: Angenommen, es gelte g(a) = g(b). Dann folgt nach Satz 12.16, dass g′(x) = 0fur mindestens ein x ∈ (a, b), im Widerspruch zur Voraussetzung. Es ist also g(a) 6= g(b).Wir definieren F : [a, b]→ R durch

F (x) = f(x)− f(b)− f(a)

g(b)− g(a)(g(x)− g(a)) .

Es ist F (a) = f(a) = F (b). Nach dem Satz von Rolle gibt es ein ξ ∈ (a, b) mit

0 = F ′(ξ) = f ′(ξ)− f(b)− f(a)

g(b)− g(a)g′(ξ) ,

woraus Satz 12.17 folgt. �

Hier ist ein Trommelwirbel angebracht. Der nachste Satz ist die Grundlage fur eine Reihezentraler Aussagen. Die Differentialrechnung taucht im Namen auf, weil wir auch nocheinen Mittelwertsatz der Integralrechnung kennenlernen werden (Satz 14.18).

Folgerung 12.18 (Mittelwertsatz der Differentialrechnung)Sei f stetig in [a, b] und differenzierbar in (a, b). Dann gibt es ein ξ ∈ (a, b) mit

f(b)− f(a)

b− a = f ′(ξ) .

Beweis: Dies folgt direkt aus Satz 12.17 mit der Wahl g(x) = x. �

Anschaulich sagt der Mittelwertsatz aus, dass es (mindestens) einen Punkt ξ gibt, dessenAbleitung f ′(ξ) gleich der Sekante durch (a, f(a)) und (b, f(b)) ist. Es kann durchausmehrere solcher Punkte geben, siehe Abb. 12.2.

Folgerung 12.19Sei f stetig in [a, b] und differenzierbar in (a, b), und

m := infξ∈(a,b)

f ′(ξ) , M := supξ∈(a,b)

f ′(ξ) .

Dann giltm(y − x) ≤ f(y)− f(x) ≤M(y − x) (12.21)

fur alle x, y ∈ [a, b] mit x ≤ y.

145

Page 152: Vorlesungsskript zur Analysis 1 -

a bξ a bξ1 ξ2

Abbildung 12.2: Illustration des Mittelwertsatzes der Differentialrechnung.

Beweis: Dies folgt durch Anwendung von Satz 12.18 auf das Teilintervall [x, y] von [a, b].�

Folgerung 12.20Sei f stetig in [a, b] und differenzierbar in (a, b), und sei f ′(x) = 0 fur alle x ∈ (a, b).Dann ist f konstant.

Beweis: Dies folgt aus (12.21) wegen m = M = 0. �

Mit Hilfe der Ableitung kann man oft feststellen, ob Funktionen monoton sind. Der fol-gende Satz erweist sich dazu als außerordentlich praktisch.

Satz 12.21 (Monotoniekriterium)Sei f differenzierbar in (a, b). Dann gilt:

(i) f ′(x) ≥ 0 fur alle x ∈ (a, b) ⇔ f ist monoton wachsend auf (a, b).

(ii) f ′(x) > 0 fur alle x ∈ (a, b) ⇒ f ist streng monoton wachsend auf (a, b).

(iii) f ′(x) ≤ 0 fur alle x ∈ (a, b) ⇔ f ist monoton fallend auf (a, b).

(iv) f ′(x) < 0 fur alle x ∈ (a, b) ⇒ f ist streng monoton fallend auf (a, b).

Ist f außerdem stetig auf [a, b], so gelten die rechts stehenden Aussagen auf dem Intervall[a, b].

Beweis: Wir beweisen nur Behauptung (i), die anderen Aussagen folgen ganz ahnlich.“⇒”: Sei a < x < y < b, dann existiert nach dem Mittelwertsatz 12.18 ein ξ ∈ (x, y) mit

f(y)− f(x) = f ′(ξ)(y − x) ≥ 0 .

“⇐”: Angenommen, es gilt x ∈ (a, b) mit f ′(x) < 0. Dann ist fur hinreichend kleinesh > 0 auch

f(x+ h)− f(x)

h< 0 ,

146

Page 153: Vorlesungsskript zur Analysis 1 -

also f(x+ h) < f(x), also ist f nicht monoton wachsend im Widerspruch zur Annahme.

Ist f stetig auf [a, b] und streng monoton wachsend auf (a, b), dann ist f auch strengmonoton wachsend auf [a, b]. Ist namlich a < x < b, so gilt fur a < x1 < x < x2 < b undn ∈ N groß genug

f

(a+

1

n

)< f(x1) < f(x) < f(x2) < f

(b− 1

n

).

Im Limes n→∞ ergibt sich f(a) ≤ f(x1) < f(x) ≤ f(x2) ≤ f(b). �

Das Beispiel f : (−1, 1) → R, x 7→ x3 zeigt, dass die umgekehrte Implikation in (ii) (unddamit auch in (iv)) nicht gultig sein kann: f ist zwar streng monoton wachsend ist, aberes gilt f ′(0) = 0.

Satz 12.22 (Globale Invertierbarkeit)Seien [a, b] ⊂ R, f : [a, b] → R stetig, und f stetig differenzierbar in (a, b) mit f ′(x) 6= 0fur alle x ∈ (a, b). Dann ist f invertierbar, und die Umkehrfunktion f−1 : f([a, b])→ [a, b]ist ebenfalls stetig und stetig differenzierbar in f((a, b)) mit

(f−1)′(y) =1

f ′(f−1(y)).

Beweis: Dies folgt direkt aus der Kombination der Satze 12.21 und 12.11; dass die Ablei-tung der Umkehrfunktion ebenfalls stetig ist, ist leicht zu sehen. �

Wir formulieren zum Abschluss dieses Abschnitts noch einen”lokalen Umkehrsatz“, des-

sen Ausweitung auf Funktionen im Mehrdimensionalen ein zentrales Thema in Analysis 2sein wird.

Satz 12.23 (Lokale Invertierbarkeit)Seien [a, b] ⊂ R, f : [a, b] → R stetig. Sei weiter f stetig differenzierbar in (a, b). Istx ∈ (a, b) mit f ′(x) 6= 0, so ist die Einschrankung f : Iδ → R, Iδ = (x − δ, x + δ), furhinreichend kleines δ > 0 streng monoton und damit, aufgefasst als Abbildung

f : Iδ → f(Iδ) ,

bijektiv. Die Umkehrabbildung f−1 : f(Iδ)→ Iδ ist ebenfalls stetig differenzierbar.

Beweis: Ubung.

12.4 Umkehrfunktionen der trigonometrischen Funktionen

Wir betrachten zunachst den Sinus. Es gilt

sin(−π

2

)= −1 , sin

(π2

)= 1 , sin′(x) = cos(x) > 0 fur alle x ∈

(−π

2,π

2

).

Also ist sin : [−π2, π

2]→ [−1, 1] stetig, streng monoton wachsend (dies folgt aus Satz 12.21)

und bijektiv. Die Umkehrfunktion heißt Arcus-Sinus,

arcsin : [−1, 1]→[−π

2,π

2

],

147

Page 154: Vorlesungsskript zur Analysis 1 -

und ist ebenfalls stetig und streng monoton wachsend. Die Ableitung des Arcus-Sinusfur x ∈ (−1, 1) errechnet sich als

(arcsin)′(x) =1

cos(arcsin(x))=

1√1− sin2(arcsin(x))

=1√

1− x2;

siehe Abb. 12.3.

Analog erhalt man, dass cos : [0, π] → [−1, 1] streng monoton fallend ist. Die Umkehr-funktion heißt Arcus-Cosinus,

arccos : [−1, 1]→ [0, π] ;

sie ist ebenfalls stetig und streng monoton fallend. Ihre Ableitung in (−1, 1) ist

(arccos)′(x) = − 1

sin(arccos(x))= − 1√

1− cos2(arccos(x))= − 1√

1− x2.

Die Ableitung der Tangens hatten wir in (12.15) bestimmt. Wegen

(tan)′(x) =1

cos2(x)> 0 , fur alle x ∈

(−π

2,π

2

)

erhalten wir, dass tan: (−π2, π

2) → R stetig, streng monoton wachsend und bijektiv ist.

Die Umkehrfunktionarctan: R→

(−π

2,π

2

)

heißt Arcus-Tangens, und wegen

1

cos2(y)=

sin2(y) + cos2(y)

cos2(y)= tan2(y) + 1

gilt

(arctan)′(x) = cos2(arctan(x)) =1

1 + tan2(arctan(x))=

1

1 + x2.

-1.0 -0.5 0.5 1.0

-1.5

-1.0

-0.5

0.5

1.0

1.5

-1.0 -0.5 0.5 1.0

0.5

1.0

1.5

2.0

2.5

3.0

-20 -10 10 20

-1.5

-1.0

-0.5

0.5

1.0

1.5

Abbildung 12.3: Die trigonometrischen Umkehrfunktionen arcsin (links), arccos (Mitte)und arctan (rechts).

148

Page 155: Vorlesungsskript zur Analysis 1 -

12.5 Hohere Ableitungen

Ist f : (a, b) → R differenzierbar auf (a, b), so konnen wir in jedem Punkt x ∈ (a, b) dieAbleitung f ′(x) betrachten. Dadurch erhalten wir eine Funktion

f ′ : (a, b)→ R .

Ist f ′ : (a, b) → R ebenfalls differenzierbar auf (a, b), so konnen wir deren Ableitung(f ′)′ : (a, b)→ R betrachten. Sie heißt die zweite Ableitung von f auf (a, b), wir schrei-ben f ′′ statt (f ′)′. Diesen Prozess konnen wir iterieren, sofern die erhaltene Funktiondifferenzierbar ist. Allgemein ist die n-te Ableitung f (n) einer Funktion f : (a, b) → Rinduktiv definiert als die Ableitung der (n − 1)-ten Ableitung f (n−1) von f , sofern dieseexistiert.

Als Beispiel betrachten wir

f(x) = x2 , f ′(x) = 2x , f ′′(x) = 2 , f (3)(x) = 0 ,

alle weiteren Ableitungen sind ebenfalls gleich Null. Weitere Beispiele sind

f(x) = ex , f ′(x) = ex , f (n)(x) = ex fur alle n,

sowie

f(x) = sin(x) , f ′(x) = cos(x) , f ′′(x) = − sin(x) , f ′′′(x) = − cos(x) , f (4)(x) = sin(x) .

Eine auf (a, b) differenzierbare Funktion f heißt stetig differenzierbar auf (a, b), fallsdie Ableitung f ′ : (a, b) → R stetig ist. Zu beachten ist, dass stetige Differenzierbarkeitein strengerer Begriff als Differenzierbarkeit ist, da es Funktionen gibt, die differenzierbarsind, deren Ableitung jedoch nicht stetig ist. Ein Beispiel ist

f(x) =

{x2 sin

(1x

), x 6= 0 ,

0 , x = 0 ,, (12.22)

siehe Abb. 12.4. Fur x 6= 0 ergeben die Ableitungsregeln

f ′(x) = 2x sin

(1

x

)− cos

(1

x

), (x 6= 0) ;

fur den Nullpunkt ergibt sich

f(h)− f(0)

h= h sin

(1

h

)→ 0 ,

also f ′(0) = 0. Die Ableitung ist aber in 0 unstetig, da f ′ keinen Grenzwert fur x → 0besitzt.

Existiert die zweite Ableitung f ′′ : (a, b) → R, so ist f ′ stetig, da jede differenzierbareFunktion stetig ist. Entsprechend folgt, dass f (k) : (a, b)→ R stetig ist fur alle k < n, fallsf (n) : (a, b)→ R existiert.

Mit Hilfe der zweiten Ableitung kann man lokale Extrema zusatzlich charakterisieren.

149

Page 156: Vorlesungsskript zur Analysis 1 -

-0.4 -0.2 0.2 0.4

-0.10

-0.05

0.05

0.10

-0.4 -0.2 0.2 0.4

-1.0

-0.5

0.5

1.0

Abbildung 12.4: Links die Funktion in (12.22) und rechts ihre Ableitung.

Satz 12.24Sei f : (a, b)→ R zweimal stetig differenzierbar, und sei x ∈ (a, b).

(i) Ist x ein lokales Minimum, so gilt f ′′(x) ≥ 0. Ist x ein lokales Maximum, so giltf ′′(x) ≤ 0.

(ii) Gilt f ′(x) = 0 und f ′′(x) > 0 (f ′′(x) < 0), und ist f ′′ stetig in x, so ist x ein strikteslokales Minimum (striktes lokales Maximum); dies bedeutet, dass f(x + h) > f(x)(f(x+ h) < f(x)) gilt, falls |h| hinreichend klein ist, fur h 6= 0.

Beweis: Wir zeigen die Aussagen fur das Minimum, die Aussagen fur das Maximum folgendaraus durch Ubergang zu −f .

Zu (i): Sei ε > 0 so gewahlt, dass f(x + h) ≥ f(x) fur alle h mit |h| < ε gilt. Sei hn → 0mit 0 < hn < ε fur alle n. Gemaß dem Mittelwertsatz 12.18 gibt es ein tn ∈ (x, x + hn)mit

0 ≤ f(x+ hn)− f(x) = f ′(tn)hn = (f ′(tn)− f ′(x))hn ,

da f ′(x) = 0. Wegen hn > 0 folgt f ′(tn) − f ′(x) ≥ 0. Nun erhalten wir wegen tn > x,tn → x und der Differenzierbarkeit von f ′ in x:

0 ≤ f ′(tn)− f ′(x)

tn − x→ f ′′(x).

Dies zeigt f ′′(x) ≥ 0.

Zu(ii): Nach Satz 10.18 gibt es ein δ > 0, so dass f ′′(t) > 0 fur alle t ∈ (x− δ, x+ δ). DieFunktion f ′ ist daher streng monoton wachsend auf (x − δ, x + δ), und es folgt f ′(t) >f ′(x) = 0 fur t > x und f ′(t) < f ′(x) = 0 fur t < x. Ist nun h 6= 0 mit |h| < δ, so giltnach dem Mittelwertsatz

f(x+ h)− f(x) = f ′(t)h

mit einem geeigneten t zwischen x und x + h. Da f ′(t)h > 0 gilt fur alle h 6= 0, |h| < δ,folgt die Behauptung. �

Die nun besprochene Regel von de l’Hospital kann bei der Berechnung von Grenzwertensehr hilfreich sein.

150

Page 157: Vorlesungsskript zur Analysis 1 -

Satz 12.25 (Satz von de l’Hospital)Seien f und g stetig auf [a, b] und differenzierbar in (a, b). Sei x ∈ (a, b) mit f(x) =g(x) = 0, und g′(ξ) 6= 0 fur alle ξ ∈ (a, b) mit ξ 6= x. Dann gilt: Falls der Grenzwert

limξ→x

f ′(ξ)

g′(ξ)

existiert, so existiert auch der Grenzwert

limξ→x

f(ξ)

g(ξ),

und es gilt

limξ→x

f(ξ)

g(ξ)= lim

ξ→x

f ′(ξ)

g′(ξ). (12.23)

Beweis: Sei (xn) eine beliebige Folge in (a, b) mit xn → x und xn 6= x fur alle n. Wieim Beweis des verallgemeinerten Mittelwertsatzes 12.17 folgt g(xn) 6= g(x) = 0 fur alle n.Nach Satz 12.17 gibt es fur alle n ein ξn zwischen x und xn mit

f(xn)

g(xn)=f(xn)− f(x)

g(xn)− g(x)=f ′(ξn)

g′(ξn). (12.25)

Aus xn → x folgt ξn → x, da |ξn − x| ≤ |xn − x|. Weil der Grenzwert der rechten Seitevon (12.25) nach Annahme existiert, konnen wir in dieser Identitat zum limes ubergehenund erhalten

limn→∞

f(xn)

g(xn)= lim

n→∞

f ′(ξn)

g′(ξn)

Da die Folge (xn) beliebig war, folgt die Behauptung. �

Man beachte die logische Reihenfolge: Weil der Grenzwert der Ableitung existiert, darfman uberhaupt erst Gleichung (12.23) schreiben.

Beispiel 12.26(i)

limx→0

sin(x)

x= lim

x→0

cos(x)

1=

cos(0)

1= 1 .

(ii) Wir berechnen

limx→0

(1

sin(x)− 1

x

).

Es ist1

sin(x)− 1

x=f(x)

g(x)

mitf(x) = x− sin(x) , g(x) = x sin(x) , f(0) = g(0) = 0 .

Es giltf ′(x)

g′(x)=

1− cos(x)

sin(x) + x cos(x), f ′(0) = g′(0) = 0 ,

151

Page 158: Vorlesungsskript zur Analysis 1 -

und weiter

f ′′(x)

g′′(x)=

sin(x)

2 cos(x)− x sin(x), f ′′(0) = 0 , g′′(0) = 2 .

Wir konnen also Satz 12.25 zweimal anwenden und erhalten

0 = limx→0

f ′′(x)

g′′(x)= lim

x→0

f ′(x)

g′(x)= lim

x→0

f(x)

g(x).

-5 5

-10

-5

5

10

sin

T4

T8

T16

Abbildung 12.5: Einige Taylorpolynome fur den Sinus mit dem Ursprung als Entwick-lungspunkt.

Als Vorbereitung auf Kapitel 16 fuhren wir jetzt Polynome ein, die in bestimmter Weiseaus Ableitungen einer gegebenen Funktion f aufgebaut sind.

Definition 12.27 (Taylorpolynom)Sei I ⊂ R offenes Intervall, f ∈ Cn(I) und a ∈ I. Dann heißt das durch

Tnf(x; a) =n∑

k=0

f (k)(a)

k!(x− a)k

definierte Polynom das n-te Taylorpolynom (oder Taylorpolynom vom Grad n)von f in a. Man bexeichnet a als Entwicklungspunkt des Taylorpolynoms.

Wir werden uns in Kapitel 16 ausfuhrlich mit Taylorpolynomen und ihren unendlichenVerwandten, den Taylorreihen, beschaftigen. Insbesondere werden wir dort in Satz 16.9sehen, dass Taylorpolynome die zugrundeliegende Funktion f ∈ Cn+1(I) approximieren.Betrachtet man namlich das Taylorpolynom fur f ∈ Cn+1(I) in einem Punkt a ∈ I, sogilt

f(x) = Tnf(x; a) +Rn+1(x) ,

wobei Rn+1 ein”kleines“ Restglied ist (dies wird in Satz 16.9 prazise gemacht). Dies

ist eine ganz erstaunliches Resultat: Das Taylorpolynom ist”lokal“, denn es nutzt nur

Information von f in a, namlich f(a), f ′(a), . . . , f (k)(a). Daraus gewinnt es eine gute

”globale“ Approximation der Funktion f , also eine auf dem ganzen Definitionsbereich

152

Page 159: Vorlesungsskript zur Analysis 1 -

geltende Approximation. Das wird in Kapitel 16 bewiesen. Als Vorgeschmack zeigen wirhier schon einmal in Abb. 12.5 ein Beispiel dieser erstaunlichen und extrem nutzlichenTheorie, namlich einige Taylorpolynome fur f = sin und a = 0. Da T1f schlichtweg dieschon in Abschnitt 8.1 gezeichnete Tangente an f im Punkt (a, f(a)) ist, konnen dieTaylorpolynome als verbesserte polynomiale Approximation an f interpretiert werden.

12.6 Konvexe Funktionen

Definition 12.28 (Konvexe Funktion)Seit D ⊂ R ein offenes Intervall. Eine Funktion f : D → R heißt konvex, wenn

f(λx+ (1− λ)y) ≤ λf(x) + (1− λ)f(y) (12.26)

fur alle x, y ∈ D und alle λ ∈ [0, 1]. Man nennt f konkav, wenn −f konvex ist.

Anschaulich bedeutet (12.26), dass zwischen zwei Punkten x und y der Graph der Funk-tion unter der Sekante durch (x, f(x) und (y, f(y) verlauft, siehe Abb. 12.6.

f(x)

a x1 λx1 + (1− λ)x2 x2 b

f(λx1 + (1− λ)x2)

λf(x1) + (1− λ)f(x2)

x

y

Abbildung 12.6: Eine konvexe Funktion und die Sekante durch (x, f(x) und (y, f(y).

Differenzierbare konvexe Funktionen lassen sich durch ihre Ableitungen elegant charakte-risieren.

Satz 12.29Sei f : [a, b]→ R stetig und auf (a, b) differenzierbar. Dann sind aquivalent:

(i) Die Funktion f ist konvex.

(ii) Die Ableitung f ′ ist monoton wachsend auf (a, b).

(iii) Zu jedem x ∈ (a, b) gilt

f(y)− f(x) ≥ f ′(x)(y − x) ∀ y ∈ [a, b]. (12.27)

Dies bedeutet, dass in jedem Punkt x die Tangente an (x, f(x)) unterhalb des Gra-phen von f verlauft.

153

Page 160: Vorlesungsskript zur Analysis 1 -

Falls f auf (a, b) zweimal differenzierbar ist, so sind (i)–(iii) aquivalent zu

(iv) Fur alle x ∈ (a, b) gilt f ′′(x) ≥ 0.

Beweis: (i) ⇒ (iii): Sei f konvex. Dann folgt fur 0 < t ≤ 1:

f(x+ t(y − x)) = f((1− t)x+ ty) ≤ (1− t)f(x) + tf(y) .

Somit gilt

f(y)− f(x) ≥ f(x+ t(y − x))− f(x)

t=f(x+ t(y − x))− f(x)

t(y − x)· (y − x)→ f ′(x)(y − x)

fur t→ 0.

(ii) ⇒ (i): Sei x0 < x < x1 ∈ [a, b]. Wir setzen t := x−x0x1−x0 ; dann gilt x = (1 − t)x0 + tx1.

Nach dem Mittelwertsatz 12.18 gibt es ein ξ0 ∈ (x0, x) und ein ξ1 ∈ (x, x1) mit

f ′(ξ0) =f(x)− f(x0)

x− x0

und f ′(ξ1) =f(x1)− f(x)

x1 − x.

Nach Voraussetzung ist f ′(ξ0) ≤ f ′(ξ1). Damit ergibt sich

f(x) ≤ f(x0) + t(f(x1)− f(x0)) = (1− t)f(x0) + tf(x0) ,

also ist f konvex.

(iii) ⇒ (ii): Wir wenden (12.27) mit y = x1 und x = x0 an und erhalten

f ′(x0) ≤ f(x1)− f(x0)

x1 − x0

.

Wenden wir hingegen (12.27) mit y = x0 und x = x1 an, so ergibt sich

f(x1)− f(x0)

x1 − x0

≤ f ′(x1) .

Beide Ungleichungen zusammen ergeben f ′(x0) ≤ f ′(x1).

Behauptung (iv) ist unter der Annahme der zweimaligen Differenzierbarkeit nach demMonotoniekriterium 12.21 (i) aquivalent zu (ii). �

12.7 Schlussbemerkung: Nicht differenzierbare Funktionen

Stetigkeit ist ein naturliches Konzept: Kleines Wackeln am Input erzeugt (lediglich) kleinesWackeln des Outputs. Differenzierbarkeit ist als Konzept in gewisser Weise subtiler. DieSchwierigkeit ist, dass die Funktionen, mit denen wir aus der Schule vertraut sind, alledifferenzierbar sind, eventuell mit endlich vielen Ausnahmestellen (wie der Ursprung beider Betragsfunktion |x|). Aber gibt es stetige Funktionen, die nirgendwo differenzierbarsind?

154

Page 161: Vorlesungsskript zur Analysis 1 -

Abbildung 12.7: Simulation von Pfaden Brownscher Bewegung.

Dem ist so, und wir werden ein Beispiel in den Ubungen sehen. Ein weiteres Beispielsind die in Abschnitt 3.6.1 erwahnten raumfullenden Kurven. In der Wahrscheinlichkeits-theorie schließlich sind stetige Kurven, die (

”fast uberall“, ein in hoheren Vorlesungen

eingefuhrter Begriff, der aber im wesentlichen das liefert, was man erwartet) nicht diffe-renzierbar sind: Sogenannte Brownsche Bewegungen, die unter anderem die Bewegung vonGasblasen in Flussigkeiten, etwa einem Glas Milch, beschreiben. Dabei wird eine Gasblasewird standig von Flussigkeitsmolekulen angestoßen und bewegt sich daher, unter dem Mi-kroskop sichtbar, hochst irregular. (Diese Entdeckung machte der schottische BotanikerRobert Brown fur Pollen in Wasser. Er fand die beobachtete Bewegung so erstaunlich,dass er zunachst dachte, die Pollen waren lebendig, was er aber spater widerlegen konnte.Einstein entwickelte 1905 eine bahnbrechende Theorie fur dieses Phanomen.) Simulatio-nen von Pfaden Brownscher Bewegung sind in Abb. 12.7 gezeigt; fur uns reicht es zusehen, dass diese Pfade sehr nichtdifferenzierbar aussehen. In Vorlesungen uber Wahr-scheinlichkeitstheorie konnen wir mehr daruber lernen. Aber die Brownsche Bewegung,gerade da sie aus Anwendungswissenschaften stammt, zeigt, dass Differenzierbarkeit nichtquasi immer gegeben ist, sondern eine echte Qualitat einer Funktion darstellt.

155

Page 162: Vorlesungsskript zur Analysis 1 -

13 Folgen von Funktionen

13.1 Punktweise Konvergenz

Folgen sind in Definition 8.1 allgemein definiert als Abbildungen von N in irgendeineMenge M . Bisher haben wir uns auf Zahlenfolgen mit M = N, M = R oder M = Ckonzentriert. In der Analysis werden aber auch standig Funktionenfolgen betrachtet;das sind Folgen, deren Elemente Funktionen sind. In Beispiel 8.16 haben wir dies imPrinzip bereits getan. Wie dort betrachten wir jetzt fn : R→ R,

fn(x) = xn . (13.1)

Auf diese Weise erhalten wir eine Folge (fn)n∈N, deren n-tes Element das n-te Monom(ein nur aus einem Glied bestehendes Polynom) ist. Fur jedes fest gewahlte x ∈ R entstehtdaraus eine Zahlenfolge (fn(x))n∈N. Deren Konvergenz haben wir bereits in Beispiel 8.16untersucht. Demnach gilt

limn→∞

fn(x) =

{0 , |x| < 1 ,

1 , x = 1 ,(13.2)

siehe Abb. 13.1.

0.0 0.2 0.4 0.6 0.8 1.0

0.2

0.4

0.6

0.8

1.0

Abbildung 13.1: Beispiel zur punktweisen Konvergenz.

Fur x ≤ −1 ist diese Folge divergent. Fur x > 1 ist sie ebenfalls divergent, aber uneigent-lich konvergent gegen ∞.

Definition 13.1 (Punktweise Konvergenz)Sei D Menge und (fn)n∈N eine Folge von Funktionen fn : D → K mit K = R oder K = C.Die Folge (fn) heißt punktweise konvergent gegen die Funktion f : D → K, falls

limn→∞

fn(x) = f(x) , fur alle x ∈ D. (13.3)

Wir schreiben bisweilen”fn → f punktweise“. Wir verwenden auch die Notation limn→∞ fn

fur den Grenzwert, mussen dabei aber klarstellen, dass der punktweise Grenzwert gemeintist.

156

Page 163: Vorlesungsskript zur Analysis 1 -

Es soll betont werden, dass die Bedingung (13.3) keine Beziehung zwischen unterschied-lichen Punkten x und y in D herstellt; es wird die Konvergenz separat in jedem Punktbetrachtet (daher der Name!). So konnen fur verschiedene Punkte x, y ∈ D die Folgen(fn(x)) und (fn(y))

”unterschiedlich schnell“ konvergieren. Wir werden in Abschnitt 13.2

eine weitere Art von Konvergenz kennenlernen, bei der das anders ist (und die sich invielen Situationen als besser erweisen wird).

Mit diesem neuen Begriff konnen wir obiges Beispiel so umformulieren: Die durch (13.1)gegebene Folge (fn) konvergiert auf D = [0, 1] punktweise gegen die durch

f(x) =

{0 , |x| < 1 ,

1 , x = 1 ,(13.4)

definierte Funktion f : [0, 1]→ R.

Als weiteres Beispiel betrachten wir

fn(x) = x2 +x

n, fn : [0, 1]→ R . (13.5)

Setzen wir f(x) = x2, so gilt

|fn(x)− f(x)| =∣∣∣xn

∣∣∣ ≤ 1

n, fur alle x ∈ [0, 1]. (13.6)

Also konvergiert fn punktweise auf [0, 1] gegen f .

Auf der rechten Seite von (13.6) kommt kein x vor, die Konvergenz von fn(x) gegen f(x)ist in gewisser Weise

”gleichmaßig“ hinsichtlich der Wahl von x. Diese Art von Konvergenz

ist so wichtig, dass wir sie im nachsten Abschnitt genauer studieren werden.

13.2 Gleichmaßige Konvergenz

In diesem Abschnitt lernen wir die gleichmaßigen Konvergenz kennen. Wir werden se-hen, dass sich dieser Begriff deutlich von der punktweisen Konvergenz unterscheidet. Diesist ein neues Phanomen: Fur reelle oder komplexe Zahlen (oder allgemeiner endlichdi-mensionale Vektorraume) gibt es nur einen Konvergenzbegriff. Fur Funktionen hingegengibt es verschiedene Konvergenzbegriffe. So werden wir sehen, dass es Folgen gibt, diepunktweise konvergieren, aber nicht gleichmaßig. Die verschiedenen Konvergenzbegriffefur Funktionen haben ihre eigenen Vor- und Nachteile. Die gleichmaßige Konvergenz wirdeine zentrale Rolle bei der Einfuhrung des Integralbegriffs in Kapitel 14 spielen und hateine Reihe sehr guter mathematischer Eigenschaften, wie wir in Kapitel 15 sehen werden.

Definition 13.2 (Gleichmaßige Konvergenz)Sei D Menge, sei (fn)n∈N eine Folge von Funktionen fn : D → K mit K = R oder K = C.Die Folge (fn) heißt gleichmaßig konvergent gegen die Funktion f : D → K, falls zujedem ε > 0 ein n0 ∈ N existiert, so dass gilt

|fn(x)− f(x)| ≤ ε fur alle x ∈ D und alle n ≥ n0. (13.7)

157

Page 164: Vorlesungsskript zur Analysis 1 -

Vorsicht! In dieser Definition durfen sich fur gegebenes ε die Funktionswerte fn(x) mitn ≥ n0 maximal um ε von f(x) unterscheiden, und zwar fur alle x ∈ D. In diesemSinne sind verschiedene Punkte x, y ∈ D nicht mehr unabhangig wie bei der punktweisenKonvergenz, sondern sozusagen gekoppelt. Gleichbedeutend mit (13.7) ist namlich dieBedingung

supx∈D|fn(x)− f(x)| ≤ ε fur alle n ≥ n0. (13.8)

Abb.13.2 veranschaulicht den Sachverhalt.ir erkennen aus (13.8), dass die Folge (fn)aus (13.5) wegen (13.6) gleichmaßig gegen f(x) = x2 konvergiert.

x

y

fnfε

ε

Abbildung 13.2: Zur gleichmaßigen Konvergenz.

Lemma 13.3Jede gleichmaßig gegen f : D → K konvergente Folge (fn) von Funktionen fn : D → K istauch punktweise gegen f konvergent.

Beweis: Das ist eine unmittelbare Folge der Definition. �

Umgekehrt braucht eine punktweise konvergente Folge aber nicht gleichmaßig konvergentzu sein. Wir betrachten nochmals das Beispiel fn(x) = xn mit der punktweise gebildetenGrenzfunktion (13.2).

Zu jedem n ∈ N wahlen wir xn ∈ [0, 1] so, dass fn(xn) = 12, das ist nach dem Zwischen-

wertsatz moglich. Es gilt dann

|fn(xn)− f(xn)| = 1

2, fur alle n ∈ N.

Die Bedingung (13.8) ist daher fur ε < 1/2 nicht erfullbar, die Konvergenz von fn gegenf ist nicht gleichmaßig. Dies formalisiert die Intuition, dass die punktweise Konvergenzum so langsamer geschieht, je naher x an den Randpunkt 1 heranruckt (sofern x 6= 1).

In diesem Beispiel beobachten wir außerdem, dass einerseits alle Funktionen fn auf [0, 1]stetig sind, andererseits die

”punktweise Grenzfunktion“ f aus (13.2) aber unstetig ist (im

158

Page 165: Vorlesungsskript zur Analysis 1 -

Punkt 1). Durch den punktweisen Grenzubergang haben wir die Stetigkeit verloren. Daskann bei der gleichmaßigen Konvergenz nicht passieren. Denn gleichmaßige Grenzwertestetiger Funktionen sind stetig, wie wir jetzt zeigen:

Satz 13.4 (Gleichmaßige Konvergenz stetiger Funktionen)Sei D ⊂ K, sei (fn) Folge stetiger Funktionen fn : D → K, sei f : D → K, und es geltefn → f gleichmaßig. Dann ist f auf D stetig.

Beweis: Seien a ∈ D und xk → a beliebig. Wir wollen zeigen, dass f(xk)→ f(a) gilt. Seiε > 0. Wir nutzen aus:

(i) Wegen der gleichmaßigen Konvergenz von (fn) gegen f gibt es ein n0, so dass furalle n ≥ n0

|f(x)− fn(x)| ≤ ε/3 , fur alle x ∈ D. (13.11)

(ii) Da fn stetig ist, gilt fn(xk)→ fn(a) fur k →∞, es gibt also ein k0 ∈ N mit

|fn(xk)− fn(a)| ≤ ε/3 , fur alle k ≥ k0. (13.12)

Damit konnen wir loslegen: Aus der Dreiecksungleichung folgt

|f(xk)− f(a)| ≤ |f(xk)− fn(xk)|+ |fn(xk)− fn(a)|+ |fn(a)− f(a)|≤ ε/3 + ε/3 + ε/3 = ε fur alle k ≥ k0,

wobei wir im letzten Schritt zweimal (13.11) und einmal (13.12) verwendet haben. (DieserBeweisklassiker ist unter dem Namen

”ε/3-Beweis“ bekannt.) �

In Quantorenschreibweise druckt sich der Unterschied von punktweiser und gleichmaßigerKonvergenz folgendermaßen aus:

fn → f punktweise: ∀ε > 0 ∀x ∈ D ∃n0 ∈ N ∀n ≥ n0 : |fn(x) − f(x)| < ε ,

fn → f gleichmaßig: ∀ε > 0 ∃n0 ∈ N ∀x ∈ D ∀n ≥ n0 : |fn(x) − f(x)| < ε .

Wir betrachten nun die gleichmaßige Konvergenz aus einem anderen Blickwinkel. Zu einerbeliebigen Menge D definieren wir den Raum aller beschrankten Funktionen auf D mitWerten in K durch

B(D;K) ={f∣∣ f : D → K, f ist beschrankt

}.

Lemma 13.5B(D;K) ist ein Vektorraum.

Beweis: Summe und skalare Vielfache von beschrankten Funktionen sind ebenfalls be-schrankt, daher ist B(D;K) ein Unterraum des Vektorraums aller Funktionen f : D → K.�

159

Page 166: Vorlesungsskript zur Analysis 1 -

Definition 13.6 (Supremumsnorm)Sei f : D → K beschrankt. Wir definieren die Supremumsnorm von f auf D durch

‖f‖∞ = supx∈D|f(x)| .

Beispiel 13.7(i) f(x) = sin(x) mit D = R:

‖f‖∞ = supx∈R| sin(x)| = 1 .

(ii) Wir betrachten f(x) = x3. Mit D = [0, 1]:

‖f‖∞ = supx∈[0,1]

|x3| = 1 .

Mit D = [−2, 1] oder D = (−2, 1]:

‖f‖∞ = supx∈[−2,1]

|x3| = supx∈(−2,1]

|x3| = 8 .

(iii) Sei f(x) = 0 fur x < 0, f(x) = 1 fur x ≥ 0. Mit D = [−1, 0) gilt ‖f‖∞ = 0, mitD = [−1, 0] gilt ‖f‖∞ = 1.

Falls f stetig und D ein abgeschlossenes und beschranktes Intervall ist, so hat |f | nachSatz 10.17 ein Maximum auf D, und

‖f‖∞ = supx∈D|f(x)| = max

x∈D|f(x)| .

Satz 13.8Sei D eine Menge und f, g : D → K beschrankte Funktionen. Dann gilt

‖f‖∞ = 0 ⇔ f = 0 , (13.13)

‖λf‖∞ = |λ| ‖f‖∞ fur alle λ ∈ K, (13.14)

‖f + g‖∞ ≤ ‖f‖∞ + ‖g‖∞ . (13.15)

Beweis: Es gilt

f 6= 0 ⇔ ∃x ∈ D mit |f(x)| > 0 ⇔ ‖f‖∞ > 0 ,

und weiter‖λf‖∞ = sup

x∈D|λf(x)| = |λ| sup

x∈D|f(x)| = |λ| ‖f‖∞ .

Die Dreiecksungleichung fur die Supremumsnorm folgt so: Da

|(f + g)(x)| ≤ |f(x)|+ |g(x)| ≤ ‖f‖∞ + ‖g‖∞fur alle x ∈ D gilt, ergibt sich durch Ubergang zum Supremum

‖f + g‖∞ = supx∈D|f(x) + g(x)| ≤ ‖f‖∞ + ‖g‖∞ .

160

Page 167: Vorlesungsskript zur Analysis 1 -

Ersetzt man in (13.13)–(13.15) die Supremumsnorm einer Funktion durch den Betrageiner Zahl, so erhalten wir die bekannten Eigenschaften des Betrags in R oder C. DieseEigenschaften werden uns spater auf den Begriff der Norm fuhren, der den Begriff derLange eines Vektors vom Vektorraum Rn auf Funktionenraume verallgemeinert.

Satz 13.9Sei D ⊂ K, sei (fn) eine Folge beschrankter Funktionen fn : D → K, und sei f : D → Kbeschrankt. Es gilt: fn konvergiert gleichmaßig gegen f genau dann, wenn

limn→∞

‖fn − f‖∞ = 0 .

Beweis: Dies ist eine Ubung im sauberen Aufschreiben der Konvergenzbegriffe der gleich-maßigen Konvergenz und Konvergenz in der Supremumsnorm (am besten in Quantoren-schreibweise); zentral ist die Aquivalenz

‖fn − f‖∞ = supx∈D|fn(x)− f(x)| ≤ ε ⇔ |fn(x)− f(x)| ≤ ε fur alle x ∈ D

(SUPER). �

161

Page 168: Vorlesungsskript zur Analysis 1 -

14 Das Integral

14.1 Grundlagen

Seien a, b ∈ R mit a < b und sei f : [a, b] → R. Wir wollen das Integral I(f) definieren,was fur nichtnegative Funktionen der anschaulichen Vorstellung

”Flacheninhalt unterhalb

des Graphen von f“ entspricht, siehe Abb. 14.1. Die zugehorige Abbildung I sollte aufeiner moglichst großen Klasse F von Funktionen definiert sein, und

I : F → R

sollte moglichst viele”gute mathematische Eigenschaften“ haben. Der Versuch, diesen

beiden Forderungen gerecht zu werden, hat in den letzten 150 Jahren zu einer ganzenReihe unterschiedlicher Definitionen des Integrals gefuhrt. In der heutigen Analysis wirduberwiegend das sogenannte Lebesgue-Integral verwendet. Dieser Integralbegriff wird inder Vorlesung Analysis 3 besprochen. In dieser einfuhrenden Vorlesung befassen wir unsmit einem konzeptionell etwas einfacheren Integralbegriff.m Folgenden ist [a, b] immer einabgeschlossenes Intervall im R mit a, b ∈ R und a < b.

∫ 3/2

0

x2 dx

x

f(x)

0.5 1 1.5

1

2x2

Abbildung 14.1: Interpretation des Integrals als Flache zwischen Graph einer nichtnega-tiven Funktion und der reellen Achse.

Definition 14.1 (Zerlegung)Eine endliche Menge Z = {x0, . . . , xn} mit n ≥ 1 und a = x0 < x1 < . . . < xn = b heißtZerlegung von [a, b]. Die Intervalle (xj−1, xj), 1 ≤ j ≤ n, heißen Teilintervalle von Z.Eine Zerlegung Z ′ heißt Verfeinerung der Zerlegung Z, wenn Z ′ ⊃ Z.

Beispielsweise ist {0, 1/3, 1/2, 1} eine Zerlegung von [0, 1], ebenso{

0,1

n,

2

n, . . . , 1

}, also xj =

j

n. (14.1)

162

Page 169: Vorlesungsskript zur Analysis 1 -

Zerlegungen wie (14.1), fur die xj+1 − xj konstant ist, heißen aquidistant.

Definition 14.2 (Treppenfunktion)Eine Funktion ϕ : [a, b] → R heißt Treppenfunktion auf [a, b], wenn es eine ZerlegungZ gibt, so dass ϕ auf allen Teilintervallen von Z konstant ist, d.h. fur alle j gibt es cj ∈ Rmit ϕ(x) = cj fur alle x ∈ (xj−1, xj). Eine solche Zerlegung Z heißt zu ϕ zugehorig. (Uberdas Verhalten von ϕ in den Teilpunkten xi wird nichts vorausgesetzt.) Wir setzen

T [a, b] ={ϕ∣∣ ϕ : [a, b]→ R Treppenfunktion

}.

Siehe Abb. 14.2.

x1 xj−1 xj b = xn

x

y

Abbildung 14.2: Beispiel einer Treppenfunktion.

Lemma 14.3Summe, Produkt und skalare Vielfache von Treppenfunktionen sind ebenfalls Treppenfunk-tionen. T [a, b] ist ein Vektorraum.

Beweis: Sind ϕ, ψ ∈ T [a, b] mit zugehorigen Zerlegungen Zϕ und Zψ, so ist Zϕ ∪ Zψzugehorige Zerlegung zu αϕ + βψ fur alle α, β ∈ R, sowie zu ϕψ. Somit ist T [a, b] einUnterraum des Vektorraums aller Abbildungen von [a, b] nach R. �

Ist ϕ : [a, b]→ R Treppenfunktion, so wollen wir das Integral von ϕ durch

I(ϕ) :=n∑

j=1

cj(xj − xj−1) (14.2)

definieren, wobei Jj := (xj−1, xj) Teilintervalle einer zu ϕ zugehorigen Zerlegung Z sindund ϕ auf Ji den konstanten Wert ci hat. Falls alle cj nichtnegativ sind, entspricht dasgerade dem Flacheninhalt der zwischen der x-Achse und dem Graphen von ϕ liegenden

163

Page 170: Vorlesungsskript zur Analysis 1 -

Menge.

Beispiel: ϕ : [0, 4]→ R,

ϕ(x) =

2 , 0 ≤ x < 1 ,

1 , 1 ≤ x < 3 ,

4 , 3 ≤ x ≤ 4 ,

I(ϕ) = 2 · (1− 0) + 1 · (3− 1) + 4 · (4− 3) = 8 ,

siehe Abb. 14.3.

-1 1 2 3 4 5

1

2

3

4

Abbildung 14.3: Integral einer Treppenfunktion.

Lemma 14.4Ist ϕ ∈ T [a, b], und sind Z = {x0, . . . , xn} und Z ′ = {x′0, . . . , x′m} zu ϕ zugehorige Zerle-gungen mit ϕ = cj auf (xj−1, xj) und ϕ = c′j auf (x′j−1, x

′j), so ist

n∑

j=1

cj(xj − xj−1) =m∑

j=1

c′j(x′j − x′j−1) . (14.3)

Beweis: Wir betrachten zunachst den Spezialfall, dass Z ′ aus Z durch Hinzunahme einesTeilpunktes x ∈ (xk−1, xk) entsteht. Dann ist m = n+ 1 und

m∑

j=1

c′j(x′j − x′j−1) =

n∑

j=1j 6=k

cj(xj − xj−1) + ck(x− xk−1) + ck(xk − x)

=n∑

j=1

cj(xj − xj−1) .

Der allgemeine Fall wird darauf zuruckgefuhrt: Jede Verfeinerung Z ′ von Z entsteht,indem wir von Z ausgehend endlich oft einen einzelnen Teilpunkt hinzunehmen. Somitgilt (14.3), falls Z ′ eine Verfeinerung von Z ist. Sind nun Z und Z ′ beliebige Zerlegungen,so besitzen sie Z ∪ Z ′ als gemeinsame Verfeinerung, und (14.3) gilt. �

Lemma 14.4 zeigt, dass der Wert der rechten Seite von (14.2) nicht davon abhangt, welcheder zu ϕ zugehorigen Zerlegungen Z zugrunde gelegt wird. Die folgende Definition istdaher sinnvoll.

164

Page 171: Vorlesungsskript zur Analysis 1 -

Definition 14.5 (Integral einer Treppenfunktion)Ist ϕ ∈ T [a, b], so definieren wir das Integral I(ϕ) von ϕ uber [a, b] durch (14.2). StattI(ϕ) schreiben wir auch ∫ b

a

ϕ(x) dx =n∑

j=1

cj(xj − xj−1)

fur eine zu ϕ gehorige Zerlegung Z.

Lemma 14.6Fur alle ϕ, ψ ∈ T [a, b] und alle α, β ∈ R gilt

∫ b

a

(αϕ+ βψ)(x) dx = α

∫ b

a

ϕ(x) dx+ β

∫ b

a

ψ(x) dx (14.4)

und es ist |ϕ(x)| ∈ T [a, b] mit

∣∣∣∣∫ b

a

ϕ(x) dx

∣∣∣∣ ≤∫ b

a

|ϕ(x)| dx ≤ (b− a)‖ϕ‖∞ . (14.5)

Ist ϕ ≤ ψ (d.h. ϕ(x) ≤ ψ(x) fur alle x ∈ [a, b]), so gilt

∫ b

a

ϕ(x) dx ≤∫ b

a

ψ(x) dx . (14.6)

Beweis: Die Aussagen (14.4) und (14.6) werden mit Definition 14.5 auf die entsprechen-den Eigenschaften von endlichen Summen zuruckgefuhrt. Die Abschatzung (14.5) folgtaus (14.6). �

Jetzt kommt der entscheidende Schritt unserer Integraldefinition. Wir definieren einegroßere Klasse von Funktionen und werden deren Integral durch Integrale approximie-render Treppenfunktionen als Grenzwert definieren.

Definition 14.7 (Regelfunktion)Eine Funktion f : [a, b]→ R heißt Regelfunktion, wenn es eine Folge (ϕn) von Treppen-funktionen in T [a, b] gibt, welche gleichmaßig gegen f konvergiert. Wir setzen

R[a, b] :={f∣∣ f : [a, b]→ R, f ist Regelfunktion

}.

Abb. 14.4 zeigt eine Approximation einer Regelfunktion durch Treppenfunktionen. Hierist ε > 0 beliebig vorgegeben und wir betrachten den Bereich

{(x, y)

∣∣ x ∈ [a, b], f(x)− ε < y < f(x) + ε},

der in der Abbildung durch die beiden gestrichelten Linien begrenzt wird. Eine Regel-funktion liegt vor, wenn ab einem gewissen Folgenglied alle approximierenden Treppen-funktionen in diesem Bereich liegen, wie die feinere gelbe Treppenfunktion das fur dasgegebene ε erfullt. Die gepunktet blau gepunktet gezeichnete Treppenfunktion mit dengroßeren Stufen verletzt diese Bedingung fur das gewahlte ε.

Die Charakterisierung des Integrals einer Regelfunktion als der Grenzwert einer Folge vonIntegralen von approximierenden Treppenfunktionen ist symbolisch in Abb. 14.5 gezeigt.

165

Page 172: Vorlesungsskript zur Analysis 1 -

f(x)− ε

y = f(x)

f(x) + ε

x

y

Abbildung 14.4: Eine Regelfunktion ist definiert als gleichmaßiger Grenzwert einer Folgevon Treppnfunktionen. Die skizzierte ε-Umgebung von f beinhaltet die in gelb gezeichneteTreppenfunktion vollstandig, die aus großeren blauen Treppen bestehende Funktion istnicht in der gezeigten ε-Umgebung enthalten.

Regelfunktionen brauchen nicht stetig zu sein (jede Treppenfunktion ist eine Regelfunkti-on), aber jede Regelfunktion f ist beschrankt: Ist ϕ eine Treppenfunktion mit ‖f − ϕ‖∞ ≤1, so gilt

|f(x)| ≤ |f(x)− ϕ(x)|+ |ϕ(x)| ≤ 1 + ‖ϕ‖∞fur alle x ∈ [a, b]. (Jede Treppenfunktion ist beschrankt, da sie nur endlich viele verschie-dene Werte annimmt.)

Lemma 14.8Eine Funktion f : [a, b] → R ist genau dann eine Regelfunktion, wenn es zu jedem ε > 0eine Treppenfunktion ϕ gibt mit

‖f − ϕ‖∞ ≤ ε .

Beweis: Das ist eine unmittelbare Folge von Definition 14.7. �

Die Idee ist naturlich, das Integral einer Regelfunktion als Grenzwert von Integralen vonimmer besser approximierenden Treppenfunktionen zu definieren. Hier droht aber einemogliche Gefahr: Kann es sein, dass zwei verschiedene Folgen von Treppenfunktionendie gleiche gegebene Funktion approximieren, aber die Grenzwerte der Integrale nichtubereinstimmen? Dies muss (und kann, wie wir in gleich sehen) ausgeschlossen werden.

Lemma 14.9Sei f ∈ R[a, b], seien (ϕn) und (ψn) Folgen in T [a, b] mit ϕn → f und ψn → f gleichmaßig.Dann gilt

limn→∞

∫ b

a

ϕn(x) dx = limn→∞

∫ b

a

ψn(x) dx . (14.7)

166

Page 173: Vorlesungsskript zur Analysis 1 -

y = f(x)

x

y

Abbildung 14.5: Das Integral einer Funktion ist der Grenzwert einer Folge von Integralenvon approximierenden Treppenfunktionen. Hier sind beispielhaft zwei approximierendeTreppenfunktion gezeigt, die sich teilweise uberlagern.

Beweis: Fur alle n,m ∈ N gilt nach Lemma 14.6∣∣∣∣∫ b

a

ϕn(x) dx−∫ b

a

ϕm(x) dx

∣∣∣∣ ≤ (b− a)‖ϕn − ϕm‖∞≤ (b− a)(‖f − ϕn‖∞ + ‖f − ϕm‖∞) .

(14.9)

Die durch

In :=

∫ b

a

ϕn(x) dx

definierte Folge ist also eine Cauchyfolge in R, also konvergent. Dasselbe gilt fur

Jn :=

∫ b

a

ψn(x) dx .

Wie in (14.9) folgt∣∣∣∣∫ b

a

ϕn(x) dx−∫ b

a

ψn(x) dx

∣∣∣∣ ≤ (b− a)(‖f − ϕn‖∞ + ‖f − ψn‖∞) → 0

fur n→∞, also gilt (14.7). �

Lemma 14.9 zeigt, dass die folgende Definition sinnvoll ist.

Definition 14.10 (Integral einer Regelfunktion)Sei f ∈ R[a, b]. Ist (ϕn) eine gleichmaßig gegen f konvergente Folge von Treppenfunktio-nen, so definieren wir das Integral von f uber [a, b] durch

∫ b

a

f(x) dx = limn→∞

∫ b

a

ϕn(x) dx .

167

Page 174: Vorlesungsskript zur Analysis 1 -

Lemma 14.11R[a, b] ist ein Vektorraum. Fur alle f, g ∈ R[a, b] und alle α, β ∈ R gilt

∫ b

a

(αf + βg)(x) dx = α

∫ b

a

f(x) dx+ β

∫ b

a

g(x) dx (Linearitat des Integrals) (14.10)

und weiter |f(x)| ∈ R[a, b] mit

∣∣∣∣∫ b

a

f(x) dx

∣∣∣∣ ≤∫ b

a

|f(x)| dx ≤ (b− a)‖f‖∞ . (14.11)

Ist f ≤ g, so gilt

∫ b

a

f(x) dx ≤∫ b

a

g(x) dx (Monotonie des Integrals) . (14.12)

Das Produkt fg zweier Regelfunktionen f, g : [a, b]→ R ist ebenfalls eine Regelfunktion.

Beweis: Seien (ϕn), (ψn) Folgen in T [a, b] mit ϕn → f und ψn → g gleichmaßig. Dann gilt

‖(αϕn + βψn)− (αf + βg)‖∞ ≤ |α|‖ϕn − f‖∞ + |β|‖ψn − g‖∞ ,

also gilt αϕn + βψn → αf + βg gleichmaßig. Daher sind Summen und skalare Vielfachevon Regelfunktionen wiederum Regelfunktionen, und R[a, b] ist ein Vektorraum. Analogzeigt man, dass ϕnψn → fg gleichmaßig. Weiter gilt

∫ b

a

(αf + βg)(x) dx = limn→∞

∫ b

a

(αϕn + βψn)(x) dx

= α limn→∞

∫ b

a

ϕn(x) dx+ β limn→∞

∫ b

a

ψn(x) dx

= α

∫ b

a

f(x) dx+ β

∫ b

a

g(x) dx .

Zum Beweis von (14.12) definieren wir

ϕn = ϕn − ‖f − ϕn‖∞ , ψn = ψn + ‖g − ψn‖∞ .

Dann gilt ϕn ≤ f und g ≤ ψn fur alle n ∈ N, sowie ϕn → f und ψn → g gleichmaßig, also

∫ b

a

ϕn(x) dx ≤∫ b

a

ψn(x) dx ,

und Grenzubergang n→∞ liefert (14.12). Schließlich folgt (14.11) aus (14.12). �

Bemerkung 14.12Der großte Teil der Aussagen von Lemma 14.11 lasst sich zusammenfassen in dem Satz:Das Integral I : (R[a, b], ‖ · ‖∞)→ R ist eine lineare, stetige und monotone Abbildung. DieLinearitat steht in (14.10). Aus (14.11) folgt, dass fn → f bezuglich ‖ · ‖∞ die KonvergenzI(fn) → I(f) zur Folge hat. Die Monotonie von I in (14.12) bezieht sich auf die durchden punktweisen Vergleich definierte Ordnungsrelation in R[a, b].

168

Page 175: Vorlesungsskript zur Analysis 1 -

Satz 14.13Jede stetige Funktion f : [a, b] → R ist eine Regelfunktion. (In Kurzform: C[a, b] ⊂R[a, b].)

Beweis: Seien f ∈ C[a, b] und n ∈ N. Wir betrachten die aquidistante Zerlegung Zn von[a, b], definiert durch

h :=b− an

, xj = a+ jh , Zn = {x0, . . . , xn} .

Wir definieren die Treppenfunktion ϕn durch ϕn(b) = f(b) und

ϕn(x) = f(xj) , falls x ∈ [xj, xj+1) , j ∈ {0, . . . , n− 1} .

Fur x ∈ [xj, xj+1) gilt ϕn(x) = ϕn(xj) = f(xj), also

|f(x)− ϕn(x)| = |f(x)− f(xj)| , |x− xj| ≤b− an

. (14.14)

Wir nehmen an, f sei keine Regelfunktion. Dann gibt es gemaß Lemma 14.8 ein ε > 0mit ‖f − ϕ‖∞ > ε fur alle Treppenfunktionen ϕ. Es gibt also tn ∈ [a, b] mit

|f(tn)− ϕn(tn)| ≥ ε .

Sei nun xn der linke Endpunkt desjenigen Teilintervalls von Zn, zu dem tn gehort. Gemaß (14.14)gilt

ε ≤ |f(tn)− ϕn(tn)| = |f(tn)− f(xn)| , |tn − xn| ≤b− an

.

Nach dem Satz von Bolzano-Weierstraß (Satz 8.23) gibt es eine Teilfolge {tnk} mit tnk →t ∈ [a, b]. Es folgt xnk → t und weiter

ε ≤ |f(tnk)− f(xnk)| → |f(t)− f(t)| = 0

falls k →∞, ein Widerspruch. Also ist f eine Regelfunktion. �

Lemma 14.14Sei a < b < c, sei f ∈ R[a, c]. Wir bezeichnen mit f |[a,b] die Einschrankung von f auf[a, b]. Dann ist f |[a,b] ∈ R[a, b] und f |[b,c] ∈ R[b, c], und es gilt

∫ c

a

f(x) dx =

∫ b

a

f(x) dx+

∫ c

b

f(x) dx . (14.15)

Beweis: Sei (ϕn) Folge in T [a, c] mit ϕn → f gleichmaßig, dann gilt ϕn|[a,b] ∈ T [a, b]und ϕn|[a,b] → f |[a,b] gleichmaßig. Also ist f |[a,b] ∈ R[a, b]. Ebenso fur [b, c]. Ist Zn einezugehorige Zerlegung zu ϕn|[a,b] und Z ′n eine zugehorige Zerlegung zu ϕn|[b,c], so ist Zn∪Z ′neine zugehorige Zerlegung zu ϕn, und aus Definition 14.5 folgt unmittelbar

∫ c

a

ϕn(x) dx =

∫ b

a

(ϕn|[a,b])(x) dx+

∫ c

b

(ϕn|[b,c])(x) dx .

Der Grenzubergang n→∞ liefert die Behauptung. �

169

Page 176: Vorlesungsskript zur Analysis 1 -

Definition 14.15Ist f ∈ R[a, b], so definieren wir

∫ a

b

f(x) dx := −∫ b

a

f(x) dx , sowie

∫ c

c

f(x) dx := 0

fur alle c ∈ [a, b].

Die in Lemma 14.11 und Lemma 14.14 formulierten Eigenschaften lassen sich entsprechendauf den Fall b < a ubertragen, insbesondere gilt (14.15) fur beliebige a, b, c ∈ R.

14.2 Der Hauptsatz der Differential- und Integralrechnung

Es folgt einer der wichtigsten Satze der Analysis. Zur Vorbereitung eine ebenfalls wichtigeDefinition:

Definition 14.16 (Stammfunktion)Seien f, F : [a, b] → R, sei F stetig auf [a, b] und differenzierbar auf (a, b). Gilt F ′(x) =f(x) fur alle x ∈ (a, b), so heißt F Stammfunktion von f .

Satz 14.17 (Hauptsatz der Differential- und Integralrechnung, HDI)Sei f : [a, b]→ R eine stetige Funktion. Zu gegebenem c ∈ [a, b] sei F : [a, b]→ R definiertdurch

F (x) =

∫ x

c

f(t) dt .

Dann gilt

(i) F ist eine Stammfunktion von f , d.h. F ist differenzierbar mit F ′ = f .

(ii) Es gilt ∫ b

a

f(x) dx = F (b)− F (a)

fur jede Stammfunktion F .

(iii) Jede Stammfunktion G : [a, b]→ R unterscheidet unterscheidet sich von F nur durcheine additive Konstante, d.h. es existiert ein C ∈ R, so dass G(x) = F (x) + C fur

alle x ∈ [a, b] gilt. Damit gilt∫ baf(x) dx = G(b)−G(a) fur jede Stammfunktion G.

Wir beweisen Teil (i) als Satz 14.20, Aussage (ii) in Satz 14.23 und (iii) in Lemma 14.22.

Als Vorbereitung ein Satz, der fur sich genommen wichtig ist.

Satz 14.18 (Mittelwertsatz der Integralrechnung)Seien f ∈ C[a, b], g ∈ R[a, b] mit g ≥ 0. Dann gibt es ein ξ ∈ [a, b] mit

∫ b

a

f(x)g(x) dx = f(ξ)

∫ b

a

g(x) dx . (14.16)

170

Page 177: Vorlesungsskript zur Analysis 1 -

Beweis: Das Produkt fg ist gemaß Lemma 14.11 und Satz 14.13 eine Regelfunktion,somit ist das Integral auf der linken Seite von (14.16) definiert. Nach dem Satz 10.17 vomMaximum existieren

m := minx∈[a,b]

f(x) , M := maxx∈[a,b]

f(x) ,

gilt wegen g ≥ 0

m

∫ b

a

g(x) dx ≤∫ b

a

f(x)g(x) dx ≤M

∫ b

a

g(x) dx .

Wir konnen ein y ∈ [m,M ] wahlen mit

y

∫ b

a

g(x) dx =

∫ b

a

f(x)g(x) dx .

Gemaß dem Zwischenwertsatz 10.14 gibt ein ξ ∈ [a, b] mit f(ξ) = y, also gilt (14.16). �

Folgerung 14.19Sei f ∈ C[a, b]. Dann gibt es ein ξ ∈ [a, b] mit

∫ b

a

f(x) dx = (b− a)f(ξ) .

Beweis: Dies ist eine Anwendung von Satz 14.18 mit g = 1. �

Satz 14.20Seien f ∈ C[a, b], c ∈ [a, b]. Wir definieren F : [a, b]→ R durch

F (x) =

∫ x

c

f(t) dt . (14.17)

Ist x ∈ (a, b), so ist F differenzierbar in x und

F ′(x) = f(x) .

Beweis: Nach Satz 14.13 ist f ∈ R[a, b], also integrierbar. Sei h ∈ R mit h 6= 0 undx+ h ∈ [a, b]. Dann ist

F (x+ h)− F (x)

h− f(x) =

1

h

(∫ x+h

c

f(t) dt−∫ x

c

f(t) dt

)− f(x)

=1

h

∫ x+h

x

f(t) dt− f(x) =1

hf(ξ)h− f(x) = f(ξ)− f(x)

fur ein geeignetes ξ ∈ [x, x+h] nach dem Mittelwertsatz der Integralrechnung (Satz 14.18mit g = 1). Sei nun hn → 0, dann gilt ξn → x fur die zugehorige Folge (ξn), und damit

F (x+ h)− F (x)

h− f(x) = f(ξn)− f(x) → 0

fur n→∞. Also ist F differenzierbar in x und F ′(x) = f(x). �

171

Page 178: Vorlesungsskript zur Analysis 1 -

Im Englischen wird der Hauptsatz”Fundamental Theorem of Calculus“ genannt. Das

ist ein gut gewahlter Name, denn der Hauptsatz ist in der Tat grundlegend. Der Beweiseben zeigt aber, dass es sich auch um ein sehr einfach zu sehendes Resultat handelt, vgl.Abb. 14.6. Dort ist F (x + h) Flache zwischen Kurve und x-Achse im Bereich zwischenc := a und x+h. Analog ist F (x) die gelb gezeichnete Flache zwischen Kurve und x-Achseim Bereich zwischen a und x. Die blau gezeichnete Flache ist die Differenz F (x+h)−F (x).Nach dem Mittelwertsatz der Integralrechnung ist diese Flache gleich der Flache desRechtecks mit Breite h und Hohe f(ξ). Diese Flache ist offensichtlich f(ξ)·h. Im Grenzwerth → 0 strebt wegen der angenommenen Stetigkeit von f der Wert f(ξ) gegen f(x), unddamit gilt

F (x+ h)− F (x)

h→ f(x) · h

h= f(x) .

x

f

a x x+ h

f(x)

f(ξ)

f(x+ h)f(x)

Abbildung 14.6: Zum Hauptsatz der Differential- und Integralrechnung.

Satz 14.21Ist f ∈ C[a, b], so ist die durch (14.17) definierte Funktion F eine Stammfunktion von f .

Beweis: Nach (14.11) gilt

|F (y)− F (x)| =∣∣∣∣∫ y

x

f(t) dt

∣∣∣∣ ≤ ‖f‖∞|y − x| , fur alle x, y ∈ [a, b].

Also ist F stetig (sogar Lipschitz-stetig) auf [a, b]. Aus Satz 14.20 folgt, dass F eineStammfunktion von f ist. �

Lemma 14.22Seien F,G ∈ C[a, b], sei F eine Stammfunktion von f : [a, b] → R. Dann ist G genaudann eine Stammfunktion von f , wenn G− F konstant ist.

Beweis: Ist G − F konstant, so ist mit F auch G auf (a, b) differenzierbar, und G′ =(G − F )′ + F ′ = F ′ = f . Ist umgekehrt G Stammfunktion von f , so gilt G′ = f = F ′,also (G− F )′ = 0 und damit G− F konstant nach Folgerung 12.20. �

172

Page 179: Vorlesungsskript zur Analysis 1 -

Satz 14.23Sei f ∈ C[a, b] und F : [a, b]→ R eine Stammfunktion von f . Dann gilt

∫ b

a

f(x) dx = F (b)− F (a) . (14.18)

Beweis: Nach Satz 14.20 wird durch

Fa(x) =

∫ x

a

f(t) dt

eine in [a, b] stetige und in (a, b) differenzierbare Funktion Fa : [a, b] → R definiert mitF ′a(x) = f(x), also eine Stammfunktion von f , und es gilt

∫ b

a

f(t) dt = Fa(b) = Fa(b)− Fa(a) .

Aus Lemma 14.22 folgtF (b)− Fa(b) = F (a)− Fa(a) ,

also gilt (14.18). �

Wir schreiben auch∫ b

a

f(x) dx = F (b)− F (a) = F∣∣∣b

a= F (x)

∣∣∣x=b

x=a;

verbreitet ist auch die Schreibweise [F (x)]ba.

Der Hauptsatz ist ein machtiges Werkzeug, um Integrale zu berechnen: Ist F gegeben undf = F ′, so konnen wir mit dem Hauptsatz das Integral von f berechnen.

Beispiel 14.24Es gilt

(ln)′(x) =1

x, x > 0 ,

also beispielsweise ∫ 2

1

1

xdx = ln(2)− ln(1) = ln(2) .

14.3 Integrationsregeln

Aufgrund des Hauptsatzes der Differential- und Integralrechnung erhalten wir aus jederRechenregel fur die Differentiation eine Rechenregel fur die Integration. Wir benutzendies, um eine Reihe sehr hilfreicher Rechenregeln herzuleiten.

Satz 14.25 (Partielle Integration)Seien f, g ∈ C[a, b], stetig differenzierbar in (a, b), und f ′, g′ seien stetig fortsetzbar auf[a, b]. Dann gilt

∫ b

a

f(x)g′(x) dx = f(x)g(x)∣∣∣x=b

x=a−∫ b

a

f ′(x)g(x) dx . (14.19)

173

Page 180: Vorlesungsskript zur Analysis 1 -

Beweis: Wir definieren F : [a, b] → R durch F (x) = f(x)g(x). Dann folgt aus der Pro-duktregel

F ′(x) = f ′(x)g(x) + f(x)g′(x) ,

also ist F Stammfunktion von f ′g + fg′, und nach dem Hauptsatz gilt

∫ b

a

[f ′(x)g(x) + f(x)g′(x)] dx = F (x)∣∣∣x=b

x=a,

woraus (14.19) folgt. �

Beispiel 14.26(i) Wir berechnen ∫ b

a

xex dx .

Dazu setzen wir f(x) = x und wahlen ein g mit g′(x) = ex, namlich g(x) = ex. Esist dann

∫ b

a

xex dx = xex∣∣∣x=b

x=a−∫ b

a

1·ex dx = xex∣∣∣x=b

x=a−ex

∣∣∣x=b

x=a= (x−1)ex

∣∣∣x=b

x=a= (b−1)eb−(a−1)ea .

(ii) Fur 0 < a < b gilt

∫ b

a

ln(x) dx =

∫ b

a

1 · ln(x) dx = x ln(x)∣∣∣x=b

x=a−∫ b

a

1 dx = (x ln(x) − x)∣∣∣x=b

x=a,

also istG(x) := x ln(x)− x

eine Stammfunktion des Logarithmus.

(iii) Wir finden eine Rekursionsformel fur

Im =

∫ b

a

(sin(x))m dx . (14.20)

Es istI0 = b− a , I1 = cos(a)− cos(b) .

Fur m ≥ 2 gilt

Im =

∫ b

a

(sin(x))m dx = −∫ b

a

(sin(x))(m−1)(cos)′(x) dx

= −(sin(x))(m−1) cos(x)∣∣∣x=b

x=a+ (m− 1)

∫ b

a

(sin(x))(m−2)(cos(x))2 dx

= −(sin(x))(m−1) cos(x)∣∣∣x=b

x=a+ (m− 1)

∫ b

a

(sin(x))(m−2)(1− sin2(x)) dx

= −(sin(x))(m−1) cos(x)∣∣∣x=b

x=a+ (1−m)Im + (m− 1)Im−2 ,

also

Im =m− 1

mIm−2 −

1

m(sin(x))(m−1) cos(x)

∣∣∣x=b

x=a. (14.21)

174

Page 181: Vorlesungsskript zur Analysis 1 -

Satz 14.27 (Substitutionsregel)Sei I ⊂ R ein Intervall, f : I → R stetig. Sei weiter g ∈ C[a, b], stetig differenzierbar in(a, b), und es gelte g([a, b]) ⊂ I. Ferner sei g′ stetig fortsetzbar auf [a, b]. Dann gilt

∫ b

a

f(g(t))g′(t) dt =

∫ g(b)

g(a)

f(x) dx .

Beweis: Sei F eine Stammfunktion von f auf dem Intervall J := g([a, b]). Dann ist F ◦g : [a, b]→ R stetig und in (a, b) differenzierbar. Aus der Kettenregel folgt

(F ◦ g)′(t) = F ′(g(t))g′(t) = f(g(t))g′(t) , t ∈ (a, b) .

Zweimalige Anwendung des Hauptsatzes liefert nun

∫ b

a

f(g(t))g′(t) dt = (F ◦ g)(b)− (F ◦ g)(a) = F (g(b))− F (g(a)) =

∫ g(b)

g(a)

f(x) dx .

Beispiel 14.28(i) Wir betrachten ∫ 2π

0

2t cos(t2) dt .

Wir setzen f(x) = cos(x), g(t) = t2. Es ist g′(t) = 2t, a = 0, b = 2π, und wirerhalten

∫ 2π

0

2t cos(t2) dt =

∫ (2π)2

0

cos(x) dx = sin(x)∣∣∣x=4π2

x=0= sin(4π2) .

Anhand dieses Beispiels zeigen wir, wie eine Substitution oft formal notiert wird.Hier ist g = t2, dg = g′(t) dt = 2t dt, wobei letztere Identitat fur dg

dt= g′(t) = 2t

steht. Weiter schreiben wir bisweilen, wenn die Integrationsgrenzen der ursprunglich-en Variablen a und b waren, fur die Integrationsgrenzen der neuen Variablen g(a) undg(b), ohne diese Werte explizit zu berechnen. Damit laßt sich die Substitutionsregelbundig formulieren als

∫ b

a

f(g(t))︸ ︷︷ ︸=f(g)

g′(t) dt︸ ︷︷ ︸= dg

=

∫ g(b)

g(a)

f(g) dg ;

man muss sich aber im Klaren sein, dass auf der linken Seite nach t integriert wird.

(ii) ∫ b

a

f(t+ c) dt =

∫ b+c

a+c

f(x) dx ,

falls f : [a+ c, b+ c]→ R stetig ist und c ∈ R. (Beweis: Substitution g(t) = t+ c.)

(iii) ∫ b

a

f(ct) dt =1

c

∫ bc

ac

f(x) dx ,

falls f : [ac, bc]→ R stetig ist und c 6= 0. (Dies zeigt die Substitution g(t) = ct.)

175

Page 182: Vorlesungsskript zur Analysis 1 -

(iv) Ist g wie im Satz vorausgesetzt, es gelte g(t) > 0 fur alle t ∈ [a, b]. Eine Anwendungder Substitutionsregel mit f(x) = 1/x liefert

∫ b

a

g′(t)

g(t)dt = ln(g(t))

∣∣∣t=b

t=a.

Fur g(t) = cos(t) ergibt sich, falls [a, b] ⊂ (−π/2, π/2),∫ b

a

− sin(t)

cos(t)dt = ln(cos(t))

∣∣∣t=b

t=a,

also ∫ b

a

tan(t) dt = − ln(cos(t))∣∣∣t=b

t=a.

Wir beenden diesen Abschnitt mit zwei Aussagen, die sich oft als nutzlich erweisen.

Satz 14.29Sei f ∈ C[a, b], f ≥ 0 und nicht die Nullfunktion. Dann ist

∫ b

a

f(x) dx > 0 .

Beweis: Sei t ∈ [a, b] mit f(t) > 0. Wir setzen ε = f(t)2

, also f(t) − ε > 0. GemaßSatz 10.18 gibt es ein δ > 0 mit f(x) − ε > 0 fur alle x ∈ [a, b] mit |x − t| < δ. Wirdefinieren ϕ : [a, b]→ R durch

ϕ(x) =

{ε , |x− t| < δ ,

0 , sonst.

Dann gilt ϕ(x) ≤ f(x) fur alle x ∈ [a, b] und damit∫ b

a

f(x) dx ≥∫ b

a

ϕ(x) dx ≥ 2δε > 0 .

�Satz 14.30 (Nulltest)Sei f ∈ C[a, b] mit ∫ b

a

f(x)ϕ(x) dx = 0

fur alle ϕ ∈ C[a, b]. Dann gilt f ≡ 0.

Beweis: Ubung. �

14.4 Integrationspraxis

Integralrechnung (ebenso wie die in Kapitel 17 behandelten Differentialgleichungen) istein januskopfiges Thema: Zum einen ist es wichtig, die theoretischen Grundlagen sauberzu beherrschen. Damit beschaftigt sich die Maß- und Integrationstheorie in hoheren Seme-stern in großerer Tiefe. Zum anderen ist es notwendig, Integrale in der Praxis berechnenzu konnen. In diesem Abschnitt stellen wir einige Integrationstricks zusammen, mit denenwir die Stammfunktionen von verschiedenen Klassen von Funktionen bestimmen konnen.

176

Page 183: Vorlesungsskript zur Analysis 1 -

14.4.1 Integration rationaler Funktionen

Eine rationale Funktion ist eine Funktion der Form

r(z) =p(z)

q(z)

mit Polynomen p und q. Die Quintessenz dieses Abschnitts ist: Fur jede rationale Funkti-on r(x) = p(x)

q(x)mit x ∈ R und reellen Koeffizienten konnen wir – sofern wir die Nullstellen

des Nennerpolynoms q bestimmen konnen – explizit eine Stammfunktion angeben, die ausrationalen Funktionen, dem Logarithmus und dem Arcustangens besteht. Die Grundideeist, r in einer geeigneten

”Standardform“ zu schreiben, die wir dann routinemaßig inte-

grieren konnen. Die Herstellung dieser Standardform erfolgt in mehreren Schritten undbasiert insbesondere auf der sogenannten Partialbruchzerlegung. Da diese Zerlegung auchin anderen Kontexten sehr hilfreich ist, besprechen wir sie fur allgemeine Polynome uberC mit komplexen Koeffizienten, siehe Schritt 2 unten.

Wir benutzen in diesem Abschnitt zwei Resultate, die in der Algebra bewiesen werden:

(i) Der Fundamentalsatz der Algebra besagt, dass jedes Polynom von Grad n uber Cfaktorisiert, also genau n komplexe Nullstellen besitzt, wenn deren Vielfachheitengezahlt werden (vgl. Abschnitt 7.3).

(ii) Sind p und q Polynome, wobei der Grad von p großer oder gleich dem Grad von q ist,ergibt die Polynomdivision eine Darstellung p(x) = t(x) ·q(x)+s(x) mit Polynoment und s. Diese Zerlegung ist eindeutig.

Beispiel 14.31Die Polynomdivision fur p(x) = x3 − 12x2 + 42x − 10 und q(x) = x2 − 7x ergibt furx /∈ {0, 7}

r(x) =p(x)

q(x)=x3 − 12x2 + 42x− 10

x2 − 7x= x− 5 +

7x− 10

x2 − 7x,

also t(x) = x− 5 und s(x) = 7x− 10 (SUPER-Ubung).

So gerustet bringen wir rationale Funktionen in einer Reihe von Schritten in die an-gekundigte

”Standarddarstellung“. Im ersten Schritt stellen wir sicher, dass der Bruch

vollstandig gekurzt ist, also keine gemeinsame Nullstelle z ∈ C von p und q existiert. For-mal dargestellt beginnen wir also mit einem Bruch r(z) := p(z)

q(z)mit beliebigen (nicht

notwendigerweise teilerfremden) Polynomen p und q. Wir bestimmen alle Nullstellenw1, . . . , wk von q,

q(z) = Cq(z − w1)l1 · . . . · (z − wk)lk

mit Cq ∈ C und l1, . . . , lk ∈ N. Ist wj mit j ∈ {1, . . . , k} nicht nur eine Nullstelle von q mitVielfachheit lj, sondern ebenfalls eine Nullstelle von p mit Vielfachheit kj ∈ N, konnenden Term (z − wj)mj mit mj := min {lj, kj} herausfaktorisieren, indem wir schreiben

p(z) = (z − wj)mjpr(z) ,

q(z) = (z − wj)mjqr(z) ,

177

Page 184: Vorlesungsskript zur Analysis 1 -

mit”Restpolynomen“ pr und qr. Verfahren wir jetzt iterativ und kurzen eventuelle gemein-

same Nullstellen von pr und qr, enthalten wir nach endlich vielen Schritten teilerfremdePolynome p und q. Man beachte, dass dieses Vorgehen theoretisch nach dem Fundamen-talsatz der Algebra immer moglich ist. In der Praxis existieren nur fur Polynome niedrigenGrades explizite Formeln zur Nullstellenbestimmung (fur n = 2 die aus der Schule bekann-te

”Mitternachtsformel“, fur n = 3 die cardanischen Formeln und fur n = 4 die Formels

von Cardano und Ferrari; schon die beiden letztgenannten Formeln sind jedoch unhand-lich und werden hier nicht besprochen). In der Algebra lernt man in der Galoistheorie,dass es prinzipiell keine aus elementaren Rechenoperationen aufgebaute Losungsformelfur Polynome vom Grad n ≥ 5 geben kann. In der Praxis hilft es bisweilen, Nullstellen zuraten.

Als Definitionsbereich von r wahlen wir C \Nq, wobei Nq die Nullstellenmenge von q ist,Nq :=

{z∣∣ z ∈ C, q(z) = 0

}. Es ist also im Allgemeinen r : C \ Nq → C; in der Integral-

berechnung werden wir uns auf reelle Argumente fur r beschranken.

Obiges Kurzen von gemeinsamen Nullstellen von p und q erlaubt uns, den maximalenDefinitionsbereich zu erhalten; r ist auch fur die z ∈ C definiert, fur die q(z) = 0, aberq(z) 6= 0 gilt.

Beispiel: Fur r(z) = z+1z2−1

ist p(z) = z + 1 und q(z) = (z + 1)(z − 1), also p(z) = 1 undq(z) = z − 1; der maximale Definitionsbereich ist C \ {1}.Im zweiten Schritt kommen wir zur Partialbruchzerlegung. Hier werden Nullstellen vong betrachtet. Ein w ∈ C heißt Pol mit Vielfachheit l von r = p

q, oder l-facher Pol, wenn

r(w) 6= 0 ist und w eine l-fache Nullstelle von g ist. Dann konnen wir

r(z) =p(z)

(z − w)l · qr(z)(14.22)

schreiben, wobei qr ein Polynom mit qr(w) 6= 0 ist. Die rationale Funktion 1(z−w)l

heißtPartialbruch.

Grundlage der Partialbruchzerlegung ist, dass rationale Funktionen additiv in Partial-bruche und eine polfreie Funktion zerlegt werden konnen, wie das nachste Lemma zeigt.

Lemma 14.32Sei r = p

qeine rationale Funktion (nicht notwendigerweise vollstandig gekurzt). Ist w ein

l-facher Pol von r, gib es eine eindeutige Zerlegung

r(z) =Cl

(z − w)l+

Cl−1

(z − w)l−1+ . . .+

C1

z − w + r0(z) (14.23)

mit einer rationalen Funktion r0, die in w keinen Pol besitzt. Hierbei sind C1, . . . , Cl ∈ Cmit Cl 6= 0. Die Differenz von r und r0,

hw(z) =Cl

(z − w)l+

Cl−1

(z − w)l−1+ . . .+

C1

z − w (14.24)

heißt Hauptteil von r in w.

Beweis: Um einen Induktionsbeweis fuhren zu konnen, formen wir (14.22) und behaupten,dass

r(z) =Cl

(z − w)l+

p(z)

(z − w)l−1 · qr(z)(14.25)

178

Page 185: Vorlesungsskript zur Analysis 1 -

mit einem Polynom p gilt. Um dies zu sehen, berechnen wir

p(z)

qr(z)− p(w)

qr(w)=p(z)qr(w)− p(w)qr(z)

qr(z)qr(w)=:

(z − w)p(z)

r(z);

dies gilt, da der Ausdruck p(z)qr(w)− p(w)qr(z) offensichtlich eine Nullstelle in w besitzt(die Konstante qr(w) ist im Polynom p absorbiert). Division durch (z − w)l ergibt

r(z) =p(z)

(z − w)l · qr(z)=

p(w)

qr(w)· 1

(z − w)l+

p(z)

(z − w)l−1 · qr(z),

also (14.25) mit Cl := p(w)qr(w)

.

Zum Induktionsbeginn: Fur l = 1 ist (14.25) die gewunschte Zerlegung: Die Funktionr0 := p/qr besitzt keinen Pol in w, da qr(w) 6= 0 gilt.

Im Induktionsschluß nehmen wir an, dass der zweite Summand in (14.25),

rl−1(z) :=p(z)

(z − w)l−1r(z)

eine rationale Funktion ist, die in w hochstens einen (l − 1)-fachen Pol besitzt, oderkeinen Pol. Trifft letzteres zu, setzen wir r0 := rl−1, andernfalls zerlegen wir rl−1 nachInduktionsannahme. Damit ergibt sich die Darstellung (14.23).

Die Eindeutigkeit zeigen wir durch einen Widerspruchsbeweis. Angenmommen, es gibtzwei Darstellungen

l∑

j=1

Cj(z − w)j

+ r0(z) =l∑

j=1

Cj(z − w)j

+ r0(z) .

Dann ergibt Multiplikation mit (z−w)l und Auswertung an z = w die Gleichheit Cl = Cl.Damit konnen die fuhrenden Terme (j = l) in obiger Gleichung entfernt werden, undanaloges Vorgehen zeigt fur alle anderen Terme die Gleichheit. �

Aus diesem Lemma ergibt sich unmittelbar die Partialbruchzerlegung.

Satz 14.33Sei r = p

qeine vollstandig gekurzte rationale Funktion, und q besitze die verschiedenen

Nullstellen w1, . . . wk. Dann kann r in eindeutiger Weise zerlegt werden als

r(z) = hw1(z) + . . .+ hwk(z) + s(z) , (14.26)

wobei s ein Polynom ist.

Beweis: Hier geht wieder der Fundamentalsatz der Algebra ein; wir benutzen, dass qzerlegt werden kann als

q(z) = (z − w1)l1 · (z − w2)l2 · . . . · (z − wk)lk .

Damit hat r Pole genau an den Stellen w1, . . . wk, jeweils mit Vielfachheiten l1, . . . lk.Seien hw1(z) + . . .+hwk(z) die zugehorigen Hauptteile. Die Behautung ergibt sich unmit-telbar aus Lemma 14.32: Zunachst ist demnach s eine rationale Funktion ohne Pole in C.

179

Page 186: Vorlesungsskript zur Analysis 1 -

Nach dem Fundamentalsatz der Algebra ist s also der Quotient eines Polynoms und einerKonstanten, und damit ein Polynom. �

Zur Praxis der Partialbruchzerlegung: P1 Den Polynomanteil s der Partialbruchzerle-

gung gewinnt man durch Division mit Rest, r = q · t+ s mit Polynomen t und s.

Wir schreiben diese Division mit Rest zunachst als r = q · t + s; zu zeigen ist namlich,dass s = s mit s aus (14.26) gilt. Dazu multiplizieren wir (14.26) mit q und beobachten,dass

t := (hw1(z) + . . .+ hwk(z)) q

ein Polynom ist, dessen Polynomgrad echt kleiner als dem von q ist. Wir haben also dieZerlegungen r = q · t+ s aus (14.26) und r = q · t+ s, wobei t und t kleineren Grad als qhaben. Wegen der Eindeutigkeit der Polynomdivision ergibt sich daraus t = t und s = s.

P2 Bestimmung der Koeffizienten, komplexer Fall. Im Beweis von Lemma 14.32 ha-

ben wir gesehen, dass fur die fuhrenden Koeffizienten Cl die Identitat Cl = p(w)qr(w)

gilt;

nach (14.22) ist dies gleich r(z) · (z − w)l ausgewertet fur z = w.

Allgemein konnen die Koeffizienten so bestimmt werden: Man multipliziert die Partial-bruchzerlegung (14.26) mit q. Dadurch entsteht auf beiden Seiten ein Polynom, und wirerhalten die Identitat

r − s · q =k∑

j=1

lj∑

l=1

Cjl(z − wj)l

· q .

Durch Zusammenfassen und Gleichsetzen entsprechender Koeffizienten ergeben sich li-neare Gleichungen fur die Unbekannten Cjl. Statt dieses Koeffizientenvergleichs ist dieEinsetzmethode oft geschickter, bei der die Unbekannten durch Einsetzen geeigneter Wer-te von z bestimmt werden.

Beispiel 14.34Fur

r(z) =z2 + z + 1

(z − 1)3(z − 2)

ergibt sich der Partialbruchansatz

r(z) =C1

z − 1+

C2

(z − 1)2+

C3

(z − 1)3+

D

z − 2.

Wir multiplizieren mit dem Nennerpolynom q(z) = (z − 1)3(z − 2) und erhalten

z2 + z + 1 = C1(z − 1)2(z − 2) + C2(z − 1)(z − 2) + C3(z − 2) +D(z − 1)3 . (14.27)

P2a Koeffizientenvergleich: Wir fassen zusammen und erhalten

z2 + z + 1 = (C1 +D)z3 + (−4C1 + C2 − 3D)z2 + (5C1 − 3C2 + C3 + 3D)z

+ (−2C1 + 2C2 − 2C3 −D) .

180

Page 187: Vorlesungsskript zur Analysis 1 -

Also ist

C1 +D = 0

−4C1 + C2 − 3D = 1

5C1 − 3C2 + C3 + 3D = 1

−2C1 + 2C2 − 2C3 −D = 1 ;

daraus ergibt sich C1 = −7, C2 = −6, C3 = −3 und D = 7.

P2b Einsetzmethode: Als Alternative zum Koeffizientenvergleich konnen wir in (14.27)

geeignete Werte fur z einsetzen. Mit z = 1 erhalten wir 3 = −C3. Fur z = 2 ergibt sich7 = D. Wahlen wir beispielsweise weiter z = 0, folgt 1 = −2C1 + 2C2 − 2C3 − D =−2C1 + 2C2 − 1; mit z = 3 finden wir 13 = 4C1 + 2C2 +C3 + 8D = 4C1 + 2C2 + 53. Ausden beiden letzten Gleichungen ergibt sich C1 = −7 und C2 = −6.

P3 Herstellung der reellen Partialbruchzerlegung. Wir diskutieren jetzt die Standarddar-

stellung der Partialbruchzerlegung im Reellen. Nach Abspaltung des Polynoms s verbleibtdie Summe der Hauptteile hw1(z) + . . .+ hwk(z), die man als eine rationale Funktion mitZahlergrad kleiner Nennergrad schreiben kann. Letzeres folgt zunachst separat fur jedeshwj durch Herstellen des Hauptnenners, da nach (14.24) der Nenner (z−wj)lj ist und diehochste Zahlerpotenz maximal C1(z − wj)lj−1 ist, namlich im Fall C1 6= 0.

Diese rationale Funktion kann wie folgt umgeschrieben werden kann, falls p und q rationaleKoeffizienten haben:

(i) Fur jede reelle Wurzel w ∈ R der Vielfachheit l treten in der Partialbruchzerlegungwie im Komplexen Summen

C1

(z − w)+

C2

(z − w)2+ . . .+

Cl(z − w)l

auf, wie in (14.24), wobei hier Cm ∈ R gilt fur m = 1, . . . , l.

(ii) Komplexe Nullstellen treten in konjugiert komplexen Paaren auf. Ist l die zugehorigeVielfachheit der Nullstelle, tritt in der Partialbruchzerlegung die Summe

l∑

m=1

Bmz +Dm

(z2 + Emz + Fm)m

auf, mit reellen Koeffizienten Bm, Dm, Em und Fm.

Wir skizzieren den Grund fur das Auftreten dieser Terme. Im Fall einer reellen Nullstelleist der Ausdruck genau der des Hauptterms (14.24). Zum Fall komplexer Nullstellen vonq: Zum einen treten die Polstellen in konjugiert komplexen Paaren w und w auf, da dieKoeffizienten von q reell sind (Ubung). Da auch p reell ist, gilt weiter r(z) = r(z). Damitsind die im Hauptteil auftretenden Koeffizienten ebenfalls konjugiert komplex, es tretenalso Paare

Cm(z − w)m

+Cm

(z − w)m

181

Page 188: Vorlesungsskript zur Analysis 1 -

auf. Bringt man diese Summe auf den Hauptnenner, ergibt sich im Nenner

((z − w) · (z − w))m =(z2 − (w + w)z + ww

)m=(z2 − 2Re (w)z + |w|2

)m=: Q(z)m ,

also fur z ∈ R ein quadratisches Polynom zur Potenz m erhoben. Im Zahler tritt durchdas Herstellen des Hauptnenners ein relles Polynom P (z) auf. Polynomdivision fur P/Qm

ergibt Summanden der Form Bnz+DnQn

mit n ≤ m wie behauptet.

Die Bestimmung der Koeffizienten im reeller Fall wird analog zum komplexen Fall vorge-nommen.

Integration rationaler Funktionen: Die vorausgehenden Uberlegungen zeigen, dass jederationale Funktion durch Partalbruchzerlegung zerlegt werden kann in

(i) ein Polynom s. Es ist s 6= 0 nur, wenn der Grad des Zahlers p großer ist als der desNenners q.

(ii) Fur jede reelle Nullstelle w der Vielfachheit l einen Ausdruck

Cl(z − w)l

+Cl−1

(z − w)l−1+ . . .+

C1

z − w . (14.28)

(iii) Fur jedes Paar konjugiert komplexer Nullstellen der Vielfachheit l einen Term

l∑

m=1

Bmz +Dm

(z2 + 2Emz + Fm)m. (14.29)

Alle diese Funktionen lassen sich explizit integrieren. Fur (14.28) gilt

∫ b

a

1

x− w dx = ln |x− w|∣∣∣x=b

x=a,

und fur m > 1 ∫ b

a

1

(x− w)mdx = − 1

m− 1

1

(x− x)m−1

∣∣∣x=b

x=a.

Fur den Fall einfacher komplex konjugierter Nullstellen in (14.29) gehen wir mit quadra-tischer Erganzung vor. Falls ∆ :=

√F − E2 > 0, ist

∫ b

a

1

x2 + 2Ex+ Fdx =

∫ b

a

1

∆2

1((x+E

)2+ 1) dx =

1√F − E2

arctan

(x+ E√F − E2

) ∣∣∣∣∣

x=b

x=a

.

Der lineare Term in Zahler von (14.29) fur m = 1 kann auf letztes Integral zuruckgefuhrtwerden, denn

∫ b

a

x

x2 + 2Ex+ Fdx =

1

2

∫ b

a

[2x+ 2E

x2 + 2Ex+ F− 2E

x2 + 2Ex+ F

]dx

=1

2ln∣∣x2 + 2Ex+ F

∣∣∣∣∣x=b

x=a−∫ b

a

E

x2 + Ex+ Fdx .

182

Page 189: Vorlesungsskript zur Analysis 1 -

Fur hohere Nennerpotenzen m > 1 bei doppelten Nullstellen leiten wir jetzt eine Rekur-sionsformel her. Sei ∆ :=

√F − E2 > 0. Mit quadratischer Erganzung ist

∫ b

a

Cx+D

(x2 + 2Ex+ F )mdx =

∫ b

a

Cx+D

((x+ E)2 + ∆2)mdx .

Wir verwenden die Substitution t = x+E∆

und schreiben c und d fur die sich aus dieserSubstitution ergebenden Integralgrenzen in t. Damit wird obiger Ausdruck zu

∫ d

c

C(∆t− E) +D

∆2m (t2 + 1)m∆ dt =

C

2∆2m−2

∫ d

c

2t

(t2 + 1)mdt+

D − C · E∆2m−1

∫ d

c

1

(t2 + 1)mdt.

(14.30)Fur das erste Integral auf der rechten Seite bietet sich die Substitution u := t2 + 1 an,also du = 2t dt. Wir erhalten

C

2∆2m−2

∫ d

c

2t

(t2 + 1)mdt =

C

2∆2m−2

∫ u(d)

u(c)

1

umdu =

−C2∆2m−2

· 1

m− 1

1

(t2 + 1)m−1

∣∣∣∣∣

t=d

t=c

.

(14.31)Fur das zweite Integral in (14.30) lasst sich Rekursionsformel angeben. Dies ist eine hilfrei-che Methode insbesondere zur Bestimmung von Integralen, deren Integranden Potenzenenthalten (vergleiche (14.20)). Um einen Rekursionsformel zu erhalten, zerlegen wir

∫ d

c

1

(t2 + 1)mdt =

∫ d

c

1

(t2 + 1)m−1dt−

∫ d

c

t2

(t2 + 1)mdt . (14.32)

Mittels partieller Integration ergibt sich fur den zweiten Term

∫ d

c

t2

(t2 + 1)mdt =

∫ d

c

t

2· 2t

(t2 + 1)mdt

=t

2(1−m)(t2 + 1)m−1

∣∣∣∣∣

t=d

t=c

− 1

2(1−m)

∫ d

c

1

(t2 + 1)m−1dt .

Damit folgt fur (14.32)

∫ d

c

1

(t2 + 1)mdt =

t

2(m− 1)(t2 + 1)m−1

∣∣∣∣∣

t=d

t=c

+2m− 3

2m− 2

∫ d

c

1

(t2 + 1)m−1dt .

Die Kombination von diesem Resultat und (14.31) ergibt fur (14.30)

∫ b

a

Cx+D

(x2 + 2Ex+ F )mdx =

−C2∆2m−2

· 1

m− 1

1

(t2 + 1)m−1

∣∣∣∣∣

t=d

t=c

+D − C · E

∆2m−1

t

2(m− 1)(t2 + 1)m−1

∣∣∣∣∣

t=d

t=c

+2m− 3

2m− 2

∫ d

c

1

(t2 + 1)m−1dt

.

183

Page 190: Vorlesungsskript zur Analysis 1 -

Unter Rucksubstitution von t durch x ergibt sich nach kurzer Rechnung

∫ b

a

Cx+D

(x2 + 2Ex+ F )mdx =

1

2m− 2· (D − C · E)(x+ E)− C∆2

(x2 + 2Ex+ F )m−1 ·∆2

+2m− 3

2m− 2

D − C · E∆2

∫ b

a

1

(x2 + 2Ex+ F )m−1dx .

Da auf der rechten Seite der Nennergrad im Vergleich zur linken Seite um Eins verringertist, kann diese Formel rekursiv angewendet werden. Wir sind damit in der Lage, alle inder Partialbruchzerlegung auftretenden Terme explizit zu integrieren.

14.4.2 Integrale von Verkettungen rationalen Funktionen

Sei r eine rationale Funktion. Ein Integral der Form∫ bar(exp(cx)) dx mit c ∈ R lasst sich

mit der naheliegenden Substitution t = exp(cx), also x = 1c

ln(t), als rationale Funktionvon t umschreiben und damit nach den Regeln des vorausgehenden Abschnitts integrieren:

∫ b

a

r(exp(ax)) dx =

∫ exp(cb)

exp(ca)

r(t)1

ctdt .

Auch rationale Funktionen, die neben der Integrationsvariablen x von Wurzeln der Formk

√Ax+BCx+D

abhangen, konnen elementar integriert werden. Sei r(x, k

√Ax+BCx+D

)eine rationale

Funktion in zwei Argumenten, wobei A ·D−B ·C 6= 0 gelte. Dann hilft die naheliegendeSubstitution

t = k

√Ax+B

Cx+D, also x =

Dtk −BA− Ctk ,

auf eine rationale Funktion in t.

Beispiel 14.35

∫ b

a

1−√xx+√x

dx =

∫ t(b)

t(a)

1− tt2 + t

· 2t dt = 2

∫ t(b)

t(a)

1− t1 + t

dt = 2

∫ t(b)

t(a)

[−1 +

2

1 + t

]dt

= [−2t+ 4 ln |1 + t|]∣∣∣∣∣

t(b)

t(a)

=[−2√x+ 4 ln |1 +

√x|]∣∣∣∣∣

x=b

x=a

.

Eine trickreichere Substitution kommt bei Integralen der Form∫ bar(sin(x), cos(x)) dx mit

−π < x < π zur Anwendung: In der sogenannten tan(x/2)-Substitution, die oft griffiger,aber historisch inkorrekt, als Weierstraß-Substitution bezeichnet wird, wahlen wir t so,dass

x = 2 arctan(t) .

Dann gilt(

cos(x

2

))2

=

(sin(x2

))2

t2=

1−(cos(x2

))2

t2,

184

Page 191: Vorlesungsskript zur Analysis 1 -

also (cos(x

2

))2

=1

1 + t2, (14.33)

und damit aus voriger Gleichung(

sin(x

2

))2

=t2

1 + t2, (14.34)

siehe Abb. 14.7. Damit ist nach den Additionstheoremen fur trigonometrische Funktionen

sin(x) = 2 sin(x

2

)cos(x

2

)= 2t ·

(cos(x

2

))2

=2t

1 + t2

und, mit (14.34) bzw. (14.33) in der zweiten bzw. dritten Gleichheit,

cos(x) =(

cos(x

2

))2

−(

sin(x

2

))2

=(

cos(x

2

))2 (1− t2

)=

1− t21 + t2

.

Zusammenfassend ergibt sich also

sin(x) =2t

1 + t2, cos(x) =

1− t21 + t2

, dx =2 dt

1 + t2,

der Integrand wird also eine rationale Funktion in t und das Integral kann mittels Parti-albruchzerlegung berechnet werden.

1

1 + t2t

x2

Abbildung 14.7: Veranschaulichung der Formeln (14.33) bzw. (14.34), aus denen die For-meln der tan(x/2)-Substitution folgen.

Beispiel 14.36Sei 0 < a < b < π. Wir setzen c = tan

(a2

)und d = tan

(b2

). Dann ist

∫ b

a

1

sin(x)dx =

∫ d

c

1 + t2

2t

2

1 + t2dt =

∫ d

c

1

tdt = ln(d)− ln(c) ,

und damit ∫ b

a

1

sin(x)dx = ln

(tan(x2

)) ∣∣∣x=b

x=a, 0 < a < b < π .

Weiter ist fur −π2< a < b < π

2, wieder mit c = tan

(a2

)und d = tan

(b2

),

∫ b

a

1

cos(x)dx =

∫ d

c

1 + t2

1− t22

1 + t2dt =

∫ d

c

2

1− t2 dt =

∫ d

c

[1

1 + t+

1

1− t

]dt =

ln

∣∣∣∣1 + t

1− t

∣∣∣∣

∣∣∣∣∣

x=d

x=c

= ln

∣∣∣∣∣1 + tan

(x2

)

1− tan(x2

)∣∣∣∣∣

∣∣∣∣∣

x=b

x=a

.

185

Page 192: Vorlesungsskript zur Analysis 1 -

14.5 Weitere Charakterisierungen von Regelfunktionen

Konnen wir einer Funktion leicht ansehen, ob sie eine Regelfunktion ist? Die Definiti-on 14.7 ist als Kriterium recht sperrig. Deshalb geben wir hier einige elegante Kriterien,aus denen man schließen kann, dass eine Funktion eine Regelfunktion ist. Ein hinrei-chendes Kriterium hat bereits Satz 14.13 geliefert, C[a, b] ⊂ R[a, b]. Wir beginnen diesenAbschnitt mit einem hinreichenden und notwendigem Kriterium, also einer Charakteri-sierung von Regelfunktionen.

Satz 14.37 (Charakterisierung von Regelfunktionen)Sei f : [a, b]→ R. Dann sind aquivalent:

(i) Es handelt sich um eine Regelfunktion, f ∈ R[a, b].

(ii) Fur alle x ∈ [a, b) existiert der rechtsseitige Grenzwert

limξ→xξ>x

f(ξ) ,

und fur alle x ∈ (a, b] existiert der linksseitige Grenzwert

limξ→xξ<x

f(ξ) .

Beweis: (i) ⇒ (ii): Siehe Ubungsaufgabe. (ii) ⇒ (i): Es gelte (ii). Wir nehmen an, f seikeine Regelfunktion. Dann gibt es ein ε > 0, so dass

‖f − ϕ‖∞ > ε , fur alle ϕ ∈ T [a, b]. (14.37)

Wir definieren eine Folge von Intervallen In = [an, bn], indem wir I0 = [a, b] setzen und,falls In bereits konstruiert ist,

In+1 =

[an,

an + bn2

]oder In+1 =

[an + bn

2, bn

]

setzen. Die Wahl wird dabei so getroffen, dass fur alle n ∈ N

‖f |In − ϕ‖∞ > ε , fur alle ϕ ∈ T (In) (14.38)

gilt. Das ist moglich: Fur n = 0 gilt (14.38) wegen (14.37); gabe es fur beide Wahlmoglichkei-ten von In+1 ein ϕ ∈ T (In+1) mit ‖f |In+1 − ϕ‖∞ ≤ ε, so gabe es auch ein ϕ ∈ T (In) mit‖f |In − ϕ‖∞ ≤ ε. Es ist dann

n∈N

In = {x} , x = supn∈N

an = infn∈N

bn .

Wir setzen (falls a < x < b; andernfalls wird nur einer der Grenzwerte betrachtet)

yl := limξ→xξ<x

f(ξ) , yr := limξ→xξ>x

f(ξ) ,

und wahlen n ∈ N so, dass

186

Page 193: Vorlesungsskript zur Analysis 1 -

|f(t)− yl| ≤ ε fur alle t ∈ [an, x), |f(t)− yr| ≤ ε fur alle t ∈ (x, bn].

Fur ϕ ∈ T (In), definiert durch ϕ(x) = f(x) und

ϕ(t) =

{yl , t < x ,

yr , t > x ,

gilt dann ‖f |In − ϕ‖∞ ≤ ε im Widerspruch zu (14.38). �

Aus Satz 14.37 folgt beispielsweise, dass die Dirichletsche Sprungfunktion aus Beispiel 10.6,

f(x) :=

{1 , x ∈ Q ,

0 , x /∈ Q ,

keine Regelfunktion ist.

Folgerung 14.38Sei f : [a, b]→ R monoton. Dann ist f eine Regelfunktion.

Beweis: Nach einer Ubungsaufgabe erfullt jede monotone Funktion die Bedingung (ii) ausSatz 14.37. �

14.6 Uneigentliche Integrale

In Abschnitt 9.1 wurden Reihen informell mit der Approximation/Berechnung von Inte-gralen der Art

∫∞0f(x) dx motiviert. Jetzt konnen wir solche Integrale sauber definieren

und behandeln.

Definition 14.39 (Uneigentliche Integrale)Sei f : [a,∞)→ R mit f ∈ R[a,M ] fur alle M > a. Wir definieren

∫ ∞

a

f(x) dx = limM→∞

∫ M

a

f(x) dx ,

falls der Grenzwert auf der rechten Seite existiert. Analog wird

∫ a

−∞f(x) dx = lim

M→−∞

∫ a

M

f(x) dx

definiert. Solche Integrale heißen uneigentliche Integrale.

Beispiel 14.40Wir betrachten ∫ ∞

1

1

xαdx mit α > 1 .

Es ist ∫ M

1

1

xαdx =

1

1− αx1−α∣∣∣x=M

x=1=M1−α − 1

1− α ,

187

Page 194: Vorlesungsskript zur Analysis 1 -

also ∫ ∞

1

1

xαdx = lim

M→∞

M1−α − 1

1− α =1

α− 1.

Fur α = 1 gilt ∫ M

1

1

xdx = ln(M)→∞ , falls M →∞ ,

also existiert∫∞

11x

dx nicht.

Definition 14.41Sei f : (a, b]→ R, f ∈ R[a+ ε, b] fur alle ε > 0. Wir definieren

∫ b

a

f(x) dx = limε→0ε>0

∫ b

a+ε

f(x) dx ,

falls der Grenzwert auf der rechten Seite existiert.

Beispiel 14.42Wir betrachten ∫ 1

0

1

xαdx mit α < 1 .

Es ist ∫ 1

ε

1

xαdx =

1

1− αx1−α∣∣∣x=1

x=ε=

1− ε1−α

1− α ,

also ∫ 1

0

1

xαdx = lim

ε→0ε>0

1− ε1−α

1− α =1

1− α .

Fur α = 1 gilt ∫ 1

ε

1

xdx = − ln(ε)→∞ , falls ε→ 0 ,

also existiert∫ 1

01x

dx nicht. Sowohl bei der Integration ab Null als auch bei der uneigent-lichen Integration bei ∞ ist 1/x innerhalb der Familie 1

xαder nichtintegrable Grenzfall.

Die eben beschriebenen Situationen konnen an beiden Integrationsgrenzen auftreten.

Definition 14.43Ist f : R→ R und f ∈ R[a, b] fur alle Intervalle [a, b], so definieren wir

∫ ∞

−∞f(x) dx =

∫ c

−∞f(x) dx+

∫ ∞

c

f(x) dx , (14.39)

falls fur ein c ∈ R beide Integrale auf der rechten Seite existieren. (Sie existieren dannfur alle c ∈ R, und die Summe hangt nicht von der Wahl von c ab.)

188

Page 195: Vorlesungsskript zur Analysis 1 -

Beispiel:

∫ ∞

−∞

1

1 + x2dx =

∫ 0

−∞

1

1 + x2dx+

∫ ∞

0

1

1 + x2dx

= limM→−∞

(− arctan(M)) + limM→∞

arctan(M)

2+π

2= π .

Vorsicht! Die Existenz von

limM→∞

∫ M

−Mf(x) dx

ist nicht hinreichend fur die Existenz von∫∞−∞ f(x) dx im Sinne von (14.39). So ist etwa

∫ M

−Mx dx = 0

fur alle M , aber ∫ M

0

x dx =1

2M2 →∞ fur M →∞.

Satz 14.44 (Integralvergleichskriterium)Sei f : [1,∞)→ R monoton fallend mit f ≥ 0. Dann gilt

∫ ∞

1

f(x) dx existiert ⇔∞∑

k=1

f(k) ist konvergent .

Beweis: Nach Folgerung 14.38 ist f ∈ R[1,M ] fur alle M > 1. Fur alle k ∈ N und allex ∈ [k, k + 1] gilt

f(k) ≥ f(x) ≥ f(k + 1) ,

also auch

f(k) ≥∫ k+1

k

f(x) dx ≥ f(k + 1)

fur alle k. Also gilt fur alle n ∈ N, n ≥ 2,

n−1∑

k=1

f(k) ≥∫ n

1

f(x) dx ≥n∑

k=2

f(k) . (14.40)

Aus der rechten Ungleichung folgt: Existiert

limn→∞

∫ n

1

f(x) dx ,

so ist wegen f ≥ 0 die Zahl

limn→∞

∫ n

1

f(x) dx = supn∈N

∫ n

1

f(x) dx

189

Page 196: Vorlesungsskript zur Analysis 1 -

eine obere Schranke fur∑n

k=2 f(k), also ist die Reihe konvergent. Aus der linken Unglei-chung in (14.40) folgt: Ist die Reihe konvergent, so ist die monoton wachsende Folge

an =

∫ n

1

f(x) dx

beschrankt, also konvergent, und wegen

an ≤∫ M

1

f(x) dx ≤ an+1 fur alle M ∈ [n, n+ 1]

folgt auch die Existenz von∫∞

1f(x) dx im Sinne von Definition 14.39. �

Beispiel 14.45Wir betrachten fur s > 1 die Funktion

f : [1,∞)→ R , f(x) =1

xs.

Nach Beispiel 14.40 existiert∫∞

1f(x) dx, also ist nach Satz 14.44 die Reihe

∞∑

k=1

1

ks

konvergent fur s > 1. Die Funktion ζ : (1,∞)→ R,

ζ(s) =∞∑

k=1

1

ks,

heißt die Riemannsche Zetafunktion.

14.7 Anwendung: Wallis’sches Produkt

Als Anwendung der Integralrechung ist es leicht, folgende bemerkenswerte Charakterisie-rung von π

2zu beweisen.

Satz 14.46Sei

wn :=2 · 21 · 3 ·

4 · 43 · 5 · . . . · · ·

2n · 2n(2n− 1)(2n+ 1)

=n∏

k=1

(2k)2

(2k + 1)(2k − 1).

Dann gilt limn→∞wn = π2. Diese Darstellung von π

2ist als Wallis’sches Produkt bekannt,

nach John Wallis (1616–1703).

Beweis: Wir hatten in Beispiel 14.26 in (14.20) Im definiert als

Im =

∫ b

a

(sin(x))m dx .

190

Page 197: Vorlesungsskript zur Analysis 1 -

Mit der Wahl a = 0 und b = π2

ergibt sich wie dort gesehen

I0 = b− a =π

2, I1 = cos(0)− cos

(π2

)= 1 ,

und fur m ≥ 2 die Rekursionsformel (14.21),

Im =m− 1

mIm−2 −

1

m(sin(x))(m−1) cos(x)

∣∣∣x=

π2

x=0=m− 1

mIm−2 .

Damit ist

I2n =(2n− 1) · (2n− 3) · . . . · 3 · 1

2n · (2n− 2) · . . . · 4 · 2 · π2

und

I2n+1 =2n · (2n− 2) · . . . · 4 · 2

(2n+ 1) · (2n− 1) · . . . · 5 · 3 .

Also istI2n+1

I2n

=2

π

n∏

k=1

(2k)2

(2k + 1)(2k − 1)=

2

πwn .

Wir wollen jetzt zeigen, dass I2n+1

I2n→ 1 fur n → ∞ gilt, dann ist der Satz bewiesen. Fur

0 ≤ x ≤ π2

ist0 ≤ sin(x) ≤ 1 ,

also ist fur alle n ≥ 0

(sin(x))2n+2 ≤ (sin(x))2n+1 ≤ (sin(x))2n .

Die Rekursionsformel und eine Integration der letzten Ungleichungen ergibt

2n+ 1

2n+ 2I2n = I2n+2 ≤ I2n+1 ≤ I2n ,

daher folgtn+ 1

2

n+ 1≤ I2n+1

I2n

≤ 1 .

Das Einschließungskriterium aus Lemma 8.12 liefert

lin n→∞I2n+1

I2n

= 1 ,

und damit ist die Behauptung gezeigt. �

Fur die in (8.22) definierte Folge (an)n∈N mit

an :=2

1· 4

3· 6

5· . . . · 2n

2n− 1fur n ≥ 1

folgt die in (8.23) postulierte asymptotische Konvergenz an ∼=√π·√n direkt aus Satz 14.46,

denn demnach gilt fur n→∞a2n

n= wn ·

2n+ 1

n→ π

2· 2 = π .

191

Page 198: Vorlesungsskript zur Analysis 1 -

14.8 Ausblick

Mit dem Begriff der Regelfunktion lasst sich ein leistungsfahiger Integralbegriff aufbauen.Dennoch wollen wir auf eine Beschrankung hinweisen. Wir haben den Hauptsatz 14.17 nurfur stetige Integranden f bewiesen. Mit etwas Mehraufwand kann man zeigen, dass derHauptsatz auch fur Regelfunktionen als Integranden gilt [1, Abschnitt 12.3]. Allerdings istauch dieses Resultat nicht perfekt. Um das zu sehen, betrachten wir die Funktion (12.22),

f(x) =

{x2 sin

(1x

), x 6= 0 ,

0 , x = 0 ,.

Wie in Abschnitt 12.5 gezeigt, ist f uberall differenzierbar, aber in 0 existiert fur f ′

weder ein linksseitiger noch einen rechtsseitiger Grenzwert. Also ist f ′ nach Satz 14.37keine Regelfunktion, und selbst die eben erwahnte verscharfte Fassung des Hauptsatzesgreift nicht. Aber wir ahnen, dass der Hauptsatz gelten sollte, mit der Stammfunktion f .Das ist auch richtig, braucht aber aber einen leistungsfahigeren Integralbegriff. Dies isteine Motivation, warum in hoheren Semestern das Lebesgue-Integral eingefuhrt wird.

Erganzendes Material zu diesem Kapitel

[1] K. Konigsberger. Analysis. 1. Springer-Lehrbuch. [Springer Textbook]. Springer-Verlag,Berlin, 2004, xiv+412. isbn: 3-540-40371-X. doi: 10.1007/978-3-642-18490-1.url: https://doi.org/10.1007/978-3-642-18490-1.

192

Page 199: Vorlesungsskript zur Analysis 1 -

15 Vertauschungssatze

Wie bereits in Abschnitt 9.7 diskutiert, ist die Vertauschung von Grenzprozessen einzentrales Thema der Analysis. Diese Frage ist von grundlegender Bedeutung, wenn wirFunktionenfolgen betrachten. Im Grunde machen wir in der Mathematik folgendes: Wirentwickeln Konzepte – etwa Stetigkeit, Differenzierbarkeit, Integrierbarkeit – und beweisenAussagen, die den Umgang mit diesen Konzepten ermoglichen oder erleichtern. ZweiFragen drangen sich auf:

(i) Stabilitat : Wenn wir Folgen von Funktionen betrachten, die stetig oder differenzier-bar oder integrierbar sind, ist die Grenzfunktion dann auch stetig oder differenzier-bar oder integrierbar? In anderen Worten: Sind die entwickelten Konzepte unterKonvergenz von Funktionenfolgen abgeschlossen?

(ii) Vertauschbarkeit : Ist Stabilitat gegeben, durfen wir dann”Approximation und Kon-

zept vertauschen“? Etwa: Nehmen wir an, wir haben festgestellt, dass fn → f (ingeeignetem Sinn, also punktweise oder gleichmaßig) und dass alle fn und die Grenz-funktion f = limn→∞ fn integrierbar sind. Gilt dann

∫ b

a

lim fn(x) dx = limn→∞

∫ b

a

fn(x) dx ?

(ii) nalog: Angenommen, es gilt fn → f in geeignetem Sinn, und alle fn und die Grenz-funktion f = limn→∞ fn sind differenzierbar. Folgt dann

(limn→∞

fn(x))′

= limn→∞

f ′n(x) ?

Diese Fragen ist auch aus praktischer Sicht von großer Bedeutung. In Anwendungen begeg-nen wir sehr oft Situationen, in denen eine explizite Berechnung nicht moglich ist – etwadie Bestimmung eines Integrals. Man greift dann oft zu numerischen Methoden zuruck, beidenen man das Integral approximiert, etwa durch das Integral von Treppenfunktionen2.Damit liegt genau die hier diskutierte Situation vor: Man hat eine Funktionenfolge (vonTreppenfunktionen), berechnet deren Integral und will wissen, ob die die Grenzfunktionintegrierbar ist und falls ja, ob die Folge der Integrale der Treppenfunktionen gegen dasIntegral der Grenzfunktion konvergiert.

15.1 Punktweise Konvergenz: Drei Enttauschungen

Die nicht wirklich motivierende Uberschrift dieses Abschnitts suggeriert, dass punktweiseKonvergenz und Vertauschung von Grenzprozessen kein Traumpaar sind. Dem ist so, wiedie folgenden Beispiele zeigen.

(i) Stetigkeit: Die Grenzfunktion einer punktweise konvergenten stetigen Funktionenfol-ge ist im Allgemeinen nicht stetig. Dies haben wir schon gesehen, die Folge der ste-tigen Funktionen (13.2) konvergiert auf [0, 1] punktweise gegen die unstetige Grenz-funktion (13.4).

2Man wird meist zu effizienteren Verfahren wie etwa der Trapezregel greifen, die man in der Numeri-schen Mathematik kennenlernt, aber das ist hier nicht der Punkt.

193

Page 200: Vorlesungsskript zur Analysis 1 -

(ii) Integrierbarkeit: Gilt fn → f punktweise, so gilt im Allgemeinen

∫ b

a

f(x) dx 6= limn→∞

∫ b

a

fn(x) dx .

Zum Beispiel betrachten wir

fn : [0, 1]→ R , fn(x) =

n2x , x ∈ [0, 1n] ,

2n− n2x , x ∈ [ 1n, 2n] ,

0 , sonst.

(15.1)

Es gilt fn → 0 punktweise in [0, 1] und alle fn und f sind integrierbar, aber

0 =

∫ 1

0

f(x) dx 6=∫ 1

0

fn(x) dx = 1

fur alle n ∈ N>0. Siehe Abb. 15.1.

(ii) Differenzierbarkeit: Gilt fn → f punktweise, so gilt im Allgemeinen

f ′(x) 6= limn→∞

f ′n(x) .

Sei etwa

fn(x) :=1√n

sin(nx) , (15.2)

siehe Abb. 15.2. Man kann leicht sehen (Ubung!), dass fn → 0 punktweise (hierist 0 die Nullfunktion f ≡ 0). Die Ableitung f ′n(x) =

√n cos(nx) konvergiert aber

nicht gegen die Ableitung der Grenzfunktion. In der Tat konvergiert die Folge derAbleitungen gar nicht, sondern divergiert.

0.0 0.2 0.4 0.6 0.8 1.0

2

4

6

8

10

Abbildung 15.1: limn→∞∫ bafn(x) dx 6=

∫ ba

limn→∞ fn(x) dx fur punktweise Konvergenz.Gezeigt ist der Graph von (15.1) fur n = 2, . . . , 20.

194

Page 201: Vorlesungsskript zur Analysis 1 -

1 2 3 4 5

-0.6

-0.4

-0.2

0.2

0.4

0.6

n=2

n=4

n=16

Abbildung 15.2: (limn→∞ fn(x))′ 6= limn→∞ f′n(x) fur punktweise Konvergenz. Zu sehen

ist der Graph von (15.2) fur n = 2, 4, 16.

15.2 Vertauschungssatze fur gleichmaßige Konvergenz

Wir zeigen jetzt, dass unter gleichmaßiger Konvergenz, anders als unter punktweiser Kon-vergenz, leistungsstarke Vertauschungsatze existieren. Dass Stetigkeit unter gleichmaßigerKonvergenz erhalten bleibt, hatten wir bereits in Satz 13.4 gesehen.

Satz 15.1 (Integralvertauschung unter gleichmaßiger Konvergenz)Sei (fn) eine Folge in R[a, b], sei fn → f gleichmaßig. Dann folgt f ∈ R[a, b] und es gilt

∫ b

a

f(x) dx = limn→∞

∫ b

a

fn(x) dx . (15.3)

Beweis: Dass f ∈ R[a, b] gilt, folgt aus fn ∈ R[a, b] und der gleichmaßigen Konvergenzfn → f (Ubung). Die Identitat (15.3) folgt leicht:

0 ≤∣∣∣∣∫ b

a

f(x) dx−∫ b

a

fn(x) dx

∣∣∣∣ ≤∫ b

a

|f(x)− fn(x)| dx ≤∫ b

a

‖f − fn‖∞ dx

= (b− a)‖f − fn‖∞ → 0 .

Fur die Vertauschbarkeit der Differenzierbarkeit unter gleichmaßiger Konvergenz gilt fol-gender Satz.

Satz 15.2Sei (fn) eine Folge mit fn ∈ C[a, b], fn stetig differenzierbar in (a, b) und f ′n stetig fort-setzbar auf [a, b]. Es gelte weiter:

(i) Die Folge (fn) konvergiert punktweise auf [a, b].

(ii) Die Folge (f ′n) konvergiert gleichmaßig auf [a, b].

Dann ist die Grenzfunktion f stetig differenzierbar und an jeder Stelle x ∈ (a, b) gilt

f ′(x) = limn→∞

f ′n(x) .

195

Page 202: Vorlesungsskript zur Analysis 1 -

Beweis: Zunachst ist die Grenzfunktion f ∗ := limn→∞ f′n nach Satz 13.4 stetig. Aus dem

Hauptsatz 14.17 folgt mit x0 ∈ [a, b] fest fur beliebiges x ∈ [a, b]

fn(x) = fn(x0) +

∫ x

x0

f ′n(t) dt .

Damit folgt aus dem Integralvertauschungssatz 15.1 fur n→∞

f(x) = f(x0) +

∫ x

x0

f ∗(t) dt .

Nach dem Hauptsatz ist f also differenzierbar mit

f ′(x) = f ∗(x) = limn→∞

f ′n(x) .

Die zentrale Voraussetzung in Satz 15.2 ist die gleichmaßige Konvergenz der Ableitung.Man wurde sich vielleicht zunachst einen Wunschsatz erhoffen, der zur Vertauschung vonFolge und Differenzierbarkeit nur die gleichmaßige Konvergenz der Funktion verlangt.Dies ist jedoch nicht moglich, wie die in Folge (15.2) zeigt, die gleichmaßig konvergiert,aber eine divergente Ableitung besitzt.

Dass die Grenzfunktion einer gleichmaßig konvergierenden Folge differenzierbarer Funk-tionen nicht differenzierbar sein muss, sieht man auch an dem Beispiel

fn(x) :=

√x2 +

1

n;

definiert als Funktion auf (−1, 1) ist fn differenzierbar, und es gilt fn → |x| sowohl impunktweisen als auch im gleichmaßigen Sinn; aber wie in Abschnitt 12.1 gezeigt, ist |x|im Urspung nicht differenzierbar.

Satz 15.3Sei (fn) eine Folge in C[a, b], seien alle fn differenzierbar auf (a, b) und f ′n stetig fortsetzbarauf [a, b]. Sei die Folge (f ′n) gleichmaßig konvergent gegen eine Funktion g : [a, b] → R.Es gebe ein x0 ∈ [a, b], so dass (fn(x0)) konvergent ist. Dann gibt es ein f ∈ C[a, b] mitfn → f gleichmaßig und f ′ = g in (a, b).

Beweis: Zunachst ist g stetig nach Satz 13.4. Aus dem Hauptsatz folgt

fn(x) = fn(x0) +

∫ x

x0

f ′n(t) dt

fur alle x ∈ [a, b]. Wir setzen

c := limn→∞

fn(x0) , f(x) = c+

∫ x

x0

g(t) dt .

Dann ist f ∈ C[a, b] und f ′ = g in (a, b) nach dem Hauptsatz, und es gilt fur alle x ∈ [a, b]

|f(x)− fn(x)| =∣∣∣∣c+

∫ x

x0

g(t) dt− fn(x0)−∫ x

x0

f ′n(t) dt

∣∣∣∣

≤ |c− fn(x0)|+∫ x

x0

|g(t)− f ′n(t)| dt

≤ |c− fn(x0)|+ |x0 − x| ‖g − f ′n‖∞ ,

196

Page 203: Vorlesungsskript zur Analysis 1 -

also0 ≤ ‖f − fn‖∞ ≤ |c− fn(x0)|+ (b− a)‖g − f ′n‖∞ ,

woraus die Behauptung folgt. �

197

Page 204: Vorlesungsskript zur Analysis 1 -

16 Potenzreihen und Taylorreihen

16.1 Gleichmaßige Konvergenz von Potenzreihen

Zur Erinnerung an Definitionen aus Abschnitt 9.5: Eine allgemeine Potenzreihe hat dieForm

f(z) =∞∑

k=0

ck(z − a)k ,

mit dem Entwicklungspunkt a ∈ C und Koeffizienten ck ∈ C. Der Konvergenzradius derPotenzreihe ist definiert durch

r :=1

lim supk→∞k√|ck|∈ [0,∞].

Nach Satz 9.21 konvergiert eine Potenzreihe∑∞

k=0 ck(z − a)k innerhalb des Konvergenz-radius absolut, also fur |z− a| < r, und divergiert fur |z− a| > r. Wir stellen uns nun dieFrage, ob diese Konvergenz gleichmaßig ist.

Satz 16.1 (Weierstraß-Kriterium)Sei D ⊂ K. Sei (fk)k∈N eine Folge von Funktionen in B(D;K), es gelte

∞∑

k=0

‖fk‖∞ <∞ . (16.1)

Dann ist fur alle x ∈ D die Reihe∞∑

k=0

fk(x) (16.2)

absolut konvergent, und die Partialsummen sn : D → K,

sn =n∑

k=0

fk ,

konvergieren gleichmaßig gegen f : D → K,

f(x) =∞∑

k=0

fk(x) .

Beweis: Fur alle x ∈ D gilt |fk(x)| ≤ ‖fk‖∞, also auch

n∑

k=0

|fk(x)| ≤n∑

k=0

‖fk‖∞ ≤∞∑

k=0

‖fk‖∞ <∞ ,

damit ist (16.2) absolut konvergent fur alle x ∈ D. Sei nun ε > 0. Aus (16.1) folgt, dasses ein n0 ∈ N gibt mit

∞∑

k=n0+1

‖fk‖∞ < ε .

198

Page 205: Vorlesungsskript zur Analysis 1 -

Dann gilt fur alle n ≥ n0 und alle x ∈ D

|sn(x)− f(x)| =∣∣∣∣∣∞∑

k=n+1

fk(x)

∣∣∣∣∣ ≤∞∑

k=n+1

|fk(x)| ≤∞∑

k=n+1

‖fk‖∞ < ε .

Also konvergiert sn gleichmaßig gegen f . �

Beispiel: Fur fk : R→ R,

fk(x) =cos(kx)

k2,

gilt

‖fk‖∞ ≤1

k2,

also∞∑

k=1

‖fk‖∞ ≤∞∑

k=1

1

k2<∞ ,

also ist Satz 16.1 anwendbar und damit die Reihe

∞∑

k=1

cos(kx)

k2

absolut und in R gleichmaßig konvergent.

Satz 16.2 (Stetigkeit von Potenzreihen)Sei (ck) eine Folge in C, sei a ∈ C, und

∞∑

k=0

ck(z − a)k

eine Potenzreihe mit Konvergenzradius r > 0. Dann konvergieren fur jedes ρ < r diePartialsummen

sn(z) =n∑

k=0

ck(z − a)k

auf K(a, ρ) gleichmaßig gegen

f(z) :=∞∑

k=0

ck(z − a)k .

Die Funktion f ist stetig auf B(a, r).

Beweis: Fur z ∈ C mit |z − a| = ρ gilt

∞∑

k=0

|ck|ρk =∞∑

k=0

|ck| |z − a|k <∞ , (16.4)

da die Potenzreihe nach Satz 9.22 dort absolut konvergiert. Wir setzen

fk(z) = ck(z − a)k ,

199

Page 206: Vorlesungsskript zur Analysis 1 -

dann gilt fur alle z mit |z − a| ≤ ρ

|fk(z)| ≤ |ck|ρk ,

also wegen (16.4)∞∑

k=0

‖fk‖∞ ≤∞∑

k=0

|ck|ρk <∞ ,

wobei die Supremumsnorm auf D = K(a, ρ) betrachtet wird. Aus dem Weierstraß-Kriteri-um (Satz 16.1) folgt, dass sn → f gleichmaßig auf K(a, ρ). Da alle sn stetig sind, ist nachSatz 13.4 auch f stetig auf K(a, ρ) und damit auch auf

B(a, r) =⋃

0<ρ<r

K(a, ρ) .

Als nachstes zeigen wir, dass eine Potenzreihe im Innern ihres Konvergenzintervalls dif-ferenzierbar ist und dass wir ihre Ableitung durch gliedweises Differenzieren erhaltenkonnen.

Satz 16.3 (Differenzierbarkeit von Potenzreihen)Sei (ck) eine Folge in R, a ∈ R, und

∞∑

k=0

ck(x− a)k (16.5)

eine Potenzreihe mit Konvergenzradius r > 0. Dann ist die durch

f(x) :=∞∑

k=0

ck(x− a)k (16.6)

definierte Funktion f : (a− r, a+ r)→ R stetig differenzierbar in (a− r, a+ r), und es gilt

f ′(x) =∞∑

k=1

kck(x− a)k−1 . (16.7)

Diese Potenzreihe hat ebenfalls den Konvergenzradius r, sie konvergiert absolut in (a −r, a+r), und fur jedes ρ < r konvergieren die Partialsummen gleichmaßig auf [a−ρ, a+ρ].

Beweis: Variante 1: Wir definieren fur k ≥ 1

gk(x) := kck(x− a)k−1 .

Ist ρ < r, so gilt fur die Supremumsnorm auf [a− ρ, a+ ρ]

‖gk‖∞ ≤ k|ck|ρk−1 . (16.11)

Sei x gewahlt mit ρ := |x− a| < r, und sei weiter x gewahlt mit ρ < |x− a| < r. Es gibtM > 0 mit

|ck| |x− a|k ≤M , fur alle k ≥ 1,

200

Page 207: Vorlesungsskript zur Analysis 1 -

da die Reihe (16.5) in x absolut konvergiert. Aus (16.11) folgt fur alle x mit |x− a| ≤ ρ

|gk(x)| ≤ k|ck|ρk−1 =k

ρ

|x− a|

)k|ck| |x− a|k ≤

k

ρ

|x− a|

)kM .

Es folgt weiter∞∑

k=1

|gk(x)| ≤∞∑

k=1

M

ρk

|x− a|

)k<∞ ,

da die rechts stehende Reihe nach dem Quotientenkriterium konvergent ist. Die Potenz-reihe

∞∑

k=1

kck(x− a)k−1 (16.12)

ist also fur jedes x mit |x − a| < r konvergent und hat daher Konvergenzradius ≥ r.Ein analoges Argument zeigt die Divergenz fur |x− a| > r, also ist der Konvergenzradiusvon (16.12) gleich r. Aus Satz 16.2 folgt die absolute Konvergenz auf (a−r, a+r) und diegleichmaßige Konvergenz auf [a− ρ, a+ ρ] fur jedes ρ < r. Wir wenden nun Satz 15.3 aufdie Partialsummen der Reihen in (16.6) und (16.7) an und erhalten, dass f differenzierbarund f ′ durch (16.7) gegeben ist, und zwar auf jedem solchen Intervall [a − ρ, a + ρ] unddamit auf (a− r, a+ r).

Variante 2: Wir zeigen, dass fur 0 < |x− a| < r und

ck =k

x− ack

gilt, dass1

lim supk→∞k√|ck|

=1

lim supk→∞k√|ck|

= r . (16.13)

Aus (16.13) folgt, dass die Potenzreihe (16.12) ebenfalls den Konvergenzradius r hat, undder Beweis geht weiter wie bei Variante 1. Um (16.13) zu beweisen, verwendet man

limk→∞

k√|x− a| = 1 , lim

k→∞

k√k = 1 ;

letzteres gilt, da ln( k√k) = (ln(k))/k → 0 fur k →∞ und daher

k√k = exp(ln(

k√k)) → exp(0) = 1 .

Es ergibt sich dann

lim supk→∞

k√|ck| =

1

limk→∞k√|x− a|

·(

limk→∞

k√k)· lim sup

k→∞

k√|ck| = lim sup

k→∞

k√|ck| .

Beispiel 16.4Die die Funktion

f(x) =∞∑

k=0

xk

201

Page 208: Vorlesungsskript zur Analysis 1 -

definierende Potenzreihe ist konvergent fur |x| < 1, divergent fur |x| > 1, hat also Kon-vergenzradius r = 1. Fur |x| < 1 gilt

f(x) =1

1− x .

Aus Satz 16.3 folgt nun1

(1− x)2= f ′(x) =

∞∑

k=1

kxk−1 .

Hieraus erhalten wir die Formel

∞∑

k=1

kxk = x∞∑

k=1

kxk−1 =x

(1− x)2.

Notation 16.5Sei I offenes Intervall in R. Wir setzen

Cn(I) ={f∣∣ f : I → R, f ist n-mal stetig differenzierbar

},

C∞(I) =∞⋂

n=1

Cn(I) .

Die Elemente von C∞(I) sind also diejenigen Funktionen, die auf I beliebig oft differen-zierbar sind; diese werden auch als unendlich oft differenzierbaren Funktionen bezeichnet.

Satz 16.6Sei (ck) eine Folge in R, a ∈ R, und

∞∑

k=0

ck(x− a)k

eine Potenzreihe mit Konvergenzradius r > 0. Dann ist die durch

f(x) =∞∑

k=0

ck(x− a)k

definierte Funktion f : (a − r, a + r) → R unendlich oft differenzierbar in (a − r, a + r),und es gilt

ck =1

k!f (k)(a) (16.14)

fur alle k ∈ N.

Beweis: Wir zeigen mit Induktion uber k: f ist k-mal differenzierbar in (a− r, a+ r), undf (k) ist gegeben durch die in (a− r, a+ r) konvergente Potenzreihe

f (k)(x) =∞∑

m=k

m(m− 1) · · · (m− k + 1)cm(x− a)m−k . (16.16)

202

Page 209: Vorlesungsskript zur Analysis 1 -

Fur k = 1 gilt (16.16) nach Satz 16.3. Gilt die Behauptung fur k, so konnen wir Satz 16.3auf f (k) anwenden und erhalten die Formel (16.16) fur k + 1 durch gliedweises Differen-zieren. Die Formel (16.14) folgt, indem wir x = a in (16.16) setzen. �

Fur Potenzreihen

f(x) =∞∑

k=0

ck(x− a)k

mit Konvergenzradius r > 0 gilt also

f(x) =∞∑

k=0

1

k!f (k)(a)(x− a)k , x ∈ (a− r, a+ r) . (16.17)

16.2 Taylorreihen

Ausgangspunkt ist die Formel (16.17), welche es (jedenfalls fur Potenzreihen) erlaubt,den Wert f(x) einer Funktion durch die Werte von f und ihren Ableitungen im Punkt adarzustellen.

Definition 16.7 (Taylorreihe)Sei a ∈ R, sei I ⊂ R offenes Intervall mit a ∈ I. Sei f ∈ C∞(I). Die Reihe

∞∑

k=0

f (k)(a)

k!(x− a)k (16.18)

heißt die Taylorreihe von f mit Entwicklungspunkt a. Falls sie den Konvergenzradiusr > 0 hat, so definiert

Tf (x) =∞∑

k=0

f (k)(a)

k!(x− a)k

eine Funktion Tf : (a− r, a+ r)→ R.

Wir erinnern an die Definition 12.27 des Taylorpolynoms: Fur f ∈ Cn(I) und a ∈ I,wobei I ein Intervall ist, ist das n-te Taylorpolynom von f in a gegeben durch

Tnf(x; a) =n∑

k=0

f (k)(a)

k!(x− a)k .

Die Partialsummen der Taylorreihe sind die also die Taylorpolynome.

Als Beispiel stellen wir die Taylorreihe des Logarithmus um den Punkt 1 auf. Zu diesemZweck betrachten wir die Funktion

f(x) = ln(1 + x)

mit Entwicklungspunkt a = 0. Diese Funktion ist beliebig oft differenzierbar,

f ′(x) =1

1 + x, f ′′(x) = − 1

(1 + x)2, f ′′′(x) =

2

(1 + x)3,

203

Page 210: Vorlesungsskript zur Analysis 1 -

allgemein

f (k)(x) = (−1)k+1 (k − 1)!

(1 + x)k, f (k)(0) = (−1)k+1(k − 1)! , k ≥ 1 .

Zusammen mit f(0) = ln(1) = 0 erhalten wir

Tf (x) =∞∑

k=1

f (k)(0)

k!xk =

∞∑

k=1

(−1)k+1 · xk

k.

Die Potenzreihe hat Konvergenzradius 1, da k√k → 1 fur k → ∞, wie in der zweiten

Beweisvariante von Satz 16.3 gezeigt. Sie divergiert fur x = −1 (harmonische Reihe) undkonvergiert fur x = 1 (alternierende harmonische Reihe).

Es ist aber dadurch noch nicht geklart, fur welche x die Taylorreihe Tf (x) mit f(x) =ln(1+x) ubereinstimmt. Denn Satz 16.2 zeigt, dass die Partialsummen Tnf echt innerhalbdes Konvergenzkreises gleichmaßig gegen die Taylorreihe Tf konvergieren. Konvergierendie Partialsummen Tnf aber auch gegen f , gilt also Tf = f? Mit dieser Frage beschaftigenwir uns im Rest dieses Abschnitts.

Bemerkung 16.8(i) Der Konvergenzradius der Potenzreihe (16.18) kann 0 sein. (In diesem Fall konnen

wir Tf (x) lediglich fur x = a definieren, und es gilt Tf (a) = f(a).)

(ii) Ist f durch eine Potenzreihe definiert, so gilt nach Satz 16.6

f = Tf .

So ist etwa

exp(x) = Texp(x) =∞∑

k=0

xk

k!.

(iii) Fur f ∈ C∞(I) ist es moglich, daß f 6= Tf . Das klassische Beispiel hierzu ist

f(x) :=

{exp

(− 1x

), x > 0 ,

0 , x ≤ 0 .(16.19)

Es ist f (k)(0) = 0 fur alle k ∈ N (siehe Ubungsaufgabe), also ist Tf = 0 im Ent-wicklungspunkt a = 0. Siehe Abb. 16.1. Ein verwandtes Beispiel zur Illustration desgleichen Phanomens ist

g(x) :=

{exp

(1

x2−1

), −1 < x < 1 ,

0 , sonst.(16.20)

Siehe Abb. 16.2.

Die Approximation einer Funktion f durch Taylorpolynome als die Partialsummen ihrerTaylorreihe

f(x) =n∑

k=0

f (k)(a)

k!(x− a)k

︸ ︷︷ ︸=Tnf(x)

+Rn+1(x)

204

Page 211: Vorlesungsskript zur Analysis 1 -

-1 1 2 3

0.12

0.22

0.32

0.42

0.52

0.62

0.72

Abbildung 16.1: Ein Plot der Funktion f aus Gleichung (16.19).

-3 -2 -1 1 2 3

0.1

0.2

0.3

-1.2 -1.1 -1.0 -0.9 -0.8 -0.7 -0.6

0.05

0.10

0.15

0.20

0.25

Abbildung 16.2: Links: Ein Plot der Funktion g aus Gleichung (16.20), rechts: Ausschnitts-vergroßerung um x = −1.

mit einem Restglied Rn+1 ist ein wichtiges Werkzeug der Analysis. Sie ist bereits dannnutzlich und sinnvoll, wenn nur die ersten n bzw. n+ 1 Ableitungen von f existieren.

Wir beweisen jetzt die Approximation, die wir in Abb. 12.5 schon fur ein Beispiel vor-gefuhrt haben. Insbesondere gewinnen wir eine Abschatzung der Differenz f − Tnf .

Satz 16.9 (Taylorentwicklung mit Integraldarstellung des Restglieds)Sei I ⊂ R offenes Intervall, f ∈ Cn+1(I) und a ∈ I. Dann gilt fur alle x ∈ I

f(x) =n∑

k=0

f (k)(a)

k!(x− a)k +Rn+1(x)

mit

Rn+1(x) =1

n!

∫ x

a

(x− t)nf (n+1)(t) dt .

Beweis: Induktion uber n. Fur n = 0 wird die Behauptung zu

f(x) = f(a) +

∫ x

a

f ′(t) dt ,

was nach dem Hauptsatz richtig ist. Zum Beweis von n− 1→ n sei

f(x) =n−1∑

k=0

f (k)(a)

k!(x− a)k +Rn(x) , (16.22)

205

Page 212: Vorlesungsskript zur Analysis 1 -

Rn(x) =1

(n− 1)!

∫ x

a

(x− t)n−1f (n)(t) dt .

Es gilt dann mit partieller Integration

Rn(x) =1

(n− 1)!

[− 1

n(x− t)nf (n)(t)

∣∣∣t=x

t=a−∫ x

a

− 1

n(x− t)nf (n+1)(t) dt

]

=1

n!(x− a)nf (n)(a) +

1

n!

∫ x

a

(x− t)nf (n+1)(t) dt .

Einsetzen in (16.22) liefert die Behauptung. �

Der nachste Satz stellt eine alternative Beschreibung des Restglieds bereit, benannt nachJoseph-Louis Lagrange (1736–1813).

Satz 16.10 (Taylorentwicklung mit Lagrange-Restglied)Seien die Voraussetzungen von Satz 16.9 erfullt. Dann gibt es zu jedem x ∈ I ein ξzwischen a und x (also a < ξ < x beziehungsweise x < ξ < a) mit

Rn+1(x) =f (n+1)(ξ)

(n+ 1)!(x− a)n+1 . (16.23)

Beweis: Da f (n+1) stetig ist und die durch

g(t) :=(x− t)nn!

(16.25)

definierte Funktion zwischen a und x nicht das Vorzeichen wechselt, konnen wir denMittelwertsatz der Integralrechnung (Satz 14.18) anwenden und erhalten, dass es ein ξ imIntervall [a, x] (bzw. [x, a]) gibt mit

Rn+1(x) =1

n!

∫ x

a

(x− t)nf (n+1)(t) dt =1

n!f (n+1)(ξ)

∫ x

a

(x− t)n dt

=f (n+1)(ξ)

(n+ 1)!(x− a)n+1 ;

aufgrund der Monotonie von g folgt sogar, dass ξ echt zwischen a und x liegt. �

Fur Interessierte sei noch erwahnt und bewiesen, dass die Aussage von Satz 16.10 auchunter der schwacheren Voraussetzung f ∈ Cn(I) und f (n) auf I differenzierbar (aber f (n+1)

nicht notwendig stetig) gilt. Der Nachweis erfolgt mit dem Satz 12.16 von Rolle: Definiere

g(t) := f(x)−n∑

k=0

f (k)(t)

k!(x− t)k − m

(n+ 1)!(x− t)n+1 ,

wobei m ∈ R so gewahlt ist, dass g(a) = 0 gilt (dies ist moglich, da die Gleichung g(a) = 0nach m aufgelost werden kann). Dann haben wir g(a) = g(x) = 0, g ∈ C(I) und g istdifferenzierbar auf I. Nach dem Satz von Rolle gibt es daher ξ zwischen a und x, alsoa < ξ < x oder x < ξ < a, mit g′(ξ) = 0. Wir berechnen

g′(t) =n∑

k=1

f (k)(t)

(k − 1)!(x− t)k−1 −

n∑

k=0

f (k+1)(t)

k!(x− t)k +

m

n!(x− t)n

=m− f (n+1)(t)

n!(x− t)n.

206

Page 213: Vorlesungsskript zur Analysis 1 -

Aus g′(ξ) = 0 folgt m = f (n+1)(ξ) und mit g(a) = 0 erhalten wir

f(x) = g(a) + Tnf(x; a) +m

(n+ 1)!(x− a)n+1 = Tnf(x; a) +

f (n+1)(ξ)

(n+ 1)!(x− a)n+1.

�Folgerung 16.11Seien die Voraussetzungen von Satz 16.9 erfullt. Gilt dann zusatzlich f (n+1) ≡ 0 in I, soist f ein Polynom vom Grad ≤ n.

Beweis: In diesem Fall ist Rn+1 ≡ 0 in I. �

Folgerung 16.12Seien die Voraussetzungen von Satz 16.9 erfullt. Dann gibt es eine Funktion η : I → Rmit

f(x) =n+1∑

k=0

f (k)(a)

k!(x− a)k + η(x)(x− a)n+1

undlimx→a

η(x) = 0 . (16.26)

Beweis: Nach Satz 16.10 finden wir zu jedem x ∈ I ein ξ(x) mit |ξ(x)− a| ≤ |x− a| und

f(x)−n+1∑

k=0

f (k)(a)

k!(x− a)k =

f (n+1)(ξ(x))− f (n+1)(a)

(n+ 1)!(x− a)n+1 .

Wir definieren

η(x) =f (n+1)(ξ(x))− f (n+1)(a)

(n+ 1)!,

und dann gilt (16.26), da f (n+1) stetig ist und limx→a ξ(x) = a. �

Ist also f ∈ Cn(I) und Tnf das n-te Taylorpolynom von f in a, so geht der Fehler|f(x)− Tnf(x; a)| fur x→ a schneller gegen 0 als (x− a)n.

Definition 16.13 (Klein-O und Groß-O)Sei I ein offenes Intervall mit 0 ∈ I und f, g : I → R Funktionen. Wir sagen

f(h) = O(g(h)) fur h→ 0 ,

falls es δ > 0 und C > 0 gibt mit

|f(h)| ≤ C|g(h)| , fur alle 0 < |h| < δ.

Wir sagenf(h) = o(g(h)) fur h→ 0 ,

falls zu jedem ε > 0 ein δ > 0 existiert mit

|f(h)| ≤ ε|g(h)| , fur alle 0 < |h| < δ. (16.27)

Gibt es ρ > 0 mit g(h) 6= 0 fur alle 0 < |h| < ρ, so schreibt man (16.27) auch in der Form

limh→0h 6=0

f(h)

g(h)= 0 .

207

Page 214: Vorlesungsskript zur Analysis 1 -

Typische Anwendungsbereiche dieser Notation (manchmal auch als Landau-Symbole be-zeichnet) sind zum einen Fehlerschranken der Form O(hα) fur geeignetes α > 0, die denFehler fur h → 0 beschreiben. Gleich folgt eine scharfere Schranke, namlich der Formo(hn), fur das Restglied der Taylorentwicklung. Insbesondere in der Numerik, Kombina-torik und in der diskreten Mathematik findet man auch oft Schranken der Form O(nk)fur n→∞ fur geeignetes k ∈ N.

Beispiel 16.14Sei Tnf das n-te Taylorpolynom von f in a ∈ I, I ein Intervall, und

r(h) = f(a+ h)− Tnf(a+ h; a) .

Dann gilt nach Folgerung 16.12

r(h) = o(hn) , falls f ∈ Cn(I),

undr(h) = O(hn+1) , falls f ∈ Cn+1(I),

da fur eine geeignete Zwischenstelle ξ

r(h) = Rn+1(a+ h) =f (n+1)(ξ)

(n+ 1)!hn+1 ,

also fur |h| ≤ h0, h0 > 0 fest,

|r(h)| ≤ C|h|n+1 , C =1

(n+ 1)!sup

|ξ−a|≤|h0||f (n+1)(ξ)| .

Beispiel 16.15(i) Die Taylorreihe des Sinus mit Entwicklungspunkt a = 0 ist

Tsin(x) =∞∑

k=0

(−1)kx2k+1

(2k + 1)!. (16.28)

Es gibt mindestens zwei Wege, das zu begrunden:

Erstens hatten wir den Sinus uber die Exponentialfunktion eingefuhrt und darauseine Potenzreihe um a = 0 fur sin bekommen mit Konvergenzradius r = ∞. NachSatz 16.6 stimmen eine Potenzreihe und ihre Taylorreihe uberein, wenn der Ent-wicklungspunkt der gleiche ist. In (16.28) ist genau die sin-Reihe angegeben unddiese ist wie begrundet identisch mit Tsin.

Zweitens kann man Tsin(x) auch uber die Formel fur die Taylorreihe aufstellen. Esgilt

f = sin, f ′ = cos, f ′′ = − sin, f ′′′ = − cos, f (4) = sin, . . .

Berechnen von f (k)(0)k!

und Streichen von Nulltermen gibt (16.28).

Da alle Ableitungen des Sinus durch 1 beschrankt sind, folgt aus Satz 16.10

|Rn(x)| ≤ |x|n

n!,

208

Page 215: Vorlesungsskript zur Analysis 1 -

also gilt fur alle x ∈ Rlimn→∞

Rn(x) = 0 ,

und damit auch

sin(x) =∞∑

k=0

(−1)kx2k+1

(2k + 1)!

fur alle x ∈ R. Schreiben wir wieder h statt x (es ist a = 0), so ist

sin(h) = h+R3(h) = h+O(h3) ,

sin(h) = h− h3

3!+R5(h) = h− h3

3!+O(h5) ,

sin(h) = h− h3

3!+h5

5!+R7(h) = h− h3

3!+h5

5!+O(h7) .

(ii) Analog folgt fur den Cosinus mit Entwicklungspunkt a = 0

cos(x) =∞∑

k=0

(−1)kx2k

(2k)!

fur alle x ∈ R.

16.3 Bonusmaterial

Der hier vorgestellte Zugang zur Lagrange-Formel des Restglieds ist klassisch. Der Vorteildieses Zugangs ist, dass er minimalen Aufwand benotigt, namlich im wesentlichen denMittelwertsatz 14.18 und die Definition von g in (16.25). Das ist elegant; aber sollten Siesich das Argument schwer zu merken finden, sind Sie in bester Gesellschaft. Tim Gowers(Fieldsmedaille 1998) schrieb 2014 in seinem Blog https://gowers.wordpress.com:

There are countless situations in mathematics where it helps to expand a func-tion as a power series. Therefore, Taylor’s theorem, which gives us circumstan-ces under which this can be done, is an important result of the course. It isalso the one result that I was dreading lecturing, at least with the Lagran-ge form of the remainder, because in the past I have always found that theproof is one that I have not been able to understand properly. I don’t meanby that that I couldn’t follow the arguments I read. What I mean is that Icouldn’t reproduce the proof without committing a couple of things to me-mory, which I would then forget again once I had presented them. Briefly, anargument that appears in a lot of textbooks uses a result called the Cauchymean value theorem3, and applies it to a cleverly chosen function4. WhereasI understand what the mean value theorem is for, I somehow don’t have thesame feeling about the Cauchy mean value theorem: it just works in this si-tuation and happens to give the answer one wants. And I don’t see an easyway of predicting in advance what function to plug in. I have always found

3Cauchy mean value theorem = verallgemeinerter Mittelwertsatz 14.18.4Dies ist die Konstruktion mit g in (16.25).

209

Page 216: Vorlesungsskript zur Analysis 1 -

this situation annoying, because a part of me said that the result ought to bea straightforward generalization of the mean value theorem, in the followingsense. The mean value theorem applied to the interval [x, x + h] tells us that

there exists y ∈ (x, x + h) such that f ′(y) = f(x+h)−f(x)h

, and therefore thatf(x+h) = f(x)+hf ′(y). Writing y = x+θh for some θ ∈ (0, 1) we obtain thestatement f(x+h) = f(x) +hf ′(x+ θh). This is the case of Taylor’s theorem.So can’t we find some kind of “polynomial mean value theorem” that will dothe same job for approximating by polynomials of higher degree?

Gowers entwickelt dann einen”Satz von Rolle von hoherer Ordnung“ und findet damit

einen neuen Beweis der Restgliedformel (16.23). Der Beweis ist nicht schwer; wir legenIhnen ans Herz, ihn unter https://tinyurl.com/yd5ob6y3 nachzulesen. Bemerkenswertist die gewisse Widerborstigkeit, einen Beweis nicht einfach hinzunehmen, nur weil das alleschon immer so gemacht haben. Durch so eine kritische und kreative Einstellung entstehtneue und schone Mathematik.

210

Page 217: Vorlesungsskript zur Analysis 1 -

17 Einfuhrung in Differentialgleichungen

Eine Differentialgleichung stellt eine Beziehung zwischen einer unbekannten Funktiony = y(t) und Ableitungen dieser Funktion her. Das primare Ziel ist es, die gesuchteFunktion y zu finden oder zumindest deren Existenz nachzuweisen.

Ein einfaches, aber wichtiges Beispiel ist

y′ = y , (17.1)

oder genauer geschriebeny′(t) = y(t) .

Dies betont, dass es sich bei y um eine Funktion einer Variablen t handelt. Oft werden inDifferentialgleichungen auftretende Funktionen jedoch aus Platzgrunden ohne Argumentgeschrieben. Eine weitere Schreibweise fur (17.1), die sich als praktisch erweisen wird, ist

dy

dt= y .

Offensichtlich ist jede Funktiony(t) = c exp(t) (17.2)

mit einer Konstante c ∈ R eine Losung fur (17.1). Die Kombination der Differentialglei-chung (17.1) und einer Anfangsbedingung

y(t0) = y0 (17.3)

fur gegebene t0, y0 ∈ R wird Anfangswertproblem genannt. Der Anfangswert (17.3)bestimmt die Konstante in (17.2) und selektiert auf diese Weise eine eindeutige Losung;c wird namlich festgelegt wird durch die Identitat

y0 = c exp(t0).

Bemerkung 17.1(i) Wir bezeichnen in diesem Kapitel die Variable nicht mit x wie bisher, sondern mit

t. Damit deuten wir an, dass es sich bei dieser Variable in Anwendungen sehr oft umdie Zeit (time) handelt. Dann legt die Differentialgleichung die zeitliche Evolutionder Funktion y fest.

(ii) Wir beschranken uns auf den skalaren Fall y : [a, b]→ R mit geeignetem Zeitintervall[a, b] ⊂ R. Die hier betrachteten Fragestellungen treten jedoch auch in vektorwerti-gen Situationen auf. Dies wird in Analysis 2 betrachtet.

(iii) Die Resulte dieses Kapitels suggerieren, dass man eine Differentialgleichung lost, d.h.eine Losung y findet. In der Tat wird das in diesem Kapitel so sein. Im allgemeinen istes jedoch nicht moglich, die Losung einer Differentialgleichung explizit anzugeben.Es kann passieren, das keine Losung y existiert. So gibt es offensichtlich keine reelleLosung y fur

(y′(t))2 + 1 = 0 . (17.4)

Wir betrachten in diesem Kapitel nur Differentialgleichungen, in denen die Funktiony und ihre Ableitungen linear auftreten. Dann lassen sich explizite Losungen finden,

211

Page 218: Vorlesungsskript zur Analysis 1 -

wie wir zeigen werden. Der springende Punkt in (17.4) ist, dass y′ nichtlinear auf-tritt; dies fuhrt zur Nichtexistenz. Im allgemeinen gilt: Differentialgleichungen, indenen die gesuchte Funktion y oder ihre Ableitungen nichtlinear auftreten, konnennur in seltenen Fallen explizit gelost werden. Wir werden in Abschnitt 17.1 eineKlasse von Differentialgleichungen studieren, bei denen y′ linear auftritt, aber ynichtlinear vorkommen kann, weil die Gleichung eine spezielle Struktur hat. Hiersieht man eine Faustregel: Die hochste auftretende Ableitung ist besonders wich-tig. Erscheint sie nichtlinear wie in (17.4), ist das Problem normalerweise besondersschwierig (oder unlosbar, siehe (17.4)). Im allgemeinen Fall (nichtlineare Gleichun-gen ohne spezielle Struktur) versucht man, mit abstrakten Methoden die Existenzeiner Losung zu zeigen. Weiß man so, dass eine Losung existiert, kann man versu-chen, sie zu approximieren. Vorlesungen zur Numerischen Mathematik werden dazuMethoden bereitstellen. Ein unubertroffenes Kompendium expliziter Losungen vonDifferentialgleichungen ist [1].

Etwas Terminologie: Abstrakt formuliert ist eine Differentialgleichung eine Identitat

F(t, y, y′, . . . , y(n)

)= 0 (17.5)

fur gegebenes n ∈ N und festes F ; dieses n ist die Ordnung der Differentialgleichung.Sowohl (17.1) als auch (17.4) sind also Differentialgleichungen erster Ordnung. Eine Dif-ferentialgleichung heißt linear, wenn die gesuchte Funktion y und alle ihre in (17.5)auftretenden Ableitungen linear auftreten.

17.1 Separable Differentialgleichungen erster Ordnung

Wir betrachten jetzt Differentialgleichungen erster Ordnung der Form

y′ = f(t, y) . (17.6)

Definition 17.2 (Losung einer Differentialgleichung erster Ordnung)Eine Losung der Differentialgleichung (17.6) ist eine differenzierbare Funktion definiertauf einem Intervall I, y : I → R, die die Gleichung (17.6) erfullt.

Das Intervall I ist hier bewusst nicht naher bestimmt. Wir werden im Folgenden anneh-men, dass die der Differentialgleichung zugrunde liegende Beobachtung zum Zeitpunkt0 beginnt. Oft ist es moglich, I := [0,∞) zu wahlen. Dann sagt man, dass die Losungglobal existiert oder fur alle Zeiten existiert. Aber das haben wir nicht in der Hand:Manche Differentialgleichungen besitzen keine globalen Losungen, sondern

”leben“ nur

fur endliche Zeit, etwa I = [0, T ) mit T > 0, wie wir in Beispiel 17.5 sehen werden. Wirsind bestrebt, ein moglichst großes Intervall I zu finden, auf dem die Losung definiert ist.

Kann die rechte Seite von (17.6) zerlegt werden als

f(t, y) = g(t)h(y) (17.7)

so spricht man von einer separablen Differentialgleichung. Separable Gleichungen sindim Prinzip einfach zu losen. Die Grundidee ist, die Variablen zu separieren (daher der

212

Page 219: Vorlesungsskript zur Analysis 1 -

Name!): Alle Terme mit t auf eine Seite, alle Terme mit y auf die andere. Dies nennt manTrennung der Variablen. Mit y′ = dy

dtfuhrt dies formal auf

dy

h(y)= g(t) dt .

Jetzt integrieren wir auf beiden Seiten:∫

dy

h(y)=

∫g(t) dt . (17.8)

Sofern wir diese unbestimmten Integrale losen konnen, etwa∫g(t) dt = G(t) + C1 und

∫dy

h(y)= H(y) + C2

mit Konstanten C1 und C2, so ergibt sich

H(y) = G(t) + C (17.9)

mit C := C1 − C2. Dies ist ein bemerkenswertes Resultat: Wir haben die Differen-tialgleichung (17.7) in die

”normale“ Gleichung (17.9) ohne Ableitungen uberfuhrt; in

der Analysis nennt man solche Gleichungen algebraische Gleichungen. Wir versuchendann, (17.9) nach y zu losen.

Beispiel 17.3Die Gleichung erster Ordnung

y′(t) = y(t)

wird nach Trennung der Variablen und Integration zu∫

dy

y=

∫dt .

Die Bestimmung dieser Integrale liefert∫

dt = t+ C1 und

∫dy

y= ln(|y|) + C2 ,

also ln(|y|) = t+ C. Wir losen dies nach y und erhalten

y = exp(t+ C) = exp(C) exp(t) oder y = − exp(t+ C) = − exp(C) exp(t) ;

mit c = exp(C) oder c = − exp(C) gibt dies die Losung (17.2),

y(t) = c exp(t) .

Wann funktioniert diese Methode? Der folgende Satz gibt ein hinreichendes Kriterium.

Satz 17.4Seien T > 0, und h : R → R und g : [0, T ] → R stetige Funktionen. Sei H eine Stamm-funktion von 1

hund G eine Stammfunktion von g. Angenommen, G(t) +C liegt in einem

Intervall, in dem h keine Nullstelle hat. Dann ist

y(t) = H−1(G(t) + C)

eine Losung der Differentialgleichung (17.7).

213

Page 220: Vorlesungsskript zur Analysis 1 -

Beweis: Auf einem Intervall, auf dem h keine Nullstelle hat, ist 1/h stetig. Damit existiertnach dem Hauptsatz der Differential- und Integralrechnung 14.17 eine Stammfunktion H.Ebenso besitzt g eine Stammfunktion G. Weiter ist

H(y) = G(t) + C

lediglich Gleichung (17.8) in ubliche Notation umgeschrieben. Da nach Annahme auf dembetrachteten Intervall h 6= 0 gilt, hat h auf diesem Intervall keinen Vorzeichenwechsel.Nach dem Monotoniekriterium 12.21 ist H streng monoton und damit umkehrbar. DurchAbleiten sehen wir, dass die so erhaltene Funktion eine Losung von (17.7) ist:

y′ =(H−1(G(t) + C

)′=(H−1

)′(G(t) + C) ·G′(t)

=1

1h(y(t))

· g(t) = h(y(t)) · g(t) = f(t, y(t)) ,

wie behauptet. �

Beispiel 17.5Wir betrachten das Anfangswertproblen

y′(t) = ay2(t) ,

y(0) = y0 ,

mit konstantem a ∈ R+ und y0 ∈ R+. Trennung der Variablen liefert

1

y2dy = a dt ,

was nach Integration auf

−1

y= at+ C

fuhrt. Auflosen nach y ergibt

y = − 1

at+ C,

und durch Berucksichtigung der Anfangsbedingung finden wir

y =1

1y0− at .

Fur y0 > 0 und a > 0 geschieht etwas Bemerkenswertes: Zur Zeit T := 1ay0

wird der

Nenner diese Ausdrucks Null, also gilt y(t)→∞ fur den linksseitigen Grenzwert t→ T .Die Losung existiert nur fur endliche Zeiten, namlich auf I := [0, T ). Genau zum ZeitpunktT wird y unendlich groß, siehe Abb. 17.1. Dieser Effekt wird in der englischsprachigenLiteratur

”blow up“ genannt.

Wir mussen noch einen beliebten Anfangerfehler ausmerzen, namlich unkritisch von”der“

Losung eines Anfangswertproblems zu sprechen. Wie vor Satz 8.5 erlautert, durfen wirnicht naiv die Eindeutigkeit eines Objekts annehmen. Und wahrend Satz 8.5 die Eindeu-tigkeit des Limes garantiert, ist ein Anfangswertproblem nicht immer eindeutig losbar,wie das folgende Beispiel zeigt.

214

Page 221: Vorlesungsskript zur Analysis 1 -

0.0 0.2 0.4 0.6 0.8

10

20

30

40

Abbildung 17.1: Beispiel 17.5 mit y0 = 2 und a = 1. Die Losung existiert nur lokal auf

dem Intervall[0, 1

2

), nicht global.

Beispiel 17.6Sei

y′ = 2√y ,

y(0) = 0 .

Offenbar ist die Nullfunktion y ≡ 0 eine Losung. Andererseits liefert der Separationsan-satz, also Satz 17.4 die Losung y(t) = t2 (SUPER). Damit nicht genug, wir konnen diesebeiden Losungen geeignet aneinanderkleben und erhalten damit unendlich viele Losungen

y(t) =

{0 , t ≤ t0 ,

(t− t0)2 , t > t0 ,

fur jedes t0 ∈ R.

Wir werden in Analysis 2 den Satz von Picard-Lindelof beweisen, der ein Kriterium furdie Existenz und Eindeutigkeit eine Losung einer Differentialgleichung liefert. Die zentraleAnnahme wird sein, dass die beteiligten Funktionen Lipschitz-stetig sind. Der springendePunkt in obigem Beispiel ist, dass die Wurzel im Urspung diese Annahme verletzt, unddiese Nicht-Lipschitz-Stetigkeit fuhrt zur Nichteindeutigkeit der Losungen.

17.2 Inhomogene Gleichungen erster Ordnung

Jetzt untersuchen wir Gleichungen der Form

y′(t)− a(t) y(t) = f(t) (17.10)

fur gegebene Funktionen a und f ; gesucht ist eine Losung y. Man nennt Gleichung (17.10)homogen, falls f ≡ 0, und andernfalls inhomogen. Inhomogene Gleichungen entspre-chen in Anwendungen oft Gleichungen, in denen externe Krafte auftreten, daher wird oftdie Variable f fur die Inhomogenitat verwendet, von engl. force.

215

Page 222: Vorlesungsskript zur Analysis 1 -

Als Vorbereitung des inhomogenen Falls betrachten kurz den zugehorigen homogenen Fall

y′(t)− a(t) y(t) = 0 , (17.11)

y(0) = y0 , (17.12)

und losen ihn formal mit Separation der Variablen. Wir schreiben also (unter der Annah-me, dass y auf dem Losungsintervall I ein eindeutiges Vorzeichen besitzt)

y′(t)

y(t)= a(t) ,

und finden mit unbestimmten Integralen

ln(|y(t)|) =

∫ t

0

a(s) ds+ C ,

also

y(t) = c exp

(∫ t

0

a(s) ds

)

mit c := ± exp(C). Aus der Anfangsbedingung (17.12) ergibt sich die Festlegung c = y0,und damit die Losung

y(t) = y0 exp

(∫ t

0

a(s) ds

). (17.13)

Dies ist zunachst nur formal eine Losung – wir keine Voraussetzungen uber die Inte-grierbarkeit von a getroffen. Fur stetiges a existiert aber das Integral nach dem Haupt-satz 14.17, und dann sieht man durch Einsetzen der in (17.13) definierten Funktionin (17.11), dass es tatsachlich um eine Losung handelt.

17.2.1 Integrierende Faktoren

In diesem Abschnitt stellen wir eine Losungsmethode fur (17.10) vor, also fur Falle mitnichtverschwindender Kraft f . Wir stellen die Betrachtung von Anfangswerten an dasEnde des Abschnitts zuruck.

Die Idee ist, dass die Gleichung einfacher wird, wenn wir y mit einer anderen von Nullverschiedenen Funktion m multiplizieren. Sei z(t) := m(t)y(t), dann gilt nach der Pro-duktregel

dz(t)

dt= y(t)

dm(t)

dt+m(t)

dy(t)

dt.

Sofern y die Gleichung (17.10) lost, wird diese Gleichung zu

dz(t)

dt= y(t)

dm(t)

dt+m(t) · f(t) +m(t) · a(t)y(t) . (17.14)

Falls wir m so wahlen konnen, dass die Gleichung

dm(t)

dt= −a(t) ·m(t) , (17.15)

216

Page 223: Vorlesungsskript zur Analysis 1 -

erfullt ist, dann heben sich der erste und der dritte Term auf der rechten Seite von (17.14)auf. Damit vereinfacht sich diese Gleichung zu der leicht zu losenden Gleichung

dz(t)

dt= m(t) · f(t) . (17.16)

Entscheidend fur die Anwendbarkeit der Methode ist also, dass wir (17.15) losen konnen.Dies kann mit Trennung der Variablen geschehen, da (17.15) geschrieben werden kann als

dm(t)

m(t)= −a(t) dt .

Wir erhalten

ln(|m(t)|) = −∫ t

0

a(s) ds+ C

(wir diskutieren hier den Fall, dass der Anfangswert fur t = 0 gegeben ist. Andere Si-tuationen lassen sich durch Anpassen der Integrationsgrenzen abhandeln.) Es reicht hier,eine Losung zu finden, daher setzen wir der Einfachheit halber C = 0. Damit ergibt sich

m(t) = exp

(−∫ t

0

a(s) ds

). (17.17)

Sobald wir m bestimmt haben, konnen wir (17.16) durch Integration losen und erhalten

z(t) =

∫ t

0

m(s) · f(s) ds ,

woraus wir y(t) = z(t)m(t)

erhalten, also mit (17.17)

y(t) =

∫ t0m(s) · f(s) ds

m(t)= exp

(∫ t

0

a(s) ds

)·(∫ t

0

exp

(−∫ s

0

a(u) du

)· f(s) ds

),

(17.18)sofern die auftretenden Integrale existieren (was fur stetige Integranden durch den Haupt-satz der Differential- und Integralrechnung gewahrleistet ist).

Die obigen Schritte lassen sich wie folgt zusammenfassen:

(i) Der integrierende Faktor ist

m(t) = exp

(−∫ t

0

a(s) ds

).

(ii) Wir setzen

z(t) :=

∫ t

0

m(s) · f(s) ds .

(iii) Eine Losung ist dann y(t) = z(t)m(t)

.

217

Page 224: Vorlesungsskript zur Analysis 1 -

Beispiel 17.7Wir wollen die Differentialgleichung

y′(t) +y

t= t2

losen, haben also a(t) = −1t

und f(t) = t2. Wir mussen etwas aufpassen, da der inte-

grierende Faktor, m(t) = exp(−∫ t

0−1s

ds)

in der vorgestellten Form nicht definiert ist:

Das Integral divergiert wegen der Singularitat im Ursprung. Allerdings liefert die untereIntegrationsgrenze ohnehin nur einen konstanten Faktor,

∫ t

t0

ds

s= ln(t) + C,

fur jedes t0 > 0. Da die Integrationskonstante zur Bestimmung des integrierenden Faktorsunerheblich ist, wahlen wir als integrierende Faktor m(t) = exp(ln(t)) = t. Jede anderevon Null verschiedene Wahl der Konstante ware auch zulassig, da sich der Wert derKonstante im Endergebnis herauskurzt. Wir berechnen als nachstes

z(t) =

∫ t

m(s) · f(s) ds =

∫ t

s · s2 ds =

∫ t

s3 ds =t4

4+ C .

Damit ergibt sich

y(t) =z(t)

m(t)=

t4

4+ C

t=t3

4+C

t.

Bemerkung 17.8Die Losungsmethode des integrierenden Faktors lasst sich gehirnspeicherplatzfreundlicher

so formulieren. Wir merken uns lediglich 1 den integrierenden Faktor

m(t) = exp

(−∫ t

0

a(s) ds

),

und 2 dass wir die gegebene Gleichung (17.10) damit multiplizieren. Alles weitere ergibtsich dann mehr oder weniger von selbst: Diese beiden Schritte ergeben ausgeschrieben

exp

(−∫ t

0

a(s) ds

)· dy(t)

dt− a(t) y(t) · exp

(−∫ t

0

a(s) ds

)= f(t) · exp

(−∫ t

0

a(s) ds

);

wir erkennen, dass die linke Seite nach der Kettenregel die Ableitung eines Produkts ist.Also konnen wir die letzte Identitat umschreiben als

(exp

(−∫ t

0

a(s) ds

)y(t)

)′= f(t) · exp

(−∫ t

0

a(s) ds

).

Wenn wir diese Gleichung integrieren und das Ergebnis nach y auflosen, haben wir eineLosung gefunden.

218

Page 225: Vorlesungsskript zur Analysis 1 -

Wir betrachten jetzt das zugehorige Anfangswertproblem, also

y′(t)− a(t) y(t) = f(t) , (17.19)

y(0) = y0 . (17.20)

Dank der in diesem Kapitel bereits geleisteten Arbeit fallt uns hier die Losung in denSchoß. Wir haben fur das inhomogene Problem mit Anfangswert 0, also

y′(t)− a(t) y(t) = f(t)

y(0) = 0 ,

eine bereits eine Losung gefunden, namlich (17.18). Und auch das homogene Problemmit Anfangsbedingung y0, also (17.11)–(17.12) haben wir bereits in (17.13) eine Losungangegeben. Man wird jetzt vermuten, dass die Summe dieser Losungen zu Teilproblemendas Gesamtproblem lost, und genauso ist es.

Satz 17.9Sei I ⊂ R ein den Ursprung enthaltendes Intervall, und seien a, f : I → R stetig. Dannist auf I eine Losung fur das Anfangswertproblem (17.19)–(17.20) gegeben durch

y(t) = exp(−A(t))

(y0 +

∫ t

0

exp(A(s)) · f(s) ds

)mit A(t) := −

∫ t

0

a(s) ds . (17.21)

Beweis: Auch wenn (17.21) optisch erst einmal unvertraut aussieht, ist es die Summe einerLosung (17.13) fur das homogene Problem mit Anfangsdatum y0 und einer Losung (17.18)des inhomogenen Problems mit Anfangsdatum 0. Dies zu sehen und durch Differenzierenzu zeigen, dass (17.21) das inhomogene Anfangwertproblem (17.19)–(17.20) lost, ist eineSUPER-Ubung. �

Bemerkung 17.10Man kann zeigen, dass die Losung des Anfangwertproblems (17.19)–(17.20) eindeutigbestimmt ist, also die Losung genau durch (17.21) gegeben ist, und dass es keine weiterenLosungen gibt.

17.2.2 Variation der Konstanten

Wir werden jetzt einen Weg aufzeigen, den Merkaufwand noch weiter zu reduzieren (auchwenn (17.21) so wichtig ist, dass sich das Merken dieser Formel auszahlt!). Hier erweist sichdas Wechselspiel zwischen homogenen und inhomogenen Gleichungen als fruchtbar. DieGrundidee der Losungstheorie inhomogener Gleichungen ist fur alle solche Gleichungengleich. Denn sowohl bei inhomogenen GleichungssystemenAx = bmit einer n×n-Matrix Aund b ∈ Rn wie in der linearen Algebra, als auch bei inhomogenen Differentialgleichungenin der Analysis gilt: Die Summe einer Losung der homogenen Gleichung und einer Losungder inhomogenen Gleichung ergibt eine Losung der inhomogenen Gleichung. Wir notierenden zugrundeliegenden Sachverhalt.

Lemma 17.11Die Losungen einer homogenenen linearen Differentialgleichung bilden einen Vektorraum.Die Summe einer Losung eines inhomogenen Systems und einer Losung des zugehorigenhomogenen Systems lost wieder die inhomogene Gleichung.

219

Page 226: Vorlesungsskript zur Analysis 1 -

Beweis: SUPER (siehe auch Beispiel 17.12). �

Es lohnt sich, die homogene Losung (17.13) und inhomogene Losung (17.18) zu verglei-chen:

yhom(t) = exp

(∫ t

0

a(s) ds

)· c ,

yinhom(t) = exp

(∫ t

0

a(s) ds

)·(∫ t

0

exp

(−∫ s

0

a(u) du

)· f(s) ds

)

︸ ︷︷ ︸=:C(t)

.

Der Unterschied ist also, dass die homogene Losung eine Konstante beinhaltet, wahrenddie Separation der Variablen uns im inhomogenen Fall eine zeitabhangige Funktion C(t)geliefert hat. Mit diesem Wissen lost man inhomogene Gleichungen meistens wie folgt.Man findet zunachst eine konstantenbehaftete Losung der zugehorigen homogenen Glei-chung. Dann ersetzt man die Konstante durch eine zeitabhangige Funktion, wie oben cdurch C(t). Man setzt die so erhaltene Funktion in die inhomogene Gleichung ein undbestimmt C(t) so, dass die gegebene Gleichung erfullt ist. Dieses Vorgehen nennt manVariation der Konstanten. Wir haben diese Methode nur fur Gleichungen erster Ord-nung motiviert, indem wir durch einen Separationsansatz C(t) bestimmen konnten unddie strukturelle Ahnlichkeit der so erhaltenen Losung mit der homogenen Gleichung beob-achtet haben. Die Variation der Konstanten ist jedoch auch in allgemeineren Situationenwie etwa bei Gleichungen hoherer Ordnung nutzlich, und wir werden ihr in den Ubungenbegegnen.

Beispiel 17.12Ein Beispiel zur Variation der Konstanten: Gegeben sei das Anfangswertproblem

y′(t)− 2y(t) = exp(7t) , (17.22)

y(0) = y0 . (17.23)

Schritt 1: Wir bestimmen die allgemeine Losung der zugehorigen Differentialgleichung

y′(t)− 2y(t) = 0 .

Die allgemeine Losung ist y(x) = C exp(2t).

Schritt 2: Wir variieren die Konstante, betrachten also

y(t) = C(t) exp(2t) .

Dann ist nach der Produktregel y′(t) = C ′(t) exp(2t) + 2C(t) exp(2t). Setzen wir diesin (17.22) ein, ergibt sich

[C ′(t) exp(2t) + 2C(t) exp(2t)]− 2C(t) exp(2t) = exp(7t) ,

alsoC ′(t) exp(2t) = exp(7t)

und damit C ′(t) = exp(5t), also C(t) = 15

exp(5t) + C mit einer Konstanten C. Daher istdie Losung von (17.22)

y(t) =

[1

5exp(5t) + C

]exp(2t) =

1

5exp(7t) + C exp(2t) ,

220

Page 227: Vorlesungsskript zur Analysis 1 -

und fur das Anfangswertptoblem (17.22)–(17.23) ist C so zu bestimmen, dass (17.23)erfullt ist. Es ist eine gute Kontrolle, durch Ableiten und Einsetzen nachzuprufen, dassdie gefundene Funktion tatsachlich (17.22) lost.

Ist Ihnen nach dieser Rechnerei nach einem Kaffee zumute? Dann genießen Sie ihn, bevorwir zum Anwendungsbeispiel kommen.

17.3 Anwendung: Coffeingehalt im Blut

Nimmt man Coffein zu sich, benotigt der Abbau oder die Absorbtion im Korper einegewisse Zeit. Der genaue Abbauprozess ist kompliziert, aber eine gute Approximation andie Konzentration der Coffeinlevels c(t) zum Zeitpunkt t ist gegeben durch die Gleichung

c′(t) = −kc(t) + f(t) (17.24)

mit positiver Konstante k und Coffeinzufuhr beschrieben durch f [2]; siehe auch [3], demdieses Beispiel entnommen ist. Also wird die Konzentration ohne weitere Coffeinzufuhr(f ≡ 0) exponentiell abfallen. Die Abfallrate wird oft durch die Halbwertszeit t1/2 cha-rakterisiert, die definiert ist durch die Gleichung

exp(−kt1/2

)=

1

2.

Also ist t1/2 = ln(2)k

. Experimentell beobachtet man eine Halbwertszeit des Coffeins von

etwa 6 Stunden. Damit ergibt sich k = ln(2)6

.

Eine Tasse mit starkem Kaffee enthalt etwa 300mg Coffein. Experimente zeigen, dass dieZunahme dieser Dosis uber eine Stunde hinweg zu einer Coffeinkonzentration von etwa8µg pro Milliliter Blut fuhrt. Nehmen wir an, dass wir drei solche Tassen Kaffee trinken,jeweils fur 30min um 7:00 Uhr, um 10:30 Uhr und um 15:00 Uhr. Dies ist ein inhomogenesProblem, denn die Coffeinzufuhr f verschwindet nicht.

Ist 24 Stunden nach der ersten Tasse noch Coffein im Blut nachzuweisen? Abb. 17.2 zeigt,dass das so ist. Um diese Figur zu erhalten, beschreiben wir die Coffeinaufnahme durcheine Treppenfunktion. Die Aufnahme von 300mg Coffein uber diesen Zeitraum fuhrt zueiner Konzentrationszufuhr von 16µg/ml, da der Zeitraum jeweils eine halbe Stunde ist,

f(t) =

16 , 0 ≤ t ≤ 0.5 ,

16 , 3.5 ≤ t ≤ 4 ,

16 , 8 ≤ t ≤ 8.5 ,

0 , sonst .

Wir setzen also t = 0 fur 7:00 Uhr und nehmen als Einheit die Stunde, so dass t = 1der Zeit 8:00 Uhr entspricht. Zudem haben wir den Coffeingehalt einer Tasse gleichmaßigauf die halbe Stunde verteilt, also eine konstante Coffeinzufuhr wahrend dieser Kaffee-pausen angesetzt. Damit sind alle Ausdrucke der Losungsformel (17.21) gegeben, dennes ist a ≡ −k. Abb. 17.2 zeigt das Ergebnis, wobei das Integral zur Visualisierung mitMathematica® berechnet wurde.

221

Page 228: Vorlesungsskript zur Analysis 1 -

5 10 15 20

5

10

15

Abbildung 17.2: Verlauf der Coffeinkonzentration im Blut (blau, in µg/ml) nach demGenuss von drei Tassen Kaffee (orange), uber ein Zeitfenster von 24h.

Dieses Beispiel war ein erster Schritt in die Modellbildung: Wir haben ein mathemati-sches Modell fur den Coffeinabbau aufgestellt und anschließend untersucht. In der Praxiswird man beim Aufstellen der Gleichung Naturgesetze oder empirische Beobachtungenverwenden, um (17.24) zu begrunden. Das Ausnutzen experimenteller Daten, wie wir esgetan haben, ist in der Modellbildung ganz typisch. Sehr hilfreich ist es, die physikalischenEinheiten zu berucksichtigen. Daher haben wir betont, dass t in Stunden gerechnet wirdund die Konzentration in µg/ml.

Wir haben mit den uns jetzt zur Verfugung stehenden Methoden ein bemerkenswertesResultat erzielt: Das Modell erlaubt namlich, quantitative Vorhersagen zur Coffeinkon-zentration als Funktion der Zeit zu treffen. Wenn wir das Ergebnis in einem Experimentvalidieren konnen, erlaubt uns das, zuverlassige Vorhersagen mit anderen Parametern(Zahl und Zeit der Kaffeepausen, Starke des Kaffees) zu treffen. Wir konnen im Erfolgs-fall das Modell auch auf andere Abbauprozesse ubertragen. Dabei muss man immer vorAugen haben, dass mathematische Modelle nur fur gewisse Parameterbereiche gultig sind– der Stoffabbau kann zum Beispiel fur sehr hohe Konzentrationen c anders ablaufen (oderim schlimmsten Fall zusammenbrechen) als fur die von uns betrachten

”normalen“ Dosen

Coffein.

Erganzendes Material zu diesem Kapitel

[1] E. Kamke. Differentialgleichungen. Losungsmethoden und Losungen. I: GewohnlicheDifferentialgleichungen, Neunte Auflage, Mit einem Vorwort von Detlef Kamke. B.G. Teubner, Stuttgart, 1977, xxvi+668. isbn: 3-519-02017-3.

[2] R. Newton u. a. Plasma and salivary pharmacokinetics of caffeine in man. Eur. J.Clin. Pharmacol. 21.1 (1981), 45–52. doi: 10.1007/BF00609587. url: https://doi.org/10.1007/BF00609587.

[3] L. N. Trefethen, A. Birkisson und T. A. Driscoll. Exploring ODEs. Society for In-dustrial und Applied Mathematics, Philadelphia, PA, 2018, vii+335. isbn: 978-1-611975-15-4. url: http://people.maths.ox.ac.uk/trefethen/Exploring.pdf.

222

Page 229: Vorlesungsskript zur Analysis 1 -

18 Unendliche Mengen

Zwei endliche Mengen sind gleich groß, wenn sie gleichviele Elemente haben. Eine Mengevon 3 Straßenbahnen ist in diesem Sinn genauso groß wie eine Menge von 3 Apfeln, obwohleine Straßenbahn deutlich großer als ein Apfel ist. . .

Wir wollen eine Definition haben, mit der man auch unendliche Mengen hinsichtlich ihrerGroße vergleichen kann.

Definition 18.1Zwei Mengen M und N heißen gleichmachtig, wenn es eine bijektive Abbildung f : M →N gibt.

Wir testen diese Definition an endlichen Mengen, denn dort wissen wir, wann zwei Mengengleich groß sind: Wenn sie gleich viele Elemente haben. Liefert obige Definition das gleicheErgebnis?

Lemma 18.2Seien m,n ∈ N. Die Mengen {0, . . . ,m} und {0, . . . , n} sind gleichmachtig genau dann,wenn m = n.

Beweis: Ist m = n, so konnen wir fur f die Identitat wahlen. Sei nun m 6= n. Wir zeigenmit Induktion uber n die Behauptung:

Ist m > n, so gibt es keine bijektive Abbildung f : {0, . . . ,m} → {0, . . . , n}.

Induktionsanfang n = 0: Die einzige Abbildung f : {0, . . . ,m} → {0} ist gegeben durchf(k) = 0 fur alle k, und diese Abbildung ist fur m > 0 nicht bijektiv.

Induktionsschritt n− 1→ n: Es genugt zu zeigen:

Ist m > n und f : {0, . . . ,m} → {0, . . . , n} bijektiv, so gibt es eine bijektiveAbbildung g : {0, . . . ,m− 1} → {0, . . . , n− 1}.

Daraus folgt, dass es ein solches f nicht geben kann, da es nach Induktionsannahme einsolches g nicht geben kann.

Die Abbildung g wird aus f wie folgt konstruiert. Zunachst ist die Restriktion

f : {0, . . . ,m− 1} → {0, . . . , n} \ {f(m)}von f auf {0, . . . ,m− 1} bijektiv. Wir definieren eine Abbildung

h : {0, . . . , n} \ {f(m)} → {0, . . . , n− 1}durch

h(i) =

{i , falls i < f(m) ,

i− 1 , falls i > f(m) .

Dann ist h ebenfalls bijektiv, und g = h ◦ f ist die gesuchte Bijektion. �

Die Anzahl der Elemente einer Menge M erhalten wir dadurch, dass wir sie in irgendeinerReihenfolge abzahlen. Abzahlen bedeutet aber gerade, dass wir eine bijektive Abbildungvon {0, . . . , n− 1} nach M definieren.

223

Page 230: Vorlesungsskript zur Analysis 1 -

Definition 18.3Sei M Menge. Ist n ≥ 1 und sind M und {0, . . . , n− 1} gleichmachtig, so definieren wirdie Anzahl der Elemente von M als n, geschrieben

#M = n ,

folgendermaßen. Wir setzen #∅ = 0. M heißt endlich, wenn es ein n ∈ N gibt mit#M = n, andernfalls heißt M unendlich, und wir schreiben #M =∞.

Definition 18.4 (Abzahlbare Menge)Eine nichtleere Menge M heißt abzahlbar, wenn es eine surjektive Abbildung τ : N→Mgibt.

Die Aussage”M ist abzahlbar“ bedeutet also, dass es eine Folge (xn)n∈N in M gibt, in

der jedes Element von M mindestens einmal auftaucht.

Beispiele: Jede endliche nichtleere Menge ist abzahlbar, N ist abzahlbar. Z ist abzahlbar:Die Abbildung τ : N→ Z,

τ(n) =

{n2, n gerade ,

−n+12, n ungerade ,

liefert die Folge 0,−1, 1,−2, 2, . . . und ist surjektiv. Sie ist sogar bijektiv, N und Z sindalso gleichmachtig. Andererseits ist N eine echte Teilmenge von Z. (Dass eine unendlicheMenge ihre Machtigkeit nicht zu andern braucht, wenn man Elemente aus ihr entfernt,klingt zunachst merkwurdig, ist aber so. Wir erinnern die historischen Anmerkungen inAbschnitt 3.6.1.)

Lemma 18.5Seien M,N Mengen und f : M → N Abbildung. Ist M abzahlbar und f surjektiv, so istauch N abzahlbar.

Beweis: Ist τ : N→M surjektiv, so ist auch f ◦ τ : N→ N surjektiv. �

Folgerung 18.6Sei M abzahlbar und N ⊂M . Dann ist N abzahlbar.

Beweis: Wahle als f : M → N irgendeine Fortsetzung der Identitat auf N . �

Satz 18.7N× N ist abzahlbar.

Beweis: In der Folge

(0, 0), (0, 1), (1, 0), (0, 2), (1, 1), (2, 0), (0, 3) . . .

taucht jedes Element von N×N mindestens einmal (sogar genau einmal) auf. In Formelnkonnen wir die entsprechende Abbildung τ : N→ N× N beschreiben durch

τ(k) = (k − sn, sn+1 − k − 1) , falls sn ≤ k < sn+1 ,

wobei

sn =n∑

i=1

i =n(n+ 1)

2, s0 = 0 .

Man kann nachrechnen, dass τ surjektiv ist (SUPER). �

224

Page 231: Vorlesungsskript zur Analysis 1 -

Folgerung 18.8Sind M und N abzahlbare Mengen, so ist auch M ×N abzahlbar.

Beweis: Seien τM : N→M und τN : N→ N surjektiv. Dann ist auch

τ : N× N→M ×N , τ(j, k) = (τM(j), τN(k))

surjektiv, also ist M ×N abzahlbar wegen Folgerung 18.5 und Satz 18.7. �

Folgerung 18.9Q ist abzahlbar.

Beweis: Die Abbildung

τ : Z× N→ Q , τ(k, n) =k

n+ 1,

ist surjektiv. �

Folgerung 18.10Sei (Mn)n∈N eine Folge abzahlbarer Mengen. Dann ist auch

n∈N

Mn

abzahlbar.

Beweis: Sei τn : N→Mn surjektiv fur alle n ∈ N. Dann ist auch

τ : N× N→⋃

n∈N

Mn , τ(n, k) = τn(k) ,

surjektiv. �

Definition 18.11 (Uberabzahlbare Menge)Eine unendliche Menge M heißt uberabzahlbar, wenn sie nicht abzahlbar ist.

Wir wollen beweisen, dass R uberabzahlbar ist. Das ist ein beruhmtes, auf Georg Cantorzuruckgehendes Resultat aus den Anfangszeiten der Mengenlehre.

Wegen Folgerung 18.6 genugt es zu zeigen, dass

[0, 1) ={x∣∣ x ∈ R, 0 ≤ x < 1

}

uberabzahlbar ist. Zu diesem Zweck betrachten wir fur x ∈ [0, 1) die Dezimalbruchent-wicklung

x =∞∑

k=1

ak · 10−k , ak ∈ {0, . . . , 9} . (18.1)

Zu gegebenem x werden die ak folgendermaßen konstruiert: Sei s0 = 0. Sind a1, . . . , an−1

und damit

sn−1 =n−1∑

k=1

ak · 10−k

bereits konstruiert, so wahlen wir an ∈ {0, . . . , 9} so, dass

sn−1 + an10−n ≤ x < sn−1 + (an + 1)10−n . (18.2)

225

Page 232: Vorlesungsskript zur Analysis 1 -

Satz 18.12Die Menge [0, 1) ist uberabzahlbar.

Beweis: Wir zeigen, dass es keine surjektive Abbildung τ : N → [0, 1) gibt. Sei τ : N →[0, 1) eine beliebige Abbildung. Sei

τ(j) =∞∑

k=1

ajk · 10−k , j ∈ N ,

die gemaß (18.1)–(18.2) konstruierte Dezimalbruchentwicklung von τ(j). Wir definierenein x ∈ [0, 1) durch

x =∞∑

k=1

bk · 10−k , (18.3)

wobei wir bk ∈ {0, . . . , 8} so wahlen, dass bk 6= ak−1,k gilt fur alle k ∈ N \ {0}. Man pruftnach, dass wegen

0 ≤∞∑

k=n+1

bk · 10−k < 10−n

(hier geht bk ≤ 8 ein) die Darstellung (18.3) mit der gemaß (18.1)–(18.2) konstruierten De-zimalbruchentwicklung von x ubereinstimmt. Es folgt, dass x 6= τ(j) gilt fur alle j ∈ N. Al-so ist τ nicht surjektiv. (Uber einen Punkt sind wir hinweggegangen: Die Dezimaldarstel-lung einer Zahl ist nicht eindeutig. Analog zu Beispiel 9.2 ist etwa 0, 09 = 0, 0999 · · · = 0, 1.Gibt es fur ein τ(j) mehrere Darstellungen, wahlen wir die nichtabbrechende, also bei-spielsweise 0, 09, und wenden obiges Argument auf diese Darstellung an.)

Folgerung 18.13Sei M eine abzahlbare Teilmenge von R. Dann ist R \M uberabzahlbar. Insbesondere istdie Menge aller irrationalen Zahlen uberabzahlbar.

Beweis: Ware R\M abzahlbar, so ware auch R abzahlbar nach Satz 18.10, im Widerspruchzu Satz 18.12. �

Bemerkung 18.14 (Kontinuumshypothese)Nach dem eben Bewiesenen sind N und R nicht gleichmachtig. Man kann sich fragen,ob es

”zwischen N und R noch etwas gibt“, d.h. ob es eine Menge M und surjektive

Abbildungenf : R→M , g : M → N

gibt, so dass M weder zu N noch zu R gleichmachtig ist. Die sogenannte Kontinuums-hypothese besagt, dass es eine solche Menge M nicht gibt. Es ist mit Methoden derMathematischen Logik bewiesen worden, dass die Kontinuumshypothese von einer Rei-he ublicher Axiomensysteme der Mengenlehre unabhangig ist, das heißt, dass sowohl dieAnnahme, sie sei wahr, als auch die Annahme, sie sei falsch, mit diesen Axiomensy-stemen vertraglich ist. Genauer hat Kurt Godel (1906–1978) im Jahr 1938 gezeigt, dassdie Kontinuumshypothese sich aus den mengentheoretischen Axiomen (Zermelo-Fraenkel-Mengenlehre) nicht widerlegen lasst. Paul Cohen (1934–2007) zeigte 1963, dass sich dieKontinuumshypothese nicht aus der Zermelo-Fraenkel-Mengenlehre beweisen lasst. Diesesehr tiefen und uberraschenden Resultate zeigen, dass die Kontinuumshypothese außer-halb der mengentheoretischen Axiomatik nach Zermelo und Fraenkel steht.

226

Page 233: Vorlesungsskript zur Analysis 1 -

Wir kehren zuruck zu abzahlbaren Teilmengen von R. Die Menge Q konnen wir auchbeschreiben als die Menge aller reellen Zahlen, die sich als Nullstellen einer linearen Glei-chung

qx+ p = 0

mit p, q ∈ Z schreiben lassen.

Definition 18.15 (Algebraische Zahl, transzendente Zahl)Eine Zahl x ∈ R heißt algebraisch, wenn es ein von Null verschiedenes Polynom p mitganzzahligen Koeffizienten gibt, so dass p(x) = 0. Eine Zahl x ∈ R heißt transzendent,wenn x nicht algebraisch ist.

Beispiel: x =√

2 ist algebraisch, da x2 − 2 = 0.

Satz 18.16Die Menge der algebraischen Zahlen ist abzahlbar.

Beweis: Die MengeG aller Polynome, deren Koeffizienten alle ganzzahlig sind, ist abzahlbar.(Beweis: Ubungsaufgabe.) Da jedes Polynom p 6= 0 nur endlich viele Nullstellen hat, istdie Menge N aller solcher Nullstellen abzahlbar; betrachte

τ : N×G→ N ,

wobei τ(k, p) als die k-te Nullstelle von p definiert ist, falls die Anzahl der Nullstellen vonp großer oder gleich k ist, und τ(k, p) = 0 andernfalls. �

Bemerkung 18.17Die Zahlen e und π sind transzendent. Aus letzterem folgt (wie man erkennt, wenn mansich naher mit Algebra beschaftigt), dass die sogenannte

”Quadratur des Kreises“ ein

unlosbares Problem ist. (Das Problem besteht darin, zu einem gegebenen Kreis nur unterVerwendung von Zirkel und Lineal ein Quadrat gleicher Flache zu konstruieren.) DieTranszendenz von π ist im 19. Jahrhundert (Ferdinand von Lindemann, 1882) bewiesenworden.

Eine reelle Zahl x heißt berechenbar, falls es einen Algorithmus gibt, welcher nachein-ander die Ziffern der Dezimalbruchentwicklung von x berechnet. Damit das eine mathe-matische Definition wird, muss zunachst definiert werden, was ein Algorithmus ist; oderaquivalent, es muss die Menge

”aller“ Algorithmen definiert werden. Das hat Alan Tu-

ring in den 1930er Jahren mit dem nach ihm benannten Begriff der”Turingmaschine“

getan. Dabei ergibt es sich, dass die Menge aller in diesem Sinne erlaubter Algorithmenabzahlbar ist. Daraus folgt, dass es nur abzahlbar viele Zahlen gibt, die berechenbar sind.Zu ihnen gehoren beispielsweise auch e und π.

227