170
Funktionalanalysis Vorlesungsskript Wintersemester 2015/16 Bernd Schmidt * * Institut f¨ ur Mathematik, Universit¨ at Augsburg, Universit¨ atsstr. 14, 86135 Augs- burg, [email protected] 1

Funktionalanalysis - math.uni-augsburg.de · aufmerksam gemacht haben, insbesondere an die Herren Julian Braun, Manuel Friedrich, Corvin G ollnitz, Asmar Nayis und Frau Anna-Laura

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Funktionalanalysis

Vorlesungsskript

Wintersemester 2015/16

Bernd Schmidt∗

∗ Institut fur Mathematik, Universitat Augsburg, Universitatsstr. 14, 86135 Augs-burg, [email protected]

1

Inhaltsverzeichnis

1 Einleitung 4

2 Normierte Raume: Grundlagen und Beispiele 62.1 Definition und elementare Eigenschaften . . . . . . . . . . . . . . 62.2 Klassische Funktionenraume . . . . . . . . . . . . . . . . . . . . . 162.3 Folgenraume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212.4 Maße . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242.5 Lebesgue-Raume . . . . . . . . . . . . . . . . . . . . . . . . . . . 272.6 Sobolev-Raume . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

3 Operatoren auf normierten Raumen 433.1 Operatoren und Funktionale . . . . . . . . . . . . . . . . . . . . . 433.2 Vier Hauptsatze fur Operatoren auf Banachraumen . . . . . . . . 533.3 Projektionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

4 Hilbertraume 644.1 Prahilbertraume . . . . . . . . . . . . . . . . . . . . . . . . . . . . 644.2 Hilbertraume und Orthogonalprojektionen . . . . . . . . . . . . . 704.3 Dualitat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 734.4 Anwendung: Elliptische Randwertprobleme . . . . . . . . . . . . . 784.5 Orthonormalsysteme . . . . . . . . . . . . . . . . . . . . . . . . . 834.6 Operatoren auf Hilbertraumen . . . . . . . . . . . . . . . . . . . . 89

5 Dualitat 945.1 Der Dualraum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 945.2 Der Satz von Hahn-Banach . . . . . . . . . . . . . . . . . . . . . 1005.3 Schwache Konvergenz und Reflexivitat . . . . . . . . . . . . . . . 1075.4 Adjungierte Operatoren . . . . . . . . . . . . . . . . . . . . . . . 1165.5 Trennung konvexer Mengen . . . . . . . . . . . . . . . . . . . . . 119

6 Kompakte Operatoren und ihre Spektraltheorie 1296.1 Kompakte Mengen in Funktionenraumen . . . . . . . . . . . . . . 1296.2 Kompakte Operatoren . . . . . . . . . . . . . . . . . . . . . . . . 137

2

6.3 Das Spektrum eines Operators . . . . . . . . . . . . . . . . . . . . 1416.4 Kompakte Operatoren auf Banachraumen . . . . . . . . . . . . . 1456.5 Kompakte normale Operatoren . . . . . . . . . . . . . . . . . . . 151

A Anhang 163A.1 Auswahlaxiom, Zornsches Lemma und Wohlordnungssatz . . . . . 163

Literaturverzeichnis 169

3

Kapitel 1

Einleitung

In der Funktionalanalysis beschaftigt man sich mit unendlichdimensionalen nor-mierten Vektorraumen (und Verallgemeinerungen hiervon) sowie stetigen Abbil-dungen auf solchen. Hierbei werden Analysis, Topologie und Algebra verknupft.In dieser Vorlesung behandeln wir insbesondere Banach- und Hilbertraume, linea-re Operatoren und Funktionale, schwache Konvergenz sowie die Spektraltheoriekompakter Operatoren. Ganz abgesehen vom intrinsischen “reinen” Interesse andiesen Themen, schafft diese Vorlesung damit Grundlagen fur viele weitere Be-reiche in der Mathematik und angrenzenden Gebieten, inbesondere der Theorieder partiellen Differentialgleichungen, der Variationsrechnung, konvexen Analy-sis, mathematischen Physik (insbesondere der Quantenmechanik), der Stochastiksowie der Numerik.

Wir beginnen mit dem Studium grundlegender Eigenschaften von normier-ten Raumen und stetigen linearen Abbildungen auf diesen Raumen in Kapitel 2.Wichtige Beispiele sind hierbei Funktionenraume, wie man sie aus der Analysiskennt, die hier nun von einem allgemeinen und abstrakteren Blickpunkt betrach-tet werden. Fur solche Abbildungen auf Banachraumen, also vollstandigen nor-mierten Raumen, diskutieren wir in Kapitel 3 eine ganze Klasse von Satzen, dieman als die Grundprinzipien der linearen Funktionalanalysis ansehen kann. ImKapitel 4 betrachten wir Hilbertraume, die sowohl in Anwendungen von großerBedeutung als auch analytisch besonders gutartig sind. Kapitel 5 ist im Wesent-lichen der Untersuchung des Dualraums eines normierten Raums gewidmet. Hierwird auch das Konzept der schwachen Konvergenz, das weitreichende Anwendun-gen in der gesamten Analysis hat, eingefuhrt. In Kapitel 6 schließlich geben wireinen Einstieg in die Spektraltheorie von Operatoren.

Vorkenntnisse: Notige Vorkenntnisse sind der Stoff der Vorlesungen Analysis1, Analysis 2 und Lineare Algebra 1.

Literatur: Ein ausgezeichnetes Lehrbuch, nach dem sich weite Teile dieser Vorle-sung richten werden, ist das Buch Funktionalanalysis [We] von Werner. Eine sehr

4

empfehlenswerte Einfuhrung die mehr Gewicht auf Anwendungen, insbesonderedie Theorie der partiellen Differentialgleichungen, legt, ist das Buch [Al] von Alt.Weitere empfehlenswerte deutschsprachige Lehrbucher sind die Bucher von [He]von Heuser und [HS] von Hirzebruch und Scharlau. Die klassischen englischspra-chigen Einfuhrungen sind unter anderem die Bucher [Co] von Conway, [RS] vonReed und Simon, [Ru] von Rudin und [Yo] von Yosida. Besonders wegen der Fullean diskutierten Anwendungen hervorzuheben ist auch das Buch [Ze] von Zeidler.Ein Klassiker, der fur fortgeschrittenere Fragestellungen immer noch von großemNutzen ist, ist das Buch [Ed] von Edwards.

Fehler: Bitte teilen Sie mir evtl. Tipp- oder auch andere Fehler in diesem Skriptper E-Mail mit.

Vielen Dank an alle, die mich auf Fehler in fruheren Versionen dieses Skriptsaufmerksam gemacht haben, insbesondere an die Herren Julian Braun, ManuelFriedrich, Corvin Gollnitz, Asmar Nayis und Frau Anna-Laura Sattelberger.

5

Kapitel 2

Normierte Raume: Grundlagenund Beispiele

2.1 Definition und elementare Eigenschaften

Die grundlegenden Objekte der Funktionalanalysis sind Vektorraume uber R oderC, auf denen, etwa durch eine Norm, topologische Begriffe definiert sind. Wirbetrachten im Folgenden nur Vektorraume uber K ∈ R,C.

Definition 2.1.1 Sei X ein K-Vektorraum. Eine Abbildung ‖ · ‖ : X → [0,∞)heißt Norm, falls fur alle x, y ∈ X,λ ∈ K die Bedingungen

(i) positive Definitheit: ‖x‖ = 0⇐⇒ x = 0,

(ii) absolute Homogenitat: ‖λx‖ = |λ|‖x‖ und

(iii) Dreiecksungleichung: ‖x+ y‖ ≤ ‖x‖+ ‖y‖

erfullt sind. Man nennt dann (X, ‖·‖) (oder auch einfach X selbst) einen normiertenRaum.

Fordert man in (i) nur “⇐=”, so spricht man von einer Halbnorm ‖ · ‖.

Beobachtung: Jede Norm ‖ · ‖ auf X induziert eine Metrik1 d auf X via

d(x, y) := ‖x− y‖.

Dadurch sind alle Begriffe wie etwa Konvergenz, Stetigkeit, offene, abgeschlos-sene und kompakte Mengen sowie Vollstandigkeit, die man aus der Theorie dermetrischen Raume kennt, auf normierten Raumen erklart.

Die offenen und abgeschlossenen Kugeln um einen Punkt x ∈ X mit Radiusr ≥ 0 sind die Mengen Br(x) := z ∈ X : ‖z − x‖ < r bzw. Br(x) := z ∈

1Die Definition und grundlegenden Eigenschaften metrischer Raume werden als bekanntvorausgesetzt. Das Wichtigste (mehr als wir hier benotigen) findet sich in [Sch-Ana2, Kap. 4]

6

X : ‖z − x‖ ≤ r. Ist x = 0, so schreiben wir hierfur auch einfach Br bzw. Br.Wenn der zugrunde liegende Raum aus dem Zusammenhang nicht eindeutig zuerkennen ist, versehen wir diese Kugeln bisweilen auch mit einem entsprechendenSuperskript.

Die vollstandigen normierten Raume, also solche, in denen jede Cauchy-Folgekonvergiert, sind die grundlegenden Objekte der Funktionalanalysis und verdie-nen einen eigenen Namen:

Definition 2.1.2 Ein vollstandiger normierter Raum heißt Banachraum.

Beispiele

1. Auf dem Kn werden durch

‖x‖1 := |x1|+ . . .+ |xn| (Summennorm),

‖x‖2 :=√|x1|2 + . . .+ |xn|2 (euklidische Norm) und allgemein

‖x‖p :=

(n∑i=1

|xi|p) 1

p

(p-Norm fur p ∈ [1,∞)) sowie

‖x‖∞ := max1≤i≤n

|xi| (Maximumsnorm)

Normen definiert, die Kn zu einem Banachraum machen. (Das wissen Sieschon aus den Analysisvorlesungen.)

2. Ist [a, b] ⊂ R ein kompaktes Intervall, so wird der Raum C([a, b]) der steti-gen Funktionen auf [a, b] mit der Supremumsnorm

‖f‖∞ := supt∈[a,b]

|f(t)|

zu einem Banachraum. (Auch das wissen Sie schon aus den Analysisvorle-sungen, wir werden es spater aber noch einmal begrunden.)

3. Es ist nicht schwer zu sehen, dass auch die 1-Norm ‖ · ‖1, definiert durch

‖f‖1 :=

∫ b

a

|f(t)| dt,

C([a, b]) zu einem normierten Raum macht. (C([a, b]), ‖ · ‖1) ist jedoch keinBanachraum. Das folgt z.B. daraus, dass die Folge (fn) mit

fn(t) =

0 fur a ≤ t ≤ a+b

2,

n(t− a+b2

) fur a+b2≤ t ≤ a+b

2+ 1

n,

1 fur a+b2

+ 1n≤ t ≤ b

eine nicht konvergente Cauchy-Folge ist. (Ubung!)

7

4. Bezeichnet C1((a, b)) den Raum der stetig differenzierbaren Funktionen auf(a, b) und ist

C1([a, b]) = f ∈ C1((a, b)) : f ist stetig fortsetzbar auf [a, b],

so ist durch‖f‖ := ‖f ′‖∞

eine Halbnorm auf C1([a, b]) definiert.

Bemerkungen:

1. Ist ‖ · ‖ eine Halbnorm auf X, so kann man, indem man anschaulich ge-sprochen x, y ∈ X mit ‖x− y‖ = 0 ‘identifiziert’, zu einem entsprechendennormierten Raum ubergehen. Genauer: Durch x ∼ y ⇐⇒ ‖x− y‖ = 0 isteine Aquivalenzrelation auf X gegeben. Bezeichnet [x] die Aquivalenzklassevon x ∈ X, so ist X/∼= [x] : x ∈ X in naturlicher Weise wieder einVektorraum, der durch

‖[x]‖ := ‖x‖(in wohldefinierter Weise) normiert wird. (Ubung!) Wir werden uns daherim Folgenden vornehmlich den normierten Raumen widmen.

2. Jeder normierte Raum kann zu einem Banachraum ‘vervollstandigt’ wer-den. Genauer: Ist (X, ‖ · ‖) ein normierter Raum, so gibt es einen Banch-raum (Y,~ · ~) und eine normerhaltende lineare Abbildung J : X → Y(also ~Jx~ = ‖x‖ fur alle x ∈ X), so dass J(X) in Y dicht liegt (al-so J(X) = Y ), die X in Y ‘einbettet’. Da wir dies spater auf besonderselegante Weise zeigen werden konnen, geben wir hier keinen vollstandigenBeweis. Stattdessen skizzieren wir eine Konstruktion, die auch im allge-meineren Rahmen zur Vervollstandigung metrischer Raume herangezogenwerden kann (s. nachster Punkt).2

Dazu betrachten wir den Vektorraum X der Cauchy-Folgen auf X, auf demdurch

‖(xn)‖ := limn→∞

‖xn‖

eine Halbnorm definiert wird. (Uberlegen Sie sich das! Beachte, dass (‖xn‖)nach Lemma 2.1.3 eine reelle Cauchy-Folge und damit konvergent ist.) Wieeben beschrieben ergibt sich daraus nun durch Faktorisieren bezuglich derAquivalenzrelation

(xn) ∼ (yn) ⇐⇒ limn→∞

(xn − yn) = 0

der normierte Raum (X/∼, ‖ · ‖). Mit etwas Arbeit lasst sich nun zeigen,dass dies tatsachlich ein Banachraum ist. (Freiwillige Ubung!) Durch J :

2Der folgende Teil dieser Bemerkung wurde in der VL weggelassen.

8

X → X/∼, Jx = (x, x, . . .) ist dann offenbar eine normerhaltende lineareAbbildung gegeben. In der Tat gilt auch J(X) = X/∼ (Ubung!)

Eine solche Vervollstandigung ist ‘im Wesentlichen eindeutig’ in dem Sinne,dass je zwei Vervollstandigungen (Y1, ‖ · ‖1) und (Y2, ‖ · ‖2) isometrisch iso-morph sind, d.h. es gibt eine normerhaltende lineare Bijektion von Y1 aufY2. (Ubung!)

3. Das analoge Vorgehen zeigt, dass jeder metrische Raum in einen bis auf Iso-metrie eindeutigen vollstandigen metrischen Raum isometrisch eingebettetwerden kann. (Freiwillige Ubung!)

Wir beginnen damit, einige grundlegende Eigenschaften normierter Raumezu untersuchen. Zunachst halten wir dazu fest, dass mit der Dreiecksungleichungauch automatisch die umgekehrte Dreiecksungleichung gilt:

Lemma 2.1.3 Ist (X, ‖ · ‖) ein normierter Raum, so gilt fur alle x, y ∈ X∣∣‖x‖ − ‖y‖∣∣ ≤ ‖x− y‖ ∀x, y ∈ X.Beweis. Eine einfache Ubung!

Satz 2.1.4 In einem normierten Raum (X, ‖·‖) sind Addition, Skalarmultiplika-tion und die Norm stetig: Fur x, x1, x2, . . . , y, y1, y2, . . . ∈ X und λ, λ1, λ2, . . . ∈ Kgilt

(i) xn → x, yn → y =⇒ xn + yn → x+ y,

(ii) λn → λ, xn → x =⇒ λnxn → λx und

(iii) xn → x =⇒ ‖xn‖ → ‖x‖.

Beweis. Die ersten beiden Aussagen sind elementar. Die letzte folgt aus der um-gekehrten Dreicksungleichung angewandt auf xn und x:∣∣‖xn‖ − ‖x‖∣∣ ≤ ‖xn − x‖ → 0.

Korollar 2.1.5 Ist X ein normierter Raum und U ⊂ X ein Unterraum, so istauch der Abschluss U ein Unterraum von X.

Beweis. Sind x, y ∈ U und λ ∈ K, so gibt es Folgen (xn) und (yn) in U mitxn → x und yn → y. Dann aber ist auch xn + λyn ∈ U fur alle n und damitx+ λy = limn→∞ xn + λyn ∈ U .

9

Satz 2.1.6 Ist X ein Banachraum und U ⊂ X ein abgeschlossener Unterraum,so ist U (bezuglich der auf U eingeschrankten Norm) selbst ein Banachraum.

Beweis. Ist (xn) eine Cauchy-Folge in U , so gibt es, da X vollstandig ist, einx ∈ X mit xn → x. Da nun U abgeschlossen ist, muss schon x ∈ U sein.

Wir beweisen hier noch ein bisweilen nutzliches Kriterium zur Vollstandigkeiteines normierten Raums (X, ‖ · ‖).

Satz 2.1.7 Es sei (X, ‖ · ‖) ein normierter Raum. Dann sind aquivalent:

(i) X ist vollstandig.

(ii) Jede absolut konvergente Reihe in X konvergiert. D.h.: Fur jede Folge (xn) ⊂X mit

∑∞n=1 ‖xn‖ <∞ existiert ein x ∈ X mit limn→∞ ‖x−

∑Nn=1 xn‖ = 0.

Beweis. (i) =⇒ (ii) ist klar, denn es ist einfach zu sehen, dass (∑N

n=1 xn)N∈Neine Cauchy-Folge ist.

(ii) =⇒ (i): Ist (xn) eine Cauchy-Folge, so konnen wir n1 < n2 < n3 < . . .wahlen, so dass fur jedes k ∈ N

‖xm − xn‖ ≤ 2−k ∀n,m ≥ nk

gilt. Insbesondere ist dann

‖xnk+1− xnk‖ ≤ 2−k

fur jedes k. Indem man yk = xnk+1−xnk setzt, gilt demnach

∑∞k=1 ‖yk‖ <∞ und

es gibt ein x ∈ X mit

limk→∞

xnk = xn1 + limk→∞

k−1∑i=1

yi = x

(Teleskopsumme). Dies zeigt, dass (xn) eine konvergente Teilfolge besitzt. Dannaber ist (xn) als Cauchy-Folge schon selbst konvergent. (Ubung: Uberlegen Siesich das!)

Aquivalente Normen

Viele Eigenschaften normierter Raume sind in gewisser Hinsicht unabhangig vonder genauen Form der Norm. Diese Beobachtung wird durch die folgende Defini-tion quantifiziert.

Definition 2.1.8 Zwei Normen ‖ · ‖1 und ‖ · ‖2 auf einem Vektorraum X heißenaquivalent, wenn es Konstanten c, C > 0 gibt mit

c‖x‖1 ≤ ‖x‖2 ≤ C‖x‖1 ∀x ∈ X.

10

Uberlegen Sie sich, dass dies tatsachlich eine Aquivalenzrelation auf der Mengeder Normen auf X definiert!

Satz 2.1.9 Es seien ‖ · ‖1 und ‖ · ‖2 Normen auf einem Vektorraum X. Dannsind aquivalent:

(i) ‖ · ‖1 und ‖ · ‖2 sind aquivalent.

(ii) Eine Folge konvergiert bezuglich ‖ · ‖1 genau dann, wenn sie bezuglich ‖ · ‖2

konvergiert.

(iii) Eine Folge ist eine Nullfolge bezuglich ‖ · ‖1 genau dann, wenn sie eineNullfolge bezuglich ‖ · ‖2 ist.

Beweis. Die Implikationen (i) =⇒ (ii) =⇒ (iii) sind klar.(iii) =⇒ (i): Ware dies nicht der Fall, so konnen wir o.B.d.A. annehmen,

dass es kein C > 0 mit ‖x‖2 ≤ C‖x‖1 fur alle x ∈ X gibt. Insbesondere existiertdann zu jedem n ∈ N ein xn ∈ X mit ‖xn‖2 > n‖xn‖1 und daher∥∥∥∥ xn

‖xn‖2

∥∥∥∥1

<1

n→ 0

mit n→∞, so dass ( xn‖xn‖2 ) bezuglich ‖ · ‖1 eine Nullfolge ist. Andererseits ist

1 =

∥∥∥∥ xn‖xn‖2

∥∥∥∥2

6→ 0.

Bemerkung: Bezuglich aquivalenter Normen sind nicht nur die gleichen Folgenkonvergent, sondern – wie man leicht sieht – auch die gleichen Folgen Cauchy-Folgen. Insbesondere ist ein Banachraum auch bezuglich jeder aquivalenten Normein Banachraum. Daruberhinaus induzieren aquivalente Normen die gleiche To-pologie: Die gleichen Mengen sind offen, abgeschlossen bzw. kompakt und diegleichen Abbildungen stetig. (Uberlegen Sie sich das!)

In diesem Zusammenhang erinnern wir auch an einen Satz aus der Analysis,der fur unendlichdimensionale Raume falsch ist:

Satz 2.1.10 Auf einem endlich-dimensionalen Raum sind je zwei Normen aqui-valent.

Beweis. Ist X endlichdimensional und e1, . . . , en eine Basis von X, so wird durch

Φ : X → Kn, λ1e1 + . . .+ λnen 7→ (λ1, . . . , λn)

ein Isomorphismus von X auf Kn definiert. Sind nun ‖ · ‖1 und ‖ · ‖2 Normen aufX, so werden durch

x 7→ ‖Φ−1x‖1 und x 7→ ‖Φ−1x‖2

11

Normen auf Kn definiert, die nach einem Satz3 aus der Analysis 2 aquivalent sind.Es gibt also c, C > 0 mit

c‖Φ−1x‖1 ≤ ‖Φ−1x‖2 ≤ C‖Φ−1x‖1 ∀x ∈ Kn

und damitc‖x‖1 ≤ ‖x‖2 ≤ C‖x‖1 ∀x ∈ X.

Beispiel: Fur unendlich-dimensionale Raume ist Satz 2.1.10 i.A. falsch. Als Bei-spiel betrachte etwa C([0, 1]) mit den Normen ‖ · ‖∞ und ‖ · ‖1. Die in Beispiel 3von Seite 7 definierte Folge (fn) ist eine Cauchy-Folge in (C([0, 1]), ‖ · ‖1), nichtjedoch in (C([0, 1]), ‖ · ‖∞).

Korollar 2.1.11 Ein endlich-dimensionaler Unterraum eines normierten Raumsist abgeschlossen.

Beweis. Indem man Φ wie im Beweis von Satz 2.1.10 betrachtet, sieht man, dass,da Kn vollstandig ist, jeder endlich-dimensionale normierte Raum vollstandig ist.Daher ist ein endlich-dimensionaler Unterraum eines normierten Raums insbe-sondere abgeschlossen.

Nichtkompaktheit unendlichdimensionaler Einheitskugeln

Zur Vorbereitung auf den nachsten Satz beweisen wir das “Rieszsche Lemma”,das auch als “Satz vom fast-orthogonalen Komplement” bekannt ist.

Lemma 2.1.12 Es sei X ein normierter Raum und U ( X ein echter abge-schlossener Unterraum. Dann gibt es zu jedem δ > 0 ein x ∈ X mit ‖x‖ = 1und

‖x− u‖ ≥ 1− δ ∀u ∈ U.

Beweis. Wahle x ∈ X \ U und setze d := inf‖x− u‖ : u ∈ U. Dann ist d > 0,da sonst eine Folge (un) in U existierte mit ‖x − un‖ → 0, also x ∈ U , weil Uabgeschlossen ist. Zu δ > 0 gibt es also ein u ∈ U mit

‖x− u‖ < d

1− δ.

Setzt man nun x = x−u‖x−u‖ , so ist tatsachlich ‖x‖ = 1 und

‖x− u‖ =

∥∥∥∥ x− u‖x− u‖

− u∥∥∥∥ =

1

‖x− u‖∥∥x− u− ‖x− u‖u︸ ︷︷ ︸

∈U

∥∥ ≥ d

‖x− u‖> 1− δ

3vgl. etwa [Sch-Ana2]

12

fur alle u ∈ U .

Als Anwendung zeigen wir den folgenden Satz, der insbesondere im Hin-blick auf die aus der Analysis bekannte Tatsache, dass in endlich-dimensionalenRaumen die kompakten Mengen gerade die beschrankten abgeschlossenen Men-gen sind, zeigt, dass sich unendlich-dimensionale Raume wesentlich anders alsendlich-dimensionale verhalten konnen.

Satz 2.1.13 Es sei (X, ‖ · ‖) ein normierter Raum. Dann sind aquivalent:

(i) dimX <∞.

(ii) B1 = x ∈ X : ‖x‖ ≤ 1 ist kompakt.

(iii) Jede beschrankte Folge in X besitzt eine konvergente Teilfolge.

Beweis. (i) =⇒ (ii): Fur X = Kn ist das aus der Analysis bekannt. Mit Φ wieim Beweis von Satz 2.1.10 ergibt sich dies dann im Allgemeinen.

(ii) =⇒ (iii): Aus (ii) ergibt sich, dass Br fur jedes r > 0 kompakt ist, was(iii) zeigt.

(iii) =⇒ (i): Es sei dimX = ∞. Wir fixieren ein x1 ∈ X mit ‖x1‖ = 1 unddefinieren eine Folge (xn) induktiv, indem wir mit dem Rieszschen Lemma xn+1

derart wahlen, dass

‖xn+1‖ = 1 und ‖xn+1 − u‖ >1

2∀u ∈ linx1, . . . , xn

gilt. (Nach Korollar 2.1.11 ist linx1, . . . , xn abgeschlossen.) Dann ist (xn) be-schrankt, kann aber wegen

‖xn − xm‖ >1

2

fur n 6= m keine Teilfolge besitzen, die eine Cauchy-Folge ist.

Separabilitat

Wir definieren nun eine Eigenschaft, die besagt, dass gewisse Raume “nicht zugroß” sind in dem Sinne, dass es eine abzahlbare Menge gibt, die jeden Punktbeliebig gut approximiert. Wir geben sie gleich allgemein fur metrische Raumean.

Definition 2.1.14 Es sei X ein metrischer Raum.

(i) Eine Teilmenge S ⊂ X heißt dicht, wenn S = X gilt.

(ii) X heißt separabel, wenn es eine abzahlbare dichte Teilmenge in X gibt.

13

Diese Eigenschaft metrischer Raume ubertragt sich auf Teilmengen:

Proposition 2.1.15 Ist X ein separabler metrischer Raum und A ⊂ X, so istauch A (bezuglich der auf A eingeschrankten Metrik) separabel.

Beweis. Ist S = x1, x2, . . . eine abzahlbare dichte Teilmenge von X, so wahlean,m ∈ B1/m(xn)∩A, falls diese Menge nicht leer ist. Die Menge dieser Punkte an,mist dann eine abzahlbare Teilmenge von A und zu jedem a ∈ A und m ∈ N gibt esein xi mit d(xi, a) < 1

mund dazu ein ai,m mit d(xi, ai,m) < 1

m, also d(a, ai,m) < 2

m.

Bemerkung: Achtung! In allgemeinen topologischen Raumen gilt dieser Satznicht.

Proposition 2.1.16 Es sei X ein normierter Raum. X ist genau dann separabel,wenn es eine abzahlbare Teilmenge A ⊂ X gibt, so dass linA = X ist.

Beweis. Die Notwendigkeit dieser Bedingung ist klar. Dass sie auch hinreichendist, sieht man, indem man

B =

n∑j=1

λjxj : n ∈ N, λj ∈ Q bzw. Q + iQ, xj ∈ A

setzt und beachtet, dass B abzahlbar mit B ⊃ linA und somit B = X ist.

Beispiele:

1. Kn ist separabel, da Qn bzw. (Q + iQ)n dicht liegen.

2. C([a, b]) ist separabel. Das ergibt sich aus dem Weierstraßschen Approxi-mationssatz, der ja besagt, dass die Polynome in C([a, b]) dicht liegen. Manuberlegt sich leicht, dass dann auch die abzahlbare Menge der Polynomemit rationalen Koeffizienten in C([a, b]) dicht liegt. (Ein analoges Resultatgilt allgemein fur C(Ω), wenn Ω ein kompakter metrischer Raum ist.)

Weitere Beispiele sowie Beispiele fur nicht separable Raume werden wir in denfolgenden Abschnitten kennenlernen.

Quotienten und Summen

Wir gehen nun noch auf die Konstruktion von Quotienten und Summen vonnormierten Raumen ein. Zunachst erinnern wir daran, dass in einem normiertenRaum (X, ‖·‖) – wie in allgemeinen metrischen Raumen – der Abstand von einemPunkt x ∈ X zu einer Menge A ⊂ X definiert ist durch

d(x,A) : inf‖x− a‖ : a ∈ A.

14

Insbesondere ist damit d(x,A) = 0 genau dann, wenn x ∈ A gilt.Es sei nun (X, ‖ · ‖) ein normierter Raum und U ⊂ X eine Unterraum, so

dass X/U den Quotientenraum bezeichnet, der ja gerade aus den Nebenklassen[x] = x+ U , x ∈ X, besteht.

Satz 2.1.17 Unter diesen Voraussetzungen gilt:

(i) [x] 7→ ‖[x]‖ := d(x, U) definiert eine Halbnorm auf X/U .

(ii) Diese Halbnorm ist eine Norm genau dann, wenn U abgeschlossen ist.

(iii) Ist X ein Banachraum und U abgeschlossen, so ist auch X/U ein Banach-raum.

Beweis. (i) ‖·‖ ist wohldefiniert, da fur [x] = [x′] ein u ∈ U mit x′ = x+u existiert,weshalb d(x′, U) = d(x, U − u) = d(x, U) ist. Des Weiteren ist offenbar ‖[0]‖ = 0und ‖λ[x]‖ = d(λx, U) = d(λx, λU) = λd(x, U) = λ‖[x]‖ fur λ 6= 0. (Fur λ = 0 istdie Aussage trivial.) Es bleibt, die Dreiecksungleichung zu begrunden. Zu x, x′ ∈X und ε > 0 wahle u, u′ ∈ U mit ‖x− u‖ ≤ ‖[x]‖+ ε

2und ‖x′− u′‖ ≤ ‖[x′]‖+ ε

2.

Dann folgt

‖[x] + [x′]‖ = ‖[x+ x′]‖ ≤ ‖x+ x′ − (u+ u′)‖

≤ ‖x− u‖+ ‖x′ − u′‖ ≤ ‖[x]‖+ε

2+ ‖[x′]‖+

ε

2≤ ‖[x]‖+ ‖[x′]‖+ ε.

und damit, da ε beliebig war, die Behauptung.

(ii) Wegen‖[x]‖ = 0 ⇐⇒ d(x, U) = 0 ⇐⇒ x ∈ U

gilt ‖[x]‖ = 0 =⇒ x ∈ U genau dann, wenn U abgeschlossen ist.

(iii) Ist (yn) eine Cauchy-Folge in X/U , so konstruieren wir eine Teilfolge (ynk)induktiv mit ‖ynk+1

−ynk‖ < 2−k: Dazu wahlen wir die Indizes nk der Reihe nacheinfach so, dass nk+1 > nk gilt und ‖ym − ynk‖ < 2−k fur alle m ≥ nk ist. Nunwahlen wir Elemente xk ∈ X wiederum induktiv mit

ynk = [xk] und ‖xk+1 − xk‖ < 2−k.

Dann aber ist (xk) eine Cauchy-Folge in X. Es gibt also ein x ∈ X mit xk → xund somit auch [xk] → [x]. Da nun die Folge yn ein konvergente Teilfolge hat,muss sie als Cauchy-Folge selbst schon konvergieren.

Beispiel: In (C([a, b];K), ‖ · ‖∞) ist U := f ∈ C([a, b];K) : f(a) = 0 ein abge-schlossener Unterraum. Der Quotientenraum C([a, b];K)/U , in dem Funktionen,die auf a ubereinstimmen, identifiziert werden, ist ein Banachraum bezuglich

‖[f ]‖ = d(f, U) = |f(a)|.

Dabei ist C([a, b];K)/U isomorph zu K. Ubung!

15

Satz 2.1.18 Sind (X, ‖ · ‖X) und (Y, ‖ · ‖Y ) normierte Raume, so wird auf derdirekten Summe X ⊕ Y durch

‖(x, y)‖ := ‖x‖X + ‖y‖Y

eine Norm definiert. Sind X und Y Banachraume, so ist auch X ⊕ Y ein Ba-nachraum.

Beweis. (Eine einfache) Ubung!

Bemerkung: Da auf dem R2 alle Normen aquivalent sind, hatte man analogirgend eine Norm ‖ · ‖R2 auf dem R2 dazu verwenden konnen, gemaß

‖(x, y)‖ = ‖(‖x‖X , ‖y‖Y )‖R2

eine Norm auf X ⊕ Y einzufuhren. All diese Wahlen fuhren zu aquivalentenNormen auf X ⊕ Y . Speziell fur die p-Norm auf R2 schreibt man dann auchX ⊕p Y .

2.2 Klassische Funktionenraume

Eine grundlegende Idee der Funktionalanalysis ist es, Funktionen, wie etwa steti-ge, differenzierbare oder integrierbare Abbildungen f : Ω→ R, Ω ⊂ Rn, dadurchzu studieren, dass man sie zu geeigneten Vektorraumen zusammenfasst, darauf insinnvoller Weise Normen definiert und diese normierten ‘Funktionenraume’ mitabstrakten funktionalanalytischen Methoden untersucht. Insbesondere sind hier-durch topologische Begriffe wie etwa die Konvergenz einer Funktionenfolge oderdie Kompaktheit einer Teilmenge von Funktionen erklart.

In den folgenden Abschnitten werden wir mehrere Funktionenraume diskutie-ren.

Beschrankte Funktionen

Wir beginnen mit dem grundlegenden Beispiel des Vektorraums aller beschrank-ten Abbildungen von einer Menge in einen Banachraum Y . Von besonderer Be-deutung ist der Spezialfall Y = K (vgl. etwa [Sch-Ana2]).

Es sei D eine Menge und (Y, ‖ · ‖Y ) ein Banachraum. (Den trivialen FallY = 0 schließen wir aus.) Wir setzen

B(D;Y ) := f : D → Y : ∃C > 0 mit ‖f(x)‖Y ≤ C fur alle x ∈ D.

(Dies ist ein Untervektorraum der Menge aller Abbildungen Y D von D nach Y .)Ist Y = K, so schreibt man fur B(D;K) auch l∞(D).

16

Satz 2.2.1 (B(D;Y ), ‖ · ‖∞) ist ein Banachraum bezuglich

‖f‖∞ := supx∈D‖f(x)‖Y .

Beachte: fk → f in B(D;Y ) heißt gerade, dass die Folge (fk) gleichmaßiggegen f konvergiert.

Beweis. Zunachst muss man sich dazu uberlegen, dass ‖ · ‖∞ tatsachlich eineNorm auf B(D;Y ) definiert: In der Tat ist fur alle f, g ∈ B(D;Y ) und λ ∈ K

(i) supx∈D‖f(x)‖Y ≥ 0 und sup

x∈D‖f(x)‖Y = 0 ⇐⇒ ‖f(x)‖Y = 0 ∀x ∈ D ⇐⇒

f ≡ 0,

(ii) supx∈D‖λf(x)‖Y = sup

x∈D

(|λ|‖f(x)‖Y

)= |λ| sup

x∈D‖f(x)‖Y und

(iii) supx∈D‖f(x)+g(x)‖Y ≤ sup

x∈D

(‖f(x)‖Y +‖g(x)‖Y

)≤ sup

x∈D‖f(x)‖Y +sup

x∈D‖g(x)‖Y .

Es sei nun (fk) eine Cauchy-Folge in B(D, Y ). Fur jedes x ∈ D gilt dann

‖fk(x)− fm(x)‖Y ≤ ‖fk − fm‖∞ → 0 mit k,m→∞.

Da Y vollstandig ist, gibt es ein f(x) ∈ Y mit fk(x)→ f(x) in Y . Dies definierteine Funktion x 7→ f(x), von der wir nun noch zeigen mussen, dass 1. f ∈ B(D, Y )ist und 2. ‖fk − f‖∞ → 0 gilt.

Zu 1. Da (fk) als Cauchy-Folge beschrankt in B(D, Y ) ist, gibt es ein C > 0mit

‖fk(x)‖Y ≤ ‖fk‖∞ ≤ C

fur alle k ∈ N und alle x ∈ D. Daher muss auch ‖f(x)‖Y ≤ C sein.

Zu 2. Es sei ε > 0. Wahle N ∈ N, so dass fur alle k,m ≥ N

‖fk − fm‖∞ ≤ε

2

gilt. Fur jedes x ∈ D konnen wir wegen fk(x) → f(x) außerdem ein (von xabhangiges) n ≥ N wahlen, so dass

‖fn(x)− f(x)‖Y ≤ε

2

ist. Dann folgt fur m ≥ N (indem wir oben k = n wahlen):

‖fm(x)− f(x)‖Y ≤ ‖fm(x)− fn(x)‖Y + ‖fn(x)− f(x)‖Y≤ ‖fm − fn‖∞ +

ε

2≤ ε.

Bildet man nun das Supremum uber alle x ∈ D, erhalt man ‖fm − f‖ ≤ ε.

17

Satz 2.2.2 (B(D;Y ), ‖ · ‖∞) ist separabel genau dann, wenn D endlich und Yseparabel ist.

Beweis. Ist D endlich und S eine abzahlbare dichte Teilmenge von Y , so ist dieabzahlbare Menge SD dicht in Y D = B(D;Y ).

Ist umgekehrt f1, f2, . . . dicht in B(D;Y ), so ist f1(x), f2(x), . . . (fur jedesx ∈ D) dicht in Y , Y also separabel. Ware nun D unendlich, so ware die Po-tenzmenge P(D) uberabzahlbar. Definiert man dann fur A ⊂ D die FunktionenfA ∈ B(D;K) durch

fA(x) =

y, falls x ∈ A,0, falls x /∈ A,

wobei y ein beliebiges Element von Y mit ‖y‖Y = 1 ist, so erhalt man also eineuberabzahlbare Familie (fA)A⊂D ⊂ B(D;Y ), wobei fur Teilmengen A1 6= A2 vonD gilt

‖fA1 − fA2‖∞ = 1

und insbesondereB1/3(fA1)∩B1/3(fA2) = ∅. Andererseits muss in jeder der KugelnB1/3(fA), A ⊂ D, mindestens ein fi, i ∈ N, liegen, was zum Widerspruch fuhrt.

Beispiel: Ein wichtiger Spezialfall istD = N und Y = K, fur den wir auch einfachB(N;K) = l∞ schreiben. (l∞, ‖ · ‖∞) ist also der nicht separable Banachraum derbeschrankten Folgen in K versehen mit der sup-Norm.

Stetige Funktionen

Eine besonders wichtige Anwendung der Satze 2.2.1 und 2.1.6 ist das folgendeBeispiel.

Satz 2.2.3 Es sei D ein metrischer Raum. Dann ist

Cb(D;Y ) := f ∈ B(D;Y ) : f ist stetig

ein Banachraum bezuglich ‖ · ‖∞.

Beweis. Da Cb(D;Y ) ein Unterraum von B(D;Y ) ist, genugt es zu zeigen, dassCb(D;Y ) abgeschlossen ist. Sei also fn → f in B(D;Y ) mit fn ∈ Cb(D;Y ) furalle n. Zu beliebigem x0 ∈ D und ε > 0 wahle N ∈ N mit

‖fN − f‖∞ <ε

3.

Da fN stetig ist, konnen wir dann außerdem δ > 0 so wahlen, dass

d(x, x0) < δ =⇒ ‖fN(x)− fN(x0)‖Y <ε

3

18

ist, wobei d die Metrik auf D bezeichne. Fur x mit d(x, x0) < δ folgt somit

‖f(x)− f(x0)‖Y≤ ‖f(x)− fN(x)‖Y + ‖fN(x)− fN(x0)‖Y + ‖fN(x0)− f(x0)‖Y < ε.

Damit ist f als stetig nachgewiesen, d.h. f ∈ Cb(D;Y ).

Hieraus erhalten wir sofort:

Korollar 2.2.4 Es sei D ein kompakter metrischer Raum. Dann ist C(D;Y ) :=f : D → Y : f ist stetig ein Banachraum bezuglich ‖ · ‖∞.

Beweis. Da auf einem kompakten metrischen Raum jede stetige Funktion be-schrankt ist (s. z.B. [Sch-Ana2]) und fur f ∈ C(D;Y ) nach Satz 2.1.4 auchx 7→ ‖f(x)‖Y stetig ist, ist hier C(D;Y ) = Cb(D;Y ).

Bemerkungen:

1. Fur kompakte metrische Raume (D, d) (i.A. aber nicht fur kompakte to-plogische Raume!) lasst sich zeigen, dass der Banachraum (C(D;Y ), ‖ · ‖∞)separabel ist, wenn Y separabel ist.(Freiwillige Ubung! Tipps: Ist (x1, . . . , xN) ein δ-Netz vonD (vgl. [Sch-Ana2]und Definition und Satz 6.1.1 unten) und setzt man ϕi = max0, 1 −d(·, xi), so definiert ψi = ϕi∑N

j=1 ϕjeine der Zerlegung D = Bδ(x1) ∪ . . . ∪

Bδ(xN) untergeordnete Teilung der 1. Ist nun S ⊂ Y abzahlbar und dicht,so wahle zu gegebenem f ∈ C(D) außerdem qi ∈ S mit |f(xi) − qi| < δ.Zeige dann, dass fur ε > 0 ∥∥∥f − N∑

i=1

qiψi

∥∥∥∞< ε

gilt, wenn δ > 0 hinreichend klein gewahlt ist.)

2. C(D,K) ist ein Beispiel einer Banachalgebra. Allgemein nennt man einenBanachraum (X, ‖ · ‖), auf dem eine assoziative bilineare Abbildung X ×X → X, (x1, x2) 7→ x1x2, die außerdem submultiplikativ ist, d.h. es ist‖x1x2‖ ≤ ‖x1‖ ‖x2‖, eine Banachalgebra. Diese Abbildung ist hier naturlichdas ubliche (punktweise) Produkt von Funktionen.

3. Eine weitreichende Verallgemeinerung des Weierstraßschen Approximati-onssatzes liefert der Satz von Stone-Weierstraß: Ist A ⊂ C(D,K) eine Un-teralgebra (also ein Unterraum, der mit je zwei Funktionen auch derenProdukt enthalt), der

• die konstante Funktion 1 enthalt,

• punktetrennend ist, d.h. fur x 6= y aus D ein f mit f(x) 6= f(y)enthalt, und

19

• (falls K = C) abgeschlossen unter komplexer Konjugation ist, d.h.f ∈ A =⇒ f ∈ A,

dann liegt A dicht in C(D,K).

Ein elementarer Beweis dieses Satzes findet sich z.B. in [He].

Differenzierbare Funktionen

Es sei Ω ⊂ Rn eine offene Menge. Ist f : Ω → K k-mal differenzierbar, solassen sich die partiellen Ableitungen bis zur k-ten Ordnung bekanntlich durchMultiindizes α ∈ Nn

0 mit |α| = α1 + . . .+ αn ≤ k in der Form

∂αf = ∂α11 · · · ∂αnn f

schreiben. Fur k ∈ N setzten wir nun

Ck(Ω;K) := f : Ω→ K : f ist k-mal stetig differenzierbar.

Fur k = 0 ist C0(Ω;K) = C(Ω;K) der Raum der stetigen Funktionen von Ω nachK.

Ist nun Ω ⊂ Rn zudem beschrankt, so definieren wir

Ck(Ω;K) := f ∈ C(Ω;K) : ∂αf ist stetig fortsetzbar auf Ω fur |α| ≤ k.

Es ist nicht schwer zu sehen, dass darauf durch

‖f‖Ck(Ω) :=∑|α|≤k

‖∂αf‖∞

eine Norm erklart ist. Eine Funktionenfolge (fn) konvergiert in diesem Raumgenau dann gegen eine Funktion f ∈ Ck(Ω;K), wenn gilt

∂αfn → ∂αf gleichmaßig in Ω fur jedes |α| ≤ k.

(Uberlegen Sie sich dass!)

Satz 2.2.5 (Ck(Ω;K), ‖ · ‖Ck(Ω)) ist ein Banachraum.

Beweis. Wir betrachten nur den Fall k = 1. Der allgemeine Fall ergibt sich hierausdurch Induktion nach k. (Uberlegen Sie sich das!)

Ist (fm) eine Cauchy-Folge in C1(Ω;K), so sind (fm), (∂1fm), . . . , (∂nfm) Cauchy-Folgen in C(Ω;K). Da dies ein Banachraum ist, gibt es Funktionen f, g1, . . . , gmmit fm → f und ∂ifn → gi, i = 1, . . . , n, in C(Ω;K) (also gleichmaßig). Es bleibtzu zeigen, dass f partiell differenzierbar mit ∂if = gi fur jedes i ist. Dann namlichist f ∈ C1(Ω;K) und es gilt fm → f in C1(Ω;K).

20

Dazu betrachten wir zu gegebenem x ∈ Ω und i ∈ 1, . . . , n die fur hinrei-chend kleine ε > 0 auf (−ε, ε) erklarten Funktionen

um(t) = fm(x+ tei), u(t) = f(x+ tei) und v(t) = gi(x+ tei).

Dann ist um ∈ C1((−ε, ε) mit u′m(t) = ∂ifm(x+ tei) und es gilt

um → u und u′m → v

gleichmaßig auf (−ε, ε). Nach einem Satz aus der Analysis 2 (s. etwa [Sch-Ana2])ist nun u differenzierbar mit u′ = v. Insbesondere fur t = 0 heißt das: ∂if(x)existiert und ist gleich gi(x).

Bemerkungen:

1. Die Raume Ck(Ω;K) sind separabel.(Freiwillige Ubung: Zeigen Sie dies fur k = 1! (Der allgemeine Fall ist ana-log.) Tipps: Durch J : Ck(Ω;K) → C(Ω;Kn+1), Jf = (f, ∂1f, . . . , ∂nf)wird eine normerhaltende lineare Einbettung definiert, wenn Kn+1 durch dieSummennorm normiert ist. Als Teilmenge des separablen Raums C(Ω;Kn+1)ist J(Ck(Ω;K)) dann separabel. Ist F1, F2, . . . dicht in J(Ck(Ω;K)), soist J−1F1, J

−1F2, . . . dicht in Ck(Ω;K).)

2. Statt K kann man auch hier einen allgemeinen (separablen) Banachraumals Wertebereich zulassen. Die Raume Ck(Ω;Y ) sind dann (separable) Ba-nachraume.

2.3 Folgenraume

Besonders anschaulich sind die Funktionenraume auf N, deren Elemente ja Fol-gen sind. Wir betrachten zunachst Raume von konvergenten Folgen und danachRaume von Folgen, die gewisse Summierbarkeitsbedingungen erfullen.

Konvergente Folgen

Aus dem Beispiel l∞ lassen sich mit Hilfe des Satzes 2.1.6 sofort weitere interes-sante Raume von Folgen gewinnen. Dazu definieren wir

d :=

(xn) ∈ KN : xn 6= 0 fur nur endlich viele n,

c0 :=

(xn) ∈ KN : limn→∞

xn = 0,

c :=

(xn) ∈ KN : limn→∞

xn existiert,

also den Raum der abbrechenden Folgen, der Nullfolgen und den Raum der kon-vergenten Folgen. Es gilt dann offenbar

d ⊂ c0 ⊂ c ⊂ l∞.

21

Satz 2.3.1 (c0, ‖ · ‖∞) und (c, ‖ · ‖∞) sind separable Banachraume.

Beweis. Ubung! (Tipps: Zeigen Sie die Vollstandigkeit durch eine Anwendung desSatzes 2.1.6. Fur die Separabilitat ist es hilfreich, die Folgen e(n), n ∈ N, definiertdurch

e(n)i =

1, falls i = n,

0, falls i 6= n,

und (1, 1, . . .) zu betrachten.

Beispiel. Im Gegensatz dazu ist (d, ‖ · ‖∞) zwar ein normierter Raum aber nichtvollstandig. d ist als Teilmenge von l∞ noch nicht einmal abgeschlossen. Ubung:Bestimmen Sie den Abschluss d dieses Raums in l∞.

Die Raume lp

Fur 1 ≤ p <∞ und eine Folge x = (xn) ∈ KN definieren wir die p-Norm

‖x‖p :=(∑n∈N

|xn|p) 1p.

Der Folgenraum lp, 1 ≤ p <∞, ist hiermit gegeben als

lp := (xn) ∈ KN : ‖x‖p <∞.

Fur p =∞ haben wir den Raum l∞ bereits definiert. Auch hier gilt

l∞ = (xn) ∈ KN : ‖x‖∞ <∞,

vgl. das Beispiel von Seite 18. Offenbar ist d ⊂ lp ⊂ c0 fur alle p ∈ [1,∞) undlp1 ⊂ lp2 , falls p1 ≤ p2.

Satz 2.3.2 Fur jedes p ∈ [1,∞) ist (lp, ‖ · ‖p) ein separabler Banachraum.

Dem Beweis schicken wir zwei wichtige Ungleichungen voraus.

Satz 2.3.3 (Holdersche Ungleichung fur Folgen) Es seien 1 ≤ p, q ≤ ∞mit 1

p+ 1

q= 1 (wobei 1

∞ := 0). Sind x = (xn), y = (yn) ∈ KN, so gilt fur

xy = (xnyn)‖xy‖1 ≤ ‖x‖p‖y‖q.

Insbesondere impliziert x ∈ lp und y ∈ lq, dass xy ∈ l1 gilt.

Beweis. Nach der Holderschen Ungleichung auf dem KN (s. z.B. [Sch-Ana1, Satz6.23]) ist fur jedes N ∈ N

N∑i=1

|xiyi| ≤ ‖(x1, . . . , xN , 0, 0, . . .)‖p ‖(y1, . . . , yN , 0, 0, . . .)‖q ≤ ‖x‖p‖y‖q.

Die Behauptung folgt nun durch den (monotonen) Grenzubergang N →∞.

22

Satz 2.3.4 (Minkowski-Ungleichung fur Folgen) Es seien 1 ≤ p ≤ ∞ undx, y ∈ KN. Dann gilt

‖x+ y‖p ≤ ‖x‖p + ‖y‖p.

Insbesondere ist damit x+ y ∈ lp, wenn x, y ∈ lp gilt.

Beweis. Nach der Minkowski-Ungleichung auf dem KN (s. z.B. [Sch-Ana1, Satz6.24]) ist fur jedes N ∈ N

‖(x1 + y1, . . . , xN + yN , 0, 0, . . .)‖p≤ ‖(x1, . . . , xN , 0, 0, . . .)‖p + ‖(y1, . . . , yN , 0, 0, . . .)‖p ≤ ‖x‖p‖y‖q.

Die Behauptung folgt nun durch den (monotonen) Grenzubergang N →∞.

Beweis von Satz 2.3.2. 1. Die Minkowski-Ungleichung ist gerade die Dreiecksun-gleichung fur ‖ · ‖p. Die ubrigen Normeigenschaften sind offensichtlich erfullt undwir erhalten, dass (lp, ‖ · ‖p) ein normierter Raum ist.

2. Um die Vollstandigkeit zu zeigen, betrachten wir eine Cauchy-Folge (x(n))

in lp. (Wir schreiben den Folgenindex oben, da jedes x(n) = (x(n)k )k∈N als Element

von lp selbst eine Zahlenfolge ist.) Fur jedes (feste) k ∈ N ist dann wegen |x(n)k −

x(m)k | ≤ ‖x(n)−x(m)‖p die Zahlenfolge (x

(n)k )n∈N eine Cauchy-Folge in K und daher

konvergent, etwa limn→∞ x(n)k =: xk. Setzen wir x = (xk)k∈N, ist nun wieder noch

zu zeigen, dass 1. x ∈ lp und 2. ‖x(n) − x‖p → 0 gilt.Zu ε > 0 wahle N ∈ N mit

‖x(n) − x(m)‖p < ε

fur m,n ≥ N . Fur jedes K ∈ N ist dann erst recht(K∑k=1

|x(n)k − x

(m)k |

p

) 1p

≤ ‖x(n) − x(m)‖p < ε

fur diese m,n. Fur m→∞ ergibt sich daraus nun(K∑k=1

|x(n)k − xk|

p

) 1p

≤ ε

und hieraus im (monotonen) Limes K →∞(∞∑k=1

|x(n)k − xk|

p

) 1p

≤ ε

fur n ≥ N . Das aber zeigt ‖x(n) − x‖p → 0.

23

3. Die Separabilitat folgt aus line(1), e(2), . . . = lp. (Uberlegen Sie sich das!)

Die lp-Raume sind tatsachlich nur ein Spezialfall der wesentlich allgemeinerenKlasse von Lebesgue-Raumen, die wir im Abschnitt 2.5 naher untersuchen wer-den. Dazu mussen wir allerdings zunachst an einige Tatsachen aus der Maß- undIntegrationstheorie erinnern.

2.4 Maße

Wir geben hier zunachst die Definition eines (positiven) Maßes und einige grund-legende Beispiele (ohne Beweise) an. Indem wir dieses Konzept erweitern undsomit auch R bzw. C-wertige Maße betrachten konnen, werden wir dann sehen,wie sich auch auf der Menge der Maße eine Banachraumstruktur definieren lasst.

Definition 2.4.1 Ein Mengensystem A von Teilmengen von Ω heißt σ-Algebra,wenn gilt

(i) ∅ ∈ A,

(ii) A ∈ A =⇒ Ac ∈ A und

(iii) A1, A2, . . . ∈ A =⇒⋃∞i=1 Ai ∈ A.

(Ω,A) heißt dann ein messbarer Raum, die Elemente von A werden als A-messbare(oder einfach messbare) Mengen bezeichnet.

(Ac = Ω \ A bezeichnet das Komplement einer Menge A ⊂ Ω.)

Bemerkung: Ist A eine σ-Algebra, so ist mit A1, A2, . . . ∈ A, n ∈ N auch

• A1 ∪ . . . ∪ An ∈ A, denn A1 ∪ . . . ∪ An = A1 ∪ . . . ∪ An ∪ ∅ ∪ ∅ ∪ . . .,

• A1 ∩ . . . ∩ An ∈ A, denn A1 ∩ . . . ∩ An = (Ac1 ∪ . . . ∪ Acn)c,

• A1 \ A2 ∈ A, denn A1 \ A2 = A1 ∩ Ac2 und

•⋂∞i=1Ai ∈ A, denn

⋂∞i=1 Ai = (

⋃∞i=1A

ci)c.

Etwas heuristisch lasst sich formulieren: In σ-Algebren sind alle abzahlbaren Men-genoperationen erlaubt, in dem Sinne, dass die Verknupfung von abzahlbar vielenOperationen mit Mengen aus A nicht aus A hinausfuhrt.

Definition 2.4.2 Es sei Ω eine Menge und A eine σ-Algebra auf Ω. Eine Abbil-dung µ : A → [0,∞] heißt ein Maß, wenn gilt

(i) µ(∅) = 0 und

24

(ii) fur paarweise disjunkte A1, A2, . . . ∈ A ist

µ

(∞⋃i=1

Ai

)=∞∑i=1

µ(Ai).

(Ω,A, µ) heißt dann ein Maßraum.

Die letzte Eigenschaft nennt man auch die σ-Additivitat eines Maßes. Beachte,dass µ den Wert ∞ annehmen darf. Fur das Rechnen auf R ∪ ∞ vereinbarenwir die Rechenregeln x +∞ = ∞ fur x ∈ (−∞,∞], x · ∞ = ∞ fur x ∈ (0,∞]und 0 · ∞ = 0.

Damit haben wir nun den Elementen von A ein Maß µ(A) zugeordnet, das die‘Große’ dieser Menge misst. Eine spezielle Rolle in der Maßtheorie spielen Null-mengen, die so klein sind, dass sie kein positives Maß haben, diejenigen N ∈ Aalso mit µ(N) = 0. Oft sind sie aufgrund ihrer Kleinheit irrelevante Ausnah-memengen. So sagt man etwa, dass eine Aussage uber die Punkte x ∈ Ω einesMaßraums (Ω,A, µ) µ-fast uberall gilt (abgekurzt: µ-f.u.), wenn es eine Nullmen-ge N gibt, so dass diese Aussage auf alle x ∈ Ω \N zutrifft.

Beispiel: Sind (Ω,A, µ) ein Maßraum und f, f1, f2, . . . : Ω → R Funktionenauf Ω, so sagt man, dass (fn) µ-f.u. gegen f konvergiert, wenn ein N ∈ A mitµ(N) = 0 existiert, so dass fur alle x ∈ Ω \N gilt limn→∞ fn(x) = f(x).

Maße lassen sich oft dadurch konstruieren, dass man fur besonders einfacheMengen C eines Mengensystems C ⊂ P(Ω) das Maß µ(C) explizit angibt undµ dann zu einem Maß fortsetzt. Zunachst muss man dazu C zu einer σ-Algebraerweitern.

Definition und Satz 2.4.3 Es seien Ω eine Menge und C ⊂ P(Ω) ein Mengen-system auf Ω. Dann ist das Mengensystem

σ(C) =⋂A ⊂ P(Ω) : A ist σ-Algebra und C ⊂ A.

eine σ-Algebra. Man nennt sie die von C erzeugte σ-Algebra.

Beispiele:

1. Es sei Ω ein metrischer (oder topologischer) Raum und O das System deroffenen Teilmengen von Ω. Dann nennt man B(Ω) := σ(O) die σ-Algebrader Borelmengen auf Ω.

2. Fur Ω = Rn ist B(Rn) auch von dem wesentlich kleineren System der offenenQuader erzeugt: Mit

C = (a1, b1)× . . .× (an, bn) : a1 ≤ b1, a2 ≤ b2, . . . , an ≤ bn

ist σ(C) = B(Rn).

25

3. Auf dem messbaren Raum (Rn,B(Rn)) gibt es genau ein Maß λ, dass Qua-dern (a1, b1)× . . .× (an, bn) den Wert

λ((a1, b1)× . . .× (an, bn)) = (b1 − a1) · . . . · (bn − an)

zuordnet. Men nennt es das Lebesgue-Borel-Maß auf Rn.

4. Ist Ω eine Menge, A eine σ-Algebra auf Ω und x ∈ Ω, so definiert

δx(A) =

1, falls x ∈ A,0, falls x /∈ A,

fur A ∈ A ein Maß auf Ω, das sogenannte Dirac-Maß bei x.

5. Ist Ω eine Menge, A eine σ-Algebra auf Ω, so ist durch

µ(A) =

#A, falls A endlich,

∞, falls A unendlich,

fur A ∈ A das sogenannte Zahlmaß auf Ω gegeben.

Es ist einfach zu sehen, dass Summen und positive Vielfache von Maßen wiederMaße sind. Um eine Vektorraumstruktur einzufuhren, definieren wir zudem diesignierten bzw. komplexen Maße.

Definition 2.4.4 Es sei (Ω,A) ein messbarer Raum. Eine Abbildung µ : A → Kheißt signiertes Maß (falls K = R) bzw. komplexes Maß (falls K = C), wenn

µ

(∞⋃n=1

An

)=∞∑n=1

µ(An)

fur paarweise disjunkte An gilt. Die Gesamtheit dieser Maße auf Ω schreibt manals M(Ω,A).

Offenbar ist dann M(Ω,A) ein Vektorraum. (Beachte: Die Werte ±∞ sind hiernicht zugelassen!)

Tatsachlich lassen sich viele Eigenschaften signierter und komplexer Maße aufEigenschaften positiver Maße zuruckfuhren. Zunachst lasst sich ja offensichtlichjedes komplexe Maß µ durch

µ = Reµ+ i Imµ

mit Hilfe der signierten Maße Reµ und Imµ schreiben. Jedes signierte Maß µwiederum lasst sich nun als Differenz positiver endlicher Maße schreiben:

26

Satz 2.4.5 (Hahn-Jordan-Zerlegung signierter Maße) Es sei (Ω,A) einmessbarer Raum und µ ein signiertes Maß darauf. Dann gibt es eine (bis aufNullmengen eindeutige) messbare Zerlegung Ω = Ω+∪Ω− (die ‘Hahn-Zerlegung’von Ω), so dass µ+ := µ|Ω+ und µ− := −µ|Ω− positive Maße sind. Es ist

µ = µ+ − µ−.

(Dies ist die ‘Jordan-Zerlegung’ von µ.)

Beweis. S. z.B. [Bau].

Ahnlich wie man zu einer Funktion f : Ω → K die nichtnegative Funktion|f | : Ω → [0,∞) bilden kann, ordnen wir einem signierten oder komplexen Maßµ nun das positive sogenannte Variationsmaß |µ| zu, mit dessen Hilfe wir danneine Norm fur µ definieren.

Definition und Satz 2.4.6 Es sei µ ein signiertes oder komplexes Maß. µ ∈M(Ω,A)

(i) Das Variationsmaß |µ| : A → R+, definiert durch

|µ|(A) := sup|µ(B1)|+ . . .+ |µ(Bn)| : A = B1∪ . . . ∪Bn, n ∈ N

fur A ∈ A, ist ein (positives) Maß auf (Ω,A), d.h. mit |µ|(Ω) <∞.4

(ii) Die Variationsnorm von µ ist ‖µ‖Var := |µ|(Ω). Dies ist eine Norm aufM(Ω,A), die (M(Ω,A), ‖ · ‖Var) zu einem Banachraum macht.

Beweis. S. z.B. [We]

Bemerkung: Mit Hilfe der Jordan-Zerlegung lasst sich das Variationsmaß einessignierten Maßes µ auch einfach als |µ| = µ+ + µ− schreiben.

2.5 Lebesgue-Raume

Integrale

Wir tragen zunachst hier kurz die wesentlichen Begriffe und Tatsachen aus der Le-besgueschen Integrationstheorie (ohne Beweis) zusammen. Wenn Sie das Lebesgue-Integral nicht kennen sollten, werden Sie hier alles, was wir brauchen werden, sozusammengestellt finden, dass Sie diese Lucke auch spater noch schließen konnen.Fur diese Vorlesung mussen Sie das Folgende dann einfach ohne Begrundung ak-zeptieren.

Das Ziel ist es nun moglichst allgemeinen Funktionen f : Ω→ R (oder sogarf : Ω → R ∪ −∞,∞) ein Integral “uber Ω bezuglich µ” zuzuordnen. Dazu

4D.h. |µ| ist ein positives endliches Maß auf (Ω,A).

27

mussen wir voraussetzen, dass f mit den σ-Algebren A und B vertraglich ist. Esist in der Integrationstheorie oft praktisch, auch die Funktionswerte ±∞ zuzu-lassen, d.h. f : Ω → R = R ∪ −∞ ∪ ∞ zu betrachten. Dazu kann man dieBorel-σ-Algebra B auf R einfach zur σ-Algebra B auf R fortsetzen, die aus allenMengen der Form

B, B ∪ −∞, B ∪ ∞ und B ∪ −∞,∞

mit B ∈ B besteht. (Dies ist wirklich eine σ-Algebra!) Allgemein definiert man:

Definition 2.5.1 Es seien (Ω,A), (Ω′,A′) messbare Raume.

(i) Eine Abbildung f : Ω→ Ω′ heißt A-A′-messbar, wenn gilt

f−1(A′) ∈ A ∀A′ ∈ A′.

(ii) Ist (Ω′,A′) = (R,B) oder (Ω′,A′) = (R, B), so nennt man eine A-B- bzw.A-B-messbare Abbildung auch einfach A-messbar.

Insbesondere werden wir fur Funktionen f : Ω → R den Bildraum R oder Rimmer mit B bzw. B betrachten.

Beispiel: Ist Ω ein metrischer Raum B(Ω) die σ-Algebra der Borelmengen darauf,so ist jede stetige Funktion f : Ω→ R B(Ω)-messbar.

Durch monotone Approximation mit besonders einfachen Funktionen lasstsich nun jeder nicht negativen A-messbaren Funktion f : Ω → R auf einemMaßraum (Ω,A, µ) ein Integral ∫

Ω

f dµ ∈ [0,∞]

zuordnen. Allgemeine A-messbare Funktionen f : Ω→ R nennen wir dann inte-grierbar und schreiben f ∈ L 1(Ω,A, µ), wenn gilt

∫Ω|f | dµ <∞. (Mit f ist auch

immer |f | messbar.) Fur diese Funktionen ist das Integral∫Ω

f dµ ∈ R

in sinnvoller Weise erklart. Ist Ω ⊂ Rn eine Borel-messbare Menge, A = B(Ω)und µ = λ, so schreiben wir auch einfach

∫Ωf dx.

Das Integral andert sich bei Abanderungen auf einer Nullmenge nicht: Giltfur f, g ∈ L 1(Ω,A, µ) f = g µ-f.u., so ist∫

Ω

f dµ =

∫Ω

g dµ.

Es stellt sich außerdem heraus, dass eine integrierbare Funktion die Werte ±∞hochstens auf einer Nullmenge annehmen kann, so dass man – ggf. nach Abandernauf einer irrelevanten Nullmenge – auch nur reellwertige Funktionen betrachtenkann.

Die grundlegenden Eigenschaften fasst der folgende Satz zusammen.

28

Satz 2.5.2 Sind f, g ∈ L 1(Ω,A, µ), a ∈ R, so sind auch af , f+g (wenn uberalldefiniert) und |f | ∈ L 1(Ω,A, µ) und es gilt

(i)∫

Ωaf dµ = a

∫Ωf dµ,

(ii)∫

Ωf + g dµ =

∫Ωf dµ+

∫Ωg dµ,

(iii) f ≤ g =⇒∫

Ωf dµ ≤

∫Ωg dµ und

(iv) |∫

Ωf dµ| ≤

∫Ω|f | dµ.

Im Wesentlichen ist also L 1(Ω,A, µ) ein Vektorraum und das Integral ist einemonotone lineare Abbildung auf L 1(Ω,A, µ) mit Werten in R. Die kleine Ein-schrankung, dass f + g nicht definiert ist, wenn fur ein x ∈ Ω f(x) = ∞ undg(x) = −∞ (oder umgekehrt) ist, bereitet keine grundsatzlichen Probleme, dadies nur auf einer Nullmenge passieren kann.

Fur komplexwertige Funktionen f : Ω → C (oder auch f : Ω → C = C ∪∞) oder allgemeiner vektorwertige Funktionen f = (f1, . . . , fn) : Ω → Rn aufeinem Maßraum (Ω,A, µ) ist die A-B(Rn)-Messbarkeit aquivalent zur A-B(R)-Messbarkeit jeder komponente fi, i = 1, . . . , n. Man schreibt f ∈ L 1(Ω,A, µ;Rn),wenn jede Komponente fi integrabel ist und definiert das Integral in diesem Fallkomponentenweise durch∫

Ω

f dµ =(∫

Ω

f1 dµ, . . . ,

∫Ω

fn dµ).

Speziell fur kompexwertige f = Re f + i Im f ist also∫Ω

f dµ =

∫Ω

Re f dµ+ i

∫Ω

Im f dµ.

Es ist nicht schwer zu sehen, dass die Aussagen aus Satz 2.5.2(i),(ii) und (vi) furalle f, g ∈ L 1(Ω,A, µ;C) und a ∈ C richtig bleiben.

Die Konvergenzsatze

Der große Vorteil des Lebesgue-Integrals im Vergleich etwa zum Riemann-Integralliegt nun nicht nur darin, dass eine wesentlich großere Klasse von Funktionenintegriert werden kann. Es gelten vor allem auch sehr starke Konvergenzsatzeuber die Vertauschung von Integral und Limes bei Funktionenfolgen.

Wir untersuchen in diesem Abschnitt Funktionenfolgen (fk) auf einem Maß-raum (Ω,A, µ), die fast uberall gegen eine Grenzfunktion f konvergieren: fk → fµ-f.u.

Satz 2.5.3 (Satz von der monotonen Konvergenz) Es seien f, f1, f2, . . . :Ω→ R A-messbar mit fk f µ-f.u.

29

(i) Ist fk ≥ 0 fur alle k, so gilt

limk→∞

∫Ω

fk dµ =

∫Ω

f dµ (∈ [0,∞]).

(ii) Sind alle fk integrierbar, so ist f genau dann integrierbar, wenn limk→∞∫

Ωfk dµ <

∞ ist. In diesem Fall gilt

limk→∞

∫Ω

fk dµ =

∫Ω

f dµ.

Naturlich gilt ein ensprechendes Resultat in (ii) fur fk f .

Satz 2.5.4 (Satz von der majorisierten Konvergenz) Es seien f, f1, f2, . . .A-messbare numerische Funktionen auf einem Maßraum (Ω,A, µ) mit fk → fpunktweise µ-f.u. Des Weiteren gebe es eine integrierbare Funktion g ∈ L 1(Ω,A, µ)mit |fk| ≤ g fur alle k. Dann sind auch die Funktionen f, f1, f2, . . . integrierbarund es gilt

limk→∞

∫Ω

fk dµ =

∫Ω

f dµ.

Man nennt g eine integrierbare Majorante.

Bemerkung: Gilt fk(x) → f(x) fur jedes x ∈ Ω, so folgt die Messbarkeit vonf aus der Messbarkeit der fk. Fur fk → f µ-f.u. bleibt dies richtig, wenn jedeµ-Nullmenge in A enthalten ist5.

Die Raume Lp

In diesem Abschnitt behandeln wir eine in der Analysis wichtige Klasse von Funk-tionen. Diejenige namlich, fur die geeignete Potenzen integrierbar sind. Im Fol-genden sei (Ω,A, µ) ein Maßraum. Wir beschranken uns der Einfachheit halberauf den Fall K = R.

Definition 2.5.5 Fur 1 ≤ p <∞ und f : Ω→ R A-messbar setzt man

‖f‖Lp :=

(∫Ω

|f |p dµ) 1

p

(∈ [0,∞])

undL p(Ω,A, µ) := f : Ω→ R : f ist A-messbar und ‖f‖Lp <∞

Ist speziell Ω ⊂ Rn messbar, A = B(Ω) und µ = λ das Lebesgue-Borel-Maß, soschreiben wir auch einfach L p(Ω).

5Man sagt dann, der Maßraum (Ω,A, µ) sei vollstandig.

30

Beachte, dass die Definition konsistent mit unserer schon fruher eingefuhrtenNotation L 1(Ω,A, µ) ist. Statt ‖f‖Lp schreibt auch oft nur ‖f‖p.Beispiele:

1. Es sei Ω = [0, 1], f(x) = |x|α. Dann ist

f ∈ L p(Ω) ⇐⇒∫ 1

0

|x|αp dx <∞ ⇐⇒ αp > −1 ⇐⇒ α > −1

p.

2. Ist Ω = [1,∞), g(x) = |x|α. Dann ist

g ∈ L p(Ω) ⇐⇒∫ ∞

1

|x|αp dx <∞ ⇐⇒ αp < −1 ⇐⇒ α < −1

p.

Definition 2.5.6 Eine A-messbare Funktion f : Ω→ R heißt wesentlich beschrankt,wenn es eine wesentliche obere Schranke c, also ein c ≥ 0 mit

|f(x)| ≤ c µ-fast uberall

gibt. Die kleinste wesentliche oberere Schranke nennt man das essentielle Supremumvon |f | und schreibt:

‖f‖L∞ := ess sup|f | := infc ≥ 0 : |f(x)| ≤ c µ-fast uberall.

Die Menge der wesentlich beschrankten Funktionen bezeichnen wir mit L∞(Ω,A, µ)(oder einfach L∞(Ω) fur das Lebesgue-Maß auf messbaren Ω ⊂ Rn).

Beachte, dass ‖f‖L∞ selbst eine wesentliche obere Schranke fur |f | ist, denngilt etwa

|f(x)| ≤ ‖f‖L∞ +1

k∀x /∈ Nk, µ(Nk) = 0, k = 1, 2, . . . ,

so ist

|f(x)| ≤ ‖f‖L∞ ∀x /∈⋃k

Nk, µ

(⋃k

Nk

)= 0.

Statt ‖f‖L∞ schreibt man auch oft nur ‖f‖∞. Dabei muss man jedoch aufpas-sen! Obwohl genauso bezeichnet, ist ‖ · ‖∞ dann i.A. nicht die Supremumsnorm.Z.B. ist ‖χQ‖∞ = 0 in L∞(Rn).

Ubung: Es sei f ∈ L p(Ω,A, µ) fur alle 1 ≤ p ≤ ∞. Zeigen Sie

limp→∞‖f‖Lp = ‖f‖L∞ .

Wir konnen nun die Ungleichungen von Holder und von Minkowski in einemsehr allgemeinen Rahmen formulieren.

31

Satz 2.5.7 (Die Holdersche Ungleichung) Es seien 1 ≤ p, q ≤ ∞ mit 1p

+1q

= 1 (wobei 1∞ := 0). Sind f, g A-messbare numerische Funktionen auf Ω, so

gilt‖fg‖L1 ≤ ‖f‖Lp‖g‖Lq .

Insbesondere impliziert f ∈ L p(Ω) und g ∈ L q(Ω), dass fg ∈ L 1(Ω) gilt.

Beweis. S. z.B. [Sch-Ana3].

Satz 2.5.8 (Die Minkowski-Ungleichung) Es seien 1 ≤ p ≤ ∞ und f, g A-messbare numerische Funktionen auf Ω. Dann gilt (falls f + g uberall definiertist)

‖f + g‖Lp ≤ ‖f‖Lp + ‖g‖Lp .

Insbesondere ist damit f + g ∈ L p(Ω,A, µ), wenn f, g ∈ L p(Ω,A, µ) gilt.

Beweis. S. z.B. [Sch-Ana3].

Bemerkung. Die Versionen fur Folgen ergeben sich sofort aus Satz 2.5.7 undSatz 2.5.8, indem man N mit dem Zahlmaß betrachtet.

Beispiele:

1. Ist µ ein endliches Maß, also µ(Ω) < ∞, (wie etwa das Lebesgue-Maß aufeiner beschrankten Menge), so gilt

p ≤ p′ =⇒ L p(Ω,A, µ) ⊃ L p′(Ω,A, µ).

Ubung: Zeigen Sie dies.

2. Wie schon oben bemerkt ergeben sich die lp-Raume als Spezialfalle, indemman Ω = N, A = P(Ω) setzt und fur µ das Zahlmaß auf N, also µ(A) = #A,betrachtet. Hier gelten – wie oben gesehen – die umgekehrten Inklusionenp ≤ p′ =⇒ lp ⊂ lp

′.

3. Ist µ = λ das Lebesgue-Borel-Maß auf R (oder Rn), so gilt fur zwei ver-schiedene p und p′ keine dieser Inklusionen:

p 6= p′ =⇒ L p(R) 6⊂ L p′(R)

fur alle p, p′ ∈ [1,∞].

Ubung: Zeigen Sie dies.

Die Notation ‖ · ‖p wird durch das folgende Korollar gerechtfertigt:

Korollar 2.5.9 Es seien 1 ≤ p ≤ ∞, f, g ∈ L p(Ω,A, µ) und λ ∈ R. Dann sindauch λf und f + g (falls uberall definiert) in L p(Ω,A, µ) und es gilt

32

(i) ‖λf‖Lp = |λ|‖f‖Lp,

(ii) ‖f + g‖Lp ≤ ‖f‖Lp + ‖g‖Lp und

(iii) ‖f‖Lp = 0 ⇐⇒ f = 0 f.u.

Beweis. (i) ist klar, (ii) ist gerade die Minkowskische Ungleichung und die Impli-kation ‘⇐=’ in (iii) ist klar.

Implikation ‘=⇒’ in (iii) folgt im Fall p =∞ aus |f | ≤ ‖f‖∞ = 0 fast uberall.Fur p ∈ [1,∞) setzen wir Nk = x ∈ Ω : |f(x)| ≥ k−1 fur k ∈ N. Wegen

0 =

∫Ω

|f |p dµ ≥∫Nk

|f |p dµ ≥∫Nk

k−p dµ = k−pµ(Nk)

ist µ(Nk) = 0 und damit auch x ∈ Ω : |f(x)| > 0 =⋃k∈NNk eine Nullmenge.

‖ · ‖Lp ist also eine Halbnorm auf L p(Ω,A, µ). Wie in der Bemerkung 1von Seite 8 beschrieben, konnen wir daraus wie folgt einen normierten Raummachen, indem wir auf der Menge der A-messbaren numerischen Funktioneneine Aquivalenzrelation durch

f ∼ g :⇐⇒ f = g µ-fast uberall

definieren undLp(Ω,A, µ) := [f ] : f ∈ L p(Ω,A, µ)

setzen, wobei [f ] die Aquivalenzklasse der Funktion f bezeichnet. Beachte, dassjede Funktion aus L p(Ω,A, µ) hochstens auf einer Nullmenge die Werte ±∞annehmen kann, so dass jede Aquivalenzklasse Vertreter mit Werten aus R hat.Dabei gilt [fk] → [f ] in Lp(Ω,A, µ) genau dann, wenn fk → f in L p(Ω,A, µ)gilt.

Auch das Konzept der punktweisen Konvergenz µ-fast uberall lasst sich uber-tragen, indem wir sagen, dass [fk] → [f ] µ-fast uberall gilt, wenn fk → f µ-fastuberall erfullt ist. Auch das hangt ja nicht von der Auswahl der Reprasentantenaus [fk] oder [f ] ab.

Es ist nun ublich, nicht ganz so genau zwischen f und der Aquivalenzklasse[f ] von f zu unterscheiden. Solange die betrachteten Funktionen unter einemIntegral auftreten, ist das ja auch nicht so schlimm. Man muss dabei allerdingsvorsichtig sein: Ein Ausdruck der Form [f ](x) allein macht i.A. keinen Sinn. Eskann ja f(x) 6= f ′(x) fur f ∼ f ′ vorkommen. Man sagt also etwa, dass nach derHolderschen Ungleichung

‖fg‖L1 ≤ ‖f‖Lp‖g‖Lq ∀f ∈ Lp(Ω,A, µ), g ∈ Lq(Ω,A, µ)

gilt, 1p

+ 1q

= 1, meint aber, dass dies fur alle Vertreter der Klassen [f ] und [g] derFall ist, ahnlich fur die Minkowski-Ungleichung.

Tatsachlich sind die normierten Raume Lp(Ω,A, µ) sogar vollstandig:

33

Satz 2.5.10 Die Raume (Lp(Ω,A, µ), ‖ · ‖Lp), 1 ≤ p ≤ ∞, sind Banachraume.

Beweis. Nach unseren Voruberlegungen ist nur noch zu begrunden, dass Lp(Ω,A, µ)vollstandig ist. Es sei also (fk) eine Cauchy-Folge aus Lp(Ω,A, µ).

1. Es sei zunachst 1 ≤ p <∞. Wir zeigen zuerst, dass es eine Teilfolge (fkm)gibt, so dass fkm punktweise fast uberall gegen ein f ∈ Lp(Ω,A, µ) konvergiert.Dazu wahlen wir k1 < k2 < . . . induktiv mit

‖fkm+1 − fkm‖Lp ≤ 2−m

und setzen

gm = fkm+1 − fkm und g =∞∑m=1

|gm| (∈ [0,∞]).

Nach der Minkowski-Ungleichung ist dann∥∥∥∥ N∑m=1

|gm|∥∥∥∥Lp≤

N∑m=1

‖fkm+1 − fkm‖Lp ≤ 1 ∀N ∈ N.

Wegen(∑N

m=1 |gm|)p gp liefert der Satz von der monotonen Konvergenz nun

auch ‖g‖Lp ≤ 1.Dann aber ist g fast uberall endlich und die Summe

∑∞m=1 gm fast uberall

absolut konvergent. Wegen∑m

i=1 gi = fkm − fk1 konvergiert die Teilfolge (fkm)fast uberall gegen ein A-messbares f (= fk1 +

∑∞i=1 gi).

2. Fur jedes m ist nun

|f − fkm|p =

∣∣∣∣ ∞∑i=m+1

gi

∣∣∣∣p ≤ gp f.u.

Da aber gp integrierbar ist und |f − fkm |p f.u. gegen 0 konvergiert, folgt aus demSatz von der majorisierten Konvergenz

‖f − fkm‖Lp =(∫|f − fkm|p dµ

) 1p → 0,

also fkm → f in Lp(Ω,A, µ). Da (fk) eine Cauchy-Folge ist, gilt dann aber schonfk → f in Lp(Ω,A, µ).

3. Fur p = ∞ gilt sogar eine starkere Aussage. Fur jedes Indexpaar i, j gibtes eine Nullmenge Nij mit

supΩ\N|fi − fj| = ‖fi − fj‖L∞

Das zeigt, dass (fk) auf Ω \N , N =⋃i,j Nij bezuglich der Supremumsnorm eine

Cauchy-Folge in B(Ω \ N ;K) bildet, wobei N immer noch eine Nullmenge ist.

34

Da dieser Raum vollstandig ist, konvergiert (fk) gleichmaßig (und insbesonderepunktweise) gegen ein messbares f ∈ B(Ω \N ; ‖ · ‖∞). Indem man f etwa durch0 auf ganz Ω fortsetzt erhalt man ein f ∈ L∞(Ω,A, µ) mit

‖fk − f‖L∞ ≤ supΩ\N|fk − f | → 0

fur k →∞.

Von besonderem Interesse ist der Fall, dass Ω ⊂ Rn eine (messbare) Teilmengedes Rn von positivem Maß ist und µ das Lebesgue-Borel-Maß auf Ω.

Satz 2.5.11 Es sei Ω ⊂ Rn messbar mit λ(Ω) > 0.

(i) Lp(Ω) separabel fur 1 ≤ p <∞.

(ii) Ist Ω ⊂ Rn offen, so liegt die Menge C∞c (Ω) der unendlich oft differenzierba-ren Funktionen mit kompaktem Trager in Ω dicht in Lp(Ω) fur 1 ≤ p <∞.

(iii) L∞(Ω) ist nicht separabel.

Beweis. (ii) Dies folgt ganz analog zu [Sch-Ana3, Korollar 4.17]. Ist f ∈ Lp(Ω) undη > 0 vorgegeben, so lasst sich zunachst ein R > 0 finden, so dass ‖f − g‖Lp < ηgilt fur g = χKRf , wo KR = x ∈ Ω : |x| ≤ R und dist(x, ∂Ω) ≥ R−1 ist.Ist nun ϕ ein Standard-Glattungskern (vgl. etwa [Sch-Ana3]) und ϕε = ε−nϕ( ·

ε),

so folgt ϕε ∗ g ∈ C∞c (Ω) und ‖ϕε ∗ g‖Lp < η fur ε hinreichend klein und somit‖f − ϕε ∗ g‖Lp < 2η.

(i) Es genugt zu zeigen, dass Lp(Rn) separabel ist. Fur allgemeine messbareΩ ⊂ Rn folgt dies dann aus Lp(Ω) = f |Ω : f ∈ Lp(Rn). Dazu genugt es nach(ii) zu begrunden, dass C∞c (Rn) separabel ist.

Nach der Bemerkung 1 von Seite 19 und Proposition 2.1.15 gibt es nun furjedes k ∈ N eine bezuglich ‖·‖∞ und damit auch bezuglich ‖·‖Lp dichte abzahlbareTeilmenge in C∞c (Bk) ⊂ C(Bk;R). Bezeichnet Sk diese Menge von Funktionen,durch 0 auf ganz Rn fortgesetzt, so ist die Vereinigung

⋃k Sk dicht in C∞c (Rn).

(iii) Ubung! Tipp: Zerlegen Sie Ω in abzahlbar viele disjunkte messbare Men-genB1, B2, . . . von positivem Maß und betrachten Sie die charakteristischen Funk-tionen von

⋃i∈ABi fur A ⊂ N.

Bemerkung: Ganz analoge Aussagen gelten fur die Lp-Raume von kompexwerti-gen oder Rn-wertigen Funktionen. Insbesondere schreibt man f ∈ Lp(Ω,A, µ;C),wenn Re f, Im f ∈ Lp(Ω,A, µ) ist und setzt ‖f‖Lp = ‖|f |‖Lp fur komplexe f .

Es ist manchmal nutzlich, die Klasse der Lp-Funktionen dahingehend zu erwei-tern, dass die fraglichen Integrierbarkeitsbedingungen nur lokal (auf kompaktenTeilmengen) gefordert werden.

Definition 2.5.12 Ist Ω ⊂ Rn offen und 1 ≤ p ≤ ∞ so setzt man

Lploc(Ω) = f : Ω→ K messbar : f |K ∈ Lp(K) ∀K ⊂ Ω mit K kompakt.

35

Genauer musste man eigentlich wieder von Aquivalenzklassen sprechen. DieLploc(Ω) sind Vektorraume, wobei wir jedoch keine Norm darauf gegeben haben.Mit dem Beispiel 1 von Seite 32 ist es nicht schwer zu sehen, dass p ≤ p′ =⇒Lploc(Ω) ⊃ Lp

loc(Ω) gilt.Zum Abschluss halten wir noch eine Folgerung aus Satz 2.5.11 fest.

Satz 2.5.13 (Fundamentallemma der Variationsrechnung) Es sei Ω ⊂ Rn

offen und f ∈ L1loc(Ω). Dann gilt∫

Ω

fϕ = 0 fur alle ϕ ∈ C∞c (U) =⇒ f = 0 fast uberall.

Beweis.6 Wie im Beweis von Satz 2.5.11(ii) schreiben wir g = χKRf mit KR =x ∈ Ω : |x| ≤ R und dist(x, ∂Ω) ≥ R−1 und beobachten, dass fur ϕε = ε−nϕ( ·

ε)

mit einem Standard-Glattungskern ϕ gilt C∞c (Ω) 3 ϕε ∗ g → g in Lp(Ω) furε→ 0. Wie im Beweis von Satz 2.5.10 gesehen, gibt eine Teilfolge εk → 0, so dassϕεk ∗ g → g punktweise fast uberall gilt. Fur x ∈ KR und genugend kleine εk istnun ist aber ϕε(x− ·) ∈ C∞c (U) und daher

ϕεk ∗ f(x) =

∫U

ϕε(x− y)f(y) dy = 0.

Es folgt g ≡ 0 und, da R beliebig war, f ≡ 0.

2.6 Sobolev-Raume

Sobolev-Raume sind Funktionenraume, deren Elemente nicht mehr im ublichen,wohl aber in einem verallgemeinerten Sinne differenzierbar sind. Sie sind dieGrundlage fur viele moderne Theorien in der Analysis. Insbesondere fur Pro-bleme in der Theorie und der Numerik der partiellen Differentialgleichungen undder Variationsrechung sind sie absolut unverzichtbar.

Die Grundidee bei der Definition von Sobolevfunktionen ist es, mit Hilfe derFormel von der partiellen Integration eine Bedingung fur Ck-Funktionen zu iso-lieren, die sich sich auch fur die wesentlich allgemeineren L1

loc-Funktionen (vgl.Definition 2.5.12) sinnvoll formulieren lasst, um dann ‘den Spieß umzukehren’und die Gultigkeit dieser Bedingung als ‘schwache Differenzierbarkeit’ zu inter-pretieren.

Der Gaußsche Satz und partielle Integration

Wir erinnern vorbereitend an den Gaußschen Integralsatz und die Formel von derpartiellen Integration im Mehrdimensionalen.

6Der Beweis dieses Satzes wurde in der VL weggelassen.

36

Satz 2.6.1 (Der Gaußsche Integralsatz) Es sei U ⊂ Rn eine offene Mengeund Ω ⊂ U eine kompakte Teilmenge mit glattem Rand und außerem Einheits-normalenfeld ν. Ist f ∈ C1(U ;Rn) ein stetig differenzierbares Vektorfeld, so gilt∫

Ω

div f(x) dx =

∫∂Ω

f(x) · ν(x) dS(x).

Hierbei bezeichnet dS(x) das ‘Flachenelement’ auf der glatten Hyperflache ∂Ω.Eine direkte Anwendung hiervon ist die folgende.

Korollar 2.6.2 (Partielle Integration) Sind u, v ∈ C1(U), so gilt∫Ω

(∂ju) v dx =

∫∂Ω

u v νj dS −∫

Ω

u ∂jv dx

fur j ∈ 1, . . . , n.

Besonders wichtig ist der Spezialfall, dass eine der Funktionen u oder v auf demRand verschwindet, womit insbesondere keine Randterme auftreten.

Korollar 2.6.3 (Partielle Integration) Es seien Ω ⊂ Rn offen, u ∈ C1(Ω)und v ∈ C1

c (Ω). Dann gilt∫Ω

(∂ju) v dx = −∫

Ω

u ∂jv dx.

Die Raume W k,p

Der Einfachheit halber betrachten wir wieder nur reelle Raume mit K = R.Raume von C- und Rn-wertigen Sobolevfunktionen konnen hiernach einfach wie-der komponentenweise definiert werden.

Sei U ⊂ Rn offen. Wir erinnern nochmals an der Raum

C∞c (U) := ϕ ∈ C∞(U) : suppϕ ⊂ U ist kompakt

(manchmal auch mit D(U) bezeichnet), den man auch den Raum der Testfunk-tionen nennt. Ist u ∈ Ck(U), so gilt nach Korollar 2.6.3 (partielle Integration)fur |α| ≤ k ∫

U

u ∂αϕ = (−1)|α|∫U

∂αuϕ ∀ϕ ∈ C∞c (U).

Diese Formel ist der Ausgangspunkt zur Definition der schwachen Ableitung.

Definition 2.6.4 Es seien u, v ∈ L1loc(U), α ein Multiindex mit |α| ≤ k. v heißt

die α-te schwache Ableitung von u, geschrieben v = ∂αu, wenn gilt∫U

u ∂αϕ = (−1)|α|∫U

v ϕ ∀ϕ ∈ C∞c (U).

37

Lemma 2.6.5 (i) Die schwache Ableitung ist – wenn sie existiert – eindeutigbis auf Nullmengen definiert.

(ii) Ist u ∈ Ck(U), so ist die schwache auch die starke (= gewohnliche) Ablei-tung.

Beweis. (i) Sind v, v α-te schwache Ableitungen von u, so ist

(−1)|α|∫U

v ϕ =

∫U

u ∂αϕ = (−1)|α|∫U

v ϕ ∀ϕ ∈ C∞c (U)

und daher ∫U

(v − v)ϕ = 0 ∀ϕ ∈ C∞c (U).

Nach Satz 2.5.13 folgt dann aber in der Tat v = v fast uberall.(ii) ist klar nach (i) und der Formel von der partiellen Integration aus Korollar

2.6.3.

Beispiel: Sei U = (−1, 1).

1. u(x) = |x|. Dann ist u schwach differenzierbar mit Ableitung

u′(x) = v(x) =

−1, x < 0,1, x > 0.

In der Tat: Ist ϕ ∈ C∞c (U), so gilt∫ 1

−1

u(x)ϕ′(x) dx =

∫ 0

−1

(−x)ϕ′(x) dx+

∫ 1

0

xϕ′(x) dx

=

∫ 0

−1

ϕ(x) dx−∫ 1

0

ϕ(x) dx = −∫ 1

−1

v(x)ϕ(x) dx,

wobei bei der partiellen Integration keine Randterme auftraten, da ϕ bei−1 und 1 und x bei 0 verschwindet.

2. u(x) =

0, x < 0,1, x > 0.

Dann ist u nicht schwach differenzierbar. (Ubung!)

Definition 2.6.6 Sei U ⊂ Rn offen, k ∈ N, p ∈ [1,∞].

(i) Der Sobolev-Raum W k,p(U) ist definiert durch

W k,p(U) := u ∈ L1loc(U) : ∂αu existiert und liegt in Lp(U) ∀ |α| ≤ k.

Fur p = 2 schreibt man auch Hk(U) = W k,p(U).

38

(ii) Fur u ∈ W k,p(U) setze

‖u‖Wk,p(U) :=

(∑

|α|≤k ‖∂αu‖pLp(U)

) 1p, 1 ≤ p <∞,∑

|α|≤k ‖∂αu‖L∞(U), p =∞.

Eine Folge (um) konvergiert also genau dann gegen ein u in W k,p(U), wenn furjeden Multiindex α mit |α| ≤ k gilt limm→∞ ∂

αum = ∂αu in Lp(U).Wir haben uns hier o.B.d.A. auf reellwertige Funktionen beschrankt. Die So-

bolevraume komplexwertiger Abbildungen sind namlich einfach durchW k,p(U ;C) =u+ iv : u, v ∈ W k,p(U) mit der offensichtlichen Norm gegeben.

Beispiel: U = B1(0) ⊂ Rn, u(x) = |x|−γ.Wenn die schwache Ableitung ∂iu existiert, dann muss sie durch

∂iu =−γxi|x|γ+2

:= vi

gegeben sein. (Betrachte Testfunktionen, die in einer Nullumgebung verschwin-den.) Nun ist vi ∈ L1

loc genau dann, wenn |x|−γ−1 integrierbar ist, also genaudann, wenn γ+ 1 < n ist (Polarkoordinaten). In der Tat ist umgekehrt unter die-ser Voraussetzung fur alle ϕ ∈ C∞c (U) nach Korollar 2.6.2 (partielle Integration)∫

U

u ∂iϕ =

∫Bε(0)

u ∂iϕ+

∫∂Bε(0)

uϕ νi −∫U\Bε(0)

vi ϕ =: I1(ε) + I2(ε)− I3(ε),

ν die innere Normale an ∂Bε(0), 0 < ε < 1. Da wegen γ + 1 < n sowohl u alsauch vi integrierbar sind, folgt mit majorisierter Konvergenz

I1(ε)→ 0 und I3(ε)→∫U

viϕ mit ε→ 0.

Außerdem ist u(x) = ε−γ auf ∂Bε(0), so dass

|I2(ε)| ≤ ‖ϕ‖∞εn−1|∂B1(0)|ε−γ → 0 mit ε→ 0.

Das zeigt, dass wirklich vi = ∂iu im schwachen Sinne gilt.Nun ist ∇u = (∂1u, . . . , ∂nu) ∈ (Lp(U))n genau dann, wenn (γ + 1)p < n gilt

und somit

u ∈ W 1,p(U) ⇐⇒ γ <n− pp

.

Satz 2.6.7 Seien u, v ∈ W k,p(U), |α| ≤ k. Dann gilt

(i) ∂αu ∈ W k−|α|,p(U),

∂β∂αu = ∂α∂βu = ∂α+βu ∀ |α|+ |β| ≤ k.

39

(ii) W k,p(U) ist ein Vektorraum und ∂α : W k,p(U) → W k−|α|,p(U) eine lineareAbbildung.

(iii) Ist V ⊂ U offen, so ist u ∈ W k,p(V ) (genauer: u|V ∈ W k,p(V )).

(iv) Ist ζ ∈ C∞c (U), so ist ζu ∈ W k,p(U) und es gilt die Leibnizformel

∂α(ζu) =∑β≤α

β

)∂βζ∂α−βu,

wobei(αβ

)= α!

β!(α−β)!ist.

Beweis. (i) Sei ϕ ∈ C∞c (U). Dann ist fur β mit |β| ≤ k − |α|∫U

∂αu ∂βϕ = (−1)|α|∫U

u ∂α+βϕ

= (−1)|α|(−1)|α+β|∫U

∂α+βuϕ = (−1)|β|∫U

∂α+βuϕ,

wobei wir im ersten Schritt ∂βϕ ∈ C∞c (U) ausgenutzt haben. Das zeigt ∂β(∂αu) =∂α+βu ∈ Lp.

(ii) Fur λ, µ ∈ R gilt∫U

(λu+ µv)∂αϕ = λ

∫U

u ∂αϕ+ µ

∫U

v ∂αϕ

= λ(−1)|α|∫U

∂αuϕ+ µ(−1)|α|∫U

∂αv ϕ

= (−1)|α|∫U

(λ∂αu+ µ∂αv)ϕ.

(iii) Klar, da C∞c (V ) ⊂ C∞c (U) und Lp(V ) ⊃ Lp(U).(iv) Ubungsaufgabe.

Satz 2.6.8 W k,p(U) ist ein Banachraum.

Beweis. Die Normeigenschaften von ‖ · ‖Wk,p(U) sind klar bis auf die Dreiecksun-gleichung fur p <∞. Die sieht man so:

‖u+ v‖Wk,p(U) =

∑|α|≤k

‖∂α(u+ v)‖pLp(U)

1p

∑|α|≤k

(‖∂αu‖Lp(U) + ‖∂αu‖Lp(U)

)p 1p

40

nach der Dreiecksungleichung auf Lp(U). Mit der Dreiecksungleichung fur die p-Norm auf Rm (hier mit m = #α : |α| ≤ k) angewandt auf (‖∂αu‖Lp)|α|≤k und(‖∂αv‖Lp)|α|≤k ergibt sich

‖u+ v‖Wk,p(U) ≤

∑|α|≤k

(‖∂αu‖Lp(U)

)p 1p

+

∑|α|≤k

(‖∂αv‖Lp(U)

)p 1p

= ‖u‖Wk,p(U) + ‖v‖Wk,p(U).

Wir mussen noch zeigen, dass W k,p(U) vollstandig ist. Sei dazu (um) eineCauchy-Folge. Dann ist fur jedes α mit |α| ≤ k die Folge (∂αum) eine Cauchy-Folge in Lp, und also existieren die Limites ∂αum → uα in Lp(U).

Setze u = u(0,...,0). Es bleibt zu zeigen, dass um → u gilt in W k,p(U). Wegen∂αum → uα in Lp(U) ist dazu nur noch ∂αu = uα zu zeigen. Sei also ϕ ∈ C∞c (U).Dann ist∫

U

u ∂αϕ = limm→∞

∫U

um ∂αϕ = lim

m→∞(−1)|α|

∫U

∂αum ϕ = (−1)|α|∫U

uα ϕ,

was beweist, dass ∂αu existiert und gleich uα ist. Dabei haben wir zweimal ausge-nutzt haben, dass fm → f in Lp(U) impliziert

∫ufm ψ →

∫Uf ψ fur ψ ∈ C∞c (U) ⊂

Lq(U), 1p

+ 1q

= 1. Dies folgt sofoert aus der Holderschen Ungleichung:∣∣∣ ∫U

(fm − f)ψ∣∣∣ ≤ ‖fm − f‖Lp‖ψ‖Lq → 0.

Auch Sobolevfunktionen konnen durch glatte Funktionen approximiert wer-den.

Satz 2.6.9 Sei U ⊂ Rn offen und p ∈ [1,∞).

(i) Dann liegt C∞(U) ∩W k,p(U) dicht in W k,p(U).

(ii) Speziell fur U = Rn gilt: C∞c (Rn) liegt dicht in W k,p(Rn).

Beweis. S. z.B. [Ev].

Bemerkung:

1. Unter zusatzlichen Glattheitsannahmen an ∂U konnen die Approximatio-nen in (i) sogar glatt auf U gewahlt werden.

2. Fur allgemeine Gebiete U liegen die Testfunktionen zwar dicht inW 0,p(U) =Lp(U), nicht jedoch in W k,p(U) fur k ≥ 1. Wie wir spater sehen werden,hangt dies damit zusammen, dass fur Sobolevfunktionen u ∈ W 1,p(U), falls∂U hinreichend glatt ist, die Einschrankung u|∂U (bis auf (n−1)-dimensinaleNullmengen) sinnvoll erklart ist.

41

3. Die Raume W k,p(U) sind separabel fur alle k ∈ N0 und alle 1 ≤ p <∞.(Freiwillige Ubung: Zeigen Sie dies fur k = 1! (Der allgemeine Fall istanalog.) Tipps: Man kann analog zum Beweis der Separabilitat der Ck-Raume vorgehen, vgl. die Bemerkung 1 von Seite 21. Durch J : W k,p(U)→Lp(U ;Rn+1), Jf = (f, ∂1f, . . . , ∂nf) wird eine normerhaltende lineare Ein-bettung definiert, wenn Rn+1 durch die p-Norm normiert ist. Als Teil-menge des separablen Raums Lp(U ;Rn+1) ist J(W k,p(U)) dann separabel.Ist F1, F2, . . . dicht in J(W k,p(U)), so ist J−1F1, J

−1F2, . . . dicht inW k,p(U).)

4. Die Raume W k,∞(U) sind fur kein k ∈ N0 separabel.

42

Kapitel 3

Operatoren auf normiertenRaumen

Wir setzen nun unser Studium allgemeiner normierter Raume fort, indem wirlineare stetige Abbildungen auf normierten Raumen untersuchen. Die Operatorenerhalten somit die lineare Vektorraumstruktur und sind zudem mit den durchdie Normen induzierten Topologien vertraglich. Dabei diskutieren wir zunachsteinige elementare Eigenschaften und insbesondere wie sich auf der Menge derOperatoren zwischen zwei Raumen selbst wieder die Struktur eines normiertenRaums bzw. Banachraums definieren lasst. Etwas genauer gehen wir dann nochauf stetige Isomorphismen ein. Im darauffolgenden Abschnitt beweisen wir viergrundlegende Satze uber Operatoren auf Banachraume. Schließlich untersuchenwir im Speziellen Projektionen.

3.1 Operatoren und Funktionale

Definition und grundlegende Eigenschaften

Wir beginnen mit der folgenden grundlegenden Definition.

Definition 3.1.1 Es seien X, Y normierte K-Vektorraume.

(i) Eine stetige lineare Abbildung von X nach Y heißt Operator (von X nachY ). Der Vektorraum der Operatoren von X nach Y wird mit L(X;Y ) be-zeichnet, fur X = Y auch mit L(X).

(ii) Ist speziell Y = K, so nennt man eine stetige lineare Abbildung von Xnach K ein Funktional (auf X). Der Vektorraum der Funktionale auf Xheißt Dualraum von X und wird mit X ′ bezeichnet.

43

Bemerkungen.

1. Abweichend von unserer Nomenklatur bezeichnet man bisweilen in der Li-teratur auch beliebige Abbildungen zwischen normierten Raumen als Ope-rator.

2. Im Unendlichdimensionalen gibt es auch nicht stetige lineare Abbildungenvon einem normierten Raum X in den Skalarenkorper K. Unser Dualraumist daher nicht der aus der Linearen Algebra bekannte Dualraum. Um dieszu unterscheiden, wird der Vektorraum aller linearen Abbildungen nach Kauch als der ‘algebraische Dualraum’ bezeichnet.

Satz 3.1.2 Es seien (X, ‖·‖X), (Y, ‖·‖Y ) normierte K-Vektorraume, T : X → Ylinear. Die folgenden Bedingungen sind aquivalent:

(i) T ist stetig.

(ii) T ist stetig bei 0.

(iii) Es gibt ein C > 0 mit ‖Tx‖Y ≤ C‖x‖X fur alle x ∈ X.

(iv) T ist Lipschitz-stetig (und damit insbesondere gleichmaßig stetig).

Beweis. (iii) =⇒ (iv): Fur x, x′ ∈ X gilt nach (iii) ‖Tx−Tx′‖Y = ‖T (x−x′)‖Y ≤C‖x− x′‖X .

(iv) =⇒ (i) =⇒ (ii): Klar.(ii) =⇒ (iii): Wenn nicht, so gabe es zu jedem n ∈ N ein xn ∈ X mit

‖Txn‖Y > n‖xn‖X . Dann aber ist∥∥∥T xnn‖xn‖X

∥∥∥Y> 1 ∀n ∈ N obwohl

∥∥∥ xnn‖xn‖X

∥∥∥X

=1

n→ 0.

Widerspruch.

Die bestmogliche Konstante C in dieser Definition bezeichnen wir als Normvon T :

Definition 3.1.3 Es seien (X, ‖ · ‖X), (Y, ‖ · ‖Y ) normierte K-Vektorraume, T :X → Y linear. Dann wird

‖T‖ := ‖T‖L(X;Y ) := infC > 0 : ‖Tx‖Y ≤ C‖x‖X ∀x ∈ X

die Operatornorm von T genannt.

Wenn es klar ist, um welche Norm es sich handelt, so schreiben wir aucheinfach nur ‖ · ‖ statt ‖ · ‖X , ‖ · ‖Y oder ‖ · ‖L(X;Y ).

44

Lemma 3.1.4 Unter denselben Voraussetzungen gilt:

(i) ‖T‖ = supx 6=0‖Tx‖‖x‖ = sup‖x‖=1 ‖Tx‖ = sup‖x‖≤1 ‖Tx‖ = sup‖x‖<1 ‖Tx‖.

(ii) ‖Tx‖ ≤ ‖T‖‖x‖ fur alle x ∈ X.

Beweis. (i) ergibt sich aus der Linearitat von T und den Normeigenschaften.(ii) Das folgt sofort aus der ersten Gleichheit in (i).

Eine wichtige Beobachtung ist nun, dass L(X;Y ) selbst wieder ein normierterRaum ist, der, wenn Y vollstandig ist, selbst wieder vollstandig ist:

Satz 3.1.5 Es seien X, Y normierte Raume.

(i) (L(X;Y ), ‖ · ‖L(X;Y )) ist ein normierter Raum.

(ii) Ist Y ein Banachraum, so auch L(X;Y ).

Beweis. (i) Nur die Dreiecksungleichung ist evtl. nicht sofort klar. Sie ergibt sichfur T, S ∈ L(X;Y ) aus

‖T + S‖ = sup‖x‖=1

‖Tx+ Sx‖ ≤ sup‖x‖=1

(‖Tx‖+ ‖Sx‖)

≤ sup‖x‖=1

‖Tx‖+ sup‖x‖=1

‖Sx‖ = ‖T‖+ ‖S‖.

(ii) Sei Y vollstandig und (Tn) eine Cauchy-Folge in L(X;Y ). Dann ist nachLemma 3.1.4(ii) fur jedes x ∈ X die Folge (Tnx) ein Cauchy-Folge in Y , so dassein T (x) ∈ Y mit Tnx→ T (x) existiert.

Da mit x, x′ ∈ X, λ ∈ K

T (x+ λx′) = limTn(x+ λx′) = T (x) + λT (x′)

gilt, ist T linear.Es sei nun ε > 0 beliebig. Wahle zunachst N ∈ N, so dass

‖Tn − Tm‖ <ε

2∀n,m ≥ N

ist, und dann zu jedem x ∈ X mit ‖x‖ ≤ 1 ein m = m(x) ≥ N mit

‖Tmx− Tx‖ <ε

2.

Fur alle n ≥ N und x ∈ X ist dann

‖Tnx− Tx‖ ≤ ‖Tnx− Tmx‖+ ‖Tmx− Tx‖ ≤ ‖Tn − Tm‖+ ‖Tmx− Tx‖ < ε.

Bildet man nun das Supremum uber alle x mit ‖x‖ ≤ 1, folgt ‖Tn − T‖ ≤ ε.Dies zeigt, dass tatsachlich ‖Tn − T‖ → 0 mit n → ∞ gilt. Beachte, dass danninsbesondere T auch stetig ist, denn fur ε = 1 und genugend große n ist ‖T‖ ≤‖T − Tn‖+ ‖Tn‖ < 1 + ‖Tn‖ <∞.

45

Satz 3.1.6 Es seien X, Y, Z normierte Raume. Ist T ∈ L(X;Y ) und S ∈ L(Y ;Z),so ist ST = S T ∈ L(X;Z) und es gilt ‖ST‖ ≤ ‖S‖‖T‖.

Beweis. Dies folgt aus ‖STx‖Z ≤ ‖S‖‖Tx‖Y ≤ ‖S‖‖T‖‖x‖X fur alle x ∈ X nachLemma 3.1.4(ii).

Bemerkung: Speziell fur X = Y = Z zeigt dieser Satz, das L(X) eine Algebramit submultiplikativer Norm ist. Ist X ein Banachraum, so ist also L(X) eineBanachalgebra.

Der folgende Satz besagt, dass Operatoren eindeutig auf den Abschluss ihresDefinitionsbereichs fortgesetzt werden konnen.

Satz 3.1.7 Ist D ⊂ X ein dichter Unterraum des normierten Raums X, Y einBanachraum und T ∈ L(D;Y ), so gibt es eine eindeutige Fortsetzung zu einemOperator T ∈ L(X;Y ). Dabei ist ‖T‖ = ‖T‖.

Beweis. Die Eindeutigkeit ergibt sich daraus, dass, wenn T eine solche Fortsetzungist, fur jedes x ∈ X eine Folge (xn) aus D gewahlt werden kann mit limxn = xund damit T x = lim T xn = limTxn. Offenbar ist dann auch ‖T‖ = ‖T‖.

Um die Existenz einer solchen Fortsetzung zu zeigen, wahle nun zu x ∈ XElemente xn ∈ D mit xn → x. Dann ist (Txn) eine Cauchy-Folge in Y , so dasses ein T (x) ∈ Y mit Txn → T (x) gibt. Es ist nicht schwer zu sehen, dass T danneine stetige lineare Fortsetzung von T ist. (Ubung!)

Bemerkung: Da jeder normierte Raum Y zu einem Banachraum vervollstandigtwerden kann (vgl. die Bemerkung 2 von Seite 8) und damit insbesondere alsdichter Unterraum eines Banachraums aufgefasst Z werden kann (s. Satz 5.3.2unten), kann jeder Operator T ∈ L(D;Y ) auf einem dichten Unterraum D desnormierten Raums X als Operator T ∈ L(D;Z) aufgefasst werden und gemaßSatz 3.1.7 zu einem Operator T ∈ L(X;Z) fortgesetzt werden.

Beispiele von Operatoren und Funktionalen

Wir betrachten nun eine ganze Reihe von Beispielen fur Operatoren und Funk-tionale.Beispiele:

1. Es seien (X, ‖ · ‖X) (Y, ‖ · ‖Y ) normierte Raume und dimX <∞. Dann istjede lineare Abbildung T : X → Y stetig:

Begrundung: Es sei e1, . . . , en eine Basis vonX. Dann wird fur c > maxi ‖Tei‖Ydurch

n∑j=1

λjej

:= c

∑j=1

|λj|

46

eine (alternative) Norm auf X definiert. Nach Satz 2.1.10 gilt dann∥∥∥T n∑j=1

λjej

∥∥∥Y≤

n∑j=1

|λj|‖Tej‖Y ≤

n∑j=1

λjej

≤ C

∥∥∥ n∑j=1

λjej

∥∥∥X.

(Im Gegensatz dazu gibt es auf jedem unendlichdimensionalen Raum Xnicht stetige lineare Abbildungen ϕ : X → K: Wahle linear unabhangigenormierte e1, e2, . . . und setze Ten = n linear fort.)

2. Es sei (Ω,A, µ) ein Maßraum. Um Pathologien auszuschließen nehmen wiran, dass zu jedem A ∈ A mit µ(A) = ∞ ein B ∈ A mit B ⊂ A und0 < µ(B) < ∞ existiert. Ist 1 ≤ p ≤ ∞ und a ∈ L∞(Ω,A, µ), so ist derMultiplikationsoperator

Ma : Lp(Ω,A, µ)→ Lp(Ω,A, µ), Ma f = af

ein Operator auf Lp(Ω,A, µ). Es gilt ‖Ma‖ = ‖a‖L∞ .

Insbesondere ist fur a = (an) ∈ l∞, der Multiplikationsoperator

Ma : lp → lp, (xn) 7→ (anxn)

ein Operator mit ‖Ta‖ = ‖a‖∞. (Ubung!)

3. Ist k ∈ N, α ein Multiindex mit |α| ≤ k und U ⊂ Rn offen und beschrankt,so ist die partielle Ableitung

∂α : Ck(U ;K)→ Ck−|α|(U ;K)

ein Operator.

4. Ist k ∈ N, α ein Multiindex mit |α| ≤ k, 1 ≤ p ≤ ∞ und U ⊂ Rn offen, soist die schwache partielle Ableitung

∂α : W k,p(U)→ W k−|α|,p(U)

ein Operator.

5. Ist D eine Menge und x0 ∈ D, so ist das Auswertungsfunktional

ϕx0 : B(D;K)→ K, ϕx0f = f(x0)

ein Funktional auf (B(D;K), ‖ · ‖∞) mit ‖ϕx0‖ = 1.

Begrundung: Die Linearitat ist klar und es gilt

|ϕx0f | = |f(x0)| ≤ ‖f‖∞,

also ‖ϕx0‖ ≤ 1. Da andererseits ϕx01 = 1 = ‖1‖∞ ist, gilt sogar ‖ϕx0‖ = 1.

47

6. Nun sei C([a, b]) versehen mit der Integralnorm ‖f‖L1 :=∫ ba|f(t)| dt. Dann

ist ϕx0 nicht stetig: Wahle stuckweise affine “Hutchenfunktionen” fn :[a, b] → [0, 1] mit fn(x0) = 1 und fn(x) = 0 fur |x − x0| ≥ 1

n, so dass

ϕx0fn = 1 fur alle n, aber ‖fn‖L1 → 0 gilt.

7. Die Limesabbildung lim : c→ K, lim x = limn→∞ xn ist ein Funktional aufdem Raum (c, ‖ · ‖∞) der konvergenten Folgen. Die Linearitat ist klar unddie Stetigkeit folgt aus | limx| ≤ ‖x‖∞. Da lim(1, 1, . . .) = 1 = ‖(1, 1, . . .)‖∞gilt, ist ‖ lim ‖ = 1.

8. Ist Ω ein kompakter metrischer Raum und µ ein signiertes oder komplexesMaß auf (Ω,B(Ω)), so ist durch

f 7→∫

Ω

f dµ

ein Funktional auf (C(Ω;K), ‖ · ‖∞) gegeben.

Speziell fur das Diracmaß δx0 , x0 ∈ Ω ist dies gerade das Auswertungsfunk-tional bei x0.

Begrundung: Die Linearitat ist klar. Um die Stetigkeit zu zeigen, bemerkenwir, dass man jedes f ∈ C(Ω;K) durch Funktionen fn, die nur endlich vieleWerte annehmen, approximieren kann, so dass (Re fn)± (Re f)± und(Im fn)± (Im f)± punktweise gilt. Ist nun µ ein Borelmaß auf Ω, so folgt∫

Ω

f dµ = limn→∞

∫Ω

fn dµ

aus dem Satz von der monotonen Konvergenz, indem man µ = (Reµ)+ −(Reµ)− + i

((Imµ)+ − (Imµ)−

)zerlegt. Da fur jedes A ∈ B(Ω) nach Defi-

nition des Variationsmaßes |µ(A)| ≤ |µ|(A) ist, ergibt sich∣∣∣ ∫Ω

f dµ∣∣∣ = lim

n→∞

∣∣∣ ∫Ω

fn dµ∣∣∣ ≤ lim

n→∞

∫Ω

|fn| d|µ| =∫

Ω

|f | d|µ|.

Damit aber folgt ∣∣∣ ∫Ω

f dµ∣∣∣ ≤ ‖µ‖Var‖f‖∞.

9. Die Abbildung f 7→∫ baf(t) dt auf C([a, b]) ist stetig bezuglich ‖ · ‖1 und

(damit erst recht) bezuglich ‖ · ‖∞:∣∣∣ ∫ b

a

f(t) dt∣∣∣ ≤ ∫ b

a

|f(t)| dt = ‖f‖1 ≤ (b− a)‖f‖∞.

48

10. Ist (Ω,A, µ) ein Maßraum, 1 ≤ p, q ≤ ∞ mit 1p

+ 1q

= 1 und g ∈ Lq(Ω,A, µ),so ist

ϕg : Lp(Ω,A, µ)→ K, f 7→∫

Ω

f g dµ

ein Funktional auf Lp(Ω,A, µ). Dies folgt aus der Holderschen Ungleichung.Dabei gilt ‖ϕg‖ = ‖g‖Lq . (Ubung!)

11. Als Spezialfall aus dem vorigen Beispiel (bzw. aus der Holderschen Unglei-chung fur Folgen) ergibt sich, dass fur 1 ≤ p, q ≤ ∞ mit 1

p+ 1

q= 1 und

jedes (yn) ∈ lq die Abbildung

(xn) 7→∞∑n=1

xnyn

ein Funktional auf lp mit Norm ‖y‖q ist.

12. Ist k ∈ C([a, b]2) und

Tkf(s) :=

∫ b

a

k(s, t)f(t) dt

fur f ∈ C([a, b]), so ist Tk ∈ L(C([a, b])). Man nennt Tk einen FredholmschenIntegraloperator mit Kern k.

Ubung: Zeigen Sie das!

Dazu ist zunachst zu bemerken, dass Tkf : [a, b] → K tatsachlich wiederstetig ist, denn fur sn → s folgt Tkf(sn) → Tkf(s) aus dem Satz von dermajorisierten Konvergenz. Die Stetigkeit von Tk folgt aus

‖Tkf‖∞ = sups∈[a,b]

∣∣∣ ∫ b

a

k(s, t)f(t) dt∣∣∣ ≤ sup

s∈[a,b]

∫ b

a

|k(s, t)| dt ‖f‖∞.

Tatsachlich gilt fur die Funktionen fr,ε(t) = k(r,t)ε+|k(r,t)| , r ∈ [a, b], ε > 0,

‖fr,ε‖∞ ≤ 1 und

supr∈[a,b]

supε>0‖Tkfr,ε‖∞ ≥ sup

r∈[a,b]

supε>0|Tkfr,ε(r)|

= supr∈[a,b]

supε>0

∫ b

a

k(r, t)k(r, t)

ε+ |k(r, t)|dt = sup

r∈[a,b]

∫ b

a

|k(r, t)| dt,

was zusammen mit der Abschatzung von oben

‖Tk‖ = sups∈[a,b]

∫ b

a

|k(s, t)| dt

zeigt.

49

Isomorphismen

Wir definieren nun noch, was wir unter einem Isomorphismus von normiertenRaumen verstehen wollen. Es handelt sich naturlich um bijektive Abbildungen,die sowohl die lineare als auch die topologische Struktur bzw. die Norm dieserRaume erhalten.

Definition 3.1.8 Es seien X und Y normierte Raume.

(i) Ein Operator T ∈ L(X;Y ) heißt Isomorphismus, wenn T invertierbar istund auch T−1 stetig ist. Ein Isomorphismus T : X → Y heißt isometrisch,wenn ‖Tx‖ = ‖x‖ fur alle x ∈ X gilt.

(ii) Man sagt, dass X und Y isomorph bzw. isometrisch isomorph sind (schrei-be X ' Y bzw. X ∼= Y ), wenn es einen (isometrischen) Isomorphismuszwischen X und Y gibt.

Lemma 3.1.9 Eine lineare Abbildung T : X → Y ist genau dann ein Isomor-phismus, wenn T surjektiv ist und es Konstanten c, C > 0 derart gibt, dass

c‖x‖ ≤ ‖Tx‖ ≤ C‖x‖

fur alle x ∈ X erfullt ist.

Beweis. Klar.

Beispiele:

1. Trivialerweise ist die Identitat Id : X → X, x 7→ x auf einem normiertenRaum ein isometrischer Isomorphismus.

2. Ist Φ : X → Y ein Vektorraumisomorphismus, ‖ · ‖X eine Norm auf Xund setzt man ‖ · ‖Y = ‖Φ−1 · ‖X (wie im Beweis von Satz 2.1.10), so istΦ : X → Y ein isometrischer Isomorphismus.

3. Die Abbildung J : X → Y aus der Bemerkung 2 von Seite 8, die einennormierten Raum isometrisch in einen Banachraum einbettet ist, nach Ein-schrankung des Wertebereichs auf J(X) ein isometrischer Isomorphismus.Da J(X) ein Banachraum ist, konnen wir somit festhalten: Jeder normierteRaum ist isometrisch isomorph zu einem dichten Unterraum eines Banach-raums. (Wir werden diese Aussage als Korollar 5.3.2 spater noch wesentlicheleganter zeigen.)

4. Da wie oben gesehen lineare Abbildungen zwischen endlich-dimensionalenRaumen automatisch stetig sind, sind je zwei endlich-dimensionale Raumeder gleichen Dimension isomorph.

50

5. c und c0 (beide wie ublich versehen mit ‖ · ‖∞) sind isomorph. Ein Isomor-phismus ist z.B. gegeben durch T : c→ c0,

(x1, x2, . . .) 7→ (limxn, x1 − limxn, x2 − limxn, . . .).

Beweis. Es ist klar, dass T linear und bijektiv ist mit

T−1((x1, x2, . . .)

)= (x2 + x1, x3 + x1, . . .).

Dabei ist

‖Tx‖ = sup| limnxn|, |x1 − limxn|, |x2 − limxn|, . . .

≤ | limxn|+ sup|xn| : n ∈ N ≤ 2‖(xn)‖∞

und

‖T−1x‖ = sup|x2 + x1|, |x3 + x1|, . . . ≤ |x1|+ sup|xn| : n ∈ N≤ 2‖(xn)‖∞,

also ‖T‖, ‖T−1‖ ≤ 2.

Man kann zeigen, dass c und c0 nicht isometrisch isomorph sind.(Freiwillige Ubung! Tipps: Man nehme an, dass T : c0 → c ein isometrischerIsomorphismus ist mit Tx = (1, 1, . . .). Dann lassen sich x1, x2 ∈ c0 findenmit x1 6= x2, ‖x1‖∞ = ‖x2‖∞ = 1 und x = x1+x2

2. Man zeige dann, dass

unmoglich auch ‖Tx1‖∞ = ‖Tx1‖∞ = 1 gelten kann.)

6. Sind X, Y normierte Raume und T : X → Y , so dass T (BX1 ) = BY

1 gilt, sosind Y und X/ kerT isometrisch isomorph. (Eine solche Abbildung T nenntman Quotientenabbildung. Insbesondere ist fur jeden abgeschlossenen Un-terraum U ⊂ X die Abbildung x 7→ [x] = x+U eine Quotientenabbildung.)

Beweis. Setze U = kerT , so dass X/U gemaß Satz 2.1.17 ein normierterRaum ist, und

T : X/U → Y, T [x] := Tx.

T ist wohldefiniert und linear. Da man zu jedem z ∈ X/U mit ‖z‖ < 1 einx ∈ X mit z = [x] und ‖x‖ < 1 wahlen kann, ergibt sich fur solche z nachVoraussetzung

‖T z‖ = ‖T [x]‖ = ‖Tx‖ < 1.

Daher ist T stetig und (durch Grenzubergang ‖z‖ → 1) ‖T z‖ ≤ 1 fur‖z‖ = 1. Des Weiteren ist T nach Konstruktion offenbar injektiv und nachVoraussetzung auch surjektiv, da es zu jedem y ∈ BY

1 ein x ∈ BX1 ) gibt mit

T [x] = Tx = y.

51

Es sei nun y ∈ Y mit ‖y‖ < 1. Nach Voraussetzung gibt es ein x ∈ BX1 mit

Tx = y und damit T [x] = y. Daher ist

‖T−1y‖ = ‖[x]‖ ≤ ‖x‖ < 1.

Auch T−1 ist also stetig und wieder durch Grenzubergang ‖y‖ → 1 ergibtsich ‖T−1y‖ ≤ 1 fur ‖y‖ = 1. Zusammengefasst gilt:

‖T z‖ ≤ ‖z‖ ∀ z ∈ X/U und ‖T−1y‖ ≤ ‖y‖ ∀ y ∈ Y

und daher auch

‖z‖ = ‖T−1T z‖T z‖ ≤ ‖T z‖ ∀ z ∈ X/U.

T ist also ein isometrischer Isomorphismus.

Als Anwendung betrachten wir das Beispiel C([a, b];K) mit U = f ∈B(D;K) : f |[a,c] ≡ 0 fur ein c ∈ [a, b]. Es sei T : C([a, b];K)→ C([a, c];K)definiert durch f 7→ f |[a,c]. Dann ist T eine Quotientenabbildung mit kerT =U und daher

C([a, c];K)/U ∼= C([a, c];K).

Speziell fur c = a ist C(a;K) ∼= K, so dass wir, wie schon im Beispiel vonSeite 15, C([a, c];K)/U ∼= K erhalten.

Ein relativ elementares doch sehr nutzliches Invertierbarkeitskriterium istdurch den folgenden Satz gegeben:

Satz 3.1.10 Es sei X ein Banachraum und T ∈ L(X) mit ‖ Id−T‖ < 1. Dannist T ein Isomorphismus mit

T−1 =∞∑k=0

(Id−T )k.

Insbesondere besagt dieser Satz, dass die Reihe∑∞

k=0(Id−T )k in L(X) kon-vergiert. Man nennt sie die Neumannsche Reihe.

Beweis. Wegen ‖(Id−T )k‖ ≤ ‖ Id−T‖k konvergiert diese Reihe absolut (geome-trische Reihe!). Da L(X) vollstandig ist, konvergiert sie dann nach Satz 2.1.7auch in L(X). Fur S :=

∑∞k=0(Id−T )k gilt dann in der Tat

S = Id +∞∑k=1

(Id−T )k = Id +(Id−T )S = Id +S(Id−T )

und somit ST = TS = Id.

Korollar 3.1.11 Die Menge der Isomorphismen auf einem Banachraum X istoffen in L(X).

52

Beweis. Ist T ∈ L(X) ein Isomorphismus und ‖S‖ < ‖T−1‖−1, so ist ‖T−1S‖ ≤‖T−1‖‖S‖ < 1 und daher Id +T−1S ein Isomorphismus. Dann aber ist auch

T (Id +T−1S) = T + S

ein Isomorphismus.

3.2 Vier Hauptsatze fur Operatoren auf Banach-

raumen

Wir kommen nun zu vier wichtigen Satzen fur Operatoren auf Banachraumen.Das sind:

1. Das Prinzip der gleichmaßigen Beschranktheit (Satz von Banach-Steinhaus),

2. der Satz von der offenen Abbildung,

3. der Satz von der inversen Abbildung und

4. der Satz vom abgeschlossenen Graphen.

Sie alle leiten sich aus einem ebenso wichtigen Satz uber vollstandige metrischeRaume ab: dem Bairsche Kategoriensatz.

Der Bairsche Kategoriensatz

Wir beginnen mit dem grundlegenden Satz uber vollstandige metrische Raume.

Satz 3.2.1 (Satz von Baire) Es sei (Un) eine Folge von offenen dichten Teil-mengen des vollstandigen metrischen Raums (M,d). Dann ist auch

⋂∞n=1 Un dicht

in M .

Beweis. Fur beliebiges x ∈ M und r > 0 betrachten wir die Kugel Br(x). DaU1 dicht ist, gibt es ein x1 ∈ U1 ∩ Br/2(x). Weil U1 auch offen ist, gibt es sogareine Kugel Br1(x1) ⊂ Br(x) ∩ U1 mit geeignetem 0 < r1 <

r2. Betrachten wir

nun die Kugel Br1(x1), so erhalten wir aus der Offenheit und Dichtheit von U2

ein x2 ∈ Br2(x2) ⊂ Br1(x1) ∩ U2 mit 0 < r2 <r12

. So fortfahrend ergeben sichinduktiv Punkte und Radien

xn+1 ∈ Brn+1(xn+1) ⊂ Brn(xn) ∩ Un+1, 0 < rn+1 <rn2.

Dann aber ist rn ≤ 2−nr fur alle n und die Folge (xn) wegen ‖xn+1 − xn‖ ≤ rneine Cauchy-Folge, etwa mit xn → x. Dabei ist wegen Brn+1(xn+1) ⊂ Brn(xn) furalle n der Limes x ∈ Brn(xn) ⊂ Br(x) ∩ Un fur alle n. Insbesondere ist

Br(x) ∩∞⋂n=1

Un 6= ∅,

53

was, da r beliebig war, zeigt, dass x ein Haufungspunkt von⋂∞n=1 Un ist.

Die offenen dichten Teilmengen sind also in einem gewissen (topologischenoder ‘Baireschen’) Sinne “große Mengen”: Selbst wenn man abzahlbar viele vonihnen schneidet, liegt das Ergebnis immer noch dicht. Die Teilmengen ihrer Kom-plemente sind daher als besonders “kleine Mengen” anzusehen. Es sind solcheMengen A, deren Komplement des Abschlusses (A)c dicht liegt, was zu (A) = ∅aquivalent ist.

Definition 3.2.2 Es sei A eine Teilmenge eines metrischen Raums.

(i) A heißt nirgends dicht, wenn ihr Abschluss A keine inneren Punkte enthalt:

(A) = ∅.

(ii) Ist A abzahlbare Vereinigung nirgends dichter Mengen, so nennt man Aeine Menge von 1. Kategorie.

(iii) Ist A nicht von 1. Kategorie, so heißt A von 2. Kategorie.

Kurz besagt der Satz von Baire also, dass in einem vollstandigen metrischenRaum abzahlbare Schnitte offener dichter Mengen dicht sind oder – durch Uber-gang zu Komplementen – Mengen 1. Kategorie ein dichtes Komplement besitzen.Insbesondere ist demnach ein vollstandiger metrischer Raum von 2. Kategorie insich.Beispiele:

1. Q ist von 1. Kategorie in R, denn jede einpunktige Menge ist nirgends dichtund Q lasst sich schreiben als Q =

⋃q∈Qq.

2. Die Bezeichnungen “groß” und “klein” fur Mengen im Sinne von Bairekonnen mit maßtheoretischen Konzepten von “großen” und “kleinen” Men-gen kollidieren: Z.B. gibt es auf dem metrischen Raum [0, 1] mit der ublichenMetrik zu jedem ε > 0 eine offene dichte Teilmenge Aε vom Lebesgue-Maßhochstens ε: Ist z.B. Q ∩ [0, 1] = q1, q2, . . ., dann ist

Aε :=⋃k∈N

Bε/2k+1(qk)

eine offene dichte Menge mit Lebesgue-Maß |Aε| ≤∑

k∈N |Bε/2k+1(qk)| ≤∑∞k=1 ε2

−k = ε. Acε ist demnach eine nirgends dichte Teilmenge mit Maß|Acε| ≥ 1− ε. Setzt man

A =⋂n∈N

A1/n,

so ist A eine Menge 2. Kategorie vom Maß 0 und Ac eine Menge 1. Kategorievom Maß 1.

54

3. Ist X ein normierter Raum und U ( X ein echter Unterraum, so enthalt Ukeine inneren Punkte. Denn ware etwa Bε(x) ⊂ U fur ein x ∈ U und ein ε >0, so ware auch X = K(Bε(x)− x) ⊂ U . Insbesondere sind abgeschlosseneechte Unterraume nirgends dicht.

Hieraus folgt auch, dass jede Vektorraumbasis eines unendlich-dimensionalenBanachraums X uberabzahlbar ist. (Zur Unterscheidung von anderen nochzu besprechenden Basen, nennt man eine Vektorraumbasis wie in der li-nearen Algebra definiert auch Hamelbasis.) Ware namlich (e1, e2, . . .) eineHamelbasis von X, so ware X =

⋃n∈N line1, . . . , en (beachte Korollar

2.1.11!) ja von 1. Kategorie.

4. Es sei 1 ≤ p < q ≤ ∞. Dann ist lp von 1. Kategorie in lq.(Ubung! Tipp: Betrachte die Mengen Bn = x ∈ lq : ‖x‖p ≤ n, n ∈ N.)

5. Es sei 1 ≤ p < q ≤ ∞. Dann ist Lq((0, 1)) von 1. Kategorie in Lp((0, 1)).(Ubung!)

Als Anwendung des Bairschen Kategoriensatzes lasst sich zeigen, dass es ste-tige, jedoch nirgends differenzierbare Funktionen auf [0, 1] gibt. Mehr noch:

Satz 3.2.3 Die Menge der stetigen nirgends differenzierbaren Funktionen auf[0, 1] ist von 2. Kategorie in C([0, 1]).

Beweis. Setze

M =f ∈ C([0, 1]) : ∃x0 ∈ [0, 1], so dass f ′(x0) existiert

und

Mk =f ∈ C([0, 1]) : ∃x0 ∈ [0, 1] ∀x ∈ [0, 1] : |f(x)− f(x0)| ≤ k|x− x0|

.

Wir uberlegen uns zunachst, dass M ⊂⋃k∈NMk gilt. Ist f ∈M differenzier-

bar bei x0, so gibt es ein δ > 0, so dass |f(x)− f(x0)| ≤ (|f ′(x0)|+ 1)|x− x0| furalle x ∈ [0, 1] mit |x−x0| < δ gilt. Fur |x−x0| ≥ δ ist außerdem |f(x)−f(x0)| ≤2‖f‖∞ ≤ 2‖f‖∞δ−1|x−x0|. Dies zeigt, dass f in Mk liegt, wenn nur k hinreichendgroß ist.

Es bleibt zu zeigen, dass jedes Mk nirgends dicht ist. Tatsachlich ist Mk ab-geschlossen, denn fur f1, f2, . . . ∈ Mk mit |fi(x) − fi(x(i)

0 )| ≤ k|x − x(i)0 | fur alle

x ∈ [0, 1] und fm → f erhalten wir nach Ubergang zu einer Teilfolge (fim)

x(im)0 → x0 ∈ [0, 1] und

|f(x)− f(x0)| = limm→∞

|fim(x)− fim(x(im)0 )| ≤ k lim

m→∞|x− x(im)

0 | = k|x− x0|

fur jedes x ∈ [0, 1]. (Beachte, dass fim gleichmaßig gegen f konvergiert und fgleichmaßig stetig ist.) Andererseits hat Mk leeres Inneres. Um dies zu zeigen,

55

betrachten wir zu ε > 0 und n ∈ N die ‘Sagezahnfunktion’ gε,n ∈ C([0, 1]), diesich durch affine Interpolation der Werte

gε,n

( 2l

2n

)= 0, l = 0, . . . , n, und gε,n

(2l − 1

2n

)=ε

2, l = 1, . . . , n,

ergibt. Offensichtlich ist ‖g‖∞ = ε2. Sind nun f ∈ Mk, ε > 0 und x0 ∈ [0, 1]

gegeben, so gilt |f(x) − f(x′)| ≤ ε8

fur |x − x′| ≤ 14n

, wenn n groß genug ist,aufgrund der gleichmaßigen Stetigkeit von f . Wir wahlen nun x1 ∈ x0 + 1

4n, x0−

14n, so dass gε,n linear zwischen x1 und x0 verlauft. Damit folgt dann

|f(x1) + gε,n(x1)− f(x0)− gε,n(x0)| ≥ |gε,n(x1)− gε,n(x0)| − |f(x1)− f(x0)|

≥ nε|x1 − x0| −ε

8≥ ε

4− ε

8

≥ ε

2n|x1 − x0| > k|x1 − x0|

fur hinreichend große n und somit f + gε,n /∈ Mk. Dies zeigt, dass Bε(f) 6⊂ Mk

gilt und, da ε > 0 beliebig war, f folglich kein innerer Punkt von Mk ist.

Das Prinzip der gleichmaßigen Beschranktheit

Das erste Hauptergebnis uber Operatoren auf Banachraumen, das wir aus demBaireschen Kategoriensatz erhalten, ist das Prinzip der gleichmaßigen Beschrankt-heit, das auch als Satz von Banach-Steinhaus bekannt ist.

Satz 3.2.4 (Satz von Banach-Steinhaus) Es seien X ein Banachraum, Yein normierter Raum und (Ti)i∈I eine Familie von Operatoren Ti ∈ L(X;Y ),so dass fur jedes x ∈ X die Menge der Werte Tix : i ∈ I in Y beschrankt ist,d.h.

supi∈I‖Tix‖ <∞.

Dann ist sogar die Menge der Operatoren Ti : i ∈ I in L(X;Y ) beschrankt,d.h.

supi∈I‖Ti‖ <∞.

Beweis. Fur n ∈ N ist

An :=x ∈ X : sup

i∈I‖Tix‖ ≤ n

=⋂i∈I

T−1i (Bn)

abgeschlossen. Nach Voraussetzung ist⋃n∈NAn = X, so dass, da X vollstandig

ist, nach dem Satz von Baire ein An einen inneren Punkt x besitzen muss, etwaBε(x) ⊂ An, ε > 0.

56

Ist nun z ∈ Bε(0), so folgt

‖Tiz‖ =1

2‖Ti(x+ z)− Ti(x− z)‖ ≤ 1

2

(‖Ti(x+ z)‖+ ‖Ti(x− z)‖

)≤ n,

was Bε(0) ⊂ An beweist. Es folgt

‖Ti‖ = sup‖x‖<1

‖Tix‖ = ε−1 supx∈Bε(0)

‖Tix‖ ≤ ε−1 supx∈An‖Tix‖ ≤

n

ε

fur alle i ∈ I.

Im nachsten Kapitel werden wir einige wichtige Konsequenzen aus dem Satzvon Banach-Steinhaus ableiten. Fur den Moment beschranken wir uns auf dasfolgende Korollar, das zeigt, dass der punktweise Limes von Operatoren wiederein Operator ist.

Korollar 3.2.5 Es seien X ein Banachraum, Y ein normierter Raum und (Tn)n∈Neine punktweise konvergente Folge von Operatoren Tn ∈ L(X;Y ). Setze T (x) :=limn→∞ Tnx. Dann ist auch T ∈ L(X;Y ).

Beweis. Es ist einfach zu sehen, dass T linear ist. Nach dem Satz von Banach-Steinhaus ist außerdem C = supn∈N ‖Tn‖ <∞ und daher

‖Tx‖ = limn→∞

‖Tnx‖ ≤ C‖x‖ ∀x ∈ X.

Offene Abbildungen und stetige Inverse

Der nachste Hauptsatz uber Operatoren auf Banachraumen handelt von offenenAbbildungen.

Definition 3.2.6 Eine Abbildung zwischen metrischen Raumen heißt offen, wennsie offene Mengen auf offene Mengen abbildet.

Im Gegensatz zur Stetigkeit, wo ja gefordert wird, dass das Urbild offenerMengen offen ist, wird hier verlangt, dass das Bild offener Mengen wieder offenist. Dies fuhrt direkt zu folgender

Beobachtung: Ist f eine offene bijektive Abbildung zwischen metrischen Raum-en, so ist f−1 stetig.

Diese Begriffsbildung ist also insbesondere dann von Nutzen, wenn man etwaeine Gleichung f(x) = y durch y = f−1(x) nach y auflosen mochte.

Satz 3.2.7 (Satz von der offenen Abbildung) Es seien X, Y Banachraumeund T ∈ L(X;Y ) surjektiv. Dann ist T offen.

57

Bevor wir diesen Satz beweisen, halten wir als direkte Konsequenz den nachstenHauptsatz fest, der besagt, dass die Umkehrabbildung einer stetigen linearen Ab-bildung zwischen Banachraumen, wenn sie existiert, automatisch stetig ist.

Korollar 3.2.8 (Satz von der inversen Abbildung) Es seien X, Y Banach-raume und T ∈ L(X;Y ) bijektiv. Dann ist T ein Isomorphismus.

Beweis. Nach dem Satz von der offenen Abbildung ist T offen und damit auchT−1 stetig.

Etwas allgemeiner lasst sich dieser Satz auch fur nicht unbedingt surjektiveAbbildungen wie folgt formulieren:

Korollar 3.2.9 Es seien X, Y Banachraume und T ∈ L(X;Y ) injektiv. Genaudann ist T−1 : T (X)→ X stetig, wenn T (X) in Y abgeschlossen ist.

Beweis. Ist T (X) abgeschlossen, so ist T (X) selbst ein Banachraum, so dassT−1 : T (X)→ X nach Korollar 3.2.8 stetig ist.

Ist umgekehrt T−1 : T (X)→ X als stetig vorausgesetzt, so ist T ein Isomor-phismus von X nach T (X) und damit T (X) wie X vollstandig.

Als weiteres Korollar erhalten wir eine Bedingung fur aquivalente Normen aufBanachraumen.

Korollar 3.2.10 Es seien X ein Vektorraum und ‖ · ‖, ~ ·~ Normen auf X, diebeide X zu einem Banachraum machen und der Abschatzung

~x~ ≤ C‖x‖ ∀x ∈ X

fur eine Konstante C > 0 genugen. Dann sind ‖ · ‖ und ~ · ~ aquivalent.

Beweis. Die identische Abbildung T : (X, ‖ · ‖) → (X,~ · ~), Tx = x ist nachVoraussetzung stetig und offensichtlich bijektiv. Nach Korollar 3.2.8 ist dann auchT−1 : (X,~ · ~) → (X, ‖ · ‖), T−1x = x stetig ist, weshalb auch eine KonstanteC ′ > 0 existiert mit

‖x‖ ≤ C ′~x~ ∀x ∈ X.

Bevor wir den Satz 3.2.7 beweisen, geben wir zunachst aquivalente Charakte-risierungen der Offenheit fur lineare Abbildungen an.

Lemma 3.2.11 Es seien X, Y normierte Raume und T : X → Y linear. Dannsind aquivalent:

(i) T ist offen.

(ii) Fur jedes r > 0 ist T (Br) eine Null-Umgebung, d.h. es gibt ein ε > 0 mitBε ⊂ T (Br).

58

(iii) Fur ein s > 0 ist T (Bs) eine Null-Umgebung, d.h. es gibt ein ε > 0 mitBε ⊂ T (Bs).

Beweis. (ii) ⇐⇒ (iii): Das ist klar wegen T (Br) = rsT (Bs) fur alle r, s > 0.

(i) =⇒ (ii): Das folgt sofort aus der Offenheit von T (Br) und 0 = T (0) ∈T (Br).

(ii) =⇒ (i): Ist U ⊂ X offen und y ∈ T (U), etwa Tx = y mit x ∈ U , so gibtes ein r > 0 mit Br(x) ⊂ U . Dann aber ist fur ein ε > 0

T (U) ⊃ T (Br(x)) = T (x+Br(0)) = y + T (Br) ⊃ y +Bε = Bε(y).

Dies zeigt, dass T (U) offen ist.

Wir benotigen noch ein recht technisches Hilfsresultat.

Lemma 3.2.12 Es seien X ein Banachraum, Y ein normierter Raum und T ∈L(X;Y ). Dann gilt fur alle r, ε > 0

Bε ⊂ T (Br) =⇒ Bε ⊂ T (Br).

Beweis. Es sei y ∈ BYε , 0 < η < 1. Dann gibt es ein y1 ∈ T (Br) mit ‖y−y1‖ < ηε.

Das gleiche Argument liefert zu y−y1η∈ BY

ε ein y2 ∈ T (Bηr) mit ‖y−y1η− y2

η‖ < ηε,

also‖y − y1 − y2‖ < η2ε.

Zu y−y1−y2η2

∈ BYε findet sich entsprechend ein y3 ∈ T (Bη2r) mit ‖y−y1−y2

η2− y3

η2‖ <

ηε, also‖y − y1 − y2 − y3‖ < η3ε.

So fortfahrend ergibt sich induktiv eine Folge (yn) mit yn ∈ T (Bηn−1r) und∥∥∥y − n∑k=1

yk

∥∥∥ < ηnε.

Wahlt man xn ∈ Bηn−1r mit Txn = yn, so gilt∑∞

n=1 ‖xn‖ ≤∑∞

n=1 ηn−1r =

r1−η <∞, weshalb x :=

∑∞n=1 xn nach Satz 2.1.7 konvergiert mit ‖x‖ ≤ r

1−η . Aus

der Stetigkeit von T folgt schließlich y = Tx ∈ T (B r1−η

). Damit ist Bε ⊂ T (B r1−η

)gezeigt.

Ist nun 0 < ε′ < ε, so lassen sich 0 < η, ρ < 1 derart finden, dass ε′ = ρ(1−η)εist. Multipliziert man beide Seiten der eben gezeigten Inklusion mit ρ(1− η), soergibt sich dann Bε′ ⊂ T (Bρr) ⊂ T (Br). Da ε′ < ε beliebig war, folgt dann abersogar Bε ⊂ T (Br).

Beweis von Satz 3.2.7. Da T surjektiv ist, gilt⋃n∈N T (Bn) = Y . Y aber ist

vollstandig, nach dem Satz von Baire also nicht von 1. Kategorie, so dass es einn ∈ N geben muss, fur welches T (Bn) nicht nirgends dicht ist. T (Bn) besitzt alsoeinen inneren Punkt y und wir konnen ε > 0 wahlen mit Bε(y) ⊂ T (Bn).

59

Ist nun z ∈ Bε(0), so gibt es demnach zu jedem k ∈ N Punkte x+k , x

−k ∈ Bn

mit

‖Tx+k − (y + z)‖ < 1

kund ‖Tx−k − (y − z)‖ < 1

k

und somit fur xk =x+k −x

−k

2nach der Dreiecksungleichung

‖Txk − z‖ =∥∥∥Tx+

k − (y + z)

2− Tx−k − (y − z)

2

∥∥∥ < 1

2k+

1

2k=

1

k.

Beachtet man nun noch, dass ‖xk‖ ≤‖x+k ‖+‖x

+k ‖

2< n ist, so zeigt dies z ∈ T (Bn).

Damit ist Bε ⊂ T (Bn) bewiesen. Nach Lemma 3.2.12 ist dann aber Bε ⊂ T (Bn),woraus mit Hilfe von Lemma 3.2.11 die Behauptung folgt.

Bemerkung: Die Voraussetzung, dass X und Y Banachraume sind, ist wesent-lich. Die Vollstandigkeit von Y wird bei der Anwendung des Satzes von Bairebenutzt und der Beweis von Lemma 3.2.12 benotigt die Vollstandigkeit von X.

Der Satz vom abgeschlossenen Graphen

Der in diesem Abschnitt zu besprechende Satz vom abgeschlossenen Graphen istein weiteres Korollar aus dem Satz von der offenen Abbildung.

Wir erinnern zunachst an die Definition des Graphs einer Abbildung: Ist f :X → Y eine Abbildung zwischen Mengen X und Y , so ist der Graph von f dieTeilmenge

graph f := (x, f(x)) : x ∈ X ⊂ X × Ydes Produktes X × Y .

Beobachtung: Sind X und Y metrische Raume und f stetig, so ist graph fautomatisch abgeschlossen (bzgl. der Produktmetrik). Die Abgeschlossenheit vongraph f , also dass

(xn, f(xn))→ (x, y) in X × Y =⇒ (x, y) ∈ graph f

gilt, heißt ja gerade, dass die Implikation(xn → x in X und f(xn)→ y in Y

)=⇒ f(x) = y

erfullt ist. Dies ist eine wesentlich schwachere Eigenschaft als die Stetigkeit, daman hier die Konvergenz der Bildfolge (f(xn)) schon voraussetzen darf und nurnoch zeigen muss, dass der Limes ‘der richtige’ ist. Fur stetige f ist aber schon

xn → x in X =⇒(f(xn)→ y in Y und f(x) = y

).

Die Umkehrung gilt i.A. nicht, wie das Beispiel f : R→ R,

f(x) =

1x, falls x 6= 0,

0, falls x = 0,

60

zeigt.

Bemerkenswerter Weise gilt Umkehrung jedoch fur lineare Abbildungen zwi-schen Banachraumen.

Satz 3.2.13 (Satz vom abgeschlossenen Graphen) Es seien X, Y Banach-raume und T : X → Y eine lineare Abbildung. Dann ist T genau dann stetig,wenn graphT abgeschlossen ist.

Beweis. Durch~x~ := ‖x‖+ ‖Tx‖ ∀x ∈ X

wird eine Norm auf X definiert (die sogenannte Graphennorm), die T : X → Yzu einer (bzgl. ~ · ~) stetigen Abbildung macht. (Beachte ‖Tx‖ ≤ ~x~ fur allex ∈ X.) Tatsachlich ist (X,~ · ~) sogar ein Banachraum. Ist namlich (xn) eineCauchy-Folge bzgl. ~ · ~, so sind (xn) und (Txn) Cauchy-Folgen in X bzw. Y .Deren Vollstandigkeit liefert dann x ∈ X und y ∈ Y mit xn → x und Txn → y.Aus der Abgeschlossenheit von graphT folgt Tx = y, also ~xn − x~→ 0.

Da nun auch (X, ‖ · ‖) ein Banachraum ist, wobei offenbar ‖ · ‖ ≤ ~ · ~ gilt,folgt aus Korollar 3.2.10, dass ‖ · ‖ und ~ · ~ aquivalent sind, so dass T auchbezuglich ‖ · ‖ stetig ist.

3.3 Projektionen

Als eine weitere Anwendung des Satzes von der offenen Abbildung diskutieren wirProjektionen auf Banachraumen und damit die Moglichkeit, einen Banachraumals direkte Summe in zwei Unterraume zu zerlegen.

Definition 3.3.1 Ist X ein Vektorraum, so nennt man eine Abbildung P : X →X mit P 2 = P eine Projektion.

Ist P : X → X eine lineare Projektion, so ist X als Vektorraum isomorph zurdirekten Summe kerP ⊕ P (X), denn jedes x ∈ X kann als

x = (Id−P )x+ Px ∈ kerP + P (X)

geschrieben werden und x ∈ kerP ∩ P (X), etwa x = Py impliziert 0 = Px =P 2y = Py = x. Umgekehrt lasst sich zu jedem Unterraum U von X mit Hilfe desBasiserganzungssatzes ein Komplementarraum V mit U+V = X und U∩V = 0finden und durch

Px = u, wenn x = u+ v mit u ∈ U und v ∈ V,

eine Projektion mit kerP = V und P (X) = U definieren. Die Abbildungen V →X/U , v 7→ v+U und U → X/V , u 7→ u+V sind dann Vektorraumisomorphismen.

61

Beachte noch, dass mit P auch Id−P eine Projektion ist und dass beimUbergang von P zu Id−P gerade die Rollen von U und V vertauscht werden.

In Banachraumen sind wir nun naturlich an stetigen linearen Projektionenund Zerlegungen von X in direkte Summen U ⊕ V interessiert, so dass X alsnormierter Raum zu U ⊕ V (vgl. Satz 2.1.18) isomorph ist.

Satz 3.3.2 Es sei X ein Banachraum.

(i) Ist P eine stetige lineare Projektion auf X, so sind kerP und P (X) abge-schlossen und es gilt

X ' kerP ⊕ P (X).

(ii) Es sei U ein abgeschlossener Unterraum von X, der einen abgeschlossenenKomplementarraum V besitzt. Dann gilt

X ' U ⊕ V

und es gibt eine stetige lineare Projektion P auf X mit P (X) = U undkerP = V . Es gilt dann

U ' X/V und V ' X/U.

Bemerkungen:

1. Fur (i) genugt es vorauszusetzen, dass X ein normierter Raum ist.

2. kerP, P (X), U, V sind Unterraume von X. Man schreibt daher auch einfachX = kerP ⊕ P (X) (topologisch) in (i) bzw. X = U ⊕ V (topologisch) in(ii), wobei diese Summen als direkte innere Vektorraumsummen aufgefasstwerden und der Zusatz “topologisch” die Isomorphie zur direkten außerenSumme ausdruckt.

Beweis. (i) Da P stetig ist, sind kerP = P−1(0) und P (X) = ker(Id−P ) =(Id−P )−1(0) abgeschlossen. Wie oben schon bemerkt, sind X und kerP ⊕P (X) = (Id−P )(X)⊕ P (X) als Vektorraume isomorph. Um die Isomorphie alsnormierte Raume nachzuweisen, bleibt zu zeigen, dass

xn → x in X ⇐⇒ (Id−P )xn → (Id−P )x und Pxn → Px

gilt. Das aber folgt direkt aus der Stetigkeit von P .(ii) U und V sind als abgeschlossene Unterraume selbst Banachraume und

damit U ⊕ V nach Satz 2.1.18 auch. Die Abbildung U ⊕ V → X, (u, v) 7→ u+ vist stetig wegen ‖u + v‖ ≤ ‖u‖ + ‖v‖ = ‖(u, v)‖ und offenbar bijektiv, nachKorollar 3.2.8 also ein Isomorphismus.

62

Insbesondere folgt damit, dass es eine Konstante C > 0 gibt, so dass ‖u‖ +‖v‖ = ‖(u, v)‖ ≤ C‖u + v‖ fur u ∈ U , v ∈ V gilt. Das aber zeigt, dass dieProjektion

Px = u, wenn x = u+ v mit u ∈ U und v ∈ V,

stetig ist. Schließlich folgen U ' X/V und V ' X/U wieder mit Korollar 3.2.8aus der Bijektivitat und Stetigkeit der Abbildungen V → X/U , v 7→ v + U undU → X/V , u 7→ u+ V

Bemerkung: Ist U ein abgeschlossener Unterraum eines Banachraums, der einenabgeschlossenen Komplementarraum besitzt (oder – nach obigem Satz aquivalentdazu – eine stetige lineare Projektion von X auf U zulasst), so heißt U komple-mentiert.

Achtung! Nicht jeder abgeschlossene Unterraum eines Banachraums ist kom-plementiert. Z.B. ist c0 in l∞ nicht komplementiert. (Ein Beweis hierfur findetsich in [We].)

63

Kapitel 4

Hilbertraume

In diesem Kapitel untersuchen wir normierte Vektorraume, die eine zusatzlicheStruktur besitzen: ein Skalarprodukt. Durch so ein Skalarprodukt wird eine Norminduziert, so dass es sich tatsachlich um spezielle normierte Raume handelt. Wennein solcher Raum ein Banachraum, also auch noch vollstandig ist, so nennt manihn einen Hilbertraum. Die Hilbertraume bilden eine außerst wichtige Klasse vonRaumen in der gesamten Analysis und mathematischen Physik. Sie sind nichtnur deshalb so wichtig, weil sie in den Anwendungen etwa auf die Theorie derpartiellen Differentialgleichungen, der Numerik oder der Quantenmechanik eineso prominente Rolle spielen, sondern auch weil sie auch vom funktionalanaly-tischen Standpunkt besonders gutartig sind. Viele ‘unschone’ Effekte, wie etwadie Existenz nicht komplementierter Unterraume, konnen in Hilbertraumen garnicht auftreten. Tatsachlich lassen sich die Hilbertraume mit Hilfe der noch zudiskutierenden Orthonormalbasen vollstandig klassifizieren.

4.1 Prahilbertraume

Definition 4.1.1 Es sei X ein K-Vektorraum. Eine Abbildung 〈·, ·〉 : X×X → Kheißt Skalarprodukt (oder auch inneres Produkt), wenn gilt:

(i) Bilinearitat (falls K = R) bzw. Sesquilinearitat (falls K = C): Fur x, x1, x2,y, y1, y2 ∈ X ist

〈λx1+x2, y〉 = λ〈x1, y〉+〈x2, y〉 und 〈x, λy1+y2〉 = λ〈x, y1〉+〈x, y2〉.

(ii) Symmetrie: Fur x, y ∈ X ist

〈x, y〉 = 〈y, x〉.

(ii) Positive Definitheit: Fur x ∈ X gilt

〈x, x〉 ≥ 0 und 〈x, x〉 = 0 =⇒ x = 0.

Ist 〈·, ·〉 ein Skalarprodukt auf X, so nennt man (X, 〈·, ·〉) einen Prahilbertraum.

64

Beispiele:

1. Der Kn mit dem euklidischen Skalarprodukt 〈x, y〉 = x1y1 + . . . + xnyn istein Prahilbertraum.

2. Jeder Unterraum eines Prahilbertraums ist wieder ein Prahilbertraum (mitdem eingeschrankten Skalarprodukt).

3. d und l2 sind Prahilbertraume mit dem Skalarprodukt 〈x, y〉 =∑∞

n=1 xnyn.(Beachte, dass diese Summe nach der Holderschen Ungleichung wegen∑∞

n=1 |xnyn| ≤ ‖x‖2‖y‖2 (sogar absolut) konvergiert.)

4. Ist (Ω,A, µ) ein Maßraum, so ist L2(Ω,A, µ) ein Prahilbertraum, wobei dasSkalarprodukt durch

〈f, g〉 :=

∫Ω

f g dµ.

gegeben ist.

5. Ist U ⊂ Rn offen, so sind die Sobolev-Raume Hk(U) = W k,2(U) (vgl.Definition 2.6.6) Hilbertraume mit dem Skalarprodukt

〈u, v〉 =∑|α|≤k

∫U

∂αu ∂αv dx.

6. Ist I eine Menge, so wird durch

l2(I) :=

(xi)i∈I : xi 6= 0 nur fur abzahlbar viele i ∈ I,

∑i∈I

|xi|2 <∞

ein Prahilbertraum mit Skalarprodukt

〈x, y〉 :=∑i∈I

xiyi

definiert. Beachte, dass wegen der absoluten Konvergenz die Summations-reihenfolge unerheblich ist. (Dies ist ein Spezialfall von Beispiel 4, wenn µdas Zahlmaß auf I ist.)

Fur Elemente x eines Prahilbertraums setzt man ‖x‖ :=√〈x, x〉. Elementar

aber uberaus nutzlich ist die folgende Ungleichung:

Lemma 4.1.2 (Die Cauchy-Schwarzsche Ungleichung) Ist (X, 〈·, ·〉) ein Prahil-bertraum, so gilt

|〈x, y〉| ≤ ‖x‖‖y‖fur alle x, y ∈ X. Es gilt die Gleichheit in dieser Ungleichung genau dann, wennx und y linear abhangig sind.

65

Beweis. Die Behauptung ist klar fur y = 0, so dass wir im Folgenden y 6= 0annehmen. Da fur alle λ ∈ K

0 ≤ 〈x+ λy, x+ λy〉= 〈x, x〉+ λ〈y, x〉+ λ〈x, y〉+ λλ〈y, y〉= ‖x‖2 + λ〈x, y〉+ λ〈x, y〉+ |λ|2‖y‖2

gilt, ergibt sich speziell fur λ = − 〈x,y〉‖y‖2

0 ≤ ‖x‖2 − 〈x, y〉‖y‖2

〈x, y〉 − 〈x, y〉‖y‖2

〈x, y〉+|〈x, y〉|2

‖y‖4‖y‖2

= ‖x‖2 − |〈x, y〉|2

‖y‖2,

woraus die behauptete Ungleichung folgt.Liegt Gleichheit vor, so zeigt die Rechnung, dass dann 〈x + λy, x + λy〉 = 0

gewesen sein, muss, was wegen der positiven Definitheit von 〈·, ·〉 zeigt, dass xund y linear abhangig sind. Ist umgekehrt vorausgesetzt, dass dies der Fall ist,etwa x = ty, so sieht man direkt, dass |〈x, y〉| = |t|‖x‖2 = ‖x‖‖y‖ gilt.

Beispiel: Fur L2(Ω,A, µ) ist die Cauchy-Schwarzsche Ungleichung gerade dieHoldersche Ungleichung mit p = q = 2.

Das nachste Ergebnis zeigt, dass unsere Schreibweise ‖x‖ :=√〈x, x〉 gerecht-

fertigt ist:

Lemma 4.1.3 Ist (X, 〈·, ·〉) ein Prahilbertraum, so definiert ‖x‖ :=√〈x, x〉 eine

Norm auf X.

Beweis. Dies folgt aus

‖λx‖2 = 〈λx, λx〉 = λλ〈x, x〉 = |λ|2‖x‖2

sowie

‖x+ y‖2 = 〈x+ y, x+ y〉 = 〈x, x〉+ 〈x, y〉+ 〈x, y〉+ 〈y, y〉= ‖x‖2 + 2Re 〈x, y〉+ ‖y‖2 ≤ ‖x‖2 + 2‖x‖‖y‖+ ‖y‖2 = (‖x‖+ ‖y‖)2

fur x, y ∈ X,λ ∈ K, wobei wir im vorletzten Schritt die Cauchy-SchwarzscheUngleichung benutzt haben.

Lemma 4.1.4 Das Skalarprodukt 〈·, ·〉 : X ×X → K auf einem PrahilbertraumX ist stetig (bezuglich der induzierten Norm ‖ · ‖).

66

Beweis. Mit xn → x, yn → y inX folgt aus der Cauchy-Schwarzschen Ungleichung

|〈xn, yn〉 − 〈x, y〉| = |〈xn − x, yn〉+ 〈x, yn − y〉|≤ ‖xn − x‖‖yn‖+ ‖x‖‖yn − y‖ → 0.

Tatsachlich lasst sich das Skalarprodukt aus der Normabbildung zuruckge-winnen:

Lemma 4.1.5 (Polarisationsformel) Ist (X, 〈·, ·〉) ein Prahilbertraum, so gilt

〈x, y〉 =1

4

(‖x+ y‖2 − ‖x− y‖2

)fur alle x, y ∈ X, wenn K = R ist, und

〈x, y〉 =1

4

(‖x+ y‖2 − ‖x− y‖2 + i‖x+ iy‖2 − i‖x− iy‖2

)fur alle x, y ∈ X im Falle K = C.

Beweis. Nachrechnen!

Bemerkung. Im Sinne von Lemma 4.1.3 ist ein Prahilbertraum insbesondereein normierter Raum (genauso wie ein normierter Raum insbesondere ein me-trischer Raum “ist”). Da durch die Polarisierungsidentitaten das Skalarprodukteindeutig durch die Norm festgelegt ist, definiert man einen Prahilbertraum auchmanchmal als einen normierten Raum, dessen Norm durch ein (dann eindeutiges)Skalarprodukt induziert ist. Auch wir werden kunftig einen solchen Raum einenPrahilbertraum nennen, wobei das (eindeutige) Skalarprodukt stillschweigend alsgegeben vorausgesetzt wird. Mit einer haarspalterischen Diskussion der Vorzugeder einen uber die andere Definition wollen wir uns jedoch nicht weiter aufhalten.

Satz 4.1.6 (Parallelogrammgleichung) Ein normierter Raum (X, ‖ · ‖) istgenau dann ein Prahilbertraum, wenn die Parallelogrammgleichung

‖x+ y‖2 + ‖x− y‖2 = 2‖x‖2 + 2‖y‖2

fur alle x, y ∈ X erfullt ist.

Bemerkung: Der Name Parallelogrammgleichung kommt aus dem SpezialfallR2 mit der euklidischen Norm. Sie besagt, dass die Summe der Quadrate derSeitenlangen eines (durch x und y aufgespannten) Parallelogramms gleich derSumme der Quadrate der Diagonalen ist.

67

Beweis. Dass diese Bedingung notwendig ist, sieht man direkt durch Nachrechnen:

‖x+ y‖2 + ‖x− y‖2

= 〈x, x〉+ 〈x, y〉+ 〈y, x〉+ 〈y, y〉+ 〈x, x〉 − 〈x, y〉 − 〈y, x〉+ 〈y, y〉= 2〈x, x〉+ 2〈y, y〉 = 2‖x‖2 + 2‖y‖2.

Um die Hinlanglichkeit zu zeigen, nehmen wir zunachst K = R an. Durch diePolarisationsformel motiviert setzen wir

〈x, y〉 :=1

4

(‖x+ y‖2 − ‖x− y‖2

).

Offenbar ist dann ‖x‖ =√〈x, x〉 und 〈x, y〉 = 〈y, x〉 fur alle x, y ∈ X. Die

Symmetrie und positive Definitheit von 〈·, ·〉 sind also klar.Es seien nun x1, x2, y ∈ X. Nach der Parallelogrammgleichung ist

‖x1 + x2 + y‖2 = 2‖x1 + y‖2 + 2‖x2‖2 − ‖x1 + y − x2‖2

und

‖x1 + x2 + y‖2 = 2‖x2 + y‖2 + 2‖x1‖2 − ‖x2 + y − x1‖2,

so dass sich

‖x1 + x2 + y‖2 = ‖x1 + y‖2 + ‖x2‖2 − 1

2‖x1 + y − x2‖2

+ ‖x2 + y‖2 + ‖x1‖2 − 1

2‖x2 + y − x1‖2

ergibt. Die gleiche Rechnung mit −y an Stelle von y liefert

‖x1 + x2 − y‖2 = ‖x1 − y‖2 + ‖x2‖2 − 1

2‖x1 − y − x2‖2

+ ‖x2 − y‖2 + ‖x1‖2 − 1

2‖x2 − y − x1‖2.

Es folgt

〈x1 + x2, y〉 =1

4

(‖x1 + y‖2 − ‖x1 − y‖2 + ‖x2 + y‖2 − ‖x2 − y‖2

)= 〈x1, y〉+ 〈x2, y〉.

Damit ist die Additivitat in der ersten Komponente gezeigt. Aus der Additivitatergibt sich insbesondere fur p, q ∈ N, x, y ∈ X

q

⟨p

qx, y

⟩= 〈px, y〉 = p〈x, y〉,

68

also 〈pqx, y〉 = p

q〈x, y〉. Wegen 〈−x, y〉 = 1

4(‖ − x+ y‖2 − ‖− x− y‖2) = −1

4(‖x+

y‖2 − ‖x− y‖2) = −〈x, y〉 haben wir also

〈λx, y〉 = λ〈x, y〉 ∀x, y ∈ X, ∀λ ∈ Q.

Die Homogenitat in der ersten Komponente allgemein folgt nun aus Stetigkeits-grunden.

Die Linearitat in der zweiten Komponente folgt aus der in der ersten und derschon gezeigten Symmetrie:

〈x, y1 + λy2〉 = 〈y1 + λy2, x〉 = 〈y1, x〉+ λ〈y2, x〉 = 〈x, y1〉+ λ〈x, y2〉.

Damit ist gezeigt, dass 〈·, ·〉 ein Skalarprodukt ist, das ‖ · ‖ induziert.Der Fall K = C ergibt sich analog, wenn man – motiviert durch die Polarisa-

tionsformel –

〈x, y〉 :=1

4

(‖x+ y‖2 − ‖x− y‖2 + i‖x+ iy‖2 − i‖x− iy‖2

)setzt. (Ubung!1)

Korollar 4.1.7 Ein normierter Raum ist genau dann ein Prahilbertraum, wennalle zweidimensionalen Unterraume Prahilbertraume sind.

Beweis. Klar nach Satz 4.1.6.

Ein wichtiges Konzept bei der Untersuchung von Prahilbertraumen ist dieOrthogonalitat.

Definition 4.1.8 Es sei (X, 〈·, ·〉) ein Prahilbertraum.

(i) Vektoren x, y ∈ X heißen orthogonal (schreibe x ⊥ y), wenn 〈x, y〉 = 0 ist.

(ii) Allgemeiner nennt man Teilmengen A,B ⊂ X orthogonal (schreibe A ⊥B), wenn a ⊥ b fur alle a ∈ A und b ∈ B erfullt ist.

(iii) Das orthogonale Komplement einer Teilmenge A ⊂ X ist

A⊥ := x ∈ X : x ⊥ a ∀ a ∈ A.

Lemma 4.1.9 (Satz des Pythagoras) Ist X ein Prahilbertraum, so gilt

x ⊥ y =⇒ ‖x± y‖2 = ‖x‖2 + ‖y‖2.

Beweis. Klar.

Die Eigenschaften des orthogonalen Komplements fasst das folgende Lemmazusammen:

1Einige Schritte lassen sich direkt auf den reellen Fall zuruckfuhren.

69

Lemma 4.1.10 Ist U ⊂ X, X ein Prahilbertraum, so gilt

(i) U⊥ ist ein abgeschlossener Unterraum von X.

(ii) linU ⊂ (U⊥)⊥.

Beweis. (i) ist klar und (ii) folgt direkt aus U ⊂ U⊥⊥ und (i).

4.2 Hilbertraume und Orthogonalprojektionen

Was die Banachraume unter den normierten Raumen sind, sind die Hilbertraumeunter den Prahilbertraumen:

Definition 4.2.1 Ein vollstandiger2 Prahilbertraum heißt Hilbertraum.

Indem wir die eingangs diskutierten Beispiele mit den dort angegebenen Ska-larprodukten auf Vollstandigkeit untersuchen, erhalten wir die folgenden Beispie-le:Beispiele:

1. Der Kn mit dem euklidischen Skalarprodukt ist ein Hilbertraum. Die indu-zierte Norm ist die euklidische: ‖x‖ =

√|x1|2 + . . .+ |xn|2.

2. Jeder abgeschlossene Unterraum eines Hilbertraums ist wieder ein Hilbert-raum.

3. l2, l2(I) fur eine allgemeine Menge I und – noch allgemeiner – L2(Ω,A, µ),(Ω,A, µ) ein Maßraum, sind Hilbertraume. Die induzierten Normen auf l2

und L2(Ω,A, µ) sind die uns wohlbekannten Normen auf diesen Raumen.

Im Beispiel 3 von Seite 50 (vgl. auch Korollar 5.3.2 unten) hatten wir gesehen,dass jeder normierte Raum isometrisch isomorph zu einem dichten Unterraumeines Banachraums ist. Ein entsprechendes Resultat gilt auch fur Prahilbert- undHilbertraume:

Satz 4.2.2 Jeder Prahilbertraum ist isometrisch isomorph zu einem dichten Un-terraum eines Hilbertraums.

Beweis. Ist X ein Prahilbertraum, also insbesondere ein normierter Raum, soist X wie eben bemerkt isometrisch isomorph zu einem dichten Unterraum Ueines Banachraums X. Die Parallelogrammgleichung gilt dann auch auf U . AusStetigkeitsgrunden gilt sie dann aber sogar auf X, so dass X nach Satz 4.1.6sogar ein Hilbertraum ist.

2naturlich bezuglich der vom Skalarprodukt induzierten Norm

70

Satz 4.2.3 (Projektionssatz) Ist H ein Hilbertraum, U ⊂ H nicht leer, abge-schlossen und konvex und x0 ∈ H, so gibt es genau ein x ∈ U mit

‖x− x0‖ = infx∈U‖x− x0‖.

Beweis. O.B.d.A. sei x0 = 0. Wir wahlen eine Folge (xn) ⊂ U mit ‖xn‖ →dist(0, U) = infx∈U ‖x‖. Die Parallelogrammgleichung liefert dann∥∥∥∥xn − xm2

∥∥∥∥2

=1

2‖xn‖2 +

1

2‖xm‖2 −

∥∥∥∥ xn + xm2︸ ︷︷ ︸∈U

∥∥∥∥2

≤ 1

2‖xn‖2 +

1

2‖xm‖2 −

(infx∈U‖x‖)2

→ 0

mit m,n → ∞. Dies zeigt, dass (xn) ein Cauchy-Folge ist. Da U abgeschlossenist, gibt es ein x ∈ U mit xn → x und damit auch ‖x‖ = limn ‖xn‖ = infx∈U ‖x‖.

Die Eindeutigkeit folgt so: Gabe es verschiedene x, x ∈ U mit ‖x‖ = infx∈U ‖x‖ =‖x‖, so ware∥∥∥∥ x+ x

2

∥∥∥∥2

<

∥∥∥∥ x+ x

2

∥∥∥∥2

+

∥∥∥∥ x− x2

∥∥∥∥2

=1

2‖x‖2 +

1

2‖x‖2 = inf

x∈U‖x‖2

nach der Parallelogrammgleichung im Widerspruch zu x+x2∈ U .

Definition 4.2.4 Die unter den Voraussetzungen von Satz 4.2.3 wohldefinierteAbbildung PU : H → U , x0 7→ x, die einem Punkt x0 das nachstgelegene Elementaus U zuordnet, nennt man die orthogonale Projektion von H auf U .

Es ist klar, dass es sich hierbei tatsachlich um eine (i.A. nichtlineare) Projek-tion handelt. Dass man von einer orthogonalen Projektion spricht, erklart sichaus dem nachsten Satz, der eine algebraische Charakterisierung dieser Abbildungangibt. Wenn U sogar ein (abgeschlossener) Unterraum ist, so ist namlich der zux0 optimale Punkt x durch die Bedingung x0 − x ⊥ U gegeben.

Satz 4.2.5 Es seien H ein Hilbertraum, U ⊂ H nicht leer, abgeschlossen undkonvex, PU die orthogonale Projektion von H auf U und x0 ∈ H. Genau danngilt PU(x0) = x, wenn

Re 〈x0 − x, x− x〉 ≤ 0 ∀x ∈ U

ist. Ist U ein abgeschlossener Unterraum, so gilt sogar

〈x0 − PU(x0), x〉 = 0 ∀x ∈ U.

71

Beweis. Dass diese Bedingung fur PU(x0) = x hinreichend ist, ergibt sich aus

‖x− x0‖2 = ‖x− x+ x− x0‖2

= ‖x− x‖2 + 2 Re 〈x− x, x− x0〉+ ‖x− x0‖2 ≥ ‖x− x0‖2

fur alle x ∈ U , so dass tatsachlich x das nachstgelegene Element aus U zu x0 ist.Zum Nachweis der Notwendigkeit betrachten wir zu gegebenem x ∈ U die

Punkte x(t) = (1− t)x+ tx ∈ U fur t ∈ [0, 1]. Dann folgt fur x = PU(x0)

‖x− x0‖2 ≤ ‖x(t)− x0‖2 = ‖x− x0 + t(x− x)‖2

= ‖x− x0‖2 + 2 Re 〈x− x0, t(x− x)〉+ ‖t(x− x)‖2,

also

0 ≤ 2 Re 〈x− x0, x− x〉+ t‖x− x‖2

fur 0 < t ≤ 1, woraus die Behauptung im Limes t→ 0 folgt.Ist nun U sogar ein Unterraum, so gilt fur x = PU(x0) wegen ±x+ x ∈ U und

±ix+ x ∈ U auch

±Re 〈x0 − x, x〉 ≤ 0 und ± Im 〈x0 − x, x〉 = Re 〈x0 − x,±ix〉 ≤ 0,

was 〈x0 − PU(x0), x〉 = 0 zeigt.

Der folgende Satz ist wesentlich bei der Untersuchung von Hilbertraumen.

Satz 4.2.6 (Satz von der Orthogonalprojektion) Es seien H ein Hilbert-raum und U ⊂ H ein abgeschlossener Unterraum. Dann erfullt die orthogonaleProjektion PU : H → U die folgenden Bedingungen.

(i) PU ist linear und stetig mit ‖PU‖ = 1 fur U 6= 0,

(ii) PU(H) = U und kerPU = U⊥,

(iii) H = U ⊕2 U⊥ und

(iv) Id−PU ist die orthogonale Projektion von H auf U⊥.

Beweis. (i) Nach Satz 4.2.5 ist fur x1, x2 ∈ H und λ ∈ K

〈x1 + λx2 − (PU(x1) + λPU(x2)), x〉 = 0 ∀x ∈ U,

so dass, wieder nach Satz 4.2.5 gilt PU(x1 + λx2) = PU(x1) + λPU(x2).Satz 4.2.5 impliziert außerdem 0 = 〈x0 − PUx0, PUx0〉 und damit

‖PUx0‖2 = 〈PUx0, PUx0〉 = 〈x0, PUx0〉 ≤ ‖x0‖‖PUx0‖,

also ‖PUx0‖ ≤ ‖x0‖ fur alle x0 ∈ H. Dies zeigt ‖PU‖ ≤ 1. Ist U 6= 0, so folgtmit u ∈ U \ 0 wegen ‖PUu‖ = ‖u‖ 6= 0 auch ‖PU‖ ≥ 1.

72

(ii) PU(H) = U (und P |U = IdU) ist klar nach Konstruktion. Außerdem ist

PUx0 = 0 ⇐⇒ 〈x0 − 0, x〉 = 0 ∀x ∈ U

nach Satz 4.2.5, was kerPU = U⊥ beweist.(iii) Nach Voraussetzung und nach Lemma 4.1.10(i) sind U und U⊥ abge-

schlossene Unterraume. Dabei ist U ∩ U⊥ = 0, denn 〈x0, x0〉 = 0 =⇒ x0 = 0und U + U⊥ = H, da sich jedes x0 ∈ H schreiben lasst als

x0 = PUx0 + (x0 − PUx0) ∈ U + U⊥,

weil nach Satz 4.2.5 ja x0 − PUx0 ⊥ U gilt. Dass sogar H = U ⊕2 U⊥ gilt, folgt

aus dieser Darstellung und dem Satz von Pythagoras: Fur alle x0 ist

‖x0‖2 = ‖PUx0‖2 + ‖x0 − PUx0‖2.

(iv) Ist x0 ∈ H, so gilt fur alle x ∈ U⊥

〈x0 − (Id−PU)x0, x〉 = 〈PUx0, x〉 = 0

und somit PU⊥x0 = (Id−PU)x0 nach Satz 4.2.5.

Als erste Anwendung zeigen wir, wie man die Aussage aus Lemma 4.1.10(ii)wesentlich verscharfen kann.

Korollar 4.2.7 Ist H ein Hilbertraum und U ⊂ H nicht leer, so ist linU =(U⊥)⊥.

Beweis. Ist U sogar ein abgeschlossener Unterraum, so ergibt sich aus Satz 4.2.6(iv)

PU⊥⊥ = Id−PU⊥ = Id−(Id−PU) = PU

und damit U⊥⊥ = U .Fur allgemeine U folgt aus der Bilinearitat und Stetigkeit des Skalarprodukts

U⊥ = (linU)⊥ = (linU)⊥, so dass nach dem schon Gezeigten nun

U⊥⊥ = (linU)⊥⊥ = linU

folgt.

4.3 Dualitat

Eine besonders wichtige Anwendung des Satzes von der Orthogonalprojektionist das folgende Darstellungsresultat fur den Dualraum eines Hilbertraums: DasSkalarprodukt vermittelt eine kanonische Identifizierung des Dualraums mit demHilbertraum selbst. Wir werden namlich zeigen, dass jedes Funktional auf einemHilbertraum H von der Form 〈·, y〉 fur ein y ∈ H ist. (In krassem Gegensatz giltfur allgemeine Banachraume X noch nicht einmal X ′ ' X, wie wir noch sehenwerden.)

73

Satz 4.3.1 (Rieszscher Darstellungssatz) Es sei H ein Hilbertraum. Danngibt es zu jedem Funktional x′ ∈ H ′ genau ein y ∈ H mit x′ = 〈·, y〉. Dabei ist‖y‖ = ‖x′‖.

Die Abbildung Φ : H → H ′, y 7→ 〈·, y〉 ist ein isometrischer konjugiert linearerIsomorphismus. D.h. Φ ist bijektiv und isometrisch und es gilt es gilt Φ(y1+λy2) =Φ(y1) + λΦ(y2) fur y1, y2 ∈ H, λ ∈ K.

Beweis. Es ist leicht zu sehen, dass Φ konjugiert linear ist. Ist y ∈ H, so ist nachder Cauchy-Schwarzschen Ungleichung

‖Φ(y)‖ = supx∈BH1

|Φ(y)x| = supx∈BH1

|〈x, y〉| ≤ supx∈BH1

‖x‖‖y‖ = ‖y‖.

Da fur x = y‖y‖ außerdem Φ(y)x = 〈 y

‖y‖ , y〉 = ‖y‖ gilt, ergibt sich dass Φ isome-trisch und damit auch injektiv ist. Es bleibt die Surjektivitat zu beweisen.

Sei also x′ ∈ H ′ und o.B.d.A. x′ 6= 0. Sei P die orthogonale Projektion von Hauf ker x′. Wegen x′ 6= 0 gibt es ein y ∈ H mit x′(y) = 1. Setze nun y = y − P y.Dann ist x′(y) = x′(y) = 1 (insbesondere y 6= 0) und y ⊥ kerx′. Ist nun x ∈ H,so erhalt man

〈x, y〉 = 〈x− x′(x)y︸ ︷︷ ︸∈ kerx′

+x′(x)y, y〉 = x′(x)‖y‖2,

was Φ( y‖y‖2 ) = x zeigt.

Darstellung stetiger Bilinearformen

Mit Hilfe des Rieszschen Darstellungssatzes gelingt es, Bilinearformen (falls K =R) bzw. Sesquilinearformen (falls K = C) durch einen geeigneten Operator inL(H) darzustellen. Der folgende Satz ist vor allem in der Theorie der partiellenDifferentialgleichung von besonderer Bedeutung. Dazu bemerken wir vorberei-tend, dass eine bilineare bzw. sesquilineare Abbildung3 B : H × H → K aufeinem Hilbertraum H genau dann stetig ist, wenn es eine Konstante C > 0derart gibt, dass

|B(x, y)| ≤ C‖x‖‖y‖ ∀x, y ∈ H

erfullt ist. (Ubung!) Eine Bilinearform bzw. Sesquilinearform B nennt man koer-ziv, wenn es außerdem eine Konstante c > 0 gibt mit

ReB(x, x) ≥ c‖x‖2 ∀x ∈ H.

Satz 4.3.2 (Satz von Lax-Milgram) Es sei B : H × H → K eine stetigeBilinearform bzw. Sesquilinearform.

3vgl. Def. 4.1.1

74

(i) Es gibt einen Operator A ∈ L(H) mit

B(x, y) = 〈x,Ay〉 ∀x, y ∈ H.

(ii) Ist B zudem koerziv, so ist A sogar ein Isomorphismus.

Beweis. (i) Es sei y ∈ H. Da die Abbildung x 7→ B(x, y) ein stetiges linearesFunktional auf H ist, existiert nach dem Rieszschen Darstellungssatz 4.3.1 eineindeutig bestimmtes Element h ∈ H, so dass

B(x, y) = 〈x, h〉 ∀x ∈ H

gilt. Dies definiert eine Abbildung y 7→ Ay := h, fur die dann

B(x, y) = 〈x,Ay〉 ∀x, y ∈ H

gilt. Die Abbildung A ist linear, da fur gegebene y1, y2 ∈ H und λ ∈ K

B(x, y1 + λy2) = B(x, y1) + λB(x, y2)

= 〈x,Ay1〉+ λ〈x,Ay2〉= 〈x,Ay1 + λAy2〉

fur alle x ∈ H gilt. Außerdem ist fur alle y ∈ H

‖Ay‖2 = 〈Ay,Ay〉 = B(Ay, y) ≤ C‖Ay‖‖y‖,

also ‖Ay‖ ≤ C‖y‖, so dass A auch stetig ist.

(ii) Aus der Koerzivitatsbedingung erhalten wir fur alle x ∈ H

c‖x‖2 ≤ ReB(x, x) = Re 〈x,Ax〉 ≤ ‖x‖‖Ax‖ =⇒ c‖x‖ ≤ ‖Ax‖.

Zusammen mit der schon gezeigten Stetigkeit bleibt nach Lemma 3.1.9 nur nochzu uberprufen, dass A auch surjektiv ist.

Dazu bemerken wir zunachst, dass die eben gezeigte Abschatzung impliziert,dass das Bild A(H) von A abgeschlossen ist: Ist Axn → z, so ist wegen

c‖xn − xm‖ ≤ ‖Axn − Axm‖

auch (xn) eine Cauchy-Folge und also konvergent, etwa gegen x. Dann aber istz = limAxn = Ax ∈ A(H). Ware daher A nicht surjektiv, so gabe es nach Satz4.2.6 ein x0 ∈ A(H)⊥ mit x0 6= 0. Das aber widerspricht c‖x0‖2 ≤ B(x0, x0) =〈x0, Ax0〉 = 0.

75

Maße mit Dichten

Als weitere Anwendung des Rieszschen Darstellungssatzes 4.3.1 besprechen wirnun den Satz von Radon-Nikodym uber Maße mit Dichten.

Es sei (Ω,A) ein messbarer Raum. Ist g eine nicht-negative A-messbare nu-merische Funktion oder eine K-wertige integrable Funktion, so ist durch

ν(A) =

∫A

g dµ

ein positives bzw. signiertes oder komplexes Maß auf (Ω,A) definiert. Dies ergibtsich sofort aus dem Satz von der monotonen Konvergenz bzw. dem Satz vonder majorisierten Konvergenz, denn offenbar ist

∫∅ g dµ = 0 und fur paarweise

disjunkte A1, A2, . . . ∈ A gilt

ν

(⋃j

Aj

)=

∫⋃j Aj

g dµ =

∫Ω

∑j

χAjg dµ =∑j

∫Ω

χAjg dµ =∑j

ν(Aj).

Man sagt in diesem Fall, dass ν die Dichte g bezuglich µ hat. Die Integrationbezuglich eines Maßes mit Dichte ist intuitiv: Hat ν die Dichte g bezuglich µ, sogilt fur eine messbare Funktion f : Ω→ K∫

Ω

f dν =

∫Ω

fg dµ,

wenn fg µ-integrierbar ist, was genau dann der Fall ist, wenn f ν-integrierbarist. (Ubung: Uberlegen Sie sich das!)

Hat ν eine Dichte g bezuglich µ, so gilt insbesondere

µ(A) = 0 =⇒ ν(A) =

∫A

g dµ = 0.

Allgemein sagt man fur ein positives Maß µ und ein positives, signiertes oderkomplexes Maß ν auf (Ω,A), dass ν absolut stetig bezuglich µ sei, und schreibtν µ, wenn jede µ-Nullmenge auch eine ν-Nullmenge ist. Der bemerkenswerteSatz von Radon-Nikodym besagt, dass diese Bedingung tatsachlich schon hinrei-chend fur die Existenz einer Dichte ist.

Vorbereitend fuhren wir noch eine Notation ein: Ist (Ω,A, µ) und ein Maß-raum, so sagt man, µ sei σ-endlich, wenn es eine Folge A1, A2, . . . ∈ A mitµ(An) <∞ fur jedes n und

⋃n∈NAn = Ω gibt. Indem man An durch An \ (A1 ∪

. . . ∪ An−1) ersetzt, darf man hierbei immer annehmen, dass die An paarweisedisjunkt sind.

Satz 4.3.3 (Satz von Radon-Nikodym) Es seien (Ω,A) ein messbarer Raumund µ ein σ-endliches positives sowie ν ein weiteres σ-endliches positives, signier-tes oder komplexes Maß darauf. Gilt ν µ, so hat ν eine Dichte bezuglich µ.

76

Beweis von Satz 4.3.3. Es seien zunachst µ und ν endliche Maße. Setze π = µ+ν.Die Abbildung

ϕ(u) =

∫Ω

u dµ

ist ein Funktional auf dem reellen Hilbertraum L2(Ω,A, π), denn nach der Cauchy-Schwarzschen Ungleichung ist

|ϕ(u)| ≤ ‖u‖L1(Ω,A,µ) ≤ ‖1‖L2(Ω,A,µ) ‖u‖L2(Ω,A,µ) ≤ µ(Ω)12 ‖u‖L2(Ω,A,π).

Nach dem Rieszschen Darstellungssatz gibt es also ein g ∈ L2(Ω,A, π) mit

ϕ(u) =

∫Ω

u g dπ ∀u ∈ L2(Ω,A, π).

Da nun mit µ und ν auch π endlich ist, liegt jede charakteristische FunktionχA fur A ∈ A in L2(Ω,A, π) und wir erhalten die beiden Identitaten

µ(A) = ϕ(χA) =

∫A

g dπ

(g ist also eine Dichte von µ bezuglich π) und

ν(A) = π(A)− µ(A) =

∫A

1− g dπ

Da dies fur jedes A ∈ A gilt, muss 0 ≤ g ≤ 1 π-fast uberall sein. Insbesondere furA0 = x ∈ Ω : g(x) = 0 liefert die erste Gleichung µ(A0) = 0. Wegen ν µ istdann aber auch ν(A0) = 0 und insgesamt π(A0) = 0. Es gilt also sogar 0 < g ≤ 1π-fast uberall, so dass 1

g≥ 1 π-fast uberall existiert.

Wir setzen nun f = 1g− 1 (≥ 0). Da µ bezuglich π die Dichte g hat, folgt

ν(A) = π(A)− µ(A) =

∫A

(1g− 1)g dπ =

∫A

f dµ.

Damit ist f die gesuchte Dichte von ν bezuglich µ.Sind µ und ν nurmehr als σ-endlich vorausgesetzt, so wahlen wir disjunkte

Zerlegungen Ω =⋃n∈NBn =

⋃n∈NCn, B1, B2, . . . , C1, C2, . . . ∈ A, so dass µ auf

jedem Bn und ν auf jedem Cn endlich ist. Nach dem schon Gezeigten gibt es eineDichte fn,m von ν bezuglich µ auf jedem An,m = Bn ∩ Cm. Es ist nicht schwerzu sehen (monotone Konvergenz), dass dann g : Ω→ [0,∞] mit f(x) = fn,m(x),falls x ∈ An,m, die gesuchte Dichte ist. (Uberlegen Sie sich das!)

Ist schließlich ν signiert oder komplex, so zerlegen wir ν durch

ν = ν+ − ν− bzw. ν = (Re ν)+ − (Re ν)− + i(Im ν)+ − i(Im ν)−

und wenden das eben Gezeigte auf jeden Summanden an. Das ist moglich, dadiese absolut stetig bezuglich µ sind. (Uberlegen Sie sich das!)

77

4.4 Anwendung: Elliptische Randwertprobleme

Eine elliptische Randwertaufgabe in der Theorie der partiellen Differentialglei-chungen besteht darin, auf einem gegebenem Gebiet U ⊂ Rn (offen und be-schrankt) und zu gegebenen f : U → R und g : ∂U → R Funktionen u : U → Rzu finden, die das Randwertproblem

Lu = f in U, u = g auf ∂U

losen. (In diesem Abschnitt ist durchwegs K = R.) Hierbei ist L ein ‘elliptischerDifferentialoperator’. Von besonderer Bedeutung sind die elliptischen Differential-operatoren zweiter Ordnung, deren prominentester Vertreter der Laplaceoperator∆ =

∑ni=1 ∂

2i ist. Wir wollen uns im Folgenden auf diesen Fall beschranken und

eine allgemeinere Analyse einer Vorlesung uber partielle Differentialgleichungenuberlassen. (Dort werden allgemeinere ‘Differentialoperatoren’ behandelt, die je-doch ublicher Weise nicht stetig sind und sogar auch nichtlinear sein konnen.) Esstellt sich also insbesondere das Problem,

−∆u = f in U, u = 0 auf ∂U,

den ‘Prototyp’ der linearen elliptischen Gleichungen zweiter Ordnung zu losen.Schon dieser Spezialfall ist jedoch von großer Bedeutung. Die Gleichung −∆u = fnennt man die Poisson-Gleichung. Sucht man Losungen mit vorgegebenen Rand-werten (insbesondere Null-Randwerten), so spricht man auch vom Dirichlet-Problem fur die Poisson-Gleichung. Diese Gleichung kommt in unzahligen Anwen-dungen (mathematische Physik, Geometrie, Wahrscheinlichkeitstheorie, . . . ) vor.Unser Ziel ist es, mit Hilfe funktionalanalytischer Methoden ‘schwache Losungen’in Sobolev-Raumen dieser Gleichung zu finden.

Randwerte und die Ungleichung von Poincare

Um ein Randwertproblem zu losen, sind wir an solchen Sobolev-Funktionen uinteressiert, die am Rand ∂U von U vorgegebene Werte annehmen, etwa

“u = g auf ∂U”.

Diese Bedingung ist selbst dann heikel, wenn g glatt und sogar auf ganz Rn

gegeben ist, da ja ∂U in den meisten interessanten Fallen eine Nullmenge ist, sodass die Einschrankung u|∂U nicht so ohne Weiteres wohldefiniert ist. Dennochkann man eine solche Bedingung sinnvoll stellen. Besonders wichtig ist es denFall von Null-Randbedingungen, also “u = 0 auf ∂U” zu verstehen, da sich derallgemeine Fall durch Ubergang zu u− g darauf zuruckfuhren lasst.

Definition 4.4.1 Wir definieren W 1,p0 (U) := C∞c (U)

W 1,p(U), d.h. W 1,p

0 (U) ist derAbschluss des Raumes der Testfunktionen C∞c (U) in W 1,p(U).

Fur p = 1 schreibt man auch W 1,20 (U) = H1

0 (U).

78

Bemerkung: Den Raum W 1,p0 (U) interpretieren wir als die Menge der Funktio-

nen u ∈ W 1,p(U) mit “u = 0 auf ∂U”. Es lasst sich zeigen, dass fur u ∈ W 1,p(U)die Einschrankung u|Γ auf eine (n − 1)-dimensionale Untermannigfaltigkeit Γvon U als Element von Lp(∂U) wohldefiniert ist. In diesem Sinne gilt tatsachlichu|∂U = 0 fur u ∈ W 1,p

0 (U), wenn der Rand von U hinreichend glatt ist.

Fur spatere Anwendungen bemerken wir hier noch, dass sich W 1,p0 -Funktionen

durch 0 auf großere Gebiete fortsetzen lassen:

Proposition 4.4.2 Sind U, V ⊂ Rn offen, U ⊂ V , so ist mit u ∈ W 1,p0 (U) die

fortgesetzte Funktion

u(x) =

u(x) fur x ∈ U,0 fur x ∈ V \ U

in W 1,p0 (V ). Dabei gilt ‖u‖W 1,p(V ) = ‖u‖W 1,p(U).

Man schreibt auch kurz einfachW 1,p0 (U) ⊂ W 1,p

0 (V ) oderW 1,p0 (U) → W 1,p

0 (V ).

Beweis. Die Abbildung T : (C∞c (U), ‖·‖W 1,p(U))→ (W 1,p0 (V ), ‖·‖W 1,p(V )), Tu = u

ist offensichtlich eine Isometrie. Ihre stetige Fortsetzung T : W 1,p0 (U)→ W 1,p

0 (V )ist dann wieder eine Isometrie. Die Behauptung folgt nun daraus, dass fur u ∈W 1,p(U) mit C∞c (U) 3 un → u folgt

T u = limn→∞

Tun = limn→∞

un = u,

denn un|U → u|U in Lp(U) und un|V \U → 0 in Lp(V \ U).

Durch die folgende Ungleichung ist es moglich W 1,p0 -Funktionen durch ihre

(schwachen) Ableitungen zu kontrollieren:

Satz 4.4.3 (Die Poincaresche Ungleichung) Es sei U ⊂ Rn offen und be-schrankt. Dann gibt es eine (nur vom Gebiet U abhangige) Konstante C > 0mit

‖u‖W 1,p(U) ≤ C‖∇u‖Lp(U) ∀u ∈ W 1,p0 (U).

Beweis. Da beide Seiten stetig von u (bezuglich der ‖ · ‖W 1,p(U)-Norm) abhangen,genugt es, diese Ungleichung nur fur Funktionen u aus dem dichten TeilraumC∞c (U) zu beweisen. Weil U beschrankt ist, gibt es a, b ∈ R mit U ⊂ (a, b)×Rn−1.Nach dem Hauptsatz der Differential- und Integralrechnung und der HolderschenUngleichung ist fur x ∈ U und 1 < p <∞, 1

p+ 1

q= 1

|u(x)|p =

∣∣∣∣ ∫ x1

a

1 · ∂1u(t, x2, . . . , xn) dt

∣∣∣∣p≤(∫ b

a

1q dt

)p/q(∫ x1

a

|∂1u(t, x2, . . . , xn)|p dt)p/p

≤ (b− a)p−1

∫ b

a

|∂1u(t, x2, . . . , xn)|p dt,

79

denn pq

= p − 1. Diese Abschatzung bleibt auch fur p = 1 mit (b − a)0 = 1

richtig. Fur p = ∞ ergibt sich aus der Holderschen Ungleichung direkt |u(x)| ≤(b− a)‖∂1u‖∞. Es folgt∫U

|u(x)|p dx ≤ (b− a)p−1

∫ b

a

∫ ∞−∞· · ·∫ ∞−∞

∫ b

a

|∂1u(t, x2, . . . , xn)|p dt dxn · · · dx2 dx1

= (b− a)p−1

∫ b

a

∫U

|∂1u(t, x2, . . . , xn)|p dx1

≤ (b− a)p‖∇u‖pLp(U)

und damit

‖u‖pW 1,p(U) = ‖u‖pLp(U) + ‖∇u‖pLp(U) ≤ ((b− a)p + 1)‖∇u‖pLp(U)

fur 1 ≤ p <∞ sowie

‖u‖W 1,∞(U) = ‖u‖∞ + ‖∂1u‖∞ + . . .+ ‖∂nu‖∞ ≤ ((b− a) + n)‖∇u‖∞

fur p =∞.

Schwache Losungen der Poisson-Gleichung

Wir untersuchen das Randwertproblem

−∆u = f in U, u = 0 auf ∂U,

U ⊂ Rn offen und beschrankt, f ∈ L2(U) gegeben, wobei ∆ den Laplaceope-rator ∆ =

∑ni=1 ∂

2i bezeichnet. Die Gleichung ∆u = f nennt man die Poisson-

Gleichung. Sucht man Losungen mit vorgegebenen Randwerten (insbesondereNull-Randwerten), so spricht man auch vom Dirichlet-Problem fur die Poisson-Gleichung.

Um den Begriff der schwachen Losung zu motivieren, nehmen wir fur einenMoment an, u seine eine hinreichend glatte Losung, multiplizieren die Poisson-Gleichung mit einer Testfunktion v ∈ C∞c (U) und integrieren partiell:∫

U

n∑i=1

∂iu ∂iv =

∫U

f v.

Diese Gleichung ergibt sogar dann noch Sinn, wenn u nur einmal schwach diffe-renzierbar ist, etwa u ∈ H1(U). Da u Null-Randbedingungen erfullen soll, fordernwir nun u ∈ H1

0 (U). Durch Approximation sieht man, dass diese Gleichung dannsogar fur alle v ∈ H1

0 (U) gilt. Das fuhrt zu folgender

80

Definition 4.4.4 (i) B : H10 ×H1

0 → R mit

B(u, v) :=

∫U

∇u · ∇v

wird die dem ‘Operator’ ∆ zugeordnete Bilinearform genannt.

(ii) u heißt eine schwache Losung des Dirichlet-Problems fur die Poisson-Gleichung,wenn

B(u, v) = 〈f, v〉L2(U) (4.1)

fur alle v ∈ H10 (U) gilt, wobei hier 〈·, ·〉L2(U) das Skalarprodukt in L2(U)

bezeichnet. Diese Gleichung bezeichnet man als Variationsgleichung.

Als Konsequenz aus Satz 4.3.2 erhalten wir nun ein sogenanntes Wohlgestellt-heitsresultat fur die Poisson-Gleichung (d.h.: Existenz, Eindeutigkeit und stetigeAbhangigkeit von den Daten):

Satz 4.4.5 Das Randwertproblem

−∆u = f in U, u = 0 auf ∂U

hat fur alle f ∈ L2(U) eine eindeutige schwache Losung u ∈ H10 (U). u hangt

stetig von f ab.

Beweis. Wir bemerken zunachst, dass H10 (U) als abgeschlossener Unterraum von

H1(U) selbst ein Hilbertraum ist. WegenB(u, v) ≤ 〈u, v〉H1(U) ≤ ‖u‖H1(U)‖v‖H1(U)

fur u, v ∈ H10 ist B stetig. Nach der Poincareschen Ungleichung gibt es außerdem

ein c > 0 mitB(u, u) = ‖∇u‖2

L2(U) ≥ c‖u‖2H1(U),

was zeigt, das B koerziv ist. Nach dem Satz 4.3.2 von Lax Milgram Satz lasst sichB also durch einen Isomorphismus A in der Form B = 〈A ·, ·〉H1(U) = darstellen.

Andererseits ist die Abbildung F : H10 (U) → R, v 7→ 〈f, v〉L2(U) linear und

stetig mit |F (v)| ≤ ‖f‖L2(U)‖v‖L2(U) ≤ ‖f‖L2(U)‖v‖H1(U), also ‖F‖ ≤ ‖f‖L2(U), sodass sich F mit Hilfe des Isomorphismus Φ aus dem Rieszschen Darstellungssatz4.3.1 als F = 〈·,Φ−1F 〉H1(U) schreiben lasst.

Daher ist (4.1) genau dann erfullt, wenn

〈Au, v〉H1(U) = 〈Φ−1F, v〉H1(U)

fur alle v ∈ H10 (U) gilt, also Au = Φ−1F , was zu u = A−1Φ−1F aquivalent ist. u ist

also eindeutig und zudem linear in f . Insbesondere gilt die Stetigkeitsabschatzung‖u‖H1(U) ≤ C‖Φ−1F‖H1(U) = C‖F‖H1(U)′ ≤ C‖f‖L2(U).

81

Bemerkung:

1. Der Beweis zeigt, dass allgemeiner fur F ∈ (H10 (U))′ die GleichungB(u, v) =

F (v) fur alle v eine eindeutige Losung u besitzt, die stetig von F abhangt.

2. Das allgemeine Randwertproblem

−∆u = f in U, u = g auf ∂U,

g ∈ H1(U) gegeben, lasst sich auf ein Problem mit Null-Randbedingungenwie folgt zuruckfuhren. Wir nennen u eine schwache Losung dieses Pro-blems, wenn u− g ∈ H1

0 gilt und

B(u, v) = (f, v) ∀ v ∈ H10 (U)

erfullt ist.

Setze w := u − g. Dann ist u eine Losung genau dann, wenn w ∈ H10 (U)

die Variationsgleichung

B(w, v) = 〈f, v〉L2(U) −B(g, v) ∀ v ∈ H10 (U)

lost. Offenbar ist B(g, ·) ∈ (H10 (U))′ und damit das Problem nach der vori-

gen Bemerkung gelost.

3. Es sei nicht verschwiegen, dass sich der Satz 4.4.5 auch ohne Ruckgriff aufden Satz von Lax-Milgram beweisen lasst, indem man auf H1

0 (U)

〈u, v〉H10 (U) =

∫U

∇u · ∇v

definiert, was nach der Poincareschen Ungleichung Satz 4.4.3 in der Tatein Skalarprodukt auf H1

0 definiert, dessen induzierte Norm aquivalent zu‖ · ‖H1 ist. Satz 4.4.5 folgt dann aus dem Rieszschen Darstellungsatz 4.3.1.Die hier beschriebenen Argumente haben jedoch den Vorteil, dass sie sichauf allgemeinere elliptische Gleichungen von der Form

−n∑

i,j=1

∂j (aij(x) ∂iu) +n∑i=1

bi(x)∂iu+ c(x) = f in U, u = 0 auf ∂U

ubertragen lassen. Mehr dazu in einer Vorlesung uber partielle Differenti-algleichungen.

4. Naturlich stellt sich die Frage, ob die gefundene schwache Losung u aucheine klassische Losung, also eine im ublichen Sinn differenzierbare Funk-tion mit ∆u = f ist, zumindest wenn f hinreichend ‘gutartig’ ist. SolcheFragen werden in der Regularitatstheorie fur Losungen partieller Differenti-algleichungen behandelt. Auch hierfur sei auf eine Vorlesung uber partielleDifferentialgleichungen verwiesen.

82

4.5 Orthonormalsysteme

In Hilbertraumen ist es – im Gegensatz zu allgemeinen Banachraumen – moglich,ein sinnvolles und zum Arbeiten sehr nutzliches Konzept einer Basis zu definieren,in die sich beliebige Elemente entwickeln lassen. Hiermit ist es sogar moglich, dieHilbertraume bis auf isometrische Isomorphie vollstandig zu klassifizieren. Wirwerden uns der Einfachheit halber auf separable Hilbertraume beschranken. Derallgemeine Fall ist zwar nicht wesentlich schwieriger zu behandeln aber doch anmanchen Stellen etwas technischer. Hierfur sei auf [We] verwiesen.

Definition 4.5.1 Es sei H ein Prahilbertraum.

(i) Eine Teilmenge ei : i ∈ I ⊂ H heißt Orthogonalsystem, wenn ei ⊥ ej furi, j ∈ I mit i 6= j gilt.

(ii) Ein Orthogonalsystem ei : i ∈ I ⊂ heißt Orthonormalsystem, wenn‖ei‖ = 1 fur alle i ∈ I erfullt ist.

M.a.W.: Eine Teilmenge ei : i ∈ I ⊂ ist ein Orthonormalsystem, wenngilt

〈ei, ej〉 = δij ∀ i, j ∈ I.

Beispiele:

1. In l2 ist e(n) : n ∈ N ein Orthonormalsystem. (Klar!)

2. Jede Teilmenge eines Orthonormalsystems ist wieder ein Orthonormalsy-stem.

3. In L2((−π, π);C) ist 1√2πeik· : k ∈ Z ein Orthonormalsystem. (Nachrech-

nen!)

4. Jedes Orthonormalsystem in einem separablen Hilbertraum ist hochstensabzahlbar: Ist ei : i ∈ I ein Orthonormalsystem, so gilt nach Pythagoras‖ei − ej‖ =

√‖ei‖2 + ‖ej‖2 =

√2 fur i 6= j. Daraus folgt die Behauptung

ahnlich wie im Beweis der Nicht-Separabilitat von l∞ (vgl. Satz 2.2.2).

Es ist leicht zu sehen, dass ein Orthonormalsystem linear unabhangig ist.Umgekehrt lasst sich jede hochstens abzahlbare linear unabhangige Menge ‘or-thonormalisieren’:

Satz 4.5.2 (Gram-Schmidtsches Orthonormalisierungsverfahren) Es seiH ein Prahilbertraum und I = N oder I = 1, . . . , N, N ∈ N. Ist xn : n ∈ I ⊂H linear unabhangig, dann existiert ein Orthonormalsystem en : n ∈ I ⊂ Hmit linxn : n ∈ I = linen : n ∈ I.

83

Beweis. Wir konstruieren en induktiv. Fur n = 1 setze e1 = x1‖x1‖ , so dass Ke1 =

Kx1 gilt. Ist n ≥ 2, so definieren wir

en :=xn −

∑n−1k=1〈xn, ek〉ek

‖xn −∑n−1

k=1〈xn, ek〉ek‖.

Induktiv ergibt sich en ∈ linx1, . . . , xn fur alle n und damit insbesondere, dassder Nenner in der Definition von en nicht verschwindet. Umgekehrt folgt aus dieserFormel direkt xn ∈ line1, . . . , en fur alle n. Damit ist linxn : n ∈ I = linxn :n ∈ I gezeigt. Offenbar ist außerdem ‖en‖ = 1 fur alle n. Die Orthogonalitatfolgt induktiv: Ist e1, . . . , en−1 ein Orthogonalsystem, so wegen⟨

xn −n−1∑k=1

〈xn, ek〉ek, em⟩

= 〈xn, em〉 −n−1∑k=1

〈xn, ek〉δkm = 0

fur alle m ∈ 1, . . . , n− 1 auch e1, . . . , en.

Satz 4.5.3 (Besselsche Ungleichung) Es seien H ein Prahilbertraum und I =N oder I = 1, . . . , N, N ∈ N. Ist en : n ∈ I ⊂ H ein Orthonormalsystemund x ∈ H, so ist ∑

n∈I

|〈x, en〉|2 ≤ ‖x‖2.

Beweis. Fur n ∈ I ist x −∑n

k=1〈x, ek〉ek ⊥ e1, . . . , en. Aus dem Satz vonPythagoras folgt also

‖x‖2 =

∥∥∥∥x− n∑k=1

〈x, ek〉ek∥∥∥∥2

+n∑k=1

‖〈x, ek〉ek‖2

≥n∑k=1

‖〈x, ek〉ek‖2 =n∑k=1

|〈x, ek〉|2.

Da n ∈ I beliebig war, folgt die Behauptung.

Wir konzentrieren uns von nun an auf Hilbertraume. Eine wichtige Konse-quenz aus der Besselschen Ungleichung ist, dass sich mit ihrer Hilfe eine besonderseinfache Darstellungsformel fur Orthogonalprojektionen gewinnen lasst.

Satz 4.5.4 Es seien H ein Hilbertraum und ei : i ∈ I mit I = N oder I =1, . . . , N, N ∈ N, ein Orthonormalsystem. Fur jedes x ∈ H konvergiert dieReihe

∑i∈I〈x, ei〉ei. Die Abbildung x 7→

∑i∈I〈x, ei〉ei ist gerade die orthogonale

Projektion von H auf linei : i ∈ I.

84

Beweis. Die Konvergenz der Reihe ist nur im Fall I = N zu uberprufen. Nach demSatz von Pythagoras und der Besselschen Ungleichung gilt dann fur m,n ∈ N,m < n, ∥∥∥∥ n∑

k=m+1

〈x, ek〉ek∥∥∥∥2

=n∑

k=m+1

|〈x, ek〉|2 → 0

mitm,n→∞, so dass die Partialsummen eine Cauchy-Folge bilden,∑∞

k=1〈x, ek〉ekalso konvergiert.

Des Weiteren ist sicherlich∑∞

k=1〈x, ek〉ek ∈ linei : i ∈ I und zudem⟨x−

∑k∈I

〈x, ek〉ek, en⟩

= 〈x, en〉 −∑k∈I

〈x, ek〉δkn = 0

fur alle n ∈ I, also x −∑∞

k=1〈x, ek〉ek ∈ ei : i ∈ I⊥ = linei : i ∈ I⊥

. Diezweite Behauptung folgt demnach aus Satz 4.2.5.

Besondere Bedeutung kommt – wie wir gleich sehen werden – den maximalenOrthonormalsystemen zu:

Definition 4.5.5 Ein maximales Orthonormalsystem in einem Hilbertraum (al-so ein solches, das nicht in einem echt großeren enthalten ist) heißt Orthonormal-basis (oder auch vollstandiges Orthonormalsystem).

Wir geben nun eine ganze Reihe von Charakterisierungen einer Orthonor-malbasis an. Besonders hervorzuheben ist die Darstellungsformel aus (iv): DieElemente eines Hilbertraums lassen sich in eine Orthonormalbasis entwickeln,wobei sich die Koeffizienten ganz einfach durch das Skalarprodukt ausdruckenlassen.

Satz 4.5.6 Es seien H ein separabler Hilbertraum und S = ei : i ∈ I mitI = N oder I = 1, . . . , N, N ∈ N, ein Orthonormalsystem. Dann sind diefolgenden Bedingungen aquivalent:

(i) S ist eine Orthonormalbasis.

(ii) Fur alle x ∈ H gilt x ⊥ S =⇒ x = 0. (M.a.W.: S⊥ = 0.)

(iii) H = linS.

(iv) Darstellungsformel: Fur alle x ∈ H gilt x =∑

i∈I〈x, ei〉ei.

(v) Parsevalsche Gleichung: Fur alle x, y ∈ H gilt 〈x, y〉 =∑

i∈I〈x, ei〉〈ei, y〉.

(vi) Vollstandigkeitsrelation: Fur alle x ∈ H gilt ‖x‖2 =∑

i∈I |〈x, ei〉|2.

85

Beweis. (i) =⇒ (ii): Gabe es ein x 6= 0 mit x ⊥ S, so ware S∪ x‖x‖ ein großeres

Orthonormalsystem als S.(ii) =⇒ (iii): Nach Korollar 4.2.7 ist linS = S⊥⊥ = 0⊥ = H.(iii) =⇒ (iv): Klar nach Satz 4.5.4.(iv) =⇒ (v): 〈x, y〉 = 〈

∑i∈I〈x, ei〉ei, y〉 =

∑i∈I〈x, ei〉〈ei, y〉.

(v) =⇒ (vi): Klar: Setze y = x.(vi) =⇒ (i): Gabe es ein großeres Orthonormalsystem S ′ ) S, so ergabe sich

fur x ∈ S ′ \ S der Widerspruch

1 = ‖x‖2 =∑i∈I

|〈x, ei〉|2 = 0.

Bemerkung: Außer fur dimH < ∞ ist eine Orthonormalbasis keine Vektor-raumbasis.

Beispiele:

1. In l2 ist e(n) : n ∈ N eine Orthonormalbasis. (Klar!)

2. Jedes Orthonormalsystem S ist Orthonormalbasis von linS.

3. In L2((−π, π);C) ist 1√2πeik· : k ∈ Z eine Orthonormalbasis: Aus der

Analysis wissen wir ja, dass sich jede Funktion aus L2((−π, π);C) in ei-ne Fourier-Reihe entwickeln lasst. Aus funktionalanalytischer Sicht ist die(L2-)Theorie der Fourier-Reihen also nichts anderes als die Entwicklung vonFunktionen in eine (ganz besondere) Orthomormalbasis.

4. Allgemeiner ist in mehreren Dimensionen x 7→ 1(2R)n/2

eiπk·x/R : k ∈ Zneine Orthonormalbasis von L2((−R,R)n;C) fur jedes R > 0. Dass es sichum ein Orthonormalsystem handelt, lasst sich einfach nachrechnen. DieVollstandigkeit folgt aus dem maßtheoretischen Resultat, dass die lineareHulle von Funktionen der Form f(x) = f1(x1) · . . . · fn(xn) fur f1, . . . , fn ∈L2((−R,R);C) dicht in L2((−R,R)n;C) liegt. (Man darf die f1, . . . , fn so-gar als Indikatorfunktionen wahlen.) Uberlegen Sie sich das!

5. Man definiert den Sobolevraum der periodischen H1-Funktionen durch

H1per((−R,R)n;C) = C∞per((−R,R)n;C)

H1

,

mit C∞per((−R,R)n;C) = u|(−R,R)n : u ∈ C∞(Rn,C) mit u(· + 2Rz) =u ∀ z ∈ Zn.Ist f ∈ L2((−R,R)n;C), so konnen wir nach dem vorigen Beispiel

f(x) =1

(2R)n/2

∑k∈Zn

akeiπk·x/R

86

fur geeignete Fourierkoeffizienten ak schreiben. Es gilt dann

f ∈ H1per((−R,R)n;C) ⇐⇒

∑k∈Zn

(1 + |k|2)|ak|2 <∞,

wobei die rechte Seite eine zurH1-Norm aquivalente Norm aufH1per((−R,R)n;C)

definiert, denn fur f ∈ H1per((−R,R)n;C) gilt

c‖f‖H1 ≤∑k∈Zn

(1 + |k|2)|ak|2 ≤ C‖f‖H1 .

mit geeigneten Konstanten c, C > 0. (Ubung!)

6. Ein weiteres prominentes Beispiel, insbesondere fur Anwendungen in derBildverarbeitung, ist die sogenannte Haar-Basis von L2(0, 1): Man setzt

ψ(t) =

1 fur 0 ≤ t < 1

2,

−1 fur 12≤ t < 1,

0 sonst,

und definiert dann fur n ∈ N und k = 0, 1, . . . , 2n− 1 die verschobenen undskalierten Funktionen

ψn,k(t) = 2n/2ψ(2nt− k).

Dann bildet ψn,k : n ∈ N, k = 0, 1, . . . , 2n − 1 eine Orthonormalbasis vonL2(0, 1). (Ubung!)

(Man nennt diese Funktionen auch Haar-Wavelets.)

7. Unter anderem in der Quantenmechanik sind die Hermiteschen Funktionenhn : R→ R, n ∈ N0, von Bedeutung. Sie sind definiert als

hn(x) =1√

2nn!√πHn(x)e−

x2

2 ,

wobei

Hn(x) = (−1)nex2 dn

dxne−x

2

das n-te Hermite-Polynom bezeichnet. hn : n ∈ N0 bildet eine Orthonor-malbasis von L2(R). (Ubung!)

Satz 4.5.7 Jeder separable Hilbertraum H besitzt eine (hochstens abzahlbare)Orthonormalbasis.

87

Beweis. Es sei x1, x2, . . . ⊂ H mit H = linx1, x2, . . .. Indem wir sukzessiveall diejenigen Elemente entfernen, die linear abhangig zu den fruheren Elemen-ten sind, durfen wir o.B.d.A. annehmen, dass diese Menge linear unabhangig ist.Nach dem Gram-Schmidtschen Orthonormalisierungsverfahren gibt es Orthonor-malsystem e1, e2, . . . mit

line1, e2, . . . = linx1, x2, . . . = H,

so dass die Behauptung aus Satz 4.5.6(iii) folgt.

Bemerkung: Mit dem Zornschen Lemma lasst sich zeigen, dass jeder Hilbert-raum eine Orthonormalbasis besitzt. Aus Satz 4.5.6(iii) ergibt sich, dass die se-parablen Hilbertraume gerade diejenigen mit einer hochstens abzahlbaren Ortho-normalbasis sind.

Korollar 4.5.8 (i) Jeder separable unendlichdimensionale Hilbertraum ist iso-metrisch isomorph zu l2.

(ii) Jeder Hilbertraum der Dimension n < ∞ ist isometrisch isomorph zu Kn

mit dem euklidischen Skalarprodukt.

Beweis. Ist ei : i ∈ I eine Orthonormalbasis eines separablen Hilbertraums H,so ist

T : H →

l2, x 7→ (〈x, e1〉, 〈x, e2〉, . . .), falls I = N,Kn, x 7→ (〈x, e1〉, . . . , 〈x, en〉), falls #I = n <∞,

ein isometrischer Isomorphismus: Nach der Besselschen Ungleichung ist T wohl-definiert. T ist außerdem offenbar linear und nach der Vollstandigkeitsrelation aus4.5.6 isometrisch, insbesondere injektiv. Die Surjektivitat schließlich folgt daraus,dass fur (ak) ∈ l2 bzw. Kn die Reihe

x =∞∑k=1

akek

konvergiert. (Das ist klar, wenn I endlich ist. Fur I = N folgt es wie im Beweisvon Satz 4.5.4 aus dem Satz des Pythagoras angewandt auf die Partialsummen.)Wegen 〈x, em〉 =

∑∞k=1 ak〈ek, em〉 = am fur alle m ∈ N ist tatsachlich Tx = (ak).

Bemerkung: Im nicht-separablen Fall gelten zu Satz 4.5.6 analoge Ergebnissefur Orthonormalbasen ei : i ∈ I. Die wesentliche Beobachtung hierbei ist, dass〈x, ei〉 6= 0 nur fur hochstens abzahlbar viele i auftreten kann. Man muss sichdann noch zusatzlich uberlegen, dass alle auftretenden Summen nicht von derAnordnung dieser Indizes abhangen. In Analogie zu Korollar 4.5.8 gilt in diesemFalle H ∼= l2(I).

88

4.6 Operatoren auf Hilbertraumen

Wir untersuchen nun Operatoren auf Hilbertraumen. Naturlich gelten alle zu-vor bewiesenen Tatsachen uber Operatoren auf Banachraumen insbesondere furHilbertraume. Ein neues Phanomen ergibt sich allerdings aus dem RieszschenDarstellungssatz durch die Moglichkeit, einen Hilbertraum mit seinem Dualraumzu identifizieren. Hierdurch lasst sich jedem Operator ein adjungierter Operatorzuordnen, der wieder auf dem ursprunglichen Hilbertraum definiert ist.

Definition und Satz 4.6.1 Sind H1, H2 Hilbertraume uber K und T ∈ L(H1;H2),so wird durch

〈Tx, y〉H2 = 〈x, T ∗y〉H1 ∀x ∈ H1 ∀ y ∈ H2

der zu T Hilbertraum-adjungierte Operator T ∗ ∈ L(H2;H1) definiert.

Beweis. Fur jedes y ∈ H2 ist die Abbildung x 7→ 〈Tx, y〉H2 ein Funktional aufH1, so dass es nach dem Rieszschen Darstellungssatz ein eindeutiges T ∗y ∈ H1

mit〈Tx, y〉H2 = 〈x, T ∗y〉H1 ∀x ∈ H1 ∀ y ∈ H2

gibt. Es ist leicht zu sehen, dass T ∗ in der Tat linear ist. Die Stetigkeit von T ∗

folgt aus der Abschatzung

‖T ∗y‖2H1 = 〈T ∗y, T ∗y〉H1 = 〈TT ∗y, y〉H2

≤ ‖TT ∗y‖H2‖y‖H2 ≤ ‖T‖L(H1;H2)‖T ∗y‖H2‖y‖H2 ,

aus der sich ‖T ∗y‖H1 ≤ ‖T‖L(H1;H2)‖y‖H2 (und damit ‖T ∗‖L(H2;H1) ≤ ‖T‖L(H1;H2))ergibt.

Allgemeiner werden wir spater zu Operatoren T ∈ L(X;Y ) fur allgemeinenormierte Raume X, Y einen adjungierten Operator T ′ definieren. Dieser wirddann jedoch den Dualraum von Y in den Dualraum von X abbilden. Wenn keineVerwechslung zu befurchten ist, nennt man aber auch T ∗ einfach den adjungiertenOperator von T .

Wir halten zunachst einige elementare Eigenschaften fest:

Satz 4.6.2 Es seien H,H1, H2, H3 Hilbertraume.

(i) Die Abbildung L(H1;H2) → L(H2;H1), T 7→ T ∗ ist konjugiert linear undisometrisch.

(ii) Fur T ∈ L(H1;H2) und S ∈ L(H2;H3) gilt (ST )∗ = T ∗S∗.

(iii) Fur T ∈ L(H1;H2) ist T ∗∗ = T .

(iv) Fur T ∈ L(H1;H2) ist kerT = T ∗(H2)⊥ und kerT ∗ = T (H1)⊥.

89

Beweis. (i) Die konjugierte Linearitat ist einfach zu sehen. Im Beweis von De-finition und Satz 4.6.1 haben außerdem bereits ‖T ∗‖L(H2;H1) ≤ ‖T‖L(H1;H2) furalle T ∈ L(H1;H2) gesehen. Mit (iii) folgt hieraus dann auch die umgekehrteUngleichung

‖T‖L(H1;H2) = ‖T ∗∗‖L(H1;H2) ≤ ‖T ∗‖L(H2;H1).

(ii) Dies folgt aus

〈STx, y〉H3 = 〈Tx, S∗y〉H2 = 〈x, T ∗S∗y〉H1

fur alle x ∈ H1, y ∈ H3.(iii) Das ergibt sich aus

〈Tx, y〉H2 = 〈x, T ∗y〉H1 = 〈T ∗y, x〉H1 = 〈y, T ∗∗x〉H2 = 〈T ∗∗x, y〉H2

fur alle x ∈ H1, y ∈ H2.(iv) Das folgt durch direktes Nachrechnen. (Ubung!)

Als besonders gutartig stellen sich die sogenannten selbstadjungierten Ope-ratoren heraus. Sie spielen auch in den Anwendungen, insbesondere etwa in derQuantenmechanik, eine zentrale Rolle. Etwas allgemeiner untersuchen wir auchnormale Operatoren.

Definition 4.6.3 Es seien H ein Hilbertraum und T ∈ L(H).

(i) T heißt normal, wenn T und T ∗ kommutieren: TT ∗ = T ∗T .

(ii) T heißt selbstadjungiert, wenn T = T ∗ gilt.

Naturlich sind selbstadjungierte Operatoren normal. Das folgende Lemma gibteine Umformulierung der Normalitat an:

Lemma 4.6.4 Es sei H ein Hilbertraum, T ∈ L(H). T ist normal genau dann,wenn

〈Tx, Ty〉 = 〈T ∗x, T ∗y〉 ∀x, y ∈ Hgilt oder – aquivalent dazu –

‖Tx‖ = ‖T ∗x‖ ∀x ∈ H.

Beweis. Wegen 〈Tx, Ty〉 = 〈x, T ∗Ty〉 und 〈T ∗x, T ∗y〉 = 〈x, TT ∗y〉 fur x, y ∈ Hist T genau dann normal, wenn 〈Tx, Ty〉 = 〈T ∗x, T ∗y〉 fur alle x, y ∈ H erfulltist. Mit Hilfe der Polarisierungsidentitat sieht man nun, dass diese Bedingung zu‖Tx‖ = ‖T ∗x‖ fur alle x ∈ H aquivalent ist.

Es ist leicht zu sehen, dass ein Operator T ∈ L(H) auf einem Hilbertraum Hgenau dann selbstadjungiert ist, wenn

〈x, Ty〉 = 〈Tx, y〉 ∀x, y ∈ H

erfullt ist. Tatsachlich folgt aus dieser Symmetriebedingung schon automatischdie Stetigkeit von T :

90

Satz 4.6.5 (Satz von Hellinger-Toeplitz) Es seien H ein Hilbertraum undT : H → H eine lineare Abbildung. Genau dann ist T ein selbstadjungierterOperator, wenn gilt

〈x, Ty〉 = 〈Tx, y〉 ∀x, y ∈ H.

Beweis. Nur dass aus dieser Symmetriebedingung schon die Stetigkeit von Tfolgt, ist nicht offensichtlich. Nach dem Satz 3.2.13 vom abgeschlossenen Graphengenugt es zu zeigen, dass graphT abgeschlossen ist. Dies aber ist in der Tat derFall, denn aus xn → x und Txn → y in H, folgt

〈y − Tx, y − Tx〉 = limn→∞〈Txn − Tx, y − Tx〉 = lim

n→∞〈xn − x, T (y − Tx)〉 = 0,

also y = Tx.

Beispiele:

1. Es sei T ∈ L(Kn) eine lineare Abbildung auf Kn mit dem euklidischen Ska-larprodukt, die bezuglich der Standardbasis durch die Matrix A beschriebenwird. T ist selbstadjungiert genau dann, wenn A symmetrisch (falls K = R)bzw. hermitesch (falls K = C) ist.

2. Orthogonalprojektionen P auf abgeschlossene Unterraume sind selbstad-jungiert:

〈x, Py〉 = 〈x+ (Px− x)︸ ︷︷ ︸⊥P (H)

, Py〉 = 〈Px, Py〉

= 〈Px, Py + (y − Py)︸ ︷︷ ︸⊥P (H)

〉 = 〈Px, y〉.

3. Fur k ∈ L2([a, b]2) wird durch

Tkf(s) :=

∫ b

a

k(s, t)f(t) dt

fur f ∈ L2([a, b]) ein Operator Tk ∈ L(L2([a, b])) definiert (Ubung! Tipp:Satz von Fubini).

Fur f, g ∈ L2([a, b]) ist dann nach dem Satz von Fubini∫ b

a

g(s)Tkf(s) ds =

∫ b

a

g(s)

∫ b

a

k(s, t)f(t) dt ds

=

∫ b

a

(∫ b

a

k(s, t)g(s) ds

)f(t) dt =

∫ b

a

Tk∗g(t) f(t) dt,

wenn k∗ die Abbildung k∗(s, t) = k(t, s) bezeichnet. Dies zeigt, dass T ∗k =

Tk∗ ist. Insbesondere ist T selbstadjungiert, wenn k(s, t) = k(t, s) gilt.

91

Naturlich gilt fur einen selbstadjungierten Operator T auf einem HilbertraumH immer 〈Tx, x〉 = 〈x, Tx〉 ∈ R fur x ∈ H. Wir bemerken nun noch, dass sichdie Operatornorm ‖T‖ durch diese Großen ausdrucken lasst.

Satz 4.6.6 Es seien H ein Hilbertraum und T ∈ L(H) selbstadjungiert. Danngilt

‖T‖ = sup‖x‖≤1

|〈Tx, x〉|.

Beweis. Offenbar ist sup‖x‖≤1 |〈Tx, x〉| ≤ sup‖x‖≤1 ‖Tx‖‖x‖ = ‖T‖. Indem man

λBH

1 = BH

1 fur |λ| = 1 beachtet, folgt die umgekehrte Richtung aus

‖T‖ = sup‖x‖≤1

‖Tx‖ = sup‖x‖≤1

∣∣∣⟨Tx, Tx

‖Tx‖

⟩∣∣∣≤ sup‖x‖,‖y‖≤1

|〈Tx, y〉| = sup‖x‖,‖y‖≤1

Re 〈Tx, y〉

=1

4sup

‖x‖,‖y‖≤1

(〈T (x+ y), x+ y〉︸ ︷︷ ︸≤ sup‖z‖≤1

〈Tz,z〉‖x+y‖2

−〈T (x− y), x− y〉︸ ︷︷ ︸≥ inf‖z‖≤1

〈Tz,z〉‖x−y‖2

)

≤ 1

4sup‖z‖≤1

|〈Tz, z〉| sup‖x‖,‖y‖≤1

(‖x+ y‖2 + ‖x− y‖2)

=1

4sup‖z‖≤1

|〈Tz, z〉| sup‖x‖,‖y‖≤1

(2‖x‖2 + 2‖y‖2)

= sup‖z‖≤1

|〈Tz, z〉|,

wobei wir im vorletzten Schritt die Parallelogrammgleichung verwendet haben.

Bemerkung. Offensichtlich gilt fur diese T dann auch

‖T‖ = sup‖x‖≤1

|〈Tx, x〉| = sup‖x‖=1

|〈Tx, x〉| = sup‖x‖<1

|〈Tx, x〉|.

Eine weitere wichtige Klasse bilden die sogenannten unitaren Operatoren:

Definition 4.6.7 Es seien H1, H2 Hilbertraume. T ∈ L(H1, H2) heißt unitar,wenn T invertierbar mit T−1 = T ∗ ist.

Naturlich ist fur H1 = H2 ein unitarer Operator T : H1 → H2 normal.

Lemma 4.6.8 Es seien H1, H2 Hilbertraume und T ∈ L(H1, H2). Die folgendenBedingungen sind aquivalent.

(i) T ist unitar.

92

(ii) T ist ein isometrischer Isomorphismus.

(iii) T ist surjektiv mit

〈Tx, Ty〉 = 〈x, y〉 ∀x, y ∈ H1.

Beweis. (i) =⇒ (ii): Nach Voraussetzung ist T ein Isomorphismus. Außerdemist ‖Tx‖2 = 〈Tx, Tx〉 = 〈x, T ∗Tx〉 = 〈x, x〉 = ‖x‖2 fur alle x ∈ H1.

(ii) =⇒ (iii): Die Surjektivitat ist klar. Mit Hilfe der Polarisierungsgleichungergibt sich 〈Tx, Ty〉 = 〈x, y〉 fur alle x, y ∈ H1 aus 〈Tx, Tx〉 = 〈x, x〉 fur allex ∈ H1.

(iii) =⇒ (i): Indem man x = y setzt, sieht man, dass T isometrisch und alsoauch injektiv ist. Aus der Bijektivitat und

〈x, T ∗Ty〉 = 〈Tx, Ty〉 = 〈x, y〉,

also T ∗T = Id, folgt dann auch T ∗ = T−1.

93

Kapitel 5

Dualitat

In diesem Kapitel untersuchen wir Funktionale auf normierten Raumen und da-mit den Dualraum, den sie bilden. Wie der Name schon sagt, sind Funktionalein der Funktionalanalysis das wesentliche Instrument, um Eigenschaften von nor-mierten Raumen zu untersuchen.

5.1 Der Dualraum

Wir erinnern zunachst an die Definition 3.1.1 und den Satz 3.1.5, wonach derDualraum X ′ eines normierten Raums X selbst durch

‖x′‖ := sup‖x‖≤1

|x′(x)| fur x′ ∈ X ′

zu einem normierten Raum wird, der, da K vollstandig ist, sogar ein Banachraumist.

Wir beginnen damit, die Dualraume einiger uns mittlerweile wohlbekannternormierter Raume zu charakterisieren.

Folgenraume

Satz 5.1.1 Fur 1 ≤ p <∞ ist(lp)′ ∼= lq

mit 1p

+ 1q

= 1 ( 1∞ := 0) und ein isometrischer Isomorphismus ist gegeben durch

T : lq → (lp)′, (Ty)x =∞∑n=1

xnyn.

Achtung! Es ist (l∞)′ 6∼= l1. Der Satz stimmt also nicht fur p =∞.

Beweis. Dass durch diese Vorschrift fur jedes y ∈ lq ein Funktional Ty auf lp

definiert wird mit ‖y‖q = ‖Ty‖(lp)′ , folgt aus Beispiel 11 von Seite 49. Offenbar

94

ist T zudem linear, so dass nur noch nachgewiesen werden muss, dass T auchsurjektiv ist.

Sei also x′ ∈ (lp)′. Definiere dann y = (yn) durch yn = x′(e(n)). Wir zeigenzunachst, dass dann y ∈ lq gilt: Fur N ∈ N ergibt sich im Fall p > 1∑

1≤n≤N

|yn|q =∑

1≤n≤Nyn 6=0

|yn|q =∑

1≤n≤Nyn 6=0

|yn|q

ynyn =

∑1≤n≤Nyn 6=0

|yn|q

ynx′(e(n))

= x′( ∑

1≤n≤Nyn 6=0

|yn|q

yne(n)

)≤ ‖x′‖

∥∥∥∥ ∑1≤n≤Nyn 6=0

|yn|q

yne(n)

∥∥∥∥p

= ‖x′‖( ∑

1≤n≤N

|yn|(q−1)p

) 1p

= ‖x′‖( ∑

1≤n≤N

|yn|q) 1

p

.

(Beachte (q − 1)p = q.) Dann aber ist( ∑1≤n≤N

|yn|q) 1

q

=

( ∑1≤n≤N

|yn|q)1− 1

p

≤ ‖x′‖

und durch den Grenzubergang N → ∞ ergibt sich ‖y‖q ≤ ‖x′‖ < ∞. Im Fallp = 1 erhalt man dies einfach aus

supn∈N|yn| = sup

n∈N|x′(e(n))| ≤ ‖x′‖ sup

n∈N‖e(n)‖1 = ‖x′‖.

Es gilt also y ∈ lq. Wegen (Ty)e(n) = yn = x′(e(n)) ist außerdem Ty = x′ aufline1, e2, . . . und damit Ty = x′ nach Satz 3.1.7. T ist also tatsachlich surjektiv.

Satz 5.1.2 Es gilt c′0∼= l1, wobei ein isometrischer Isomorphismus wieder gege-

ben ist durch

T : l1 → c′0, (Ty)x =∞∑n=1

xnyn.

Beweis. Wegen c0 ⊂ l∞ ergibt sich aus Beispiel 11 von Seite 49 wieder, dassT ∈ L(l1; c0)′ ist und wegen |(Ty)x| ≤ ‖y‖1‖x‖∞ die Abschatzung ‖Ty‖ ≤ ‖y‖1

erfullt. Definiert man zu gegebenem x′ ∈ c′0 wie oben y = (yn) durch yn = x′(en),so folgt fur N ∈ N∑

1≤n≤N

|yn| =∑

1≤n≤Nyn 6=0

|yn|yn

yn = x′( ∑

1≤n≤Nyn 6=0

|yn|yn

en

)

≤ ‖x′‖∥∥∥∥ ∑

1≤n≤Nyn 6=0

|yn|yn

en

∥∥∥∥∞≤ ‖x′‖.

95

Mit N → ∞ impliziert dies ‖y‖1 ≤ ‖x′‖, woraus wie in 1. wieder die Surjekti-vitat folgt. Daruber hinaus zeigt diese Rechnung auch ‖y‖1 ≤ ‖Ty‖, so dass Ttatsachlich eine Isometrie (und insbesondere injektiv) ist.

Korollar 5.1.3 Es gilt d′ ∼= l1, wobei ein isometrischer Isomorphismus wiedergegeben ist durch

T : l1 → d′, (Ty)x =∞∑n=1

xnyn.

Beweis. Das folgt sofort aus Satz 5.1.2. Da d dicht in c0 liegt, lasst sich nach Satz3.1.7 namlich jedes Funktional eindeutig und normgleich zu einem Funktional aufc0 fortsetzen.

Lp-Raume

Allgemeiner gilt fur Lp-Raume im Falle 1 ≤ p <∞:

Satz 5.1.4 Ist (Ω,A, µ) ein σ-endlicher Maßraum, so ist durch

Lq(Ω,A, µ)→ (Lp(Ω,A, µ))′, (Tg)f =

∫Ω

fg dµ

mit 1p

+ 1q

= 1 ( 1∞ := 0) ein isometrischer Isomorphismus gegeben.

Bemerkung. Fur 1 < p < ∞ kann man auf die Voraussetzung, dass (Ω,A, µ)σ-endlich ist, verzichten, s. z.B. [Al].

Beweis. Wir wissen bereits aus Beispiel 10 von Seite 49, dass fur g ∈ Lq(µ) durchTg ein Funktional auf Lp(µ) mit ‖Tg‖ = ‖g‖Lq gegeben ist. Offensichtlich istT linear, so dass nur noch zu zeigen bleibt, dass T auch surjektiv ist. Sei alsoy′ ∈ (Lp(µ)′.

1. Wir nehmen zunachst an, dass µ endlich ist. Dann ist χA ∈ Lp(µ) fur jedesA ∈ A und wir konnen die Abbildung

ν : A → K, ν(A) = y′(χA)

betrachten. Offensichtlich ist ν additiv, denn ν(A ∪ A′) = y′(χA∪A′) = y′(χA +χA′) = ν(A) + ν(A′) fur A ∩ A′ = ∅. Tatsachlich ist ν sogar σ-additiv, denn furpaarweise disjunkte A1, A2, . . . ∈ A ist

ν( ⋃n∈N

An

)= y′(χ⋃

n∈N An) = y′

(∑n∈N

χAn

)=∑n∈N

y′(χAn) =∑n∈N

ν(An),

96

wobei wir ausgenutzt haben, dass∑

n∈N χAn = χ⋃n∈N An

in Lp(µ) gilt, was aus

limN→∞

∥∥∥ ∞∑n=N+1

χAn

∥∥∥pLp

= limN→∞

∫Ω

χ⋃∞n=N+1 An

dµ = 0

nach dem Satz von der majorisierten Konvergenz (mit Majorante 1) folgt. (Hiergeht die Voraussetzung p <∞ ein.)

ν ist also ein signiertes bzw. komplexes Maß. Offenbar ist dabei ν µ, dennµ(A) = 0 impliziert χA = 0 in Lp(µ) und damit ν(A) = y′(χA) = 0. Nach demSatz 4.3.3 von Radon-Nikodym gibt es also ein g ∈ L1(µ) mit

y′(χA) = ν(A) =

∫A

g dµ =

∫χA g dµ

fur alle A ∈ A. Dies gilt dann auch fur Linearkombinationen von charakteristi-schen Funktionen, so dass wir

y′(f) =

∫fg dµ ∀ f ∈ linχA : A ∈ A

bekommen. Verwenden wir nun noch die maßtheoretische Tatsache, dass linχA :A ∈ A dicht liegt in L∞(µ), so erhalten wir sogar

y′(f) =

∫fg dµ ∀ f ∈ L∞(µ),

denn die Ausdrucke beider Seiten dieser Gleichung sind stetig in f ∈ L∞(µ):|y′(f)| ≤ ‖y′‖ ‖f‖Lq ≤ C‖y′‖ ‖f‖L∞ und |

∫Ωfg dµ| ≤ ‖g‖L1‖f‖L∞ .

2. Wir mussen nun noch zeigen, dass g ∈ Lq(µ) ist. Dann gilt insbesondere

y′(f) =

∫fg dµ ∀ f ∈ Lp(µ)

wieder aus Stetigkeitsgrunden. Dies geht analog zum Beweis von Satz 5.1.1Es sei zunachst p > 1 (also q <∞). Fur n ∈ N setze

An = x ∈ Ω : |g(x)| ≤ n und An = x ∈ Ω : 0 < |g(x)| ≤ n.

Wir berechnen dann∫An

|g|q dµ =

∫An

|g|q dµ =

∫An

|g|q

gg dµ = y′

(χAn|g|q

g

)≤ ‖y′‖

∥∥∥χAn |g|qg ∥∥∥Lp = ‖y′‖(∫

An

|g|(q−1)p dµ

) 1p

= ‖y′‖(∫

An

|g|q dµ) 1

p

,

97

denn (q − 1)p = q. Es folgt(∫An

|g|q dµ) 1

q

=

(∫An

|g|q dµ)1− 1

p

≤ ‖y′‖.

Mit monotoner Konvergenz ergibt sich im Grenzwert n→∞ nun(∫Ω

|g|q dµ) 1

q

≤ ‖y′‖ <∞

und somit g ∈ Lq(µ).Ist andererseits p = 1 (und q =∞), so setzen wir A = x ∈ Ω : |g(x)| > ‖y′‖.

Ware nun µ(A) > 0, so hatten wir

‖y′‖µ(A) <

∫A

|g| dµ =

∫A

|g|gg dµ = y′

(χA|g|g

)≤ ‖y′‖

∥∥∥χA |g|g

∥∥∥L1

= ‖y′‖∫

Ω

∣∣∣χA |g|g

∣∣∣ dµ = ‖y′‖µ(A),

einen Widerspruch. Es gilt also |g| ≤ ‖y′‖ fast uberall und somit g ∈ L∞(µ).

3. Es sei nun µ nur noch als σ-additiv vorausgesetzt. Fur jedes B ∈ Amit µ(B) < ∞ betrachten wir das endliche Maß µB und das Funktional y′B ∈(Lp(µB))′ gegeben durch

µB(A) = µ(A ∩B) ∀A ∈ A bzw. y′B(f) = y′(χBf) ∀ f ∈ Lp(µB).

Wegen |y′B(f)| ≤ ‖y′‖‖χBf‖Lp ≤ ‖y′‖‖f‖Lp ist dabei immer ‖y′B‖ ≤ ‖y′‖. Nachdem schon Gezeigten gibt es dann Funktionen gB ∈ Lq(µB) mit

y′B(f) =

∫Ω

fgB dµB =

∫B

fgB dµ, ‖gB‖Lq(µB) = ‖y′B‖

fur alle f ∈ Lp(µB). O.b.d.A. konnen wir dabei gB ≡ 0 auf Ω \B fordern, so dass

y′B(f) =

∫Ω

fgB dµ, ‖gB‖Lp(µ) = ‖y′B‖‖ ≤ ‖y′‖

gilt.Nach Voraussetzung gibt es nun paarweise disjunkte B1, B2, . . . ∈ A mit⋃

n∈NBn = Ω und µ(Bn) < ∞ fur jedes n. Beachte, dass fur jedes N ∈ Nund f ∈ Lp(µ) dann∫

f(gB1 + . . .+ gBN ) dµ = y′B1(f) + . . .+ y′BN (f)

= y′(χB1f + . . .+ χBNf) = y′⋃Nn=1Bn

(f) =

∫fg⋃N

n=1Bn

98

gilt, so dass insbesondere

gB1 + . . .+ gBN = g⋃Nn=1Bn

µ-f.u.

ist.Wir definieren nun g : Ω→ K durch

g(x) = gBn(x) fur x ∈ Bn.

Nach dem Satz von der monotonen Konvergenz ist dann∫Ω

|g|q dµ = limN→∞

∫Ω

N∑n=1

|gBn|q dµ = limN→∞

∫Ω

N∑n=1

|g⋃Nn=1Bn

|q dµ

= limN→∞

‖g⋃Nn=1Bn

‖qLq ≤ ‖y′‖q <∞

(beachte, dass die Bn paarweise disjunkt sind und gBn auf Ω \ Bn verschwindet)und fur alle f ∈ Lp(µ)∫

Ω

fg dµ =

∫Ω

∞∑n=1

fgBn dµ =∞∑n=1

∫Ω

fgBn dµ =∞∑n=1

y′(χBnf) = y′(f),

wobei wir im ersten Schritt den Satz von der majorisierten Konvergenz (mitMajorante |fg|) angewandt haben und im letzten Schritt

∑∞n=1 χBnf = f in

Lp(µ) benutzt haben, was sich wiederum aus dem Satz von der majorisiertenKonvergenz (mit Majorante |f |p) ergibt.

Stetige Funktionen und Maße

Es sei Ω ein metrischer Raum. Unser Ziel ist es, zumindest fur kompakte Ω denDualraum (C(Ω)′ des Raums der stetigen Funktionen auf Ω zu charakterisieren.Dazu benotigen wir zunachst eine maßtheoretische Vorbereitung.

Wir bezeichnen mit B(Ω) die σ-Algebra der Borelmengen auf Ω. Maße auf(Ω,B(Ω)) nennt man dann Borelmaße.

Definition 5.1.5 Ein positives Borelmaß µ heißt regular, wenn

(i) µ(K) <∞ fur alle kompakten K ⊂ Ω ist und

(ii) fur jede Borel-Menge A gilt

µ(A) = supµ(K) : K ⊂ A ist kompakt = infµ(U) : U ⊃ A ist offen.

Ein signiertes bzw. kopmplexes Borelmaß µ heißt regular, wenn |µ| regular ist.Der Raum der regularen Maße auf Ω wird mit Mreg(Ω) bezeichnet.

99

Bemerkung. Ist Ω ein vollstandiger metrischer Raum oder Ω ⊂ Rn offen, so istjedes Borelmaß auf Ω schon regular.

Satz 5.1.6 Es sei Ω ein kompakter metrischer Raum. Dann gilt C(Ω)′ ∼=Mreg(Ω).Ein isometrischer Isomorphismus gegeben ist durch

T :Mreg(Ω)→ C(Ω)′, (Tµ)f =

∫Ω

f dµ.

Beweis. S. z.B. [Al].

5.2 Der Satz von Hahn-Banach

Der grundlegende Satz, der all unseren Untersuchungen in diesem Kapitel zu-grunde liegt, ist der Satz von Hahn-Banach. Es gibt mehrere Versionen diesesSatzes, so dass es sich eigentlich um eine ganze “Satz-Familie” handelt.

Zur Vorbereitung benotigen wir noch eine Definition.

Definition 5.2.1 Es sei X ein K-Vektorraum. Eine Abbildung m : X → R heißtsublinear (oder Minkowski-Funktional), wenn gilt

(i) m(λx) = λm(x) fur alle x ∈ X, λ ≥ 0 (positive Homogenitat),

(ii) m(x+ y) ≤ m(x) +m(y) fur alle x, y ∈ X (Subadditivitat).

Beachte, dass der Wertebereich einer sublinearen Funktion immer R ist, selbstwenn K = C ist. Auch mussen sublineare Funktionen weder linear noch stetigsein (der Vektorraum, auf dem sie definiert sind, muss ja nicht einmal eine Normtragen). Trotzdem spricht man von Minkowski-Funktionalen.

Beispiel: Jede Halbnorm ist sublinear.

Der Kern aller Versionen des Satzes von Hahn-Banach ist ein Fortsetzungsre-sultat uber lineare Abbildungen, das mit Hilfe des Zornschen Lemmas1 bewiesenwird. Wir benutzen also das Auswahlaxiom. (Zur Aquivalenz des Zornschen Lem-mas und des Auswahlaxioms siehe z.B. Satz A.1.5 im Anhang.)

Satz 5.2.2 (Satz von Hahn-Banach) Es seien X ein R-Vektorraum und U ⊂X ein Unterraum. Des Weiteren seien m : X → R ein Minkowski-Funktional undϕ : U → R linear mit

ϕ(u) ≤ m(u) ∀u ∈ U.1Erinnerung: Das Zornsche Lemma besagt: Ist (M,≤) eine (partiell) geordnete nichtleere

Menge, so dass jede total geordnete Teilmenge (also A ⊂ M mit x ≤ y oder y ≤ x ∀x, y ∈ A)eine obere Schranke besitzt (also ein s ∈M mit x ≤ s ∀x ∈ A), dann besitzt M ein maximalesElement (also ein x ∈M mit x ≥ x =⇒ x = x).

100

Dann gibt es eine lineare Fortsetzung ϕ : X → R, die ebenfalls von m domi-niert wird:

ϕ(x) ≤ m(x) ∀x ∈ X und ϕ(u) = ϕ(u) ∀u ∈ U.

Beweis. Wir behandeln zunachst den Fall dimX/U = 1, d.h. X = U + Rx0 furein x0 ∈ X \ U . Fur jedes r ∈ R wird dann durch

ϕr(u+ λx0) = ϕ(u) + λr

eine lineare Fortsetzung von U auf X definiert. Es bleibt, r so zu wahlen, dassϕr ≤ m auf X ist.

Hierzu genugt es zu garantieren, dass fur alle u ∈ U die Ungleichung

ϕ(u) + λr ≤ m(u+ λx0),

die fur λ = 0 ja nach Voraussetzung gilt, fur λ = ±1 erfullt ist, denn dann ist

ϕ(u) + λr = |λ|(ϕ

(u

|λ|

)± r)≤ |λ|m

(u

|λ|± x0

)= m(u+ λx0)

auch fur die ubrigen λ.Diese beiden Ungleichungen nun sind zu

r ≤ m(u+ x0)− ϕ(u) und r ≥ ϕ(u)−m(u− x0) ∀u ∈ U

aquivalent. Ein solches r lasst sich aber finden, denn wegen

m(u1 + x0)− ϕ(u1)−(ϕ(u2)−m(u2 − x0)

)≥ m(u1 + u2)− ϕ(u1 + u2) ≥ 0

fur alle u1, u2 ∈ U ist

supu∈U

(ϕ(u)−m(u− x0)) ≤ infu∈U

(m(u+ x0)− ϕ(u)).

Der allgemeine Fall folgt nun durch ein Anwendung des Zornschen Lemmasauf die Menge

M =

(V, ψ) : V ist Unterraum mit U ⊂ V ⊂ X und

ψ : V → R ist linear mit ψ|U = ϕ und ψ ≤ m|V,

geordnet durch

(V, ψ) ≤ (V ′, ψ′) :⇐⇒ V ⊂ V ′ und ψ′|V = ψ.

(Wegen (U,ϕ) ∈ M ist M 6= ∅.) Ist nun (Vi, ψi) : i ∈ I eine total geordneteTeilmenge von M , so wird durch

V :=⋃i∈I

Vi, ψ(x) := ψi(x), wenn x ∈ Vi,

101

ein Vektorraum V und eine lineare Abbildung ψ : V → R wohldefiniert, die alleψi fortsetzt und immer noch von m dominiert wird. D.h. (V, ψ) ∈ M ist eineobere Schranke fur (Vi, ψi) : i ∈ I. Nach dem Zornschen Lemma besitzt nun Mein maximales Element (V , ϕ). Tatsachlich ist ϕ die gesuchte Fortsetzung auf X,denn ware V 6= X, so gabe es nach dem ersten Beweisteil eine von m dominierteFortsetzung auf V + Rx0 fur ein x0 ∈ X \ V im Widerspruch zur Maximalitatvon (V , ϕ).

Ist m sogar eine Halbnorm, so lasst sich dieses Ergebnis auch fur komple-xe Raume fomulieren. Dazu bemerken wir vorbereitend, dass naturlich jeder C-Vektorraum auch ein R-Vektorraum ist.

Satz 5.2.3 (Satz von Hahn-Banach) Es seien X ein K-Vektorraum und U ⊂X ein Unterraum. Des Weiteren seien p : X → [0,∞) eine Halbnorm und ϕ :U → K linear mit

|ϕ(u)| ≤ p(u) ∀u ∈ U.Dann gibt es eine lineare Fortsetzung ϕ : X → K, deren Betrag ebenfalls von pdominiert wird:

|ϕ(x)| ≤ p(x) ∀x ∈ X und ϕ(u) = ϕ(u) ∀u ∈ U.

Beweis. Der Fall K = R folgt direkt aus Satz 5.2.2, da mit ϕ(x) ≤ p(x) auch

−ϕ(x) = ϕ(−x) ≤ p(−x) = p(x)

fur alle x ∈ X ist.Sei nun K = C. Dann ist Reϕ : U → R eine R-lineare Abbildung auf U mit

Reϕ ≤ |ϕ| ≤ p|U . Indem wir U und X als R-Vektorraume auffassen, erhalten wiraus Satz 5.2.2 eine R-lineare Fortsetzung ψ : X → R mit ψ|U = Reϕ und ψ ≤ p.

Setzen wirϕ(x) = ψ(x)− iψ(ix),

so ist wegen ϕ(ix) = ψ(ix) − iψ(−x) = iϕ(x) die Abbildung ϕ : X → C sogarC-linear. ϕ aber ist eine Fortsetzung von ϕ, denn fur u ∈ U ist

ϕ(u) = ψ(u)− iψ(iu) = Reϕ(u)− iReϕ(iu)

= Reϕ(u)− iRe iϕ(u) = Reϕ(u) + i Imϕ(u) = ϕ(u).

Um schließlich |ϕ| ≤ p einzusehen, wahlen wir, zu gegebenem x ∈ X, λ ∈ C mit|λ| = 1, so dass λϕ(x) ≥ 0 ist. Dann ergibt sich

|ϕ(x)| = λϕ(x) = ϕ(λx) = ψ(λx) ≤ p(λx) = p(x).

Bemerkung. Es sei X ein C-Vektorraum. Wie gerade bemerkt ist dann fur jedeC-lineare Abbildung ϕ : X → C naturlich Reϕ : X → R eine R-lineare Funktion.

102

Umgekehrt zeigen die Argumente in diesem Beweis, dass sich jeder R-linearenAbbildung ψ : X → R durch die Vorschrift ψ(x) = ψ(x)− iψ(ix) eine C-lineareFunktion zuordnen lasst. Dabei gilt

Re ψ = ψ und Reϕ = ϕ.

Diese Operationen sind also invers zueinander. Offenbar ist dabei |Reϕ| ≤ |ϕ|.Ist p eine Halbnorm, so ergibt der letzte Beweisschritt außerdem |ψ| ≤ p =⇒|ψ| ≤ p. Es folgt

|ϕ| ≤ p ⇐⇒ |Reϕ| ≤ p.

Ist X normiert, so zeigt diese Aquivalenz angewandt auf die Halbnormen c‖ · ‖,c ≥ 0,

‖ϕ‖ = ‖Reϕ‖.

Eine unmittelbare Konsequenz ist die Fortsetzungsversion des Satzes vonHahn-Banach.

Korollar 5.2.4 (Satz von Hahn-Banach) Es seien X ein normierter Raumund U ein Unterraum. Dann gibt es zu jedem Funktional u′ ∈ U ′ eine normgleicheFortsetzung x′ ∈ X ′ zu einem Funktional auf X:

x′|U = u′ und ‖x′‖ = ‖u′‖.

Beweis. Nach Definition der Norm auf U ′ ist |u′(u)| ≤ ‖u′‖‖u‖ fur u ∈ U . Dap(x) := ‖u′‖‖x‖ eine Halbnorm definiert, gibt es nach Satz 5.2.3 eine Fortsetzungzu einer linearen Abbildung x : X → K mit

|x′(x)| ≤ p(x) = ‖u′‖‖x‖ ∀x ∈ X,

also ‖x′‖ ≤ ‖u′‖. Andererseits gilt, da x′ eine Fortsetzung von u′ ist, naturlich‖x′‖ = sup

x∈BX1

|x′(x)| ≥ supx∈BU1

|x′(x)| = ‖u′‖.

Beispiel: Ist U = c der Raum der konvergenten Folgen und X = l∞, so lasst sichdas Limesfunktional lim : c→ K, (xn) 7→ limxn zu einem Funktional L : l∞ → Kfortsetzen. L kann nicht von der Form L(x) =

∑∞n=1 xnyn fur eine Folge (yn) ∈ l1

sein: Wegen 0 = L(e(n)) = yn fur alle n ∈ N ergabe sich der Widerspruch L = 0.Dieses Beispiel zeigt insbesondere, dass der Dualraum von l∞ nicht in Analogie

zum Fall p < ∞ (vgl. Satz 5.1.1) mit l1 identifiziert werden kann. Wir werdenam Ende dieses Abschnitts sehen, dass l1 und (l∞)′ nicht isomorph sind.

Bemerkungen:

1. Fur Operatoren gilt ein solches Fortsetzungresultat im Allgemeinen nicht.Wann immer U ein nicht-komplementierter Unterraum von X ist (wie etwac0 in l∞, vgl. die Bemerkung von Seite 63), kann die Identitat auf U nicht zueinem Operator X → U fortgesetzt werden. Eine solche Fortsetzung wareja eine stetige lineare Projektion von X auf U .

103

2. Umgekehrt lasst sich nun mit dem Satz von Hahn-Banach zeigen, dassendlich-dimensionale Raume komplementiert sind: Es seien X ein normier-ter Raum und U ⊂ X ein Unterraum mit dimU <∞ und Basis u1, . . . , un.Mit u′1, . . . , u′n bezeichnen wir die duale Basis von U ′, so dass u′i(uj) = δijgilt. Setzt man nun die u′i zu Funktionalen x′i ∈ X ′ fort, erhalt man diestetige lineare Projektion

P : X → U, Px =n∑i=1

x′i(x)ui

von X auf U .

Korollar 5.2.5 Ist X ein normierter Raum und x ∈ X, x 6= 0, so gibt es einFunktional x′ ∈ X ′ mit

x′(x) = ‖x‖ und ‖x′‖ = 1.

Beweis. Fur U = Kx ist u′(λx) := λ‖x‖ ein Funktional in U ′ mit ‖u′‖ = 1,das nach Korollar 5.2.4 normgleich zum gesuchten Funktional auf X fortgesetztwerden kann.

Bemerkung: Das ist ein wichtiges Korollar aus dem Satz von Hahn-Banach: Zujedem x ∈ X gibt es ein Funktional (mit Norm 1), das die Norm von x ‘erkennt’. Apriori ist noch nicht einmal klar, dass uberhaupt von 0 verschiedene Funktionaleauf X existieren. Angewandt auf x = x1−x2 zeigt Korollar 5.2.5 jedoch, dass X ′

so reichhaltig ist, dass zu je zwei verschiedenen Punkten aus X ein Funktional x′

angegeben werden kann mit x′(x1) 6= x′(x2). Man sagt, X ′ sei punktetrennend.

Korollar 5.2.6 Ist X ein normierter Raum, so gilt

‖x‖ = supx′∈X′,‖x′‖=1

|x′(x)| = supx′∈X′,‖x′‖≤1

|x′(x)| = supx′∈X′,‖x′‖<1

|x′(x)| ∀x ∈ X,

wobei die ersten beiden Suprema angenommen werden.

Beweis. Die Gleichheit der letzten drei Terme folgt aus der positiven Homogenitatdes Betrags. Außerdem ist offenbar |x′(x)| ≤ ‖x′‖‖x‖ = ‖x‖ fur ‖x′‖ = 1, also‖x‖ ≥ sup x′∈X′,

‖x′‖=1

|x′(x)|. Die umgekehrte Ungleichung und dass die ersten beiden

Suprema tatsachlich Maxima sind, ergibt sich nun direkt aus Korollar 5.2.5.

Korollar 5.2.7 Es seien X ein normierter Raum und U ( X ein echter abge-schlossener Unterraum. Dann gibt es zu jedem x ∈ X \U ein Funktional x′ ∈ X ′mit ‖x′‖ = 1 und

x′|U ≡ 0 sowie x′(x) = inf‖x− u‖ : u ∈ U ( 6= 0).

104

Beweis. Es sei Φ : X → X/U die Quotientenabbildung x 7→ [x] := x + U . NachKorollar 5.2.5 gibt es ein Funktional ϕ ∈ (X/U)′ mit ‖ϕ‖ = 1 und ϕ([x]) =‖[x]‖ = inf‖x− u‖ : u ∈ U. Setze nun x′ = ϕ Φ. Dies erfullt offensichtlich die

letzten beiden geforderten Eigenschaften. Wegen Φ(BX1 ) = B

X/U1 ist außerdem

auch ‖x′‖ = 1.

Korollar 5.2.8 Es seien X ein normierter Raum und U ⊂ X ein Unterraum.U ist genau dann dicht in X, wenn fur alle x′ ∈ X ′ gilt

x′|U = 0 =⇒ x′ = 0.

Beweis. Die Notwendigkeit dieser Bedingung folgt aus Satz 3.1.7, die Hinlang-lichkeit aus Korollar 5.2.7 (angewandt auf U).

Mit der folgenden Definition, konnen wir dieses Korollar in einen allgemeine-ren Rahmen einbetten.

Definition 5.2.9 Es sei X ein normierter Raum, X ′ sein Dualraum. Fur Teil-mengen U ⊂ X und V ⊂ X ′ werden die Mengen

U⊥ := x′ ∈ X ′ : x′(u) = 0 ∀u ∈ U und V⊥ := x ∈ X : v(x) = 0 ∀ v ∈ V

der Annihilator von U in X ′ bzw. der Annihilator von V in X genannt.

Bemerkung: Ist X = H sogar ein Hilbertraum, so lassen sich H und H ′ mit derAbbildung Φ : H → H ′ aus dem Rieszschen Darstellungssatz identifizieren. DerAnnihilator einer Menge U ⊂ H ist dann gerade ihr orthogonales Komplement,genauer: das Bild unter Φ des orthogonalen Komplements: Dieses ist ja

Φ(y) ∈ H ′ : 〈x, y〉 = 0 ∀x ∈ U = Φ(y) ∈ H ′ : Φ(y)x = 0 ∀x ∈ U.

(Daher auch die gleiche Bezeichnung U⊥.) Im Banachraumfall ist dagegen daraufzu achten, dass U⊥ eine Teilmenge des Dualraums und nicht des Raums selbstist.

Korollar 5.2.8 besagt gerade, dass ein Unterraum U genau dann dicht ist,wenn U⊥ = 0 ist. Allgemeiner gilt der folgende Satz, der die entsprechendenResultate uber Hilbertraume aus Lemma 4.1.10 und Korollar 4.2.7 auf den Ba-nachraumfall verallgemeinert.

Satz 5.2.10 Es seien X ein normierter Raum, U ⊂ X und V ⊂ X ′.

(i) U⊥ und V⊥ sind abgeschlossene Unterraume von X ′ bzw. X.

(ii) Es ist linU = (U⊥)⊥ und linV ⊂ (V⊥)⊥.

105

Beweis. (i) Das ist einfach.(ii) Ist u ∈ U , so gilt x′(u) = 0 fur alle x′ ∈ U⊥. Also ist auch u ∈ (U⊥)⊥.

Zusammen mit (i) ergibt sich linU ⊂ (U⊥)⊥. Ist nun x /∈ linU , so gibt es nachKorollar 5.2.7 ein x′ ∈ X ′ mit x′|linU = 0 und x′(x) 6= 0. Insbesondere ist x′ ∈ U⊥.Wegen x′(x) 6= 0 ist dann aber x /∈ (U⊥)⊥. Das zeigt die umgekehrte InklusionlinU ⊃ (U⊥)⊥.

Ist v ∈ V , so gilt v(x) = 0 fur alle x ∈ V⊥. Also ist auch v ∈ (V⊥)⊥. Zusammenmit (i) ergibt sich linV ⊂ (V⊥)⊥.

Bemerkungen:

1. Ist U ein abgeschlossener Unterraum von X und also U = (U⊥)⊥, so gilt

U⊥ ∼= (X/U)′ und U ′ ∼= X ′/U⊥.

Dies ergibt sich daraus, dass die Abbildungen

(X/U)′ → U⊥, ϕ 7→ ϕΦ und X ′/U⊥ → U ′, [x′] = x′+U⊥ 7→ x′|U ,

wobei Φ(x) := x+ U ist, isometrische Isomorphismen sind. (Ubung!)

2. Im Allgemeinen ist V 6= (V⊥)⊥ auch wenn V ein abgeschlossener Unterraumvon X ′ ist. Z.B. ist fur V = c0 ⊂ l∞ ∼= (l1)′: (c0)⊥ = x ∈ l1 :

∑xnyn =

0 ∀y ∈ c0 = 0 und daher ((c0)⊥)⊥ = 0⊥ = l∞ ) c0.

Als weitere Anwendung des Satzes von Hahn-Banach beweisen wir nun nochfolgendes Separabilitatskriterium:

Satz 5.2.11 Es sei X ein normierter Raum. Ist X ′ separabel, so auch X.

Beweis. Es sei x′1, x′2, . . . dicht in X ′. Zu jedem n ∈ N wahle xn ∈ X mit‖xn‖ = 1 und |x′n(xn)| ≥ 1

2‖x′n‖ und setze dann U = x1, x2, . . . ⊂ X. Wir

werden zeigen, dass U⊥ = 0 ist, womit nach Satz 5.2.10 linU = (U⊥)⊥ = Xgilt, was nach Proposition 2.1.16 die Behauptung zeigt.

Ist x′ ∈ U⊥, x′ 6= 0, so gibt es ein x′n mit ‖x′ − x′n‖ ≤ 14‖x′‖. Hieraus aber

folgt zunachst

‖x′n‖ ≥ ‖x′‖ − ‖x′n − x′‖ ≥3

4‖x′‖

und damit dann3

8‖x′‖ ≤ 1

2‖x′n‖ ≤ |x′n(xn)| = |x′n(xn)− x′(xn)︸ ︷︷ ︸

=0

| ≤ ‖x′n − x′‖ ≤1

4‖x′‖

im Widerspruch zu x′ 6= 0.

Bemerkungen:

1. Die umgekehrte Implikation ist i.A. falsch. Z.B. ist X = l1 separabel, X ′ ∼=l∞ aber nicht.

2. Dieses Beispiel zeigt auch, dass (l∞)′ nicht isomorph zu l1 sein kann. NachSatz 5.2.11 musste sonst mit l1 ja auch l∞ separabel sein.

106

5.3 Schwache Konvergenz und Reflexivitat

Wir kommen nun zu einem auch fur viele Anwendungen zentralen Konzept derFunktionalanalysis: der schwachen Konvergenz. Schon in Satz 2.1.13 hatten wirgesehen, dass die Einheitskugel in unendlichdimensionalen Raumen niemals kom-pakt ist, so dass von der bloßen Beschranktheit einer Folge nicht auf die Existenzeiner konvergenten Teilfolge geschlossen werden kann. Fur viele Anwendungenware ein solches Kompaktheitsargument jedoch sehr wunschenswert. Ein Auswegaus dieser misslichen Lage gelingt, indem wir unseren Begriff von ‘Konvergenz’abschwachen und schwach konvergente Folgen betrachten, die auf sogenanntenreflexiven Raumen einen solchen Schluss zulassen.

Reflexivitat

Ist X ein normierter Raum und X ′ sein Dualraum, so ist der Dualraum X ′′ vonX ′ naturlich auch wieder ein Banachraum. Man nennt X ′′ den Bidualraum von X.Dieser Raum ist insbesondere deshalb von großer Bedeutung, weil X kanonischals Teilraum von X ′′ aufgefasst werden kann.

Satz 5.3.1 Die kanonische Abbildung ιX : X → X ′′, definiert durch

ιX(x) : X ′ → K, (ιX(x)) (x′) = x′(x) ∀x′ ∈ X ′

fur jedes x ∈ X, ist linear und isometrisch (und insbesondere stetig).

(Wir schreiben auch einfach ι fur ιX , wenn klar ist, im welches X es geht.)

Beweis. Tatsachlich wird durch diese Vorschrift fur jedes x ∈ X ein Funktionalι(x) auf X ′ definiert: Die Linearitat in X ′ ist klar und die Stetigkeit folgt aus|(ι(x))(x′)| = |x′(x)| ≤ ‖x‖‖x′‖. Nach Korollar 5.2.6 gilt sogar

‖ι(x)‖ = sup‖x′‖≤1

|x′(x)| = ‖x‖,

was die Isometrie (und Stetigkeit) von ι zeigt. Schließlich ist ι offensichtlich linear.

Aus der Bemerkung 2 von Seite 8 wissen wir schon, dass jeder normierteRaum als dichter Unterraum eines Banachraums (namlich seiner Vervollstandi-gung) aufgefasst werde kann. Mit der kanonischen Abbildung erhalten wir hierfurnun einen besonders eleganten Beweis.

Korollar 5.3.2 Jeder normierte Raum ist isometrisch isomorph zu einem dich-ten Unterraum eines Banachraums.

107

Beweis. Klar: X ∼= ι(X) und ι(X) ist dicht in ι(X), was als abgeschlossenerUnterraum von X ′′ selbst ein Banachraum ist.

Im Allgemeinen ist ι nicht surjektiv. Da (Bi-)Dualraume immer Banachraumesind, ist das z.B. fur nicht vollstandige Raume nie der Fall. Selbst unter denBanachraumen gibt es aber wichtige Beispiele, fur die ι nicht surjektiv ist. Wenndoch, so verdient ein solcher Raum einen eigenen Namen:

Definition 5.3.3 Ein Banachraum X heißt reflexiv, wenn die kanonische Abbil-dung ι : X → X ′′ surjektiv ist.

Bemerkung: Fur einen reflexiven Raum gilt damit insbesondere X ∼= X ′′. AberAchtung! Aus X ∼= X ′′ allein folgt noch nicht, dass X reflexiv ist.

Beispiele:

1. Endlichdimensionale Raume X sind immer reflexiv, da ι wegen dimX =dimX ′′ surjektiv ist.

2. Jeder Hilbertraum ist reflexiv.

Beweis. Es sei H ein Hilbertraum mit Skalarprodukt 〈·, ·〉H . Ist Φ der iso-metrische konjugiert lineare Isomorphismus aus Satz 4.3.1, so ist offenbardurch

〈Φ(x),Φ(y)〉H′ = 〈y, x〉Hein Skalarprodukt definiert mit 〈Φ(x),Φ(x)〉H′ = 〈x, x〉H = ‖x‖2 = ‖Φ(x)‖2.H ′ ist also selbst ein Hilbertraum und der Satz 4.3.1 liefert einen isometri-schen konjugiert linearen Isomorphismus Ψ : H ′ → H ′′. Dabei ist nun furx, y ∈ H

(ΨΦx)(Φy) = 〈Φy,Φx〉H′ = 〈x, y〉H = (Φy)x = ιH(x)(Φy),

also ιH = Ψ Φ. Mit Φ und Ψ ist dann aber auch ιH surjektiv.

3. Fur 1 < p < ∞ sind die Raume lp reflexiv. c0 und l1 sind nicht reflexiv.(Spater werden wir sehen, dass auch l∞ nicht reflexiv ist.)

Identifiziert man (lp)′ gemaß Satz 5.1.1 mit lq, 1p

+ 1q

= 1, 1 ≤ p <∞, sowie

c′0 mit l1, so gilt fur x ∈ lp bzw. c0 und y ∈ lq bzw. l1

(ι(x)) (y) =∞∑n=1

xnyn,

also ι(x) = x. Dies zeigt, dass die lp fur 1 < p <∞ reflexiv sind, c0 und l1

jedoch nicht: Es gilt ιc0(c0) = c0 ( l∞ (klar) und ιl1(l1) ( (l∞)′ (vgl. das

Beispiel von Seite 103).

108

4. Allgemein ergibt sich aus Satz 5.1.4 (und der darauf folgenden Bemerkung):Ist (Ω,A, µ) ein Maßraum, so sind fur 1 < p < ∞ die Raume Lp(Ω,A, µ)reflexiv. (Uberlegen Sie sich das!)

Spater werden wir sehen, dass L1(Ω,A, µ) und L∞(Ω,A, µ), von trivialenAusnahmen abgesehen, dagegen nicht reflexiv sind.

Bemerkung: Eine allgemeine Beispielklasse reflexiver Raume ist durch die gleich-maßig konvexen Banachraume gegeben. Dabei heißt ein normierter Raum gleich-maßig konvex, wenn seine Einheitskugel BX

1 in folgendem Sinne gleichmaßig striktkonvex ist: Zu jedem ε > 0 existiert ein δ > 0, so dass fur alle x, y ∈ BX

1 gilt:∥∥∥x+ y

2

∥∥∥ > 1− δ =⇒ ‖x− y‖ < ε.

Der Satz von Milman, den wir hier allerdings nicht beweisen werden, besagt nun,dass jeder gleichmaßig konvexe Banachraum reflexiv ist.

Die Reflexivitat ubertragt sich auf abgeschlossene Unterraume:

Satz 5.3.4 Ist X ein reflexiver Raum und U ⊂ X ein abgeschlossener Unter-raum, so ist auch U reflexiv.

Beweis. Ist u′′ ∈ U ′′, so wird durch die Vorschrift

x′ 7→ x′′(x′) := u′′(x′|U)

ein Funktional x′′ ∈ X ′′ definiert, denn offensichtlich ist x′′ linear und wegen

|x′′(x′)| ≤ ‖u′′‖‖x′|U‖ ≤ ‖u′′‖‖x′‖

auch stetig. Nach Voraussetzung gibt es ein x ∈ X mit ι(x) = x′′, so dass sich

x′(x) = (ι(x)) (x′) = u′′(x′|U) ∀x′ ∈ X ′′

ergibt. Es gilt dann sogar x ∈ U , denn anderenfalls gabe es nach Korollar 5.2.7ein x′ ∈ X ′ mit x′(x) 6= 0 und x′|U = 0.

Ist nun u′ ∈ U ′, so konnen wir nach Korollar 5.2.4 u′ zu einem Funktionalx′ ∈ X ′ fortsetzen und erhalten somit

u′′(u′) = u′′(x′|U) = x′(x) = u′(x) ∀u′ ∈ U ′,

also u′′ = ιU(x).

Beispiel: Die Sobolevraume W k,p(U), U ⊂ Rn offen und k ∈ N0, sind fur alle1 < p < ∞ reflexiv (nicht jedoch fur p = 1 oder p = ∞). Das lasst sich mitHilfe von Satz 5.3.4 ganz analog zur Separabilitat dieser Raume zeigen, indemman nachweist, dass W k,p(U) isometrisch isomorph zu einem abgeschlossenenUnterraum von Lp(U ;RN) fur ein geeignetes N ∈ N ist, vgl. die Bemerkung 3von Seite 42.Freiwillige Ubung: Zeigen Sie dies fur k = 1! (Der allgemeine Fall ist analog.)

Als nachstes bemerken wir, dass ein zu einem reflexiven Raum isomorpherRaum selbst reflexiv sein muss.

109

Satz 5.3.5 Es seien X und Y isomorphe Banachraume: X ' Y . Dann ist Xreflexiv genau dann, wenn Y reflexiv ist.

Beweis. Es genugt zu zeigen, dass Y reflexiv ist, wenn X reflexiv ist. Es seiT : X → Y ein Isomorphismus. Ist y′′ ∈ Y ′′, so wird durch

x′′(x′) = y′′(x′ T−1) ∀x′ ∈ X ′

ein Element x′′ ∈ X ′′ definiert, denn offensichtlich ist x′′ linear in x′ und es gilt|x′′(x′)| ≤ ‖y′′‖‖x′‖‖T−1‖ mit x′ T−1 ∈ Y ′. Da X reflexiv ist, existiert ein x ∈ Xmit ιX(x) = x′′. Setzt man nun y = Tx, so ergibt sich fur y′ ∈ Y ′, indem wirx′ = y′ T ∈ X ′ setzen,

y′′(y′) = y′′(y′ T T−1) = y′′(x′ T−1)

= x′′(x′) = x′(x) = y′Tx = y′(y),

also ιY (y) = y′′.

Wichtig ist auch, dass ein Raum genau dann reflexiv ist, wenn sein Dualraumreflexiv ist.

Satz 5.3.6 Es sei X ein Banachraum. Dann gilt: X ist genau dann reflexiv,wenn X ′ reflexiv ist.

Beweis. Es sei zunachst X als reflexiv vorausgesetzt. Ist x′′′ ∈ X ′′′, so wird durchx′ = x′′′ ιX ein Funktional x′ ∈ X ′ definiert. Aus der Reflexivitat von X folgtnun fur jedes x′′ ∈ X ′′ mit x′′ = ιX(x)

x′′′(x′′) = x′′′(ιX(x)) = x′(x) = (ιX(x)) (x′) = x′′(x′),

also x′′′ = ιX′(x′). Damit ist gezeigt, dass ιX′ surjektiv ist.

Ist nun umgekehrtX ′ als reflexiv vorausgesetzt, so ist nach dem eben gezeigtenauch X ′′ reflexiv und damit nach Satz 5.3.4 auch X ∼= ι(X) ⊂ X ′′.

Beispiele:

1. Dieser Satz zeigt auch, dass l∞ ∼= (l1)′ nicht reflexiv ist, da – wie obengezeigt – l1 nicht reflexiv ist.

2. Ist Ω ⊂ Rn messbar mit Lebesgue-Maß großer 0, so sind L1(Ω) und L∞(Ω)nicht reflexiv. Das folgt zunachst fur L1(Ω), da dieser Raum separabel ist,L∞(Ω) aber nicht, so dass auch L1(Ω)′′ ∼= L∞(Ω)′ nicht separabel sein kann(vgl. Satz 5.2.11) und somit L1(Ω) 6∼= L1(Ω)′′ ist. Dann ist aber ist auchL∞(Ω) ∼= L1(Ω)′ nicht reflexiv.

3. Allgemeiner gilt fur σ-additive Maßraume: L1(Ω,A, µ) und L∞(Ω,A, µ)sind nicht reflexiv, es sei denn, sie sind schon endlich dimensional.

(Diese Raume sind unendlich-dimensional genau dannn, wenn es in A un-endlich viele disjunkte Mengen positiven endlichen Maßes gibt.)

110

Schwache Konvergenz und schwach*-Konvergenz

Wir kommen nun zu einem grundlegenden Konzept in der Analysis: der schwa-chen Konvergenz und der schwach*-Konvergenz.

Definition 5.3.7 Es seien X ein normierter Raum, X ′ sein Dualraum.

(i) Eine Folge (xn) ⊂ X heißt schwach konvergent gegen x ∈ X, wenn

limn→∞

x′(xn) = x′(x) ∀x′ ∈ X ′

gilt. Man schreibt dann auch xn x.

(ii) Eine Folge (x′n) ⊂ X ′ heißt schwach*-konvergent2 gegen x′ ∈ X ′, wenn

limn→∞

x′n(x) = x′(x) ∀x ∈ X

gilt. Man schreibt dann auch x′n∗ x′.

Beispiele.

1. Eine Folge (xn) in einem Hilbertraum H konvergiert genau dann schwachgegen x ∈ H, wenn gilt

〈xn, y〉 → 〈x, y〉 ∀ y ∈ H.

Dies folgt unmittelbar aus dem Rieszschen Darstellungssatz 4.3.1.

2. Fur 1 < p <∞ konvergiert die Folge (e(n)) in lp schwach und – wenn lp alsDualraum von lq, 1

p+ 1

q= 1, aufgefasst wird – schwach* gegen 0. (Warum?)

3. Setze gk(x) = eikx fur k ∈ N, x ∈ R. Nach dem Lemma von Riemann-

Lebesgue gilt dann gk∗ 0 in L∞(R;C).

Bemerkungen.

1. Naturlich sind konvergente Folgen in X und in X ′ auch schwach bzw.schwach*-konvergent. Die Umkehrung stimmt aber nicht wie das obige Bei-spiel 2 zeigt.

2. Offenbar gilt xn x in X ⇐⇒ ι(xn)∗ ι(x) in X ′′.

3. Die schwache und die schwach*-Konvergenz lassen sich als Folgenkonver-genz bzgl. geeigneter Topologien auf X bzw. X ′ interpretieren. Im Allge-meinen sind diese Topologien nicht von einer Metrik induziert.

2Sprich: schwach-stern-konvergent. Der Stern * kommt daher, dass man den Dualraum vonX statt mit X ′ auch haufig mit X∗ bezeichnet.

111

Satz 5.3.8 Es sei X ein normierter Raum.

(i) Jede schwach konvergente Folge in X ist beschrankt.

(ii) Ist X ein Banachraum, so ist auch jede schwach*-konvergente Folge in X ′

beschrankt.

Beweis. (ii) Gilt x′n∗ x′ in X ′, so konvergiert x′n punktweise gegen x′. Nach dem

Satz von Banach-Steinhaus ist daher

supn∈N‖x′n‖ <∞.

(i) Gilt nun xn x in X, nach Bemerkung 2 von oben also ι(xn)∗ ι(x) in

X ′′, so folgt aus dem eben Gezeigten, da X ′ ein Banachraum ist,

supn∈N‖xn‖ = sup

n∈N‖ι(xn)‖ <∞.

In Anwendungen ist es oft nutzlich zu wissen, dass man die schwache bzw. dieschwach*-Konvergenz nur auf dichten Teilmengen von X ′ bzw. X testen muss,wenn man schon weiß, dass die betrachtete Folge beschrankt ist:

Satz 5.3.9 Es sei X ein normierter Raum.

(i) Ist (xn) eine beschrankte Folge in X mit

limn→∞

x′(xn) = x′(x) ∀x′ ∈ D′

fur eine dichte Menge D′ ⊂ X ′, so gilt xn x.

(ii) Ist (x′n) eine beschrankte Folge in X ′ mit

limn→∞

x′n(x) = x′(x) ∀x ∈ D

fur eine dichte Menge D ⊂ X, so gilt x′n∗ x′.

Beweis. (i) Es sei x′ ∈ X ′. Wahlt man zu M := supn∈N ‖xn‖ + ‖x‖ und ε > 0beliebig ein z′ ∈ D′ mit ‖x′ − z′‖ < ε

2M, so folgt

|x′(xn)− x′(x)| ≤ |x′(xn)− z′(xn)|+ |z′(xn)− z′(x)|+ |z′(x)− x′(x)|≤ ‖x′ − z′‖(‖xn‖+ ‖x‖) + |z′(xn)− z′(x)| < ε

fur hinreichend große n, also limn→∞ x′(xn) = x′(x).

(ii) Der Beweis ist vollig analog zu dem in (i).

Bemerkung: Ist X ′ separabel, so dass die Menge D′ = z′1, z′2, . . . abzahlbargewahlt werden kann, so sieht man hieraus, dass sich die schwache Konvergenz

112

auf beschrankten Mengen(!) durch eine Metrik beschreiben lasst: Definiere da-zu die Halbnormen pn(x) = |z′n(x)|. Dann ist durch dn(x, y) = pn(x − y) ei-ne Pseudometrik gegeben. (D.h. dn erfullt die Eigenschaften einer Metrik mitder Ausnahme, dass dn(x, y) = 0 nicht x = y impliziert.) Definiert man dann

dn(x, y) = dn(x,y)

1+dn(x,y), so ist dn eine durch 1 beschrankte Pseudometrik, fur die

offensichtlich limm→∞

dn(xm, x) = 0 ⇐⇒ limm→∞

dn(xm, x) = 0 gilt. Nur die Dreiecks-

ungleichung ist hier nicht unmittelbar ersichtlich. Sie folgt mit der Monotonievon [0,∞) 3 t 7→ t

1+taus

dn(x, z)

1 + dn(x, z)≤ dn(x, y) + dn(y, z) + dn(x, y)dn(y, z)

1 + dn(x, y) + dn(y, z) + dn(x, y)dn(y, z)

≤ dn(x, y)

1 + dn(x, y)+

dn(y, z)

1 + dn(y, z).

Setze nun

d(x, y) :=∞∑n=1

2−ndn(x, y).

Dies ist offenar wieder eine Pseudometrik. Es gilt d(x, y) = 0 =⇒ x′n(x− y) = 0fur alle n, so dass, da D′ dicht in X ′ liegt, x − y = 0 ist. d ist also sogar eineMetrik auf X. Dabei gilt fur Folgen (xm)

d(xm, x)→ 0 ⇐⇒ dn(xm, x)→ 0 ∀n ∈ N.

(‘=⇒’ folgt aus dn ≤ d, ‘⇐=’ ergibt sich aus d ≤∑N

n=1 2−ndn + 2−N .)Fur jedes R > 0 gilt dann nach Satz 5.3.9 xn x in BX

R genau dann, wennd(xn, x)→ 0.

Ganz analog erhalt man, wenn X separabel und D = z1, z2, . . . dicht in

X liegt, eine Metrik d′(x′, y′) =∑∞

n=1 2−n |(x′−y′)(xn)|1+|(x′−y′)(xn)| auf X ′, so dass auf be-

schrankten Mengen x′n∗ x′ in BX′

R genau dann gilt, wenn d(x′n, x′) → 0 gilt.

Beispiel. (Schnell oszillierende Funktionen) Allgemeiner als im Beispiel 3 vonSeite 111 gilt: Es sei g : R → C eine b-periodische Funktion (b > 0), so dassg|(0,b) ∈ Lp(0, 1) ist fur ein 1 < p < ∞. Setzt man gk(x) = g(kx) fur k ∈ N, sogilt

gk g mit g ≡∫ 1

0

g(x) dx

in Lp(0, 1). (Ubung: Zeigen Sie dies!)

(Die Aussage stimmt auch fur p = 1 und, wenn man ‘’ ersetzt durch ‘∗’,

fur p =∞.)

113

Die Wichtigkeit der schwach*-Konvergenz und der schwachen Konvergenzruhrt von den folgenden Kompaktheitsresultaten her, die unter gewissen Bedin-gungen – bis auf Ubergang zu einer Teilfolge – eine Umkehrung des vorigenErgebnisses zulassen:

Satz 5.3.10 Es sei X ein separabler normierter Raum. Dann besitzt jede be-schrankte Folge im Dualraum X ′ eine schwach*-konvergente Teilfolge.

Beweis. Es sei x1, x2, . . . eine dichte Teilmenge vonX. Ist (x′n) ⊂ X ′ beschrankt,so verschaffen wir uns mit einem Diagonalfolgenargument eine Teilfolge (y′n) von(x′n), so dass y′n(xk) fur jedes k ∈ N konvergiert. Das geht so:

Zunachst gibt es wegen der Beschranktheit der x′n(x1) eine Teilfolge (x′(1)n )n∈N,

so dass (x′(1)n (x1))n∈N konvergiert. Aus dieser wahlen wir dann eine Teilfolge

(x′(2)n )n∈N, so dass (x′(2)

n (x2))n∈N konvergiert. Naturlich konvergiert dann auch

noch (x′(2)n (x1))n∈N. Indem wir so fortfahrend sukzessive Teilfolgen auswahlen,

erhalten wir fur jedes k ∈ N eine Teilfolge (x′(k)n )n∈N, so dass (x′(k)

n (xm))n∈N fur

1 ≤ m ≤ k konvergiert. Setzt man nun yn = x′(n)n , so erhalt man eine Teilfolge

von (x′n)n∈N, die fur jedes k – bis auf die ersten k−1 Folgenglieder – eine Teilfolge

von (x′(k)n )n∈N ist. Damit konvergiert (y′n(xk))n∈N fur jedes k ∈ N.

Dann aber existiert fur jedes x ∈ linx1, x2, . . . der Limes

y′(x) := limn→∞

y′n(x).

Wegen |y′(x)| ≤ supn∈N ‖y′n‖‖x‖, lasst sich y′ gemaß Satz 3.1.7 eindeutig zueinem Element y′ ∈ X ′ stetig fortsetzen. Nach Satz 5.3.9(ii) gilt dann tatsachlich

y′n∗ y′.

Bemerkung: Dieser Satz (zusamen mit Satz 5.3.13(ii) unten) ist ein Spezial-fall des grundlegenden Satzes von Alaoglu, der besagt, dass die Kugeln BX′

R ,R > 0, schwach*-kompakt in X ′ sind, also kompakt bezuglich der oben erwahn-ten schwach*-Topologie auf X ′. Nur wenn X separabel ist, ist diese Topologieallerdings von einer Metrik (s.o.) induziert, so dass man in diesem Fall schließendarf, dass beschrankte Folgen eine schwach*-konvergente Teilfolge besitzen. Die-se Eigenschaft der Folgenkompaktheit folgt in allgemeinen topologischen Raumennicht automatisch aus der Kompaktheit, die durch die endliche Uberdeckungsei-genschaft, vgl. Definition und Satz 6.1.1 unten, definiert ist.

Achtung! Selbst wenn X ′ separabel ist, muss eine beschrankte Folge in einemBanachraum X keine schwach konvergente Teilfolge besitzen, wie das folgendeBeispiel zeigt.

Beispiel. Ist xn = (1, . . . , 1, 0, . . .) (mit n Einsen in den ersten Eintragen undsonst Nullen), n ∈ N, so ist (xn) eine beschrankte Folge in c0, die dort aber nichtschwach konvergiert. (Der einzig mogliche Limes ist x = (1, 1, . . .) /∈ c0.) Es gilt

jedoch xn∗ x in l∞ ∼= (l1)′. Uberlegen Sie sich das!

114

Fur die Existenz schwach konvergenter Teilfolgen ist nun der folgende Satzuber reflexive (aber nicht notwendig separable) Raume zentral.

Satz 5.3.11 In einem reflexiven Raum besitzt jede beschrankte Folge eine schwachkonvergente Teilfolge.

Beweis. Ist X ein separabler reflexiver Raum, so sind X ′′ und damit nach Satz5.2.11 auch X ′ ebenfalls separabel. Ist nun (xn) ⊂ X eine beschrankte Folge inX, so besitzt (ι(xn)) nach Satz 5.3.10 eine in X ′′ schwach*-konvergente Teilfolge(ι(xnk)), deren Limes wegen der Surjektivitat von ι durch ein ι(x), x ∈ X, gegebenist. Nach der Bemerkung 2 von Seite 111 konvergiert dann (xnk) schwach gegenx.

Der allgemeine Fall lasst sich auf den separablen zuruckfuhren: Es sei (xn) ⊂X eine beschrankte Folge im reflexiven Raum X. Dann ist U = linx1, x2, . . .ein separabler Unterraum, der nach Satz 5.3.4 wieder reflexiv ist. Es gibt alsoeine Teilfolge (xnk) und ein x ∈ U mit

u′(xnk)→ u′(x) ∀u′ ∈ U ′.

Ist nun allgemeiner x′ ∈ X ′, so ergibt sich aus der Beobachtung x′|U ∈ U ′ sofort

x′(xnk) = x′|U(xnk)→ x′|U(x) = x′(x).

Korollar 5.3.12 Jede beschrankte Folge in einem Hilbertraum besitzt eine schwachkonvergente Teilfolge.

Beweis. Klar nach Satz 5.3.11 und Beispiel 2 von Seite 108.

Aus dem Satz von Hahn-Banach erhalten wir eine Normabschatzung fur schwa-che bzw. schwach*-Limespunkte.3

Satz 5.3.13 Es sei X ein normierter Raum. Dann gilt:

(i) xn x =⇒ ‖x‖ ≤ lim infn→∞

‖xn‖,

(ii) x′n∗ x′ =⇒ ‖x′‖ ≤ lim inf

n→∞‖x′n‖.

Beweis. (i) Nach Korollar 5.2.5 gibt es ein x′ ∈ X ′ mit ‖x′‖ = 1 und x′(x) = ‖x‖.Damit ergibt sich

‖x‖ = x′(x) = limn→∞

|x′(xn)| = lim infn→∞

|x′(xn)| ≤ lim infn→∞

‖x′‖‖xn‖ = lim infn→∞

‖xn‖.

3Vornehm ausgedruckt besagt der folgende Satz, dass die Norm schwach bzw. schwach*folgenunterhalbstetig ist.

115

(ii) Nach der Definition der Norm gibt es zu jedem ε > 0 ein x ∈ X mit‖x‖ = 1 und |x′(x)| ≥ ‖x′‖ − ε. Damit ergibt sich

‖x′‖−ε ≤ |x′(x)| = limn→∞

|x′n(x)| = lim infn→∞

|x′n(x)| ≤ lim infn→∞

‖x′n‖‖x‖ = lim infn→∞

‖x′n‖.

Da ε > 0 beliebig war, folgt die Behauptung.

Bemerkung. Das Lemma 5.5.9 von Mazur gibt noch etwas genauer Auskunftuber die mogliche Lage von schwachen Limespunkten, s. Abschnitt 5.5.

5.4 Adjungierte Operatoren

Jedem Operator zwischen normierten Raumen ist auf naturliche Weise ein Ope-rator zwischen den entsprechenden Dualraumen zugeordnet, wobei sich allerdingsdie Reihenfolge umkehrt:

Definition 5.4.1 Sind X, Y normierte Raume und T ∈ L(X;Y ), so wird durch

(T ′y′)(x) = y′(Tx) ∀x ∈ X ∀ y′ ∈ Y ′

der zu T adjungierte Operator T ′ ∈ L(Y ′, X ′) definiert.

Beachte hierbei, dass T ′y′ offenbar linear und wegen |y′(Tx)| ≤ ‖y′‖‖T‖‖x‖auch stetig ist.

Bemerkung. Ist T ∈ L(H1;H2) ein Operator zwischen Hilbertraumen, so istder Hilbertraum-adjungierte Operator T ∗ ∈ L(H2;H1) (vgl. Definition und Satz4.6.1) durch T ′ gegeben, wenn die Hilbertraume mit ihren Dualraumen identifi-ziert werden. Genauer: Bezeichnen Φi : Hi → H ′i, i = 1, 2, die konjugiert linearenisometrischen Isomorphismen aus dem Rieszschen Darstellungssatz, so gilt

T ∗ = Φ−11 T ′Φ2.

Beispiele:

1. Es sei T ∈ L(Rn;Rm) gegeben durch die Matrix A ∈ Km×n bezuglich derStandardbasen auf Rm und Rn. Fur x ∈ Rm und y ∈ Rn ist dann

yTAx = (ATy)Tx,

was, wenn man (Rm)′ mit Rm und (Rn)′ mit Rn identifiziert, zeigt, dassT ′ ∈ L(Rm;Rn) durch die transponierte Matrix AT gegeben ist.

2. Ist X ein normierter Raum, so ist Id′X = IdX′ . (Klar!)

116

3. Auf X = lp (oder c0) sind der Linksshift SL und der Rechtshift SR definiertdurch

SL(x1, x2, . . .) = (x2, x2, . . .) und SR(x1, x2, . . .) = (0, x1, x2, . . .).

Es gilt dann (auf den entsprechenden Raumen) S ′L = SR und S ′R = SL.(Ubung!)

Wir halten zunachst einige Eigenschaften der Adjungierten fest:

Satz 5.4.2 Es seien X, Y und Z normierte Raume.

(i) Die Abbildung L(X;Y )→ L(Y ′;X ′), T 7→ T ′ ist linear und isometrisch.

(ii) Fur T ∈ L(X;Y ) und S ∈ L(Y ;Z) gilt (ST )′ = T ′S ′.

(iii) Fur T ∈ L(X;Y ) ist T ′′ιX = ιY T .

Beweis. (i) Offensichtlich gilt (T+λS)′ = T ′+λS ′ fur S, T ∈ L(X;Y ) und λ ∈ K.Die Isometrie folgt mit Korollar 5.2.6 aus

‖T ′‖ = supy′∈BY ′1

‖T ′y′‖ = supy′∈BY ′1

supx∈BX1

|(T ′y′)x|

= supx∈BX1

supy′∈BY ′1

|y′(Tx)| = supx∈BX1

‖Tx‖ = ‖T‖.

(ii) In der Tat ist fur x ∈ X und z′ ∈ Z ′

(T ′S ′z′)x = (S ′z′)(Tx) = z′(STx).

(iii) Dies folgt daraus, dass fur alle x ∈ X und y′ ∈ Y ′ gilt

(T ′′ιX(x))y′ = ιX(x)(T ′y′) = (T ′y′)x = y′(Tx) = (ιY Tx)y′.

Bevor wir Adjungierten weiter untersuchen, nutzen wir dieses neue Konzeptschon einmal, um zu zeigen, wie sich schwach konvergente Folgen unter Abbil-dungen durch Operatoren verhalten.

Satz 5.4.3 Es seien X und Y normierte Raume und T ∈ L(X;Y ). Dann gilt4

xn x in X =⇒ Txn Tx in Y.

Beweis. Fur y′ ∈ Y ′ gilt

y′(Txn) = (T ′y′)xn → (T ′y′)x = y′(Tx).

Die Kerne von T und T ′ lassen sich mit Hilfe der Annihilatoren der Bildervon T ′ bzw. T beschreiben:

4Topologisch vornehm ausgedruckt: Operatoren sind schwach folgenstetig.

117

Satz 5.4.4 Es seien X, Y normierte Raume und T ∈ L(X;Y ). Dann gilt

T (X)⊥ = kerT ′ und T ′(Y ′)⊥ = kerT.

Beweis. Dies folgt aus

T (X)⊥ = y′ ∈ Y ′ : y′(y) = 0 ∀y ∈ T (X) = y′ ∈ Y ′ : y′(Tx) = 0 ∀x ∈ X= y′ ∈ Y ′ : (T ′y′)x = 0 ∀x ∈ X = y′ ∈ Y ′ : T ′y′ = 0.

und

T ′(Y ′)⊥ = x ∈ X : x′(x) = 0 ∀x′ ∈ T ′(Y ′) = x ∈ X : (T ′y′)(x) = 0 ∀y′ ∈ Y ′= x ∈ X : y′(Tx) = 0 ∀y′ ∈ Y ′ = x ∈ X : Tx = 0.

Eine Anwendung hiervon ist ein Losungskriterium fur lineare Gleichungen:

Korollar 5.4.5 Sind X, Y normierte Raume und T ∈ L(X;Y ), so gilt

T (X) = (kerT ′)⊥.

Ist insbesondere T ein Operator mit abgeschlossenem Bild, y ∈ Y gegeben, so gilt

∃x : Tx = y ⇐⇒(T ′y′ = 0 =⇒ y′(y) = 0

).

Beweis. Dies folgt sofort aus Satz 5.4.4 mit Satz 5.2.10(ii).

Zum Schluss dieses Abschnitts halten wir noch fest, wie sich die Invertierbar-keit und das Bilden der Adjungierten zueinander verhalten.

Satz 5.4.6 Es seien X und Y Banachraume, T ∈ L(X;Y ). Genau dann ist Tein (isometrischer) Isomorphismus, wenn T ′ ein (isometrischer) Isomorphismusist. Sind T und T ′ Isomorphismen, so gilt

(T−1)′ = (T ′)−1.

Bemerkung

1. Nach dem Satz von der inversen Abbildung konnte man in diesem Satz stattder Isomorphie auch einfach die Invertierbarkeit von T bzw. T ′ fordern.

2. Die Implikation T (isometrischer) Isomorphismus =⇒ T ′ (isometrischer)Isomorphismus benotigt nicht, dass X, Y Banachraume sind.

118

Beweis. Ist T invertierbar, so gilt nach Satz 5.4.2(ii) und Beispiel 2 von Seite 116

IdX′ = (T−1T )′ = T ′(T−1)′ und IdY ′ = (TT−1)′ = (T−1)′T ′,

was zeigt, dass auch T ′ invertierbar ist mit (T ′)−1 = (T−1)′. Ist zudem T isome-trisch, so auch T ′, denn fur alle y′ ∈ Y ′ ist dann

‖T ′y′‖ = supx∈BX1

|(T ′y′)x| = supx∈BX1

|y′(Tx)| = supz∈BX1

|y′(z)| = ‖y′‖.

Es sei nun T ′ als invertierbar vorausgesetzt. Nach dem eben Gezeigten ist dannT ′′ ein Isomorphismus. Da X ein Banachraum und daher ι(X) abgeschlossen inX ′′ ist, folgt hiermit und mit Satz 5.4.2(iii) insbesondere, dass auch

(ιY T )(X) = (T ′′ιX)(X)

abgeschlossen ist. Da ιY injektiv und stetig ist, ist damit auch T (X) = ι−1Y ((ιY T )(X))

abgeschlossen.Nun ist T ′ nach Voraussetzung ein Isomorphismus. Nach Korollar 5.4.5 und

Satz 5.4.4 ist daher

T (X) = T (X) = 0⊥ = Y und kerT = T ′(Y ′)⊥ = X ′⊥ = 0,

T also bijektiv. Ist zudem T isometrisch, so auch T ′, denn fur alle x ∈ X ist nachKorollar 5.2.6 dann

‖Tx‖ = supy′∈BY1

|y′(Tx)| = supy′∈BY1

|(T ′y′)(x)| = supz′∈BY1

|z′(x)| = ‖x‖.

5.5 Trennung konvexer Mengen

In diesem Abschnitt5 untersuchen wir die Moglichkeit, konvexe Mengen U und Vin einem normierten Raum durch stetige Funktionale voneinander zu trennen.6

Die Niveaumengen x ∈ X : x′(x) = t eines Funktionals x′ sind affine Raumeder Kodimension 1, die ganz X in die zwei Halbraume

x ∈ X : x′(x) ≥ t und x ∈ X : x′(x) ≤ t

einteilen. Es geht nun darum, ein x′ ∈ X ′ zu finden, so dass

x′(u) < x′(v) ∀u ∈ U, v ∈ V5Dieser Abschnitt wurde erst zum Schluss der VL besprochen.6Erinnerung: Eine Teilmenge U eines Vektorraums heißt konvex, wenn mit x, x′ ∈ U , λ ∈

[0, 1] auch λx+ (1− λ)x′ ∈ U gilt.

119

gilt, so dass also U und V in verschiedenen Halbraumen enthalten sind. Man sagtdann, dass x′ die Mengen U und V trennt.

Wir beginnen damit, einige einfache Eigenschaften konvexer Mengen zu be-weisen.

Lemma 5.5.1 Es seien X ein normierter Raum und U, V ⊂ X konvex.

(i) Dann sind auch die Mengen U, U , U + V und U − V konvex.

(ii) Ist U 6= ∅, so gilt U = U.

Beweis. (i) Zu x, x′ ∈ U lasst sich ein ε > 0 mit Bε(x), Bε(x′) ⊂ U finden. Fur

jedes z ∈ Bε(0) und λ ∈ [0, 1] ist dann auch λx+ (1− λ)x′+ z = λ(x+ z) + (1−λ)(x′ + z) ∈ U und somit Bε(λx+ (1− λ)x′) ⊂ U , also λx+ (1− λ)x′ ∈ U.

Sind x, x′ ∈ U , λ ∈ [0, 1], so gibt es xn, x′n ∈ U mit xn → x und x′n → x′.

Damit ist auch λx+ (1− λ)x′ = limn→∞(λxn + (1− λ)x′n) ∈ U .Sind x = u± v, x′ = u′± v′ ∈ U ± V , u, u′ ∈ U , v, v′ ∈ V und λ ∈ [0, 1], so ist

auch λx+ (1− λ)x′ = λu+ (1− λ)u′ ± λv + (1− λ)v′ ∈ U ± V .

(ii) Es genugt, U ⊂ U zu zeigen. Sei also x0 ∈ U, etwa Bε(x0) ⊂ U , ε > 0.Fur jedes x ∈ U und t ∈ [0, 1) gilt tx + (1 − t)x0 ∈ U. Ist namlich ‖z‖ < ε, soliegt

tx+ (1− t)x0 + (1− t)z = tx+ (1− t)(x0 + z) ∈ U,

was B(1−t)ε(tx+ (1− t)x0) ⊂ U zeigt. Damit ist x = limt1

tx+ (1− t)(x0 + z) ∈ U.

Definition 5.5.2 Es sei X ein normierter Raum und U ⊂ X.

(i) U heißt absorbierend, wenn es zu jedem x ∈ X ein s > 0 mit sx ∈ U gibt.

(ii) Ist U absorbierend, so wird durch mU : X → R,

mU(x) := inft > 0 :

x

t∈ U

(= inf t > 0 : x ∈ tU

)das Minkowski-Funktional zu U definiert.

Beispiele:

1. Ist Br ⊂ U fur ein r > 0, so ist U absorbierend, denn fur jedes x ∈ X istx ∈ tU , wenn t > ‖x‖

rist. Insbesondere ist mU durch mU ≤ ‖·‖

rbeschrankt.

2. Speziell fur U = Br, r > 0, ergibt sich mU(x) = r−1‖x‖.

3. U = (xn) ∈ d : |xn| ≤ 1n ist konvex und absorbierend. 0 ist jedoch kein

innerer Punkt von U .

120

Lemma 5.5.3 Es seien X ein normierter Raum und U ⊂ X konvex mit 0 ∈ U.Dann ist

(i) mU sublinear und

(ii) a) mU(x) < 1 ⇐⇒ x ∈ U,b) mU(x) = 1 ⇐⇒ x ∈ ∂U ,

c) mU(x) > 1 ⇐⇒ x ∈ U c.

Beachte, dass U wegen 0 ∈ U absorbierend ist. Mit (i) ist insbesondere der NameMinkowski-Funktional gerechtfertigt.

Beweis. (i) Zunacht ist mU(λx) = inft > 0 : λxt∈ U = λ infs > 0 : x

s∈ U =

λmU(x) fur alle x ∈ X und λ ≥ 0. Sind nun x, x′ ∈ X, so wahle zu gegebenemε > 0 positive t, t′ > 0 mit t < mU(x) + ε und t′ < mU(x′) + ε, die x

t, x′

t′∈ U

erfullen. Aus der Konvexitat von U folgt dann

t

t+ t′x

t+

t′

t+ t′x′

t′=x+ x′

t+ t′∈ U,

also mU(x + x′) ≤ t + t′ ≤ mU(x) + mU(x′) + 2ε. Da ε > 0 beliebig war folgtmU(x+ x′) ≤ mU(x) +mU(x′).

(ii) Zunachst bemerken wir, dass offensichtlich mU(x) ≤ 1 fur x ∈ U gilt. Essei Bε = Bε(0) ⊂ U .

a) Ist mU(x) < 1, so gibt es ein 0 < t < 1 mit xt∈ U . Dann aber ist auch

x + (1 − t)z = txt

+ (1 − t)z ∈ U fur z ∈ Bε, also B(1−t)ε(x) ⊂ U und damitx ∈ U. Ist nun umgekehrt x ∈ U, so ist auch λx ∈ U fur hinreichend kleinesλ > 1 und damit nach (i) mU(x) = λ−1mU(λx) ≤ λ−1 < 1.

c) Ist mU(x) > 1, so gibt es ein t > 1 mit xt/∈ U . Wegen x

t= 1

t(x +

(t − 1)z) + t−1t

(−z) folgt dann aber auch x + (t − 1)z /∈ U fur z ∈ Bε, also

B(t−1)ε(x) ⊂ U c und damit x ∈ U c. Ist umgekehrt x ∈ U c

, so ist auch λx /∈ U ⊃U fur hinreichend großes λ < 1 und damit nach (i) und dem schon GezeigtenmU(x) = λ−1mU(λx) ≥ λ−1 > 1.

b) Dies folgt unmittelbar aus (a) und (c).

Wir kommen nun zu den Hahn-Banachschen Trennungssatzen. Das grundle-gende Lemma hierfur ergibt sich aus dem Hahn-Banachschen Fortsetzungssatz.

Lemma 5.5.4 Es seien X ein normierter Raum und U ⊂ X eine nicht leereoffene und konvexe Teilmenge mit 0 /∈ U . Dann existiert ein x′ ∈ X ′ mit

x′(u) < 0 ∀u ∈ U bzw. Rex′(u) < 0 ∀u ∈ U,

falls K = R bzw. K = C.

121

Bemerkung: Durch Translation ersieht man hieraus, dass offene Mengen vonjedem Punkt ihres Komplements getrennt werden konnen.

Beweis. Es genugt den Fall K = R zu beweisen, da wir im Falle K = C den RaumX auch als R-Vektorraum auffassen konnen und dann eine R-lineare Abbildungmit der gewunschten Eigenschaft erhalten, die durch Rex′ fur ein x′ ∈ X ′ gegebenist, vgl. die Bemerkung von Seite 102.

Es sei x0 ∈ U . Dann ist V = U −x0 offen und konvex mit 0 ∈ V , so dass nachLemma 5.5.3(i) mV sublinear ist. Wir betrachten nun auf dem Unterraum Rx0

das Funktionalϕ(λx0) := −λmV (−x0).

Wegen ϕ(λx0) = mV (λx0) fur λ ≤ 0 und ϕ(λx0) ≤ 0 ≤ mV (λx0) fur λ ≥ 0 lasstsich dies nach Satz 5.2.2 zu einer linearen Abbildung x′ : X → R fortsetzen, dieebenfalls von mV dominiert wird. Tatsachlich ist x′ stetig, denn wahlt man ε > 0mit Bε ⊂ V , so ergibt sich

|x′(x)| = x′(±x) ≤ mV (±x) = ε−1‖ ± x‖ = ε−1‖x‖

fur alle x ∈ X (vgl. Beispiel 1 von Seite 120).Nun ist 0 /∈ U und daher −x0 /∈ V , nach Lemma 5.5.3(ii) also mV (−x0) ≥ 1.

Fur u ∈ U mit u = v + x0, v ∈ V , ist daher

x′(u) = x′(v) + x′(x0) ≤ mV (v) + ϕ(x0) = mV (v)−mV (−x0) < 1− 1 = 0

wieder nach 5.5.3(ii).

Bemerkungen:

1. Nach Lemma 5.5.1(ii) gibt es demnach zu jeder konvexen Menge U mit0 /∈ U und U 6= ∅ ein nicht triviales x′ ∈ X ′ mit x′|U ≤ 0 bzw. Re x′|U ≤ 0.

2. Die Voraussetzung, dass das Innere von U nicht leer ist, ist wesentlich.Ohne sie kann es vorkommen, dass das einzige Funktional x′ mit x′|U ≤ 0das Null-Funktional ist:

Betrachte etwa im Raum (d, ‖ · ‖∞) die Menge derjenigen Folgen, derenletztes nicht verschwindendes Folgenglied positiv ist:

U = (xn) ∈ d : xN > 0 falls xN 6= 0 und xn = 0 ∀n > N.

Offenbar ist U konvex und 0 /∈ U . Ist x′ ∈ d′ ∼= l1 (s. Korollar 5.1.3), etwax′ = (yn), mit x′|U ≤ 0, so gilt fur jedes n ∈ N

λyn + yn+1 = x′(λen + en+1) ≤ 0

fur alle λ ∈ R, so dass yn = 0 sein muss.

122

Wir kommen nun zur ersten Version des Hahn-Banachschen Trennungssatzes.Dabei fassen wir die Falle K = R und K = C zusammen, indem wir auch imreellen Fall Rex′ schreiben.

Satz 5.5.5 (Hahn-Banachscher Trennungssatz) Es seien X ein normierterRaum, U, V ⊂ X disjunkte konvexe Teilmengen und U offen. Dann existiert einx′ ∈ X ′ mit

Rex′(u) < Rex′(v) ∀u ∈ U, v ∈ V.

Beweis. Nach Lemma 5.5.1 ist W = U − V konvex. Wegen U ∩ V = ∅ ist 0 /∈ Wund wegen W =

⋃v∈V U − v ist W offen. Nach Lemma 5.5.4 gibt es nun ein

x′ ∈ X ′ mit Re x′|W < 0, woraus die Behauptung folgt.

Korollar 5.5.6 (Hahn-Banachscher Trennungssatz) Es seien X ein nor-mierter Raum, U, V ⊂ X disjunkte konvexe Teilmengen und U 6= ∅. Dannexistiert ein x′ ∈ X ′ mit

Rex′(u) ≤ Rex′(v) ∀u ∈ U, v ∈ V und

Rex′(u) < Rex′(v) ∀u ∈ U, v ∈ V.

Beweis. Wahle x′ zu U und V gemaß Satz 5.5.5 (beachte Lemma 5.5.1(i)). DieBehauptung folgt dann aus der Stetigkeit von x′ und U = U nach Lemma5.5.1(ii).

Die nachste Version zeigt, dass eine kompakte konvexe Menge U von einerdisjunkten abgeschlossenen konvexen Menge V gleichmaßig strikt getrennt werdenkann, so dass also ein ε > 0 existiert mit

Rex′(u) + ε ≤ Rex′(v) ∀u ∈ U, v ∈ V.

Dazu benotigen wir noch ein kleines Lemma, wobei wir zuerst daran erinnern,dass in metrischen Raumen (M,d) der Abstand eines Punktes x ∈ M und einerMenge U ⊂ M gegeben ist durch dist(x, U) := infd(x, u) : u ∈ U und derzweier Mengen U, V ⊂M durch dist(U, V ) := infd(u, v) : u ∈ U, v ∈ V .

Lemma 5.5.7 Es seien X ein normierter Raum, U, V ⊂ X disjunkte Teilmen-gen.

(i) Ist U kompakt und V abgeschlossen, so ist dist(U, V ) > 0.

(ii) Fur jedes r > 0 ist Ur = x ∈ X : dist(x, U) < r offen.

(iii) Ist U konvex, so ist auch Ur fur alle r > 0 konvex.

123

Beweis.7 (i) Anderenfalls gabe es Folgen un ∈ U , vn ∈ V mit ‖un − vn‖ → 0. Istdann unk → u ∈ U eine konvergente Teilfolge, so musste auch vnk → u gelten,also auch u ∈ V , da V abgeschlossen ist. Damit folgt der Widerspruch u ∈ U ∩V .

(ii) Fur alle x, y ∈M ist nach der Dreiecksungleichung dist(x, U) ≤ d(x, y) +dist(y, U). Indem man die Rollen von x und y vertauscht folgt daraus

|dist(x, U)− dist(y, U)| ≤ d(x, y),

so dass sich x 7→ dist(x, U) als (Lipschitz-)stetig herausstellt. Als Urbild von(−∞, r) unter dieser Abbildung ist Ur offen.

(iii) Zu x, x′ ∈ Ur wahle u, u′ ∈ U mit ‖x − u‖, ‖x′ − u′‖ < r. Fur λ ∈ [0, 1]ist dann auch λu+ (1− λ)u′ ∈ U und somit wegen∥∥λx+ (1− λ)x′ −

(λu+ (1− λ)u′

)∥∥ ≤ λ‖x− u‖+ (1− λ)‖x′ − u′‖ < r

auch λx+ (1− λ)x′ ∈ Ur.

Satz 5.5.8 (Hahn-Banachscher Trennungssatz) Es seien X ein normierterRaum, U, V ⊂ X disjunkte konvexe Teilmengen und U kompakt sowie V abge-schlossen. Dann existiert ein x′ ∈ X ′ mit

supu∈U

Rex′(u) < infv∈V

Rex′(v).

Beweis. Nach Lemma 5.5.7 ist ε := 12dist(U, V ) > 0 und Uε konvex und offen mit

Uε∩V = ∅. Satz 5.5.5 liefert dann ein x′ ∈ X ′ mit Rex′(x) < Rex′(v) fur x ∈ Uεund v ∈ V . Dann aber gilt fur alle u ∈ U , und v ∈ V :

Rex′(v) ≥ supz∈Bε

Rex′(u+ z) = Re x′(u) + ε supz∈B1

Rex′(z) = Rex′(u) + ε‖x′‖

(s. die Bemerkung von Seite 102), woraus die Behauptung folgt.

Als direkte Anwendung der Hahn-Banachschen Trennungssatz zeigen wir, dasssich die Bedingung, dass alle Glieder einer schwach konvergenten Folge in einerabgeschlossenen konvexen Teilmenge liegen, auf deren (schwachen) Grenzwertubertragt.

Satz 5.5.9 (Lemma von Mazur) Es sei X ein normierter Raum und V ⊂ Xeine abgeschlossene konvexe Teilmenge. Ist (xn) eine schwach gegen x konvergenteFolge, deren Folgenglieder in V liegen, so gilt auch x ∈ V .

Beweis. Anderenfalls gabe es nach Satz 5.5.8 ein Funktional x′ ∈ X ′ mit

Rex′(x) < infv∈V

Rex′(v) ≤ Rex′(xn)

fur alle n, so dass sich der Widerspruch

Rex′(x) < infv∈V

Rex′(v) ≤ limn→∞

Rex′(xn) = Re x′(x)

ergabe.

7Der Beweis dieses Lemmas wurde in der VL weggelassen.

124

Anwendung: Konvexe Funktionen und die direkte Methodeder Variationsrechnung

Wir betrachten nun Funktionen f : X → (−∞,+∞], wobei X ein normierterRaum ist, und erinnern zunachst daran, dass

(i) f konvex heißt, wenn

f(λx+ (1− λ)x′) ≥ λf(x) + (1− λ)f(x′) ∀x, x′ ∈ X, λ ∈ [0, 1]

gilt, und

(ii) f unterhalbstetig (bzgl. der Normkonvergenz) genannt wird, falls fur jedeFolge (xn) ⊂ X mit xn → x gilt

lim infn→∞

f(xn) ≥ f(x).

Der Epigraph von f ist definiert als

epi f := (x, t) ∈ X ⊕ R : t ≥ f(x).

Lemma 5.5.10 Es sei X ein Vektorraum, f : X → (−∞,+∞] eine Funktion.

(i) f ist genau dann konvex, wenn epi f eine konvexe Menge in X ⊕ R ist.

(ii) f ist genau dann unterhalbstetig, wenn epi f eine abgeschlossene Menge inX ⊕ R ist.

Beweis. Ubung!

Mit Hilfe der Hahn-Banachschen Trennungssatze konnen wir nun das folgendeResultat uber konvexe Funktionen zeigen, wobei wir uns o.B.d.A. auf den reellenFall K = R beschranken. Dabei nennen wir eine Abbildung ϕ : X → R stetigund affin, wenn ϕ von der Form ϕ = x′ + c fur ein x′ ∈ X ′ und ein c ∈ R ist.

Satz 5.5.11 Ist f : X → (−∞,+∞] konvex und unterhalbstetig, so gilt fur jedesx ∈ X

f(x) = supϕ(x) : ϕ ist stetig und affin mit ϕ ≤ f.

Beweis.8 Wir durfen o.B.d.A. f 6≡ +∞ annehmen. Offensichtlich ist auch f(x) ≥supϕ(x) : ϕ ist stetig und affin mit ϕ ≤ f, so dass es zu zeigen genugt, dass zujedem x0 ∈ X und jedem t0 < f(x0) eine stetige affine Funktion ϕ : X → R mitϕ ≤ f auf X und ϕ(x0) ≥ t0 existiert.

Da epi f nach Lemma 5.5.10 konvex und abgeschlossen ist, liefert Satz 5.5.8fur ein solches (x0, t0) ∈ X ⊕ R ein Funktional Φ ∈ (X ⊕ R)′ mit

Φ(x0, t0) < infΦ(x, t) : (x, t) ∈ epi f.8Der Beweis dieses Satzes wurde in der VL nur skizziert.

125

Wir definieren ψ ∈ X ′ und α ∈ R durch

ψ(x) = Φ(x, 0) und α = Φ(0, 1),

so dass Φ(x, t) = Φ((x, 0) + (0, t)) = ψ(x) + αt gilt, und somit

ψ(x0) + αt0 < ψ(x) + αt ∀(x, t) ∈ epi f.

Da diese Ungleichung fur ein x mit f(x) < ∞ und beliebig große t > f(x) gilt,muss α ≥ 0 sein.

Fall 1: α > 0. In diesem Fall definieren wir durch

ϕ(x) = −α−1ψ(x) + α−1ψ(x0) + t0

eine stetige affine Funktion auf X. Es gilt dann ϕ(x0) = t0. Um ϕ ≤ f zuuberprufen, genugt es, diejenigen x ∈ X mit f(x) <∞ zu betrachten. Fur dieseaber ist (x, f(x)) ∈ epi f , so dass die Ungleichung von oben

ψ(x0) + αt0 < ψ(x) + αf(x)

ergibt, also in der Tat

f(x) > −α−1ψ(x) + α−1ψ(x0) + t0 = ϕ(x).

Fall 2: α = 0. Da Φ die Mengen (x0, t0) und epi f strikt trennt, gibt es einc ∈ R mit

ψ(x0) = Φ(x0, t0) < c < Φ(x, f(x)) = ψ(x) ∀x mit f(x) <∞

(beachte α = 0). Insbesondere ist f(x0) =∞.Nach Fall 1 gibt es ein stetiges affines ϕ mit ϕ ≤ f . Dann aber ist auch ϕ mit

ϕ(x) = ϕ(x) + a(c− ψ(x))

fur jedes a > 0 stetig und affin. Es folgt

ϕ(x0) = ϕ(x0) + a(c− ψ(x0)) ≥ t0,

wenn a hinreichend groß gewahlt ist. Andererseits ist fur alle a > 0 und x mitf(x) <∞

ϕ(x) < ϕ(x) ≤ f(x)

und damit ϕ ≤ f auf X.

Eine wichtige Anwendung der schwachen Konvergenz tritt bei der Suche nachMinimierern von Funktionen F : X → R ∪ +∞ auf reflexiven Raumen X inder Variationsrechnung auf. Der nachte Satz beschreibt die sogenannte direkteMethode zur Losung dieses Optimierungsproblems.

Man nennt F : X → R ∪ +∞ schwach unterhalbfolgenstetig, wenn

xn x =⇒ lim infn→∞

F (xn) ≥ F (x)

gilt, und koerziv (oder koerzitiv), falls F (x)→∞ fur ‖x‖ → ∞ erfullt ist.

126

Satz 5.5.12 Es seien X ein reflexiver Raum und F : X → R ∪ +∞ schwachunterhalbfolgenstetig und koerziv. Ist U ⊂ X abgeschlossen und konvex, so nimmtF sein Minimum auf U an.

Beweis. O.B.d.A. sei F 6≡ ∞. Wahle eine Folge (un) in U mit F (un) → infU F .Wegen lim‖u‖→∞ F (u) = ∞ muss (un) beschrankt sein und besitzt daher nachSatz 5.3.11 eine schwach konvergente Teilfolge unk u fur ein u ∈ X. Nach Satz5.5.9 gilt dann sogar u ∈ U . Aus der schwachen Unterhalbfolgenstetigkeit folgtnun

infUF = lim

k→∞F (unk) ≥ F (u),

womit u als (globale) Minimalstelle von F auf U nachgewiesen ist.

Beispiel. Es seien X ein reflexiver Raum, x0 ∈ X. Nach Satz 5.3.13 ist die Norm-abbildung und damit auch die Abbildung x 7→ ‖x0 − x‖ schwach unterhalbfol-genstetig. Offenbar ist sie auch koerziv. Folglich gibt es zu jeder abgeschlossenenkonvexen Menge U ⊂ X ein u ∈ U mit

dist(x0, U) = infu∈U‖x0 − u‖ = ‖x0 − u‖.

Da die schwache Unterhalbfolgenstetigkeit von F im Gegensatz zur Koerzi-vitat zunachst als komplizierte Bedingung erscheint, ist das folgende Kriteriumbesonders nutzlich.

Satz 5.5.13 Ist X ein normierter Raum und F : X → R∪+∞ unterhalbstetig(bzgl. Normkonvergenz) und konvex, so ist F schwach unterhalbfolgenstetig.

Beweis. Es sei xn x0 in X. Nach Satz 5.5.11 gibt es zu jedem ε > 0 ein stetigesaffines ϕ mit ϕ(x0) > F (x0) − ε (falls F (x0) < ∞) bzw. ϕ(x0) > ε−1. (fallsF (x0) =∞). Wegen ϕ(xn)→ ϕ(x0) ergibt sich nun

lim infn→∞

F (xn) ≥ limn→∞

ϕ(xn) = ϕ(x0) > F (x0)− ε (bzw. > ε−1).

Da ε > 0 beliebig war, folgt die Behauptung.

Damit erhalten wir den folgenden Satz:

Korollar 5.5.14 Ist X ein reflexiv Raum und F : X → R∪∞ unterhalbstetig,konvex und koerziv, so nimmt F sein Minimum auf abgeschlossenen konvexenMengen an. Ist F sogar strikt konvex, so ist dieses Minumum eindeutig.

Beweis. Nach den Satzen 5.5.12 und 5.5.13 bleibt nur die Eindeutigkeit zu zeigen.Gabe es zwei verschiedene Minimierer x und x, so ergabe sich der Widerspruch

F( x+ x

2

)<

1

2F (x) +

1

2F (x) = F (x) = F (x).

127

Beispiel. Es seien ψ : [0, 1]× R → R stetig mit c|t|p − C ≤ ψ(x, t) ≤ C|t|p + Cfur geeignete Konstanten c, C > 0 und konvex in der zweiten Variable sowie1 < p <∞. Dann ist

F : Lp([0, 1])→ R, F (f) =

∫ 1

0

ψ(x, f(x)) dx

stetig, konvex und koerziv. (Ubung!) Folglich nimmt F sein Minimum auf ab-geschlossenen konvexen Teilmengen von Lp([0, 1]) an. (Z.B. auf f ∈ Lp([0, 1]) :∫ 1

0f(x) dx = 3, f(z) ≥ 4 f.f.a. z ∈ [0, 1/2].)

128

Kapitel 6

Kompakte Operatoren und ihreSpektraltheorie

Im letzten Kapitel besprechen eine Klasse besonders gutartiger Operatoren, diein vielen Anwendungen wichtig ist: die Klasse der kompakten Operatoren. Dazuerinnern wir zunachst an die Definition und nutzliche Kriterien fur Kompaktheitin metrischen Raumen und besprechen grundlegende Kompaktheitskriterien inverschiedenen Funktioenraumen. Im Anschluss geben wir eine Einfuhrung in dieSpektraltheorie von Operatoren auf Banachraumen, die eine Verallgemeinerungder Eigenwerttheorie von Matrizen auf Operatoren in unendlichdimensionalenBanachraumen ist. Wir spezialisieren uns dann auf kompakte Operatoren, furdie sich eine solche Theorie tatsachlich in weitgehender Analogie zum endlichdi-mensionalen Fall entwickeln lasst.

6.1 Kompakte Mengen in Funktionenraumen

Der Begriff der Kompaktheit ist von zentraler Bedeutung in der gesamten Analy-sis. Wie wir in Satz Satz 2.1.13 gesehen haben ist es jedoch ausschließlich in end-lichdimensionalen Raumen der Fall, dass beschrankte und abgeschlossene Mengenimmer schon kompakt sind. Insbesondere im Hinblick auf die (unendlichdimen-sionalen) Funktionenraume, die wir kennengelernt haben, stellt sich also ganznaturlich die Aufgabe, moglichst starke Kriterien fur die Kompaktheit von Teil-mengen in diesen Raumen aufzufinden, um kompakte Mengen moglichst gut zubeschreiben.

Kompaktheit in metrischen Raumen

Wir erinnern zunachst an die Definition und einige aquivalente Umfomulierungenkompakter Teilmengen von metrischen Raumen.

129

Definition und Satz 6.1.1 Es sei (M,d) ein metrischer Raum, A ⊂ M . Aheißt kompakt, wenn eine (und damit jede) der folgenden aquivalenten Bedingun-gen erfullt ist:

(i) Jede Folge (xk) ⊂ A besitzt eine in A konvergente Teilfolge.

(ii) A erfullt die endliche Uberdeckungseigenschaft: Aus jeder Familie (Ui)i∈Ioffener Mengen, die A uberdecken, d.h. A ⊂

⋃i∈I Ui erfullen, konnen end-

lich viele Mengen Ui1 , . . . , Uin ausgewahlt werden, die A auch schon uber-decken: A ⊂ Ui1 ∪ . . . ∪ Uin.

Kurz: Jede offene Uberdeckung besitzt eine endliche Teiluberdeckung.

(iii) A ist vollstandig und totalbeschrankt: Dies bedeutet, dass es zu jedem ε > 0ein endliches ε-Netz gibt, also endlich viele Punkte x1, . . . , xn ∈ A gibt, sodass A von Bε(x1) ∪ . . . ∪Bε(xn) uberdeckt wird.

Beweis. S. etwa [Sch-Ana2, Satz 4.31].

Bemerkungen:

1. Die Eigenschaften (i) und (ii) sind auch in allgemeinen topologischen Raum-en sinnvolle Aussagen, dann jedoch im Allgemeinen nicht mehr aquivalent.Zur Unterscheidung nennt man die Eigenschaften in (i) und (ii) auch Fol-genkompaktheit bzw. Uberdeckungskompaktheit. Achtung: Unter Kompakt-heit versteht man dann immer die Uberdeckungskompaktheit.

2. Direkt durch Komplementbildung ergibt sich die zu (ii) aquivalente For-mulierung: A erfullt die endliche Durchschnittseigenschaft: Ist (Vi)i∈I eineFamilie in A abgeschlossener Mengen mit

⋂i∈I Vi = ∅, so gibt es endlich

viele Mengen Vi1 , . . . , Vin mit⋂nk=1 Vik = ∅.

Fur das Folgende ist es nutzlich, auch den schwacheren Begriff der Relativ-kompaktheit einzufuhren.

Definition 6.1.2 Es sei (M,d) ein metrischer Raum. Eine Teilmenge A ⊂ Mheißt relativkompakt, wenn A kompakt ist.

Bemerkung. Offensichtlich sind relativkompakte Mengen beschrankt, da ja so-gar ihr Abschluss als kompakte Menge beschrankt ist. Umgekehrt stimmt dasnicht! So ist ja z.B. in jedem unendlichdimensionalen normierten Raum die Ein-heitskugel nicht relativkompakt. In endlichdimensionalen normierten Raumensind jedoch tatsachlich die relativkompakten Mengen gerade die beschranktenMengen.

Korollar 6.1.3 Eine Teilmenge eines vollstandigen metrischen Raums ist rela-tivkompakt genau dann, wenn sie totalbeschrankt ist.

130

Beweis. Es sei A die fragliche Teilmenge. Ist A kompakt, so gibt es zu jedemε > 0 ein ε

2-Netz x1, . . . , xN von A. Wahlt man nun zu jedem xi ein zi ∈ A mit

d(xi, zi) <ε2, so ist z1, . . . , zN ein ε-Netz von A.

Ist umgekehrt A als totalbeschrankt vorausgesetzt, so ist auch A totalbe-schrankt, da jedes ε

2-Netz von A ein ε-Netz von A ist. Zudem ist A als abge-

schlossene Menge eines vollstandigen Raums selbst vollstandig.

Kompaktheit in c0 und lp

In den Folgenraumen c0 und lp ist besonders einfach zu sehen, dass die Einheitsku-gel nicht relativkompakt ist. So hat z.B. die Folge (e(n))n∈N keine konvergente Teil-folge. Stellt man sich e(n) = (0, . . . , 0, 1, 0 . . .) (mit der 1 an der n-ten Stelle) als diePositionsangabe eines ‘Masseteilchens’ vor, das sich zur Zeit n an der Position nbefindet, so beschreibt die Folge (e(n)) ein in jedem Schritt nach rechts hupfendes

Teilchen. Fur jedes feste k ∈ N gilt dann e(n)k → 0, so dass (e(n)) punktweise ge-

gen 0 = (0, 0, . . .) konvergiert. Dabei ist jedoch limn→∞ ‖e(n)‖∞ = 1 > 0 = ‖0‖∞bzw. limn→∞ ‖e(n)‖p = 1 > 0 = ‖0‖p. Das Problem, das im Endlichdimensionalennicht auftreten kann, ist hier, dass ‘Masse im Unendlichen verschwunden’ ist.

Schließt man durch eine geeignete Bedingung (wie (ii) in den folgenden Satzen)aus, dass Masse im Unendlichen verschwindet, so erhalt man fur die Folgenraumec0 und lp, 1 ≤ p < ∞, tatsachlich schon eine vollstandige Charakterisierung derKompaktheit.

Proposition 6.1.4 Eine Teilmenge K ⊂ c0 ist relativkompakt genau dann, wenn

(i) K beschrankt ist: ∃C > 0 : ‖x‖p ≤ C ∀x ∈ K und

(ii) ‘Masse nicht im Unendlichen verschwindet’, genauer:

∀ ε > 0 ∃N ∈ N : supn≥N|xn| < ε ∀x ∈ K.

Der wesentliche Punkt in (ii) ist hier wie auch im folgenden Satz, dass das Nunabhangig von x gewahlt werden kann.

Beweis. Es sei K relativkompakt. Dann ist K insbesondere beschrankt. Ist nunε > 0, so gibt es ein ε

3-Netz x(1), . . . , x(M) fur K. Wahle N ∈ N mit |x(m)

n | < ε3

furalle 1 ≤ m ≤ M und n ≥ N . Ist nun x ∈ K beliebig, so ergibt sich fur n ≥ N ,indem man m mit ‖x− x(m)‖∞ < ε

3wahlt,

|xn| ≤ |xn − x(m)n |+ |x(m)

n | ≤2ε

3

und somit supn≥N |xn| < ε.

Sind umgekehrt (i) und (ii) vorausgesetzt, so lasst sich zu ε > 0 ein N ∈ Nderart wahlen, dass |xn| < ε

2fur alle x ∈ K und n ≥ N gilt. Wir betrachten nun

131

die Projektion P : c0 → RN , Px = (x1, . . . , xN). Da P (K) beschrankt in RN ist,gibt es ein ε

2-Netz Px(1), . . . , Px(M) (bezuglich der Maximumsnorm) von P (K).

Dann aber ist x(1), . . . , x(M) ein ε-Netz von K, denn fur ein x ∈ K ergibt sichnach geeigneter Wahl von n

‖x− x(n)‖∞ ≤ max‖Px− Px(n)‖∞, sup

i≥i0|xi − x(n)

i |

≤ max‖Px− Px(n)‖∞, sup

i≥i0|xi|+ sup

i≥i0|x(n)i |< ε.

Die Behauptung folgt nun aus Korollar 6.1.3.

Ganz analog lasst sich das entsprechende Ergebnis fur lp, 1 ≤ p <∞, zeigen.

Proposition 6.1.5 Eine Teilmenge K ⊂ lp, 1 ≤ p < ∞, ist relativkompaktgenau dann, wenn

(i) K beschrankt ist: ∃C > 0 : ‖x‖p ≤ C ∀x ∈ K und

(ii) ‘Masse nicht im Unendlichen verschwindet’, genauer:

∀ ε > 0 ∃N ∈ N :∞∑n=N

|xn|p < ε ∀x ∈ K.

Beweis. Ubung.

Der Satz von Arzela-Ascoli

In Funktionenraumen ist die Situation noch etwas schwieriger, da nicht nur Masseim Unendlichen verschwinden kann, sondern auch ein besonders irregulares lokalesVerhalten zum Verlust von Kompaktheit fuhren kann.

Beispiele:

1. In Cb(R) betrachte die Funktion

f(x) =

2x, falls 0 ≤ x ≤ 1

2,

2− 2x, falls 12≤ x ≤ 1,

0 sonst

und setze fn(x) = f(x− n), so dass die Folge (fn) einen ‘nach rechts wan-dernden Buckel’ beschreibt. (fn) besitzt keine konvergente Teilfolge. (Masseveschwindet im Unendlichen.)

132

2. Betrachte nun die Funktionenfolge

gn(x) =

1− nx, falls 0 ≤ x ≤ 1

n,

0 sonst

in C([0, 1]). Da [0, 1] kompakt ist, kann keine Masse im Unendlichen ver-schwinden. Dennoch besitzt (gn) keine konvergente Teilfolge.

Der Satz von Arzela-Ascoli, den wir nun beweisen werden, liefert tatsachlicheine vollstandige Charakterisierung (relativ-)kompakter Teilmengen im Raumder stetigen Funktionen C(D;K) (vgl. Korollar 2.2.4). Er ist daruber hinaus dieGrundlage fur Kompaktheitsresultate auch in anderen Funktionenraumen.

Satz 6.1.6 (Satz von Arzela-Ascoli) Es sei (M,d) ein kompakter metrischerRaum. K ⊂ C(M), wobei C(M) mit der sup-Norm versehen sei. Dann ist Krelativkompakt genau dann, wenn K

(i) beschrankt ist: ∃C > 0 : ‖f‖∞ ≤ C ∀ f ∈ K und

(ii) gleichgradig stetig ist:

∀x ∈M ∀ ε > 0∃ δ > 0 : |f(x)− f(y)| < ε ∀ y mit d(y, x) < δ ∀ f ∈ K.

Gleichgradige Stetigkeit heißt kurz gesagt: In der ε-δ-Formulierung der Stetig-keit von f kann das δ unabhangig von f ∈ K gewahlt werden. In dieser Definitionbenotigt man nicht, dass M kompakt ist.

Ist M jedoch kompakt so ist jede gleichgradig stetige Teilmenge von C(M)sogar gleichmaßig gleichgradig stetig, d.h. δ kann auch unabhangig von x gewahltwerden:

Lemma 6.1.7 Ist (M,d) ein kompakter metrischer Raum K ⊂ C(M) gleichgra-dig stetig, so gilt

∀ ε > 0 ∃ δ > 0 : |f(x)− f(y)| < ε ∀x, y mit d(y, x) < δ ∀ f ∈ K.

Beweis. Sei ε > 0. Zu jedem x ∈ M wahle δx > 0, so dass y ∈ B2δx(x) =⇒f(y) ∈ Bε/2(f(x)) gilt fur alle f ∈ K. Da M kompakt ist gibt es endlich vielex1, . . . , xN ∈M mit M = Bδx1

(x1) ∪ . . . ∪BδxN. Setze δ = minδx1 , . . . , δxN.

Ist nun f ∈ K, so gibt es zu Punkten y, y′ ∈M mit d(y, y′) < δ ein xi mit y ∈Bδxi

(xi) und damit auch y, y′ ∈ B2δxi(xi). Dann gilt aber f(y), f(y′) ∈ Bε/2(f(xi))

und damit d(f(y), f(y′)) < ε.

Beispiel: Die Menge

K := f ∈ C([0, 1]) : f Lipschitz-stetig mit Lipschitz-Konstante L, f(0) = 0

133

ist gleichmaßig gleichgradig stetig und beschrankt. Fur x, y ∈ [0, 1] und f ∈ Kist namlich

|f(x)− f(y)| ≤ L|x− y|,was erstens zeigt, dass man δ = ε

Lnur von ε abhangig wahlen kann, und zweitens,

indem man y = 0 wahlt und das Supremum uber x bildet, ‖f‖∞ ≤ L.

Beweis von Satz 6.1.6. “=⇒”: Jede relativkompakte Menge ist naturlich be-schrankt. Zu gegebenem ε > 0 wahlen wir nun ein ε

3-Netz f1, . . . , fn von K

und δ > 0 so klein, dass |fj(x)− fj(y)| < ε3

ist fur alle x, y ∈ M mit d(x, y) < δund j = 1, . . . , n. Da es zu jedem f ∈ K ein fi gibt mit ‖f − fi‖∞ < ε

3, folgt nun

|f(x)−f(y)| ≤ |f(x)−fi(x)|+ |fi(x)−fi(y)|+ |fi(y)−f(y)| ≤ 2‖f−fi‖∞+ε

3< ε

fur d(x, y) < δ.

“⇐=”: Es sei ε > 0. Nach Lemma 6.1.7 existiert ein δ > 0 mit

|f(x)− f(y)| < ε

5∀x, y mit d(y, x) < δ ∀ f ∈ K.

Es sei r1, . . . , rn ein ε5-Netz der C-Kugel BC(0) in K und x1, . . . , xm ein δ-Netz von

M . Wir ordnen nun jedem m-Tupel (i1, . . . , im) aus 1, . . . , nm eine Funktionfi1···im ∈ K zu, so dass

fi1···im(xj) ∈ Bε/5(rij)

gilt, sofern eine solche Funktion existiert. Die Menge der Tupel, fur die diesmoglich ist, sei mit I bezeichnet.

Es sei nun f ∈ K beliebig gegeben und (i1, . . . , im) ein Tupel mit f(xj) ∈Bε/5(rij) fur j = 1, . . . ,m. Ist dann x ∈M , etwa x ∈ Bδ(xj0), so folgt

|f(x)− fi1···im(x)|≤ |f(x)− f(xj0)|+ |f(xj0)− fi1···im(xj0)|+ |fi1···im(xj0)− fi1···im(x)|

5+ 2 · ε

5+ε

5=

5,

denn d(x, xj0) < δ und f(xj0), fi1···im(xj0) ∈ Bε/5(rij0 ). Das aber heißt, dass ‖f −fi1···im‖∞ < ε ist. Die fi1···im mit (i1, . . . , im) ∈ I bilden also ein ε-Netz fur K. DaC(M) vollstandig ist, folgt die Behauptung nun aus Korollar 6.1.3.

Beispiel: Eine Funktion f : U → R, U ⊂ Rn, heißt Holder-stetig zum Exponentenγ ∈ (0, 1], wenn eine Konstante C > 0 existiert, so dass

|f(x)− f(y)| ≤ C|x− y|γ

gilt fur alle x, y ∈ U . (Fur γ = 1 ist dies gerade die Lipschitz-Stetigkeit.) Durch

|f |C0,γ := supx,y∈Ux 6=y

|f(x)− f(y)||x− y|γ

134

ist dann eine Halbnorm auf den Holder-stetigen Funktionen definiert. Man nennt|f |C0,γ auch die Holder-Konstante von u.

Ist U kompakt, γ ∈ (0, 1] und C > 0, so ist es nicht schwer zu sehen, dass

K := f ∈ C(U) : f Holder-stetig mit |f |C0,γ ≤ C, f(0) = 0

gleichmaßig gleichgradig stetig und beschrankt, also relativkompakt ist.

Der Satz von Kolmogorov-Riesz

Mit Hilfe des Satzes von Arzela-Ascoli lasst sich auch ein Kompaktheitskriteriumfur Teilmengen von Lp(Rn) beweisen.

Satz 6.1.8 (Satz von Kolmogorov-Riesz) Es sei K ⊂ Lp(Rn), 1 ≤ p < ∞.Dann ist K relativkompakt genau dann, wenn

(i) K beschrankt ist: ∃C > 0 : ‖f‖Lp ≤ C ∀ f ∈ K,

(ii) die folgende ‘integrale gleichgradige Stetigkeitsbedingung’ erfullt ist:

∀ ε > 0 ∃ δ > 0 : ‖f(·+ h)− f‖Lp < ε ∀h ∈ Rn mit |h| < δ ∀ f ∈ K

und

(iii) ‘Masse nicht im Unendlichen verschwindet’:

∀ ε > 0∃R > 0 : ‖f‖Lp(Rn\BR) < ε ∀ f ∈ K.

Beachte, dass (ii) gerade die Entsprechung der gleichmaßig gleichgradigenStetigkeit fur p-Normen ist. Eine Menge K von K-wertigen Funktionen auf demRn ist ja genau dann gleichmaßig gleichgradig stetig, wenn

∀ ε > 0 ∃ δ > 0 : ‖f(·+ h)− f‖∞ < ε ∀h ∈ Rn mit |h| < δ ∀ f ∈ K

gilt. (Uberlegen Sie sich das!)

Beweis. S. z.B. [Al].

Der Satz von Rellich

Ein besonders in der Theorie der partiellen Differentialgleichungen und der Varia-tionsrechnung wichtiges Kompaktheitsergebnis ist der Satz von Rellich-Kondra-chov, der ein hinreichendes Kompaktheitskriterium in Lp-Raumen auf beschrank-ten Gebieten im Rn durch W 1,p-Abschatzungen bereit stellt. Wir geben hier nureinen Spezialfall an.

135

Dazu bemerken wir vorbereitend, dass fur R > 0 Elemente f des RaumsL2((−R,R)n) nach dem Beispiel 4 von Seite 86 durch Ihre Fourier-Reihe gemaß

f(x) =1

(2R)n/2

∑k∈Zn

fkeiπk·x/R

dargestellt werden konnen, wobei fk die Fourier-Koeffizienten von f bezeichnet.Die Abbildung f 7→ (fk)k∈Zn ist dann – wie im Beweis von Korollar 4.5.8 gezeigt– ein isometrischer Isomorphismus von L2((−R,R)n) nach l2(Zn).

Nach Proposition 6.1.5 sind nun die relativkompakten Mengen in l2(Zn) genaudiejenigen beschranktem Mengen K ⊂ l2(Zn), fur die

∀ ε > 0 ∃N > 0 :∑k∈Zn|k|≥N

|xk|2 < ε ∀x ∈ K

gilt. Dies lasst sich analog zu Proposition 6.1.5 beweisen oder aber direkt hieraufzuruckfuhren, indem man beachtet, dass fur eine Bijektion φ : N → Zn die Ab-bildung l2(N)→ l2(Zn), (xi)i∈N 7→ (xφ−1(k))k∈Zn ein isometrischer Isomorphismusist, wobei ja |k| → ∞ ⇐⇒ φ−1(k)→∞ gilt.

Satz 6.1.9 (Satz von Rellich) Es sei U ⊂ Rn ein beschranktes Gebiet. IstK ⊂ H1

0 (U) beschrankt, so ist K relativkompakt in L2(U).

Beweis. Wahle R > 0 so groß, dass U ⊂ (−R,R)n gilt. Nach Proposition4.4.2 konnen wir jedes u ∈ K durch 0 auf (−R,R)n zu einer Funktion u ∈H1

0 ((−R,R)n) ⊂ H1per((−R,R)n) fortsetzen. Sind uk die Fourier-Koeffizienten

von u, so ist nach dem Beispiel 5 von Seite 86∑k∈Zn

(1 + |k|2)|uk|2 ≤ C‖uk‖H1 ≤ C

fur eine von u ∈ K unabhangige Konstante C > 0. Dann aber ist∑k∈Zn|k|≥N

|uk|2 ≤ N−2∑k∈Zn|k|≥N

(1 + |k|2)|uk|2 ≤ CN−2

fur u ∈ K, so dass (uk)k∈Zn : u ∈ K relativkompakt in l2(Zn) und somit Krelativkompakt in L2((−R,R)n) ist.

Bemerkung. Eine allgemeinere Version dieses Satzes ist der Satz von Rellich-Kondrachov, s. z.B. [Ev].

136

6.2 Kompakte Operatoren

Wir besprechen nun eine Klasse besonders gutartiger Operatoren, die in vielenAnwendungen wichtig ist.

Definition 6.2.1 Es seien X, Y normierte Raume und T : X → Y linear. IstT (B1) relativkompakt in Y , so nennt man T einen kompakten Operator. Die Men-ge der kompakten Operatoren wird mit K(X;Y ) bezeichnet, fur X = Y auch mitK(X).

Wir beginnen mit einigen elementaren Eigenschaften kompakter Operatoren.

Satz 6.2.2 Es seien X, Y, Z normierte Raume und T : X → Y, S : Y → Zlinear.

(i) T ist genau dann kompakt, wenn fur jede beschrankte Folge (xn) ⊂ X dieBildfolge (Txn) eine in Y konvergente Teilfolge besitzt.

(ii) K(X;Y ) ist ein Unterraum von L(X;Y ).

(iii) Ist Y ein Banachraum, so ist K(X;Y ) ein abgeschlossener Unterraum desBanachraums L(X;Y ) und insbesondere selbst ein Banachraum.

(iv) Gilt T ∈ L(X;Y ), S ∈ L(Y ;Z) und ist mindestens einer der OperatorenT, S kompakt, so ist auch das Produkt ST kompakt.

Beweis. (i) Aus der Linearitat von T ergibt sich, dass T genau dann kompaktist, wenn T (Br) fur jedes r > 0 relativkompakt in Y ist. Daraus ist (i) leicht zuersehen.

(ii) Dass K(X;Y ) ⊂ L(X;Y ) gilt, folgt daraus, dass T (B1) kompakt unddaher insbesondere beschrankt ist. Es seien nun T1, T2 ∈ K(X;Y ), λ ∈ K und(xn) ⊂ X eine beschrankte Folge. Es gibt eine Teilfolge xnk , so dass T1xnk kon-vergiert. Nach Ubergang zu einer weiteren Teilfolge (der ersten Teilfolge) (xnkm )konvergiert auch (T2xnkm ) und naturlich (T1xnkm ) immer noch. Daher ist auch(T1xnkm + λT2xnkm ) konvergent, was nach (i) zeigt, dass T1 + λT2 kompakt ist.

(iii) Es seien Tn ∈ K(X;Y ), T ∈ L(X;Y ) mit Tn → T . Nach Korollar 6.1.3genugt es zu zeigen, dass T (B1) totalbeschrankt ist. Es sei also ε > 0 gegeben.Wahle n ∈ N mit ‖Tn − T‖ < ε

2und ein ε

2-Netz y1, . . . , yn der relativkompakten

Menge Tn(B1). Zu jedem y ∈ T (B1), etwa mit Tx = y, x ∈ B1, existiert dann einyi mit ‖Tnx− yi‖ < ε

2, so dass

‖y − yi‖ ≤ ‖Tx− Tnx‖+ ‖Tnx− yi‖ < ‖T − Tn‖‖x‖+ε

2< ε

folgt. Dies zeigt, dass T (B1) ⊂⋃ni=1Bε(yi) ist.

(iv) Es sei (xn) eine beschrankte Folge in X. Ist T kompakt, so gibt es eine inY konvergente Teilfolge Txnk . Da S stetig ist, konvergiert dann auch STxnk . Ist

137

dagegen S kompakt, so bemerkt man zuerst, dass wegen der Stetigkeit von T dieFolge (Txn) beschrankt in Y ist, weshalb STxn eine in Z konvergente Teilfolgezulasst.

Bemerkung: Der Satz zeigt insbesondere, dass K(X) ein (abgeschlossenes) Idealin L(X) ist.

Beispiel: Sind X, Y normierte Raume und ist T ∈ L(X;Y ) mit endlich-dimen-sionalem Bild T (X), so ist T kompakt. Dies folgt sofort daraus, dass in endlich-dimensionalen Raumen beschrankte abgeschlossene Mengen (hier T (B1)) kom-pakt sind.

Aus diesem Beispiel und Satz 6.2.2 ergibt sich ein wichtiges hinreichendesKriterium fur die Kompaktheit von Operatoren, das unter gewissen Vorausset-zungen an Y sogar notwendig ist. (Man kann zeigen, dass dies im Allgemeinennicht richtig ist.1)

Satz 6.2.3 Es seien X ein normierter Raum, Y ein Banachraum und T ∈L(X;Y ).

(i) Gibt es eine Folge (Tn) von Operatoren mit endlich-dimensionalem Bild, sodass Tn → T gilt, so ist T ∈ K(X;Y ).

(ii) Gibt es eine Folge (Sn) ⊂ L(Y ) von Operatoren mit endlich-dimensionalemBild, so dass

Sny → y ∀ y ∈ Y

gilt, so lasst sich jeder kompakte Operator durch solche mit endlich-dimen-sionalem Bild approximieren.

Beweis. (i) ist klar nach obigem Beispiel und Satz 6.2.2.(ii) Es sei T ∈ K(X;Y ). Da mit Sn auch SnT endlich-dimensionales Bild hat,

folgt die Behauptung aus (i), wenn SnT → T gezeigt ist. Wir bemerken zunachst,dass nach dem Satz von Banach-Steinhaus c := supn ‖Sn‖ < ∞ gilt. Zu ε > 0beliebig wahlen wir nun ein ε

2(c+1)-Netz y1, . . . , yn der relativkompakten Menge

T (B1). Fur x ∈ B1, yi mit ‖Tx − yi‖ < ε2(c+1)

und hinreichend große n erhaltman dann

‖(Sn − Id)Tx‖ ≤ ‖Snyi − yi‖+ ‖(Sn − Id)(Tx− yi)‖

≤ ε

2+ (sup

n‖Sn‖+ 1)‖Tx− yi‖ ≤

ε

2+ (c+ 1)

ε

2(c+ 1)≤ ε.

Bildet man das Supremum uber alle x ∈ B1, folgt schließlich ‖SnT − T‖ ≤ ε furdiese n.

1Vgl. etwa die Diskussion in [We].

138

Bemerkungen:

1. Ist Y ein Banachraum, so dass sich fur jeden normierten Raum X jederkompakte Operator von X nach Y durch solche mit endlich-dimensionalemBild approximieren lasst, so sagt man, Y habe die Approximationseigen-schaft.

2. Die Bedingung aus (ii) trifft insbesondere z.B. auf all die Raume c0, c, lp fur1 ≤ p <∞, C([0, 1]) und Lp((0, 1)) fur 1 ≤ p <∞ zu. (Ubung: UberprufenSie das zumindest fur c0, c und lp mit 1 ≤ p <∞!)

Auch l∞ und L∞((0, 1)) besitzen aber, wie man zeigen kann, die Approxi-mationseigenschaft.

Beispiele:

1. Ist a = (an) ∈ l∞, so ist fur 1 ≤ p ≤ ∞ nach dem Beispiel von Seite 47Ta : lp → lp, (xn) 7→ (anxn) ein Operator. Ta ist genau dann kompakt, wenn(an) eine Nullfolge ist. (Ubung!)

2. Der Fredholmsche Integraloperator Tk ∈ L(C([a, b])) aus dem Beispiel 12von Seite 49 ist kompakt.

Beweis. Da Tk stetig ist, genugt es nach dem Satz von Arzela-Ascoli zuzeigen, dass Tkf : f ∈ C([a, b]) mit ‖f‖∞ ≤ 1 gleichgradig stetig ist:Dazu wahlen wir mit Hilfe der gleichmaßigen Stetigkeit von k zu gegebenemε > 0 ein δ > 0, so dass |k(s, t)−k(s′, t)| < ε

b−a ist, wann immer |s− s′| < δgilt. Es folgt

|Tkf(s)− Tkf(s′)| =∣∣∣∣∫ b

a

(k(s, t)− k(s′, t))f(t) dt

∣∣∣∣≤∫ b

a

|k(s, t)− k(s′, t)|‖f‖∞ dt ≤ ε

fur ‖f‖∞ ≤ 1.

3. Auch der Operator Tk ∈ L(L2(a, b)) aus Beispiel 3 von Seite 91 ist kom-pakt. (Ubung: Zeigen Sie dies! Tipps: Verwenden Sie das Kriterium vonKolmogorov-Riesz aus Satz 6.1.8 (fur durch 0 fortgesetzte Funktionen Tkfmit ‖f‖L2 ≤ 1) oder das Kriterium aus Satz 6.2.3(i), indem Sie k durchgeeignete Treppenfunktionen approximieren.)

4. Es sei U ⊂ Rn beschrankt und offen. Die identische Abbildung H10 (U) →

L2(U), u 7→ u nennt man auch die kanonische Einbettung von H10 (U) in

L2(U). (Man schreibt dies auch als H10 (U) → L2(U).) Der Satz 6.1.9 von

Rellich besagt nun, dass diese Einbettung kompakt ist.

139

5. Es sei U ⊂ Rn beschrankt und offen. Die kanonische Einbettung C1(U) →C(U) ist kompakt. (Ubung!)

Eine besonders gutartige Eigenschaft kompakter Operatoren ist es, schwachkonvergente in stark konvergente Folgen zu uberfuhren (vgl. auch Satz 5.4.3).

Satz 6.2.4 Es seien X und Y normierte Raume und T ∈ K(X;Y ). Dann gilt

xn x in X =⇒ Txn → Tx in Y.

Beweis. Wir zeigen, dass jede Teilfolge (Txnk) eine weitere Teilfolge (Txnkm )besitzt, die gegen Tx konvergiert. Nach einem elementaren Satz2 aus der Analysisfolgt dann Txn → Tx.

Da (xnk) nach Satz 5.3.8 beschrankt ist, gibt es wegen der Kompaktheit vonT eine Teilfolge (xnkm ), so dass (Txnkm ) (stark) konvergiert. Nach Satz 5.4.3 giltaber Txnkm Tx, so dass dies der (starke) Limes Tx sein muss.

Bemerkung: Ist X reflexiv, so lasst sich die Kompaktheit eines Operators durchdie Eigenschaft (ii) charakterisieren: Gilt dann namlich xn x =⇒ Txn → Txfur ein T ∈ L(X;Y ), so muss T kompakt sein.

Schließlich zeigen wir, dass ein Operator zwischen Banachraumen genau dannkompakt ist, wenn sein adjungierter Operator kompakt ist.

Satz 6.2.5 (Satz von Schauder) Es seien X, Y Banachraume und T ∈ L(X;Y ).Dann ist T genau dann kompakt, wenn T ′ kompakt ist.

Beweis. Es sei zunachst T als kompakt vorausgesetzt, so dass Ω := T (B1) kom-pakt ist. Es sei (y′n) eine beschrankte Folge in Y ′, etwa ‖y′n‖ ≤ c fur alle n ∈ N.Die eingeschrankten Funktionale y′n|Ω ∈ C(Ω) bilden eine Folge beschrankter undgleichgradig stetiger Funktionen auf Ω:

‖y′n|Ω‖∞ = supy∈Ω|y′n(y)| ≤ ‖y′n‖ sup

y∈Ω‖y‖ ≤ c sup

y∈Ω‖y‖ ≤ C ∀n ∈ N

fur ein C > 0 und ∣∣y′n|Ω(y)− y′n|Ω(y)∣∣ ≤ sup

n∈N‖y′n‖‖y − y‖.

Nach dem Satz 6.1.6 von Arzela-Ascoli gibt es nun eine gleichmaßig konvergenteTeilfolge (y′nk |Ω), die dann insbesondere eine Cauchy-Folge ist. Es folgt

‖T ′y′nk − T′y′nm‖ = sup

x∈BX1

|y′nk(Tx)− y′nm(Tx)| ≤ ‖y′nk |Ω − y′nm|Ω‖∞ → 0

2Ist (xn) eine Folge in einem metrischen Raum (M,d), so dass jede Teilfolge eine weitereTeilfolge besitzt, die gegen ein x ∈M konvergiert, so gilt xn → x.

(Der Punkt hierbei ist, dass der Limes x nicht von der Wahl der Teilfolgen abhangt.)Beweis. Falls nicht, so gibt es ein ε > 0 und eine Teilfolge xnk

mit d(xnk, x) > ε fur alle k ∈ N.

Dann aber hat xnkkeine gegen x konvergente Teilfolge.

140

mit k,m→∞. X ′ aber ist ein Banachraum, so dass (T ′y′nk) konvergiert.

Ist umgekehrt T ′ als kompakt vorausgesetzt, so ist nach dem eben GezeigtenT ′′ kompakt, also auch T ′′ιX = ιY T (vgl. Satz 5.4.2(iii)). Ist nun (xn) ⊂ Xeine beschrankte Folge, so existiert, weil ιY (Y ) abgeschlossen ist (Y ist ja einBanachraum), eine Teilfolge (xnk) mit ιY Txnk → ιY (y) fur ein y ∈ Y . Da ιYisometrisch ist, gilt dann aber auch Txnk → y, was zeigt, dass T kompakt ist.

6.3 Das Spektrum eines Operators

Unser nachstes Ziel ist es, eine Eigenwerttheorie fur Operatoren auf einem Ba-nachraum zu entwickeln. Zwar lassen sich Eigenwerte wie aus der linearen Algebragewohnt auch fur allgemeine Operatoren definieren, im Unendlichdimensionalenkonnen allerdings – wie gleich sehen werden – Effekte auftreten, die es notig ma-chen, den allgemeineren Begriff des Spektrums einzufuhren. Um dies zu sehen,erinnern wir zunachst daran, dass fur einen normierten Raum X mit dimX <∞(o.B.d.A. X = Kn) λ ∈ K ein Eigenwert ist wenn eine (und damit alle) deraquivalenten Bedingungen

• λ Id−T ist nicht injektiv

• λ Id−T ist nicht surjektiv

• λ Id−T ist nicht invertierbar

erfullt ist. Das Problem ist nun, dass diese Bedingungen im Unendlichdimensio-nalen nicht mehr aquivalent sind. Dies gibt Anlass zu der folgenden ausfuhrlichenDefinition.

Im Folgenden sei immer X ein Banachraum. Wir kurzen außerdem fur λ ∈ Kdas λ-fache der Identitat λ Id einfach mit λ ab.

Definition 6.3.1 Fur T ∈ L(X) nennt man

(i) ρ(T ) = λ ∈ K : λ− T ist invertierbar, die Resolventenmenge von T und

(ii) σ(T ) = K \ ρ(T ) das Spektrum von T . Dabei heißt

a) σp(T ) = λ ∈ K : λ− T ist nicht injektiv das Punktspektrum von T .Das sind diejenigen λ ∈ K, fur die ein x ∈ X \ 0 mit Tx = λxexistiert. Ein solches λ heißt Eigenwert von T und ein solches x heißtEigenvektor von T (zum Eigenwert λ).

b) σc = λ ∈ K : λ− T ist injektiv, nicht surjektiv mit dichtem Bild istdas stetige Spektrum (oder kontinuierliche Spektrum) von T und

c) σr(T ) = λ ∈ K : λ − T ist injektiv ohne dichtes Bild ist das Rest-spektrum (oder Residualspektrum) von T .

141

Offensichtlich gilt σ(T ) = σp(T ) ∪ σc(T ) ∪ σr(T ).

Bemerkung: Im Endlichdimensionalen ist jeder Spektralwert ein Eigenwert,denn eine lineare Abbildung eines endlichdimensionalen Raums in sich ist in-jektiv genau dann, wenn sie surjektiv ist.

Beispiele:

1. Auf X = lp, 1 ≤ p ≤ ∞, betrachte Tx = (x1,x22, x3

3, . . .). Es ist nicht schwer

zu sehen, dass die Eigenwerte gerade σp(T ) = 1, 12, 1

3, . . . mit zugehorigen

Eigenvektoren e1, e2, e3, . . . sind. Fur λ /∈ σp(T ) ∪ 0 ist außerdem λ − Tinvertierbar mit Inverser

(λ− T )−1x = (a1x1, a2x2, . . .),

wobei an = (λ− 1n)−1 ist. (Da (an) beschrankt ist, definiert dies tatsachlich

einen Operator lp → lp.) Fur λ = 0 schließlich ist λ − T = −T offenbarinjektiv. Ist 1 ≤ p <∞, so hat −T wegen −T (lp) ⊃ −T (d) = d dichtes Bild.Doch ist −T nicht surjektiv. (Z.B. gibt es kein x ∈ lp mit Tx = (n−1−1/p)n.)Daher ist σc(T ) = 0 und σr(T ) = ∅. Fur p =∞ dagegen ist −T (l∞) ⊂ c0,was nicht dicht in l∞ liegt. In diesem Falle ist also σr = 0.

2. Es gilt σ(T ′) = σ(T ) fur T ∈ L(X), denn nach Satz 5.4.6 ist λ − T inver-tierbar genau dann, wenn (λ− T )′ = λ− T ′ invertierbar ist.

3. Ist H ein Hilbertraum, so gilt σ(T ∗) = λ : λ ∈ σ(T ) fur T ∈ L(H). Diesfolgt aus dem vorigen Beispiel und λ− T ∗ = (λ− T )∗.

Nach dem Satz von der stetigen Inverse ist (λ−T )−1 stetig fur λ ∈ ρ(T ). Mandefiniert dann:

Definition 6.3.2 Es sei T ∈ L(X).

(i) Fur λ ∈ ρ(T ) nennt man den Operator Rλ(T ) = (λ − T )−1 die Resolventevon T in λ.

(ii) Die Abbildung ρ(T )→ L(X), λ 7→ Rλ(T ) ist die Resolventenabbildung.

Die Resolventenabbildung ist besonders gutartig: Sie lasst sich in eine (Ope-ratorwertige) Potenzreihe entwickeln:

Satz 6.3.3 Es sei T ∈ L(X). Die Resolventenmenge ρ(T ) ist offen und Rλ(T )lasst sich lokal als Potenzreihe in der Variablen λ mit Koeffizienten in L(X)schreiben.

Beweis. Es sei λ0 ∈ ρ(T ). Fur λ ∈ K ist dann

λ− T = λ0 − T + λ− λ0 = (λ0 − T )(Id +(λ− λ0)(λ0 − T )−1

).

142

Ist nun |λ−λ0| < ‖(λ0−T )−1‖−1, so ist nach Satz 3.1.10 Id +(λ−λ0)(λ0−T )−1

invertierbar und also auch λ− T . Dies zeigt, dass ρ(T ) offen ist.Satz 3.1.10 liefert außerdem(

Id +(λ− λ0)(λ0 − T )−1)−1

=∞∑k=0

(−(λ− λ0)(λ0 − T )−1

)k,

so dass

Rλ(T ) =(Id +(λ− λ0)(λ0 − T )−1

)−1(λ0 − T )−1

=∞∑k=0

(−(λ− λ0)(λ0 − T )−1

)k(λ0 − T )−1

=∞∑k=0

(−1)k (Rλ0(T ))k+1 (λ− λ0)k

folgt.

Bevor wir das Spektrum eines Operators genauer untersuchen, benotigen wirnoch ein elementares Lemma aus der Analysis.

Lemma 6.3.4 Es sei (an) ⊂ R eine Folge mit 0 ≤ an+m ≤ anam fur alle m,n ∈N. Dann konvergiert n

√an (und zwar gegen inf n

√an).

Beweis. Setze a = inf n√an. Zu gegebenem ε > 0 wahle N ∈ N mit N

√aN ≤ a+ ε.

Jedes n ∈ N kann dann (eindeutig) in der Form n = kN + r mit k ∈ N0 undr ∈ 0, 1, . . . , N − 1 geschrieben werden. Damit ergibt sich (mit a0 := 1)

n√an ≤

(akNar

)1/n ≤ (a+ ε)kN/n max0≤r≤N−1

a1/nr → a+ ε

mit n→∞ und also a ≤ n√an ≤ a+ 2ε fur hinreichend große n ∈ N.

Da fur einen Operator T ∈ L(X) gilt ‖Tm+n‖ ≤ ‖T n‖‖Tm‖ fur alle m,n ∈ N,zeigt dieses Lemma, dass wir definieren konnen:

Definition 6.3.5 Fur T ∈ L(X) heißt r(T ) := limn→∞

‖T n‖1/n der Spektralradius

von T .

Offenbar ist dann r(T ) ≤ ‖T‖. Woher der Name kommt, erklart der folgendeSatz.

Satz 6.3.6 Es sei T ∈ L(X).

(i) Das Spektrum σ(T ) ist kompakt. Es gilt |λ| ≤ r(T ) fur alle λ ∈ σ(T ).

(ii) Im Falle K = C, X 6= 0 gibt es ein λ ∈ σ(T ) mit |λ| = r(T ). Insbesondereist σ(T ) 6= ∅.

143

Bemerkung: Im Falle K = R kann das Spektrum durchaus leer sein. Schonim Endlichdimensionalen gibt es ja reelle Matrizen, die keine reellen Eigenwertebesitzen.

Beweis. (i) Ist |λ| > r(T ), so gibt es ein 0 < α < 1, so dass ‖T n‖1/n ≤ α|λ| furalle hinreichend großen n ∈ N gilt. Fur diese n ist dann ‖λ−nT n‖ ≤ αn, so dassdie Reihe S = λ−1

∑∞n=0 λ

−nT n (sogar absolut) konvergiert.Nun ist

(λ− T )S = S(λ− T ) = λ−1

∞∑n=0

λ−nT n(λ− T )

= λ−1

∞∑n=0

(λ−(n−1)T n − λ−nT n+1

)= λ−1λ1T 0 = Id

(Teleskopsumme) und daher S = (λ − T )−1 = Rλ(T ), insbesondere λ ∈ ρ(T ).Dies zeigt die zweite Behauptung. Da ρ(T ) offen ist, folgt daraus auch die erste.

(ii) Fur diesen Beweis benotigen wir ein wenig Funktionentheorie.3

1. Wir uberlegen uns zunachst, dass σ(T ) nicht leer ist. Ware dies der Fall,so ware fur jedes ϕ ∈ L(X)′ die Abbildung

fϕ : C→ C, fϕ(λ) = ϕ(Rλ(T ))

nach der im Beweis von Satz 6.3.3 gewonnenen Darstellung

fϕ(λ) =∞∑k=0

ϕ((−Rλ0(T ))k+1

)(λ− λ0)k

fur λ nahe λ0 analytisch auf ganz C. Dabei ist nach dem Beweis von (i) Rλ(T ) =λ−1

∑∞n=0 λ

−nT n fur |λ| ≥ r(T ), also

|fϕ(λ)| ≤ ‖ϕ‖‖Rλ(T )‖ ≤ ‖ϕ‖λ−1

∞∑n=0

λ−n‖T n‖ ≤ ‖ϕ‖‖T‖

fur |λ| ≥ 2‖T‖. Somit ist fϕ beschrankt, nach dem Satz von Liouville also kon-stant. Insbesondere fur λ0 = 0 mussen dann all die Koeffizienten ϕ

((−R0(T ))k+1

)mit k ≥ 1 verschwinden. Da aber ϕ ∈ L(X)′ beliebig war, ergibt sich mit

3Satz von Cauchy-Taylor: Ist f : G → C, G ⊂ C offen, analytisch (also um jeden Punktlokal in eine Potenzreihe entwickelbar) und ist f(z) =

∑∞k=0 ak(z−z0)k in einer Umgebung von

z0 ∈ G, so konvergiert diese Reihe fur alle z in der großten offenen in G gelegenen Kreisscheibeum z0 gegen f(z).Satz von Liouville: Ist f : C→ C analytisch und beschrankt, so ist f konstant.Stetige Fortsetzung: Es sei G ⊂ C offen und z0 ∈ G. Ist f : G→ C stetig und analytisch auf

G \ z0, so ist f auf ganz G analytisch.

144

dem Satz von Hahn-Banach fur k = 1 nun (−R0(T ))2 = 0 im Widerspruchzu R0(T )2T 2 = T−2T 2 = Id.

2. Es seir := r(T ) := sup|λ| : λ ∈ σ(T ),

so dass nach (i) r ≤ r := r(T ) ist. Setze

G = z ∈ C : z = 0 oder z−1 ∈ ρ(T ),

so dass – wieder nach (i) – BC1/r die großte in G enthaltene offene Kreisscheibe

um 0 ist. Ist ϕ ∈ L(X)′, so betrachten wir die Abbildung

f : G→ C, f(z) =

ϕ ((z−1 − T )−1) , falls z 6= 0,

0, falls z = 0.

Aus Satz 6.3.3 folgt, dass f analytisch ist in G\0mit f(z) = zϕ ((Id−zT )−1)→0 fur z → 0, so dass sogar f : G→ C analytisch ist.

Nun gilt nach dem Beweis von (i)

f(z) =∞∑n=0

ϕ(T n)zn+1

fur |z| < 1r. Nach dem Satz von Cauchy-Taylor konvergiert diese Reihe auf BC

1/r.

Ist also |λ| > r, so konvergiert f(λ−1) =∑

n=0 ϕ(T n)λ−n−1, so dass insbesondereϕ(T nλ−n−1) → 0 sein muss. M.a.W.: T nλ−n−1 0. Da schwach konvergenteFolgen beschrankt sind, ergibt sich ‖T n‖ ≤ C|λ|n+1 fur ein C > 0 und damit

r = limn→∞

‖T n‖1/n ≤ limn→∞

C1/n|λ|n+1n = |λ|.

Da |λ| > r beliebig war, folgt auch r ≤ r, also r = r. Fur σ(T ) 6= ∅ folgt aus derKompaktheit von σ(T ) damit r = max|λ| : λ ∈ σ(T ).

6.4 Kompakte Operatoren auf Banachraumen

Wir untersuchen nun kompakte Operatoren auf einem Banachraum. Fur dieseOperatoren lasst sich – ahnlich wie im endlichdimensionalen Fall – das Spek-trum vollstandig charakterisieren. Daruberhinaus erhalten wir in Analogie zurHauptraumzerlegung einer endlichdimensionalen Matrix eine Zerlegung des Ba-nachraums in invariante Unterraume, auf denen der betrachtete Operator einebesondere Struktur aufweist. Die Ergebnisse dieses Abschnitts bezeichnet manauch als die Theorie von Riesz-Schauder.

Im Folgenden sei X ein Banachraum. Die wesentlichen Resultate, auf denender Spektralsatz fur kompakte Operatoren letztlich beruht, sind die beiden fol-genden Satze uber kompakte Storungen der Identitat.

145

Satz 6.4.1 Es sei T ∈ K(X) und S := Id−T . Dann gilt:

(i) dim kerS <∞.

(ii) S(X) ist abgeschlossen und dim(X/S(X)) <∞.

Beweis. (i) Wir zeigen, dass jede beschrankte Folge (xn) in kerS eine konvergenteTeilfolge besitzt, was nach Satz 2.1.13 die Behauptung impliziert: Da T kompaktist gibt es namlich eine Teilfolge (xnk), so dass Txnk konvergiert. Wegen Sxnk = 0konvergiert dann aber auch xnk = Txnk . Da nun kerS abgeschlossen ist, liegt derLimes tatsachlich in kerS.

(ii) Setze U = kerS und betrachte den von S induzierten Operator

S : X/U → S(X), [x] 7→ Sx,

wobei [x] = x+U ist. Offensichtlich ist S wohldefiniert und bijektiv. Zudem ist Sstetig, da man den Reprasentanten x der Klasse [x] immer so wahlen kann, dass‖x‖ ≤ 2‖[x]‖ gilt, so dass ‖S[x]‖ = ‖Sx‖ ≤ 2‖S‖‖[x]‖ folgt.

Tatsachlich ist auch die Inverse S−1 stetig: Ware dies nicht der Fall, so gabees eine Folge (xn) ⊂ X mit

‖[xn]‖ = 1 ∀n ∈ N und S[xn] = Sxn → 0.

O.B.d.A. sei dabei ‖xn‖ ≤ 2‖[xn]‖ = 2. Da nun T kompakt ist, gibt es eineTeilfolge (xnk) und ein x ∈ X mit Txnk → x. Dann aber folgt auch xnk =Sxnk + Txnk → x. Daraus ergibt sich wegen Sx = limk Sxnk = 0 dann einerseitsx ∈ kerS. Andererseits folgt mit ‖[x]‖ = limk ‖[xnk ]‖ = 1 auch x /∈ kerS.Widerspruch.

S : X/U → S(X) ist also tatsachlich ein Isomorphismus. Mit X/U ist dannauch S(X) vollstandig und insbesondere abgeschlossen.

Aus Satz 5.4.4 und der Bemerkung 1 von Seite 106 schließlich folgern wir dass

kerS ′ = S(X)⊥ ∼= (X/S(X))′,

so dass mit (i) angewandt auf S ′ (beachte Satz 6.2.5) dim(X/S(X))′ = dim kerS ′ <∞ und damit auch X/S(X) endlichdimensional ist.

Bemerkung: Man nennt codimS(X) := dim(X/S(X)) auch die Kodimensionvon S(X) (inX). Operatoren S ∈ L(X), die den Bedingungen (i) und (ii) aus Satz6.4.1 genugen, heißen Fredholmoperatoren. Die ganze Zahl indS = dim kerS −codimS(X) heißt dann der Index von S.

Satz 6.4.2 Es sei T ∈ K(X) und S := Id−T . Dann gilt:

(i) Es gibt abgeschlossene invariante Unterraume N und R (d.h. S(N) ⊂ Nund S(R) ⊂ R) mit dimN <∞ und X = N ⊕R (topologisch), so dass

N = kerSn und R = Sn(X)

fur ein n ∈ N gilt und S|R : R→ R ein Isomorphismus ist.

146

(ii) dim kerS = dim(X/S(X)) = dim kerS ′ = dim(X ′/S ′(X ′)).

Beweis.4 Fur k ∈ N setze Nk = kerSk und Rk = Sk(X). Wir zeigen zunachst,dass es n, n ∈ N mit Nn+1 = Nn und Rn+1 = Rn gibt. Da offensichtlich Nk+1 ⊃Nk und Rk+1 ⊂ Rk fur alle k ∈ N gilt, konnte man namlich anderenfalls furk ≥ 2 mit dem Rieszschen Lemma 2.1.12 Elemente xk ∈ Nk mit ‖xk‖ = 1 unddist(xk, Nk−1) ≥ 1

2oder Elemente xk ∈ Rk mit ‖xk‖ = 1 und dist(xk, Rk+1) ≥ 1

2

wahlen. Fur k < m gilt dann

‖Txm − Txk‖ = ‖xm − xk︸︷︷︸∈Nm−1

+ Sxk − Sxm︸ ︷︷ ︸∈S(Nm)⊂Nm−1

‖ ≥ 1

2

oder

‖Txk − Txm‖ = ‖xk − xm︸︷︷︸∈Rk+1

+Sxm − Sxk︸ ︷︷ ︸∈S(Rk)⊂Rk+1

‖ ≥ 1

2.

Im Widerspruch zur Kompaktheit von T ware also (T xk) oder (T xk) keine Cauchy-Folge.

Es seien nun die kleinsten solchen n, n fixiert. Da fur k > n bzw. k > n

Nk = kerSn+1 ∩ Sk−n−1(X) = kerSn ∩ Sk−n−1(X) = Nk−1

bzw.

Rk = Sk(X) = Sk−n−1(Sn+1(X)) = Sk−n−1(Sn(X)) = Rk−1

gilt, ergibt sich dann induktiv Nn = Nn+1 = . . . und Rn = Rn+1 = . . ..Nun ist einerseits Nn ∩ Rn = 0. Denn ist x = Sny ∈ Nn fur ein y ∈ X, so

folgt S2ny = Snx = 0, also y ∈ N2n = Nn und damit x = Sny = 0. Andererseitsgilt X = Nn + Rn. Ist namlich x ∈ X, so gibt es wegen Snx ∈ Rn = R2n einy ∈ X mit Snx = S2ny. Dann aber ist x = (x− Sny) + Sny ∈ Nn +Rn.

Tatsachlich ist n = n: Ware n > n, so gabe es ein x ∈ Nn \ Nn. WegenX = Nn +Rn lasst sich x = y + z mit y ∈ Nn und z ∈ Rn = Rn schreiben. Dannaber folgt z = x − y ∈ Nn + Nn = Nn, also z ∈ Nn ∩ Rn und somit nach demeben Gezeigten z = 0 im Widerspruch zu x /∈ Nn.

Ware umgekehrt n > n, so gabe es ein x ∈ Rn \ Rn. Schreibe wie ebenx = y + z mit y ∈ Nn = Nn und z ∈ Rn. Nun folgt y = x− z ∈ Rn + Rn = Rn,also y ∈ Nn ∩Rn und somit y = 0 im Widerspruch zu x /∈ Rn.

Setzen wir also N = Nn und R = Rn, so ist X = N ⊕ R, wobei dieseZerlegung nach Satz 3.3.2 topologisch ist (vgl. auch die Bemerkung 2 auf Seite62), da nach Satz 6.4.1 die Raume Nk und Rk abgeschlossen sind. Es gilt jaSk = (Id−T )k = Id +

∑km=1

(km

)(−T )m ∈ Id +K(X).

4Der Beweis dieses Satzes wurde in der VL weggelassen.

147

Um schließlich zu beweisen, dass S|R ein Isomorphismus ist, genugt es nachdem Satz von der stetigen Inversen, die Bijektivitat zu uberprufen: Wegen S(R) =R ist S|R offensichtlich surjektiv. Die Injektivitat folgt, indem man x ∈ R =Sn(X) mit Sx = 0 als x = Sny, y ∈ X schreibt, so dass sich

0 = SnSy =⇒ y ∈ Nn+1 = Nn =⇒ x = Sny = 0

ergibt.

(ii) Aus dem Beweis von Satz 6.4.1 wissen wir schon, dass

dim kerS ′ = dimX/S(X)

gilt. Wir uberlegen uns nun, dass auch

dimX ′/S ′(X ′) = dim kerS

richtig ist. Beachte dabei, dass wegen Satz 6.2.5 S ′ = IdX′ +T′ auch eine kom-

pakte Storung der Identitat ist. Nach den Satzen 5.4.4 und 5.2.10 ist (kerS)⊥ =(S ′(X ′)⊥)⊥ ⊃ S ′(X ′). Tatsachlich sind diese Mengen gleich: Da S(X) abgeschlos-sen ist, ist S : X/ kerS → S(X), [x] 7→ Sx ein Isomorphismus (Korollar 3.2.8).Ist nun x′ ∈ (kerS)⊥, so wirkt x′ auf wohldefinierte Weise durch x′([x]) = x′(x)als Funktional auf X/ kerS (mit |x′([x])| ≤ infz∈[x] |x′(z)| ≤ ‖x′‖‖[x]‖). Daher istdie Abbildung

S(X)→ K, x 7→ x′(S−1x)

ein Funktional auf S(X), das sich nach dem Satz von Hahn-Banach stetig zueinem Funktional ϕ ∈ X ′ fortsetzen lasst. Wegen

x′(x) = x′([x]) = x′(S−1Sx) = ϕ(Sx)

ist aber x′ = S ′ϕ ∈ S ′(X ′). Dies zeigt die umgekehrte Inklusion. Mit der Bemer-kung 1 von Seite 106 folgt nun X ′/S ′(X ′) = X ′/(kerS)⊥ ∼= (kerS)′ und wegendim kerS <∞ dann auch dimX ′/S ′(X ′) = dim kerS.

Es bleibt, dim(X/S(X)) = dim kerS zu zeigen. Dazu wahlen wir N und Rwie in (i). Dann ist die Abbildung N/S(N) → X/S(X), x + S(N) 7→ x + S(X)wegen S(N) ⊂ S(X) wohldefiniert und offensichtlich linear, aber auch bijektiv.Um einzusehen, dass sie injektiv ist, schreibe x ∈ N mit x + S(N) 7→ S(X),also x ∈ N ∩ S(X), als x = Sy + Sz fur y ∈ N und z ∈ R. Wegen Sn+1z =Snx− Sn+1y = 0− 0 = 0 ist dann z = 0, also x = Sy ∈ S(N). Die Surjektivitatersieht man, indem man x = y + Sz mit y ∈ N und z ∈ (S|R)−1R = R schreibt,aus y+S(N) 7→ y+S(X) = y+S(z+X) = x+S(X). Dies zeigt, dass N/S(N)und X/S(X) als Vektorraume isomorph sind.

Des Weiteren ist fur x = y + z mit y ∈ N und z ∈ R genau dann Sx =Sy + Sz = 0, wenn Sy = −Sz ∈ N gilt, und damit genau dann, wenn y = 0und Sz = 0 gilt. Dies zeigt, dass kerS = kerS|N gilt. Da nun aber S|N : N → N

148

eine lineare Abbildung auf einem endlichdimensionalen Raum ist, folgt schließlichN/S(N) ∼= kerS|N . Zusammengefasst erhalten wir

dim(X/S(X)) = dim(N/S(N)) = dim kerS|N = dim kerS.

Bemerkung: Nach (ii) ist also Id−T fur T ∈ K(X) ein Fredholmoperator vomIndex 0.

In Anwendung auf das Losen von Gleichungen spiegeln sich unsere bisherigenErgebnisse in dem folgenden Losungskriterium wider:

Korollar 6.4.3 (Die Fredholmsche Alternative) Es seien T ∈ K(X), λ ∈K \ 0. Dann gilt entweder

(i) Die homogene Gleichungλx− Tx = 0

hat nur die triviale Losung und die inhomogene Gleichung

λx− Tx = y

ist fur jedes y ∈ X eindeutig losbar.

oder

(ii) Es existieren 0 < n = dim ker(λ − T ) < ∞ linear unabhangige Losungender homogenen Gleichung und auch die adjungierte homogene Gleichung

λx′ − T ′x′ = 0

hat n linear unabhangige Losungen. In diesem Fall ist die inhomogene Glei-chung genau dann losbar, wenn

y ∈ (ker(λ− T ′))⊥,

d.h. wenn x′(y) = 0 fur alle x′ mit λx′ − T ′x′ = 0 gilt.

Beweis. Das folgt wegen λ − T = λ(Id−λ−1T ) sofort aus Satz 6.4.1 und 6.4.2angewandt auf Id−λ−1T und aus Korollar 5.4.5, wonach (λ− T )(X) = (ker(λ−T ′))⊥ gilt.

Wir kommen nun zum Hauptergebnis dieses Abschnitts.

149

Satz 6.4.4 (Spektralsatz fur kompakte Operatoren) Es sei T ∈ K(X).

(i) Es gilt σ(T ) \ 0 = σp(T ) \ 0. Jeder Eigenraum ker(λ − T ) fur λ ∈σ(T ) \ 0 ist endlichdimensional. Fur dimX =∞ ist 0 ∈ σ(T ).

(ii) σ(T ) ist hochstens abzahlbar und hat keinen von 0 veschiedenen Haufungs-punkt.

(iii) Zu jedem λ ∈ σ(T ) \ 0 gibt es abgeschlossene T -invariante UnterraumeNλ und Rλ mit ker(λ − T ) ⊂ Nλ, dimNλ < ∞ und X = Nλ ⊕ Rλ, sodass (λ − T )|Nλ : Nλ → Nλ nilpotent5 und (λ − T )|Rλ : Rλ → Rλ einIsomorphismus ist.

Beweis. (i) Fur λ ∈ K\0 ist nach Korollar 6.4.3 λ−T injektiv genau dann, wennλ− T surjektiv ist, und dim ker(λ− T ) <∞. Daher ist σ(T ) \ 0 = σp(T ) \ 0und jeder Eigenraum zu λ ∈ σ(T ) \ 0 ist endlichdimensional.

Ist nun 0 ∈ ρ(T ), so ist T invertierbar und mit T auch Id = T−1T kompakt.Dann aber muss dimX <∞ sein, s. Satz 2.1.13.

(ii) Es genugt offenbar zu zeigen, dass fur jedes r > 0 die Menge λ ∈ σ(T ) :|λ| ≥ r = λ ∈ σp(T ) : |λ| ≥ r endlich ist. Ware dies nicht der Fall, so gabees paarweise verschiedene Eigenwerte λn ∈ K, n ∈ N, mit |λn| ≥ r und entspre-chenden Eigenvektoren xn ∈ X. Dann aber ist xn : n ∈ N linear unabhangig.Ansonsten gabe es namlich ein n ∈ N mit xn+1 =

∑nk=1 αkxk, wobei x1, . . . , xn

linear unabhangig ist und nicht alle αk ∈ C verschwinden. Dann aber folgt

0 = (λn+1 − T )xn+1 =n∑k=1

(λn+1 − T )αkxk =n∑k=1

(λn+1 − λk︸ ︷︷ ︸6=0

)αkxk,

also doch αk = 0 fur alle k.Schreibt man Xn = linx1, . . . , xn, so ist demnach Xn ) Xn−1 fur alle n ≥ 2.

Nach dem Rieszschen Lemma 2.1.12 gibt es xn =∑n

k=1 α(n)k xk ∈ Xn mit ‖xn‖ = 1

und dist(xn, Xn−1) ≥ 12. Ist nun n > m, so ergibt sich

‖T xn − T xm‖ =∥∥λnxn − λn λ−1

n

((λn − T )xn + T xm

)︸ ︷︷ ︸∈Xn−1

∥∥ ≥ |λn|2≥ r

2,

denn (λn − T )xn + T xm =∑n

k=1(λn − λk)α(n)k xk +

∑mk=1 λkα

(m)k xk ∈ Xn−1. Im

Widerspruch zur Kompaktheit von T ist daher (T xn) keine Cauchy-Folge.

(iii) Dies folgt wegen λ− T = λ(Id−λ−1T ) aus Satz 6.4.2.

5d.h. (λ− T )n(Nλ) = 0 fur ein n ∈ N

150

Bemerkungen:

1. Die Aussagen (i) und (ii) folgen auch ohne Ruckgriff auf den Satz 6.4.2. Manmuss dann allerdings noch extra begrunden, dass fur λ 6= 0 der Operatorλ− T genau dann injektiv ist, wenn er surjektiv ist.

2. Der Raum Nλ wird auch Hauptraum von T zu λ genannt.

6.5 Kompakte normale Operatoren

In diesem Abschnitt beweisen wir den Spektralsatz fur kompakte normale (imFalle K = C) bzw. selbstadjungierte (im Falle K = R) Operatoren auf einemHilbertraum. Dieser Satz ist das Pendant zur Hauptachsentransformation vonMatrizen fur unendlichdimensionale Raume.

Im Folgenden sei H ein Hilbertraum.

Satz 6.5.1 Es seien T ∈ L(H) normal, x, y ∈ H und λ, µ ∈ K. Dann gilt:

(i) r(T ) = ‖T‖,

(ii) Tx = λx ⇐⇒ T ∗x = λx,

(iii) σr(T ) = ∅ und

(iv) Tx = λx, Ty = µy mit λ 6= µ =⇒ x ⊥ y.

Beweis. (i) Wir zeigen durch Induktion nach n, dass ‖T n‖ = ‖T‖n fur alle n ∈ Ngilt. Dies ist klar fur n = 0 und n = 1. Fur n ≥ 1 gilt nach Lemma 4.6.4 furx ∈ H

‖T nx‖2 = 〈T nx, T nx〉 = 〈T n−1x, T ∗T nx〉 ≤ ‖T n−1x‖‖T ∗T nx‖= ‖T n−1x‖‖T n+1x‖ ≤ ‖T n−1‖‖T n+1‖‖x‖2.

Ist die Behauptung also fur n − 1 und n bewiesen, so ergibt der Ubergang zumSupremum uber alle x mit ‖x‖ = 1

‖T n+1‖ ≥ ‖T‖2n‖T‖−n+1‖ = ‖T‖n+1.

Da die umgekehrte Ungleichung trivialerweise richtig ist, ergibt sich ‖T n+1‖ =‖T‖n+1.

r(T ) = ‖T‖ ist nun klar nach der Definition von r(T ).

(ii) Nach Lemma 4.6.4 ist (λ− T )x = 0 ⇐⇒ (λ− T ∗)x = (λ− T )∗x = 0.

(iii) Fur λ ∈ σr(T ) gabe es ein x ∈ H \0 mit x ∈ (λ−T )(H)⊥ = ker(λ−T ∗)(vgl. Satz 4.6.2(iv)), also nach (ii) auch Tx = λx im Widerspruch zu λ /∈ σp(T ).

151

(iv) Nach (ii) ist

λ〈x, y〉 = 〈λx, y〉 = 〈Tx, y〉 = 〈x, T ∗y〉 = 〈x, µy〉 = µ〈x, y〉.

Wegen λ 6= µ muss somit 〈x, y〉 = 0 sein.

Satz 6.5.2 Ist T ∈ L(H) selbstadjungiert, so gilt

(i) σ(T ) ⊂ R sowie

(ii) ‖T‖ ∈ σ(T ) oder −‖T‖ ∈ σ(T ).

Beweis. (i) Fur λ ∈ C und x ∈ H gilt

‖(λ− T )x‖2 = |λ|2‖x‖2 − λ〈x, Tx〉 − λ〈Tx, x〉+ ‖Tx‖2

= |λ|2‖x‖2 − 2Reλ〈x, Tx〉+ ‖Tx‖2

≥((Reλ)2 + (Imλ)2

)‖x‖2 − 2Reλ‖x‖‖Tx‖+ ‖Tx‖2

=(Reλ‖x‖ − ‖Tx‖

)2+ (Imλ)2‖x‖2

≥ (Imλ)2‖x‖2.

Ist Imλ 6= 0, so ist daher λ − T injektiv, also λ /∈ σp(T ). Diese Abschatzungzeigt aber auch, dass fur solche λ das Bild (λ − T )(H) abgeschlossen ist. (Dennfur (λ − T )xn → y ist dann mit ((λ − T )xn) auch (xn) eine Cauchy-Folge, etwaxn → x und damit y = limn(λ − T )xn = (λ − T )x.) Daher ist auch λ /∈ σc(T ).Schließlich ist nach Satz 6.5.1(iii) auch λ /∈ σr(T ).

(ii) Nach Satz 4.6.6 gibt es (ggf. nach Ubergang zu einer geeigneten Teilfolge)eine Folge (xn) ⊂ H mit ‖xn‖ = 1 und limn→∞〈Txn, xn〉 = λ ∈ −‖T‖, ‖T‖.Wegen

lim supn→∞

‖λxn − Txn‖2 = lim supn→∞

〈λxn − Txn, λxn − Txn〉

= lim supn→∞

(λ2 − 2λ〈Txn, xn〉+ ‖Txn‖2

)≤ λ2 − 2λ2 + ‖T‖2 = 0

ist dann aber λ− T nicht invertierbar.

Wir kommen nun zum zentralen Ergebnis dieses Abschnitts.

Satz 6.5.3 (Spektralsatz fur kompakte normale Operatoren) Es sei T ∈K(H) normal (falls K = C) bzw. selbstadjungiert (falls K = R). Dann existierenein Orthonormalsystem en : n ∈ I mit I = N oder I = 1, . . . , N, N ∈ N,und Zahlen λn, n ∈ I, mit λn → 0 falls I = N, so dass gilt:

H = kerT ⊕ linen : n ∈ I (topologisch), kerT ⊥ linen : n ∈ I

152

und T hat die Darstellung

Tx =∑n∈I

λn〈x, en〉en ∀x ∈ H.

Dabei ist λn : n ∈ I = σ(T ) \ 0 die Menge der nicht verschwindendenEigenwerte von T und jedes en ein Eigenvektor zum Eigenwert λn.

Ist H ein separabler Hilbertraum, so kann man en : n ∈ I zu einer Ortho-normalbasis en :∈ I fortsetzen, indem man einfach die Elemente einer Ortho-normalbasis von kerT hinzunimmt. Fur x ∈ H ist dann

x =∑n∈I

〈x, en〉en und Tx =∑n∈I

λn〈x, en〉en

mit T en = λnen. Bezuglich dieser Orthnormalbasis wirkt T also wie eine unend-lich große Diagonalmatrix diag(λ1, λ2, . . .).

Beweis. Nach Satz 6.4.4 gibt es hochstens abzahlbar viele paarweise verschiedeneµn ∈ K mit σ(T )\0 = µ1, µ2, . . .. Daruberhinaus ist dim ker(µn−T ) =: dn <∞. Wir definieren die λn dann durch

(λ1, λ2, λ3, . . .) = (µ1, . . . , µ1︸ ︷︷ ︸d1-mal

, µ2 . . . , µ2︸ ︷︷ ︸d2-mal

, . . .).

Nach Satz 6.4.4 definiert dies endlich viele λn, n ≤ N , oder eine Nullfolge(λn). Des Weiteren wahlen wir zu jedem ker(λn − T ) eine Orthonormalbasis

e(n)1 , . . . , e

(n)dn und definieren entsprechend die en durch

(e1, e2, e3, . . .) = (e(1)1 , . . . , e

(1)d1, e

(2)1 , . . . , e

(n)d2, . . .).

Nach Konstruktion und Satz 6.5.1(iv) bildet dann en : n ∈ I ein Orthonormal-system mit Ten = λnen und en ⊥ kerT fur alle n und damit kerT ⊥ linen : n ∈I.

Tatsachlich ist H = kerT ⊕ linen : n ∈ I. Ware dies namlich nicht der Fall,so ware U = (kerT ⊕ linen : n ∈ I)⊥ 6= 0. U aber ist invariant unter T undT ∗, denn u ∈ U impliziert nach Satz 6.5.1(ii)

〈T (∗)u, en〉 = 〈u, T (∗)en〉 = λn〈u, en〉 oder λn〈u, en〉 = 0

und〈T (∗)u, x〉 = 〈u, T (∗)x〉 = 0 ∀x ∈ kerT = kerT ∗.

Damit aber ist T |U : U → U ein normaler bzw. selbstadjungierter kompakterOperator, der, da U ⊥ kerT , ungleich 0 ist. Nach den Satzen 6.4.4, 6.3.6(ii)und 6.5.1(i) bzw. 6.4.4 und 6.5.2(ii) hat T |U dann einen Eigenwert λ 6= 0 mit

153

zugehorigem Eigenvektor x ∈ U . Dann aber ergibt sich der Widerspruch λ ∈ σ(T )und x ∈ line1, e2, . . ..

Wir konnen also jedes x ∈ H schreiben als x = z +∑

n∈I〈x, en〉en, wobeiz ∈ kerT ist. Es folgt

Tx =∑n∈I

〈x, en〉Ten =∑n∈I

λn〈x, en〉en.

Bemerkung: Der wichtige Spezialfall selbstadjungierter kompakter Operatorenkann auch direkter mit Satz 6.5.2(ii) bewiesen werden, indem man bemerkt, dass‖T‖ oder −‖T‖ sogar ein Eigenwert ist, und dann λn und en induktiv durchλn = ±‖T |X⊥n−1

‖, Xn = line1, . . . , en−1, und Ten = λnen mit ‖en‖ = 1 und

en ⊥ Xn−1 definiert.

Beispiel: Ist U ⊂ Rn offen so ist nach dem Rellichschen Einbettungssatz der Ope-rator T : H1

0 (U) → L2(U), Tf = f kompakt. Es sei nun L der Losungsoperatorder Poissongleichung, d.h. es gilt

−∆u = f in U und u = 0 auf ∂U

genau fur u = Lf , also ∫U

∇Lf · ∇v =

∫fv ∀ v ∈ H1

0 .

Nach Satz 4.4.5 ist L : L2(U)→ H10 (U) stetig. Dann aber ist K = TL : L2(U)→

L2(U) kompakt. Da H10 (U) (genauso wie C∞c (U)) dicht liegt in L2(U), ist zudem

kerK = kerL = 0.K ist auch selbstadjungiert, denn∫

U

Kf g =

∫U

Lf g =

∫U

∇Lg · ∇Lf =

∫U

f Lg =

∫U

f Kg,

wobei wir im zweiten Schritt die Variationsgleichung fur ∆Lg = g mit v = Lf undim dritten Schritt die Variationsgleichung fur ∆Lf = f mit v = Lg angewendethaben.

Fur f = g 6= 0 zeigt diese Rechnung∫UKf f =

∫U|∇Lf |2 ≥ c‖Lf‖H1 > 0

fur ein c > 0 (Poincaresche Ungleichung), so dass fur jeden Eigenwert λ von K(mit Eigenvektor f) λ > 0 folgt.

Nach Satz 6.5.3 gibt es also eine positive Nullfolge von Eigenwerten mit einer(L2-)Orthonormalbasis en : n ∈ N aus “Eigenfunktionen” von K:

λn 0, Ken = λnen.

Ken = λnen heißt aber gerade ja en ∈ H10 (U) und −∆λnen = en im schwachen

Sinne. Setzen wir also µn = λ−1n , so erhalten wir eine positive Folge µn +∞

mit−∆en = µnen in U und en = 0 auf ∂U

154

im schwachen Sinne. Dies ist die Spektralzerlegung des Laplaceoperators auf U mitDirichlet-Randwerten.

Indem wir in der Darstellung von T aus Satz 6.5.3 gleiche Eignenwerte zu-sammenfassen, ergibt sich mit den Bezeichnungen aus dem Beweis dieses Satzes

Tx =∑n∈I

λn〈x, en〉en =∑

µk∈σp(T )

µk

dk∑n=1

〈x, e(k)n 〉e(k)

n =∑

µk∈σp(T )

µkPkx,

wobei Pk ∈ L(H) mit

Pkx =

dk∑n=1

〈x, e(k)n 〉e(k)

n

gerade die Orthogonalprojektion von H auf den Eigenraum ker(µk − T ) zumEigenwert µk von T ist. Es gilt

PkPl = 0 fur k 6= l,

denn wegen Satz 6.5.1(iv) ist Pl(H) ⊥ Pk(H). Tatsachlich konvergiert diese Dar-stellung von T nicht nur punktweise, sondern sogar in der Operatornorm:

Korollar 6.5.4 Es sei T ∈ K(H) normal (falls K = C) bzw. selbstadjungiert(falls K = R) mit σ(T ) \ 0 = µk : k ∈ J mit J = N oder J = 1, . . . ,M,M ∈ N. Bezeichnet Pk die Orthogonalprojektion von H auf den (eindlichdimen-sionalen) Eigenraum ker(µk − T ) zum Eigenwert µk von T , so gilt

T =∑k∈J

µkPk.

Beweis. Es ist nur noch zu zeigen, dass im Falle J = N die Reihe∑∞

k=1 µkPkin L(H) gegen T konvergiert. Dazu bemerken wir, dass fur n′ > n der Opera-

tor∑n′

k=n+1 µkPk (mit endlichdimensionalem Bild) ein kompakter normaler bzw.selbstadjungierter Operator mit den Eigenwerten µn+1, . . . , µn′ ist, so dass∥∥∥∥ n′∑

k=n+1

µkPk

∥∥∥∥ = max|µn+1|, . . . , |µn′ |

gilt. Fur n, n′ →∞ konvergiert dies gegen 0, was zeigt, dass die Partialsummender fraglichen Reihe eine Cauchyfolge in L(H) bilden. Ihr Limes ist T , denn esgilt ja Tx =

∑k∈J µkPkx fur jedes x ∈ H.

Es sei nun T ein kompakter normaler bzw. selbstadjungierter Operator. Mitden Bezeichnungen aus Satz 6.5.3 und Korollar 6.5.4 schreiben wir

Tx =∑k∈J

µkPkx =∑n∈I

λn〈x, en〉en.

155

Mit P0 sei außerdem die orthogonale Projektion auf kerT bezeichnet. Ausgehendvon dieser Darstellung lasst sich definieren, wie skalare Funktionen auf T wirken.Zur Motivation betrachten wir zunachst ein Polynom p(z) = ανz

ν+. . .+α1z+α0,fur das sicherlich

p(T ) = ανTν + . . .+ α1T + α0 Id

sein soll. Fur jedes m ∈ N und alle x ∈ H ist dabei

Tmx =

(∑k∈J

µkPk

)mx =

∑k∈J

(µkPk)mx =

∑k∈J

µmk Pkx =∑n∈I

λmn 〈x, en〉en

da wegen PkPl = 0 fur k 6= l alle gemischten Terme verschwinden und P 2k = Pk

gilt. Fur m = 0 ist außerdem

T 0x = Idx = P0x+∑n∈I

〈x, en〉en =∑k∈J0

Pkx

fur alle x ∈ H, wobei wir im zweiten Schritt Satz 4.5.6(iii) und (iv) auf linen :n ∈ I angewandt haben. Es folgt

p(T )x =∑

k∈J∪0

p(µk)Pkx = p(0)P0x+∑n∈I

p(λn)〈x, en〉en ∀x ∈ H

mit µ0 = 0. Hierdurch motiviert definieren wir fur ein solches T :

Definition 6.5.5 Ist f ∈ l∞(σ(T );K) eine beschrankte Funktion, so definierenwir einen Operator f(T ) ∈ L(H) durch

f(T )x =∑

k∈J∪0

f(µk)Pkx = f(0)P0x+∑n∈I

f(λn)〈x, en〉en ∀x ∈ H.

(Tatsachlich hangt f(T ) nur von den Werten von f auf σp(T ) ab, denn fur 0 /∈σp(T ) ist P0 = 0.) Dass dies im Falle I = N wohldefiniert ist, ergibt sich daraus,dass die Folge (f(λn)〈x, en〉)n nach Satz 4.5.6(vi) in l2 liegt. (Vgl. den Beweis vonKorollar 4.5.8.)

Wir betrachten nun zu gegebenem T die Abbildung f 7→ f(T ).

Satz 6.5.6 (Funktionalkalkul fur kompakte normale Operatoren) Es seiΦ : l∞(σp(T ))→ L(H), Φ(f) = f(T ).

(i) Φ ist linear und multiplikativ (also ein Algebrenhomomorphismus).

(ii) Φ ist involutiv: Φ(f) = Φ(f)∗ fur alle f ∈ l∞(σp(T )).

(iii) Φ(f) = Id fur f ≡ 1 und Φ(f) = T fur f(z) = z.

(iv) Φ ist isometrisch. Insbesondere ist Φ stetig.

156

Beweis. Es sei T =∑

k∈J∪0 µkPk wie in Korollar 6.5.4.

(i) Sind f, g ∈ l∞(σp(T )), λ ∈ K, so ist offenbar

(f + λg)(T ) = f(T ) + λg(T ),

Φ also linear. Die Multiplikativitat ergibt sich aus

f(T )g(T )x =∑

k∈J∪0

f(µk)Pk

( ∑l∈J∪0

g(µl)Plx

)=

∑k∈J∪0

f(µk)g(µk)Pkx = (fg)(T )x

fur alle x ∈ H, wobei wir PkPl = δklPk ausgenutzt haben.

(ii) Da die Pk nach Beispiel 2 von Seite 91 selbstadjungiert sind, gilt

⟨x, f(T )y

⟩=

⟨x,

∑k∈J∪0

f(µk)Pky

⟩=

⟨ ∑k∈J∪0

f(µk)Pkx, y

⟩=⟨f(T )x, y

⟩fur x, y ∈ H, woraus f(T ) = f(T )∗ folgt.

(iii) Dies folgt aus der motivierenden Rechnung vor Definition 6.5.5.

(iv) Fur jedes x ∈ H ist nach Pythagoras und Satz 4.5.6

‖f(T )x‖2 =∥∥∥f(0)P0x+

∑n∈I

f(λn)〈x, en〉en∥∥∥2

= ‖f(0)P0x‖2 +∑n∈I

|f(λn)〈x, en〉|2

≤ ‖f‖2∞

(‖P0x‖2 +

∑n∈I

|〈x, en〉|2)

= ‖f‖2∞‖x‖2.

Andererseits ist ‖f(T )en‖ = |f(λn)| und, falls P0 6= 0 und e0 ∈ kerT , ‖f(T )e0‖ =|f(λ0)|. Es folgt ‖f(T )‖ = ‖f‖∞.

Beispiel. Ist T ∈ K(H) selbstadjungiert, so ist eiT ein unitarer Operator. Diesfolgt aus

(eiT )∗eiT = e−iT eiT = Id = eiT e−iT = eiT (eiT )∗,

wobei wir σ(T ) ⊂ R ausgenutzt haben.

Als nutzliche Anwendung erweist es sich, Quadratwurzeln aus positiven Ope-ratoren zu ziehen.

Definition 6.5.7 Ein Operator T ∈ L(H) heißt positiv (schreibe T ≥ 0), wenn

〈Tx, x〉 ≥ 0 ∀x ∈ H

gilt.

157

Satz 6.5.8 Ist T ∈ K(H) ein positiver selbstadjungierter Operator, so gibt esgenau einen positiven selbstadjungierten Operator A ∈ K(H) mit A2 = T .

Wir schreiben auch A =√T fur dieses A.

Beweis. Wir schreiben T =∑

k∈J µkPk wie oben. Zunachst bemerken wir, dassµk ≥ 0 fur alle k gilt, denn ware λ < 0 ein Eigenwert zum Eigenvektor x, so wareja 〈Tx, x〉 = λ〈x, x〉 < 0. Damit ist

A =√T =

∑k∈J

õkPk

nach Definition 6.5.5 erklart und nach Satz 6.5.6 gilt A2 = T .Ist nun B ∈ K(H) ein beliebiger positiver selbstadjungierter Operator mit

B2 = T , so konnen wir nach dem Spektralsatz B =∑

k∈J µkPk mit σ(B) \ 0 =

µk : k ∈ J ⊂ [0,∞) und Orthogonalprojektionen Pk auf ker(µk−B) schreiben.Es ist dann ∑

k∈J

µkPk = T = B2 =∑k∈J

µ2kPk.

Dann aber muss, evtl. nach Umnummerierung, µ2k = µk und Pk = Pk (und J = J)

gelten. (Uberlegen Sie sich das!) Dies impliziert B = A.

Wir betrachten nun im folgenden zwei Hilbertraume H1, H2.

Satz 6.5.9 (Polarzerlegung kompakter Operatoren) Es seien H1, H2 Hil-bertraume. Zu jedem T ∈ K(H1;H2) existiert ein Operator U ∈ L(H1;H2), sodass U |(kerU)⊥ : (kerU)⊥ → U(H1) unitar ist, mit der Eigenschaft

T = U√T ∗T .

Es gibt genau ein solches U mit kerU = kerT .

Beweis. Offenbar ist T ∗T selbstadjungiert und, wegen 〈T ∗Tx, x〉 = 〈Tx, Tx〉 ≥ 0fur x ∈ H1, auch positiv.

√T ∗T ist also nach Satz 6.5.8 erklart.

DurchU(√T ∗Tx) = Tx ∀x ∈ H1

ist U auf√T ∗T (H1) und damit

√T ∗T (H1) eindeutig festgelegt. Tatsachlich wird

hierdurch und stetige Fortsetzung ein isometrischer Isomorphismus U :√T ∗T (H1)→

T (H1) definiert, denn da√T ∗T selbst selbstadjungiert ist, gilt

‖√T ∗Tx‖2 = 〈

√T ∗Tx,

√T ∗Tx〉 = 〈x, T ∗Tx〉 = 〈Tx, Tx〉 = ‖Tx‖2

fur x ∈ H1. (Insbesondere ist kerT = ker√T ∗T .) Nach Satz 4.6.2(iv) ist außer-

dem (kerT )⊥ = (ker√T ∗T )⊥ =

√T ∗T (H1). Setzt man nun U ≡ 0 auf kerT ,

158

so wird hierdurch in eindeutiger Weise U mit den gewunschten Eigenschaftendefiniert.

Da, wie eben gesehen, fur T ∈ K(H1;H2) der Operator√T ∗T ein positi-

ver selbstadjungierter kompakter Operator ist, besteht sein Punktspektrum auseiner endlichen Menge oder einer Nullfolge nichtnegativer reeller Zahlen (derenQuadrate gerade die Eigenwerte von T ∗T sind). Wir konnen daher definieren:

Definition 6.5.10 Fur T ∈ K(H1;H2) nennt man die (mit Vielfachhheit) gezahl-ten Eigenwerte s1 ≥ s2 ≥ . . . ≥ 0 von

√T ∗T die Singularwerte von T .

Mit Hilfe Singularwerte ergibt sich nun die folgende Darstellung eines allge-meinen Operators T ∈ K(H1, H2).

Satz 6.5.11 Es sei T ∈ K(H1, H2) mit Singularwerten s1 ≥ s2 ≥ . . . 0. Danngibt es Orthogonalsysteme ei : i ∈ I in H1 und e′i : i ∈ I in H2, I =1, . . . , N oder I = N, so dass

Tx =∑k∈I

sk〈x, ek〉e′k ∀x ∈ H1

gilt.

Beweis. Nach dem Spektralsatz gilt

√T ∗Tx =

∑k∈I

sk〈x, ek〉ek,

wenn ek der zu sk gehorige Eigenvektor ist. Insbesondere ist dann ei : i ∈ I einOrthonormalsystem in (kerT ∗T )⊥ = (kerT )⊥ (vgl. den Beweis von Satz 6.5.9).Wahlen wir nun U wie in Satz 6.5.9 und setzen e′i = Uei, so ist auch e′i : i ∈ Iein Orthonormalsystem in U(H1) ⊂ H2, da ja U |(kerU)⊥ : (kerU)⊥ → U(H1)unitar ist. Es folgt

Tx = U√T ∗Tx = U

∑k∈I

sk〈x, ek〉ek =∑k∈I

sk〈x, ek〉e′k

fur alle x ∈ H1.

Zum Schluss dieses Kapitels diskutieren wir noch eine besonders gutartigeKlasse von Operatoren. Im Folgenden sei H ein separabler Hilbertraum.

Definition 6.5.12 Ein Operator T ∈ K(H) heißt Hilbert-Schmidt-Operator,wenn die Folge der Singularwerte (sn) von T in l2 liegt.

Um die Notation einfach zu halten, nehmen wir außerdem stillschweigend an,dass H unendlichdimensional ist. (Im endlichdimensionalen Fall ist trivialerweisejeder Operator ein Hilbert-Schmidt-Operator. Die ubrigen Aussagen sind volliganalog.)

159

Lemma 6.5.13 T ∈ K(H) ist ein Hilbert-Schmidt-Operator genau dann, wennfur eine (und dann jede) Orthonormalbasis en : n ∈ N gilt

∑∞n=1 ‖Ten‖2 <∞.

In diesem Falle ist∞∑n=1

‖Ten‖2 = ‖(sn)‖22,

wenn (sn) die Folge der Singularwerte von T ist.

Beweis. Ist T ∈ K(H), so gibt es nach Satz 6.5.11 Orthonormalbasen e1, e2, . . .und e′1, e′2, . . . von H, so dass T von der Form

Tx =∞∑n=1

sn〈x, en〉e′n ∀x ∈ H

ist, wenn s1 ≥ s2 ≥ . . . 0 die Singularwerte von T sind. Fur jede Orthonormalbasisen : n ∈ N gilt nun nach Satz 4.5.6

∞∑k=1

‖Tek‖2 =∞∑k=1

∥∥∥∥ ∞∑n=1

sn〈ek, en〉e′n∥∥∥∥2

=∞∑k=1

∞∑n=1

s2n|〈ek, en〉|2

=∞∑n=1

s2n

∞∑k=1

|〈ek, en〉|2 =∞∑n=1

s2n‖en‖2 =

∞∑n=1

s2n.

Hieraus folgt die Behauptung.

Bemerkung. Sind S und T Hilbert-Schmidt-Operatoren und e1, e2, . . . eineOrthonormalbasis, so lasst sich auch zeigen, dass der Ausdruck

〈S, T 〉HS =∞∑n=1

〈Sen, T en〉

nicht von der Wahl der Orthonormalbasis abhangt und ein Skalarprodukt auf derMenge HS(H) der Hilbert-Schmidt-Operatoren definiert, das HS(H) zu einemHilbertraum macht. Die induzierte Norm ist dann

‖T‖HS = ‖(sn)‖2,

wo (sn) die Folge der Singularwerte von T ist. (Diese Norm ist nicht aquivalentzur Operatornorm in L(H).) Einzelheiten finden sich z.B. in [We].

Das folgende Beispiel liefert eine vollstandige Charakterisierung der Hilbert-Schmidt-Operatoren auf L2(a, b).

Beispiel. Wir betrachten den in den Beispielen 3 von Seite 91 und 3 von Seite139 diskutierten Integraloperator Tk ∈ K(L2(a, b)),

Tkf(s) =

∫ b

a

k(s, t)f(t) dt

160

auf L2(a, b) mit Kern k ∈ L2((a, b)2).Tk ist ein Hilbert-Schmidt-Operator, denn fur jede Orthonormalbasis en :

n ∈ N von L2(a, b) ist nach Satz 4.5.6

∞∑n=1

‖Ten‖2 =

∫ b

a

∞∑n=1

∣∣∣∣ ∫ b

a

k(s, t)en(t) dt

∣∣∣∣2 ds=

∫ b

a

‖k(s, ·)‖2L2(a,b) ds = ‖k‖2

L2((a,b)2),

wobei wir den Satz von der monotonen Konvergenz und den Satz von Fubiniausgenutzt haben, nach dem insbesondere k(s, ·) ∈ L2(a, b) fur fast alle s ∈ (a, b)gilt. Die Behauptung folgt nun aus Lemma 6.5.13, das außerdem ‖k‖L2 = ‖(sn)‖2

liefert, wenn (sn) die Folge der Singularwerte von Tk ist.Tatsachlich ist jeder Hilbert-Schmidt-Operator T auf L2(a, b) ein solcher In-

tegraloperator. Um dies einzusehen schreiben wir T gemaß Satz 6.5.11

Tf =∞∑n=1

sn〈f, en〉e′n ∀ f ∈ L2(a, b),

wobei s1 ≥ s2 ≥ . . . 0 die Singularwerte von T und e1, e2, . . . sowie e′1, e′2, . . .geeignete Orthonormalbasen von L2(a, b) sind.

Da dann die Funktionen (s, t) 7→ en(t) e′n(s), n ∈ N, orthonormal in L2((a, b)2)sind, wird durch die in L2((a, b)2) konvergente Reihe

k(s, t) :=∞∑n=1

sn en(t) e′n(s)

eine Funktion k ∈ L2((a, b)2) definiert. Ist Tk ∈ K(L2(a, b)) der Integraloperatormit Kern k, so ergibt sich fur alle l,m ∈ N mit dem Satz von Fubini

〈Tkel, e′m〉 =

∫ b

a

∫ b

a

k(s, t) el(t) em(s)′ dt ds

=∞∑n=1

sn

∫ b

a

∫ b

a

en(t) e′n(s) el(t) e′m(s) dt ds

=∞∑n=1

sn

∫ b

a

e′n(s) em(s)′ ds

∫ b

a

en(t) el(t) dt

=∞∑n=1

snδnmδnl = smδlm,

wobei wir im zweiten Schritt ausgenutzt haben, dass die k definierende Reihe inL2((a, b)2) konvergiert und die Funktion (s, t) 7→ el(t) em(s) in L2((a, b)2) liegt.

161

Es gilt aber ebenso

〈Tel, e′m〉 =

⟨ ∞∑n=1

sn〈el, en〉e′n, e′m⟩

=∞∑n=1

snδnlδnm = smδlm.

Da l,m beliebig waren, ist daher 〈Tkf, g〉 = 〈Tf, g〉 fur alle f ∈ linen : n ∈ N =L2(a, b) und g ∈ line′n : n ∈ N = L2(a, b), so dass in der Tat Tk = T gilt.

162

Anhang A

Anhang

In diesem Anhang1 formulieren wir das Auswahlaxiom und zeigen, dass es aqui-valent zum Lemma von Zorn und zum Wohlordnungssatz ist. Wir gehen dannnoch kurz auf das Prinzip der transfiniten Induktion ein.

A.1 Auswahlaxiom, Zornsches Lemma und Wohl-

ordnungssatz

Axiom A.1.1 (Auswahlaxiom) Zu jeder Familie (Ai)i∈I nicht-leerer Mengengibt es eine “Auswahlfunktion”

f : I →⋃i∈I

Ai mit f(i) ∈ Ai ∀ i ∈ I.

Ob das Auswahlaxiom als gultig angenommen werden soll oder nicht, hat imletzten Jahrhundert immer wieder zu Diskussionen gefuhrt. Die Kritik an diesemAxiom bezieht sich dabei darauf, dass es im Allgemeinen ja schlecht moglich sei,eine solche Abbildung f tatsachlich zu konstruieren. Die uberwiegende Anzahlan Mathematikern aber akzeptiert es. Vom formalen Standpunkt sind beide Mei-nungen zulassig: Die Annahme des Auswahlaxioms fuhrt nicht zu Widerspruchen,wenn die ubrigen Axiome der Mengenlehre widerspruchsfrei sind (Godel 1938).Andererseit folgt das Auswahlaxiom auch nicht aus den ubrigen Axiom (Cohen1963). Viele interessante Resultate insbesondere in der Analysis beruhen aller-dings auf dem Auswahlaxiom und es ware ja schade, auf die zu verzichten.

Eine aquivalente Formulierung des Auswahlaxioms ist: Zu jeder Menge X gibtes eine Abbildung

f : P(X) \ ∅ → X mit f(A) ∈ A ∀A ∈ P(X) \ ∅.1Bonusmaterial: Dieser Anhang ist nicht Teil der Vorlesung.

163

(Hierbei bezeichnet P(X) die Potenzmenge von X.) f nennt man dann auch ein-fach eine Auswahlfunktion fur X. Diese Form folgt unmittelbar aus Axiom A.1.1angewandt auf (A)A∈P(X)\∅. Umgekehrt erhalt man Axiom A.1.1 aus dieser For-mulierung indem man X =

⋃i∈I Ai setzt, g : P(X) \ ∅ → X mit g(A) ∈ A fur

A ∈ P(X) \ ∅ wahlt und f : I → X durch f(i) = g(Ai) definiert.Es gibt zwei besonders wichtige zum Auswahlaxiom aquivalente Aussagen:

Das Lemma von Zorn und der Wohlordnungssatz. Zur Erinnerung:

Definition A.1.2 Es sei X eine Menge.

(i) Eine Relation ≤ auf X heißt Ordnung und (X,≤) ein geordneter Raum,wenn fur alle x, y, z ∈ X gilt:

a) x ≤ x (Reflexivitat),

b) x ≤ y und y ≤ x =⇒ x = y (Antisymmetrie) und

c) x ≤ y und y ≤ z =⇒ x ≤ z (Transitivitat).

(ii) Ist (X,≤) ein geordneter Raum und Y ⊂ X, so heißt ein Element x ∈X mit y ≤ x fur alle y ∈ Y eine obere Schranke oder Majorante fur Y .Entsprechend werden untere Schranken bzw. Minoranten definiert.

Ein x ∈ X heißt maximales (minimales) Element von X, wenn es keineecht großeren (kleineren) Elemente gibt, d.h.:

y ≥ x (bzw. y ≤ x) =⇒ y = x.

(iii) Ein geordeneter Raum (X,≤) heißt total geordnet, wenn je zwei Elementevergleichbar sind, also mit x, y ∈ X x ≤ y oder y ≤ x gilt.

(iv) Ist (X,≤) ein geordneter Raum, so dass es in jeder Teilmenge Y ⊂ X einkleinstes Element gibt, also ein y1 ∈ Y mit y1 ≤ y fur alle y ∈ Y , so nenntman (X,≤) wohlgeordnet. y1 heißt auch das erste Element in Y .

Wir schreiben x < y, wenn x ≤ y und x 6= y ist, sowie x ≥ y (x > y), wenny ≤ x (und x 6= y) gilt. Beachte außerdem, dass jede wohlgeordnete Menge Xauch total geordnet ist, da ja jede zweielementige Menge x, y fur x, y ∈ X einerstes Element enthalt.

Satz A.1.3 (Zornsches Lemma) Es sei (X,≤) ein geordneter Raum, in demjede total geordnete Teilmenge eine obere Schranke besitzt. Dann gibt es ein ma-ximales Element in X.

(Einen geordneten Raum, in dem jede total geordnete Teilmenge eine obereSchranke besitzt, nennt man auch induktiv geordnet.)

164

Satz A.1.4 (Wohlordnungssatz) Jede Menge lasst sich wohlordnen.

Satz A.1.5 Das Auswahlaxiom, das Lemma von Zorn und der Wohlordnungssatzsind aquivalent.

Fur den Beweis, der im Wesentlichen der Darstellung in [Pe] folgt, benotigenwir noch eine kleine Vorbereitung.

Definition A.1.6 Es sei (X,≤) ein geordneter Raum.

(i) Ist Y ⊂ X, so bezeichnen wir die Menge der echten oberen und unterenSchranken mit Maj(Y ) bzw. Min(Y ):

Maj(Y ) = x ∈ X : x > y ∀ y ∈ Y , Min(Y ) = x ∈ X : x < y ∀ y ∈ Y .

(ii) Ist f eine Auswahlfunktion fur die Familie (A)A⊂XA6=∅

der nicht-leeren Teil-

mengen von X, so nennt man eine Teilmenge C ⊂ X eine f -Kette, wennC bezuglich ≤ wohlgeordnet ist und fur jedes x ∈ C gilt

f(Maj(C ∩Minx)) = x.

Ubung: Uberlegen Sie sich, dass das erste Element einer jeden f -Kette f(X) istund dass f(X) eine (einelementige) f -Kette ist.

Lemma A.1.7 Sind C1 und C2 f -Ketten in X mit C1 6⊂ C2, so gibt es einx1 ∈ C1 mit

C2 = C1 ∩Minx1.

Beweis. Da C1 \C2 eine nicht-leere Teilmenge der wohlgeordneten Menge C1 ist,gibt es ein erstes Element x1 in C1 \ C2. Alle Elemente aus C1, die echt kleinerals x1 sind, mussen also zu C2 gehoren:

C1 ∩Minx1 ⊂ C2.

Angenommen diese Inklusion ware echt. Dann konnten wir in der nicht-leerenTeilmenge C2 \ (C1∩Minx1) wieder ein erstes Element x2 finden. Die Elementeaus C2, die echt kleiner als x2 sind, wurden dann in C1 ∩Minx1 liegen:

C2 ∩Minx2 ⊂ C1 ∩Minx1.

Nehmen wir wiederum an, dass auch diese zweite Inklusion echt ist, so gabe esauch in C1 ∩Minx1 \ C2 ∩Minx2 ein erstes Element y, das dann ja auch inC2 liegt und kleiner als x1 ist, und es ware

C1 ∩Miny = C1 ∩Minx1 ∩Miny ⊂ C2 ∩Minx2.

165

Diese Inklusion kann aber nicht echt sein. Fur jedes x ∈ C2∩Minx2 (⊂ C1) giltnamlich y 6≤ x, da anderenfalls y ≤ x < x2 und somit y ∈ C2 ∩Minx2 ware, imWiderspruch zur Wahl von y. Dann aber muss x < y sein, da ja beide Elementein der total geordneten Menge C2 liegen, und das heißt, dass x ∈ C1 ∩Minyliegt.

Wenden wir nun f auf beide Seiten von

Maj(C1 ∩Miny) = Maj(C2 ∩Minx2)

an, ergibt sich y = x2. Nach Konstruktion von y und x2 ist jedoch y ∈ C1 ∩Minx1 und x2 /∈ C1 ∩Minx1. Wir mussen also die Annahme, dass die zweiteInklusion echt war, verwerfen und erhalten aus

Maj(C2 ∩Minx2) = Maj(C1 ∩Minx1)

nach Anwenden von f x2 = x1. Das wiederum widerspricht x1 /∈ C2 und x2 ∈ C2;wir mussen also auch die Annahme, dass die erste Inklusion echt war, aufgebenund erhalten

C1 ∩Minx1 = C2.

Wir konnen nun den Aquivalenzsatz A.1.5 beweisen:

Beweis von Satz A.1.5.1. Auswahlaxiom =⇒ Zornsches Lemma.Es sei (X,≤) ein geordneter Raum, in dem jede total geordnete Teilmenge eineobere Schranke besitzt. Wahle eine Auswahlfunktion f fur X. Es sei weiter (Cj)die Familie aller f -Ketten in X und C =

⋃j∈J Cj. Dann ist

C ∩Minx = Cj ∩Minx ∀x ∈ Cj.

Wegen C ⊃ Cj ist hier nur “⊂” zu zeigen: Ist y ∈ C ∩ Minx, etwa y ∈Ci ∩ Minx, so ist entweder Ci ⊂ Cj und damit y ∈ Cj ∩ Minx oder aberCi 6⊂ Cj und daher nach Lemma A.1.7 Cj = Ci ∩xi fur ein xi ∈ Ci, also wegeny < x < xi (beachte x ∈ Cj) wieder y ∈ Cj.

Tatsachlich ist C selbst eine f -Kette: Da nach Lemma A.1.7 je zwei f -Kettenineinander enthalten sind, ist C total geordnet. Ist nun Y ⊂ C nicht leer, so istY ∩ Cj 6= ∅ fur ein j. Es sei dann y das erste Element in Y ∩ Cj. Dann aber istwegen

C ∩Miny = Cj ∩Miny = ∅

y sogar das erste Element von C. Schließlich folgt fur x ∈ C, etwa x ∈ Cj

f(Maj(C ∩Minx)) = f(Maj(Cj ∩Minx)) = x.

C ist also (als Vereinigung aller) die langste f -Kette in X.

166

Dann aber ist Maj(C) = ∅, denn anderenfalls ware fur

x := f(Maj(C)) ⊂ Maj(C)

C ∪ x eine langere f -Kette. (Beachte, dass C ∪ x immer noch wohlgeordnetist wegen x > x fur alle x ∈ C und dass f(Maj(C ∩Minx)) = f(Maj(C)) = xgilt.) Nach Annahme besitzt aber C in X eine obere Schranke x, die somit in Cselbst liegen muss. x ist dann das gesuchte maximale Element, denn gabe es einy mit y > x, so ware y ∈ Maj(C) = ∅.2. Zornsches Lemma =⇒ Wohlordnungssatz.Es sei X eine Menge. Auf dem System

M = (C,≤) wohlgeordnet : C ⊂ X

der wohlgeordneten Teilmengen definieren wir eine Ordnung durch (C1,≤1) (C2,≤2) wenn C1 = C2 und ≤1 = ≤2 gilt oder es ein x2 ∈ C2 mit

C1 = C2 ∩Minx2 = x ∈ C2 : x <2 x2 und ≤1 = ≤2|C1

gibt. Wir behaupten, dass dann (M,) induktiv geordnet ist. Sei also N =(Cj,≤j) : j ∈ J ⊂M eine total geordnete Teilmenge. Setze C =

⋃j∈J Cj. Wir

definieren eine Ordnung ≤ auf C, indem wir x ≤ y setzen, wenn x, y ∈ Cj undx ≤j y gilt. Da N total geordnet ist, ist dies wohldefiniert. Wie in 1. behauptenwir, dass

C ∩Minx = Cj ∩Minx ∀x ∈ Cjgilt. Wegen C ⊃ Cj ist wieder nur “⊂” zu zeigen: Ist y ∈ C ∩ Minx, etway ∈ Ci∩Minx, so ist entweder (Ci,≤i) (Cj,≤j) und damit y ∈ Ci ⊂ Cj oderaber (Cj,≤j) (Ci,≤i) und daher Cj = Ci ∩ xi fur ein xi ∈ Ci, also wegeny < x < xi (beachte x ∈ Cj) wieder y ∈ Cj. Genau wie in 1. ergibt sich nundaraus, dass (C,≤) wohlgeordnet ist. Schließlich ist (C,≤) eine obere Schrankefur N : Das ist klar, wenn es ein großtes Element in N gibt, das dann ja gerade Cist. Gibt es kein großtes Element in N , existiert also zu jedem Cj ∈ N ein Ci ∈ Nmit (Cj,≤j) ≺ (Ci,≤i), etwa Cj = Ci ∩Minxi, so ist auch

Cj = Ci ∩Minxi = C ∩Minxi, ≤j = ≤|Cj ,

d.h. (Cj,≤j) (C,≤).

Nach dem Zornschen Lemma existiert nun ein maximales Element (C, ≤) inM . Die Behauptung folgt nun daraus, dass C = X ist. Ware dies nicht der Fall,so gabe es ein x ∈ X \ C. Setzte man dann ≤ durch y ≤x fur alle y ∈ C fort, soware auch (C ∪x, ≤) (C, ≤) wohlgeordnet im Widerspruch zur Maximalitatvon (C, ≤).

167

3. Wohlordnungssatz =⇒ Auswahlaxiom.Ist (Ai)i∈I eine Familie nicht-leerer Mengen, so wahle eine Wohlordnung auf⋃i∈I Ai und definiere f(i) als das erste Element von Ai.

Das Beweisprinzip der vollstandigen Induktion lasst sich auf wohlgeordneteMengen ubertragen: Es sei (X,≤) wohlgeordnet. Das kleinste Element in X be-zeichnen wir mit 1. Eine Aussage uber die Elemente x ∈ X ist wahr, wenn dasFolgende gezeigt ist:

• Die Aussage gilt fur 1.

• Gilt die Aussage fur alle y < x, so gilt sie auch fur x.

Man nennt dieses Beweisschema das Prinzip der transfiniten Induktion. Tatsachlichgenugt es, eine etwas schwachere Variante nachzuweisen, in der man die folgendenFalle unterscheidet. Ist x ∈ X und gibt es ein y ∈ X mit x = minz ∈ X : z > y,so nennt man y einen Vorganger von x. Gibt es keinen Vorganger von x 6= 1,so nennt man x ein Limes-Element. Im Unterschied zu einem Vorganger be-sitzt jedes Element x (außer das evtl. vorhandene großte) einen Nachfolger:minz ∈ X : z > x. Eine Aussage uber die Elemente x ∈ X ist dann wahr,wenn das Folgende gezeigt ist:

• Die Aussage gilt fur 1.

• Gilt die Aussage fur x, so gilt sie auch fur den Nachfolger von x.

• Ist x ein Limeselement und gilt die Aussage fur alle y < x, so gilt sie auchfur x.

Um das einzusehen, wahle aus der Menge aller x, fur die die fragliche Aussagefalsch ist, das kleinste Element x1, sofern diese Menge nicht leer ist. Dann istx1 6= 1. Hat nun x1 einen Vorganger y, so gilt die Aussage fur y und damit auchfur den Nachfolger x1 von y. Ist andererseits x1 ein Limeselement, so gilt dieAussage wieder fur x1, da sie ja fur alle y < x1 erfullt ist. Widerspruch.

168

Literaturverzeichnis

[Al] H. W. Alt: Lineare Funktionalanalysis. Springer-Verlag, Berlin · Heidelberg2006.

[Bau] H. Bauer: Maß- und Integrationstheorie. de Gruyter, Berlin · New York1990.

[Co] J. B. Conway: A Course in Functional Analysis. Springer-Verlag, New York1990.

[Ed] R. E. Edwards: Functional Analysis. Theory and applications. Holt, Rine-hart and Winston, New York 1965.

[Ev] L. C. Evans: Partial Differential Equations. Graduate Studies in Mathema-tics 19. American Mathematical Society, Providence, RI, 1998.

[He] H. Heuser: Lehrbuch der Analysis 2. Teubner, Stuttgart 1991.

[He] H. Heuser: Funktionalanalysis. Theorie und Anwendung. Teubner, Stuttgart2006.

[HS] F. Hirzebruch, W. Scharlau: Einfuhrung in die Funktionalanalysis. Biblio-graphisches Institut Mannheim, 1991.

[RS] M. Reed, B. Simon: Methods of modern mathematical physics. I. FunctionalAnalysis. Academic Press, Inc, New York 1980.

[Ru] W. Rudin: Functional Analysis. McGraw-Hill, Inc., New York 1991.

[Pe] G. K. Pedersen: Analysis Now. Springer-Verlag, Berlin · Heidelberg · NewYork 1989.

[Sch-Ana1] B. Schmidt: Analysis 1. Vorlesungsskript Uni Augsburg 2014.(www.math.uni-augsburg.de/schmidt/skripten/ana1.pdf)

[Sch-Ana2] B. Schmidt: Analysis 2. Vorlesungsskript Uni Augsburg 2014.(www.math.uni-augsburg.de/schmidt/skripten/ana2.pdf)

169

[Sch-Ana3] B. Schmidt: Analysis 3. Vorlesungsskript Uni Augsburg 2015.(www.math.uni-augsburg.de/schmidt/skripten/ana3.pdf)

[We] D. Werner: Funktionalanalysis. Springer-Verlag, Berlin · Heidelberg · NewYork 2000.

[Yo] K. Yosida: Functional Analysis. Springer-Verlag, Berlin · Heidelberg · NewYork 1995.

[Ze] E. Zeidler: Applied Functional Analysis – Main Principles and Their App-lications. Springer, Berlin, 1995.

170