83
Vorlesung Variationsmethoden Wintersemester 2019/2020 DRAFT - MAY CONTAIN TYPOS/ERRORS! 6. Januar 2020 Prof. Dr. Jan-Frederik Pietschmann Fakult¨ at f¨ ur Mathematik, Technische Universit¨ at Chemnitz Reichenhainer Straße 41, Chemnitz, Germany please send remarks/typos to [email protected] Inhaltsverzeichnis 1 Modellierung und Motivation 3 1.1 Makroskopische Theorie der W¨ arme ........................... 3 1.2 Interpretation als Diffusionsgleichung ........................... 8 1.3 Motivation Variationsmethoden .............................. 9 2 Strukturen 11 2.1 Topologische R¨ aume .................................... 11 2.2 Metrische R¨ aume ...................................... 14 2.3 Normierte R¨ aume ...................................... 16 2.4 Hilbertr¨ aume ........................................ 19 2.5 Dualr¨ aume und Riesz-Fr´ echet ............................... 27 2.6 The Theorems of Stampacchia and Lax-Milgram .................... 30 3 L P Spaces 34 3.1 Some Results about Integration That Everyone Must Know .............. 35 3.2 Definition and Elementary Properties of L p Spaces ................... 37 3.3 Reflexivity, separability, dual space of L p ......................... 39 3.4 Convolution and regularization .............................. 41 1

Vorlesung Variationsmethoden · 2020. 1. 6. · Vorlesung Variationsmethoden Wintersemester 2019/2020 DRAFT - MAY CONTAIN TYPOS/ERRORS! 6. Januar 2020 Prof. Dr. Jan-Frederik Pietschmann

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

  • Vorlesung Variationsmethoden

    Wintersemester 2019/2020

    DRAFT - MAY CONTAIN TYPOS/ERRORS!

    6. Januar 2020

    Prof. Dr. Jan-Frederik Pietschmann

    Fakultät für Mathematik, Technische Universität ChemnitzReichenhainer Straße 41, Chemnitz, Germany

    please send remarks/typos to [email protected]

    Inhaltsverzeichnis

    1 Modellierung und Motivation 31.1 Makroskopische Theorie der Wärme . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.2 Interpretation als Diffusionsgleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . 81.3 Motivation Variationsmethoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

    2 Strukturen 112.1 Topologische Räume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112.2 Metrische Räume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142.3 Normierte Räume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162.4 Hilberträume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192.5 Dualräume und Riesz-Fréchet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272.6 The Theorems of Stampacchia and Lax-Milgram . . . . . . . . . . . . . . . . . . . . 30

    3 LP Spaces 343.1 Some Results about Integration That Everyone Must Know . . . . . . . . . . . . . . 353.2 Definition and Elementary Properties of Lp Spaces . . . . . . . . . . . . . . . . . . . 373.3 Reflexivity, separability, dual space of Lp . . . . . . . . . . . . . . . . . . . . . . . . . 393.4 Convolution and regularization . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

    1

  • 4 Sobolev Spaces 474.1 Weak derivatives. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 474.2 Elementary properties. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 504.3 Approximation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 534.4 Extensions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 574.5 Trace-Operator (Spuroperator) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 594.6 Sobolev Inequalities . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 614.7 Additional topics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

    5 Second-Order Elliptic Equations 725.1 Definitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 725.2 Regularity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 835.3 Maximumprinzipien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

    2

  • 1 Modellierung und Motivation

    mytuc.org/yhxw

    Ziel dieses Abschnitts ist die Herleitung der Wärmeleitungsgleichung aus (zwei verschiedenen) phy-sikalischen Überlegungen. Diese Gleichung dient uns im weiteren Verlauf der Vorlesung als wichtigesBeispiel.

    1.1 Makroskopische Theorie der Wärme

    Wärme = Grundkonzept der Thermodynamik und entspricht der (ungeordneten) Bewegung vonMolekülen.

    Dieser Bewegung ist eine kinetische Energie zugeordnet, die als Wärmeenergie bezeichnet wird.

    Die Temperator ist dann ein lineares Maß für den Mittelwert dieser Energie.

    Die Volumenarbeit ist die an einem geschlossenen System zu leistende Arbeit W , um das Volumendes Systems vom Wert V1 auf eines mit dem Wert V2 zu verändern. Allgemein gilt:

    W1,2 = −ˆsF (s) · ds,

    wobei F die Kraft ist, die entlang des Weges s wirkt. Für reibungsfrei und quasistatisch zugeführteArbeit in dem einem Zylinder mit dem Querschnitt A (also ds = dVA ) gilt wegen F = p · A(Reibungsfreiheit) also

    W1,2 =

    ˆ V2V1

    δW = −ˆ V2V1

    p · dV = −p∆V

    https://de.wikipedia.org/wiki/Volumenarbeit

    Um zu einer Differentialgleichung zu kommen, verwenden wir Konzepte der Thermodynamik, dieenergetischer Natur sind:

    • Die innere Energie U bezeichnet die kinetische Energie der Teilchen des betrachteten Systems,die Energie der chemischen Bindungen der Teilchen des Systems, und ähnliche Effekte.

    3

    mytuc.org/yhxwhttps://de.wikipedia.org/wiki/Volumenarbeit

  • • Die Enthalpie H ist die Summe aus innerer Energie und Volumenarbeit, d.h.,

    H = U + pV. (1.1)

    Die Erhaltung der Energie wird im ersten Hauptsatz der Thermodynamik beschrieben, der besagt,dass die Anderung der inneren Energie (∆U) (in einem gegebenen Zeitintervall) gleich der Summeaus zugefuhrter Wärmemenge (∆Q) und geleisteter Arbeit (−∆W ) ist, also

    ∆U = ∆Q−∆W.

    Da die Arbeit durch W = pV gegeben ist, können wir die Energieerhaltung als

    ∆Q = ∆(U +W ) = ∆(U + pV ) = ∆H (1.2)

    umschreiben, d.h. die Änderung der Enthalpie ist gleich der zugeführten Wärmemenge.

    1.1.1 Transport

    Wir betrachten nun den Energietransport in einem Gebiet Ω ⊂ R3 für positive Zeit t > 0. Zurmakroskopischen Beschreibung verwenden wir kontinuierliche Dichten, d.h. wir betrachten die Ent-halpie h und die Temperatur u als Funktionen

    h, u : Ω× R+ → R+,

    wobei dann z.B. für D ⊂ Ω giltH(D, t) =

    ˆDh(x, t) dx.

    Die Grundlage für die Modellierung ist der erste Hauptsatz der Thermodynamik, (1.2). Betrachtenwir ein beliebiges Teilgebiet D ⊂ Ω, dann ist die (zeitliche) Änderung der Enthalpie in D gleich derzugeführten Wärmemenge. Wärmezufuhr kann durch verteilte Wärmequellen (beschrieben durchihre Dichte f(x, t) ∈ R) oder Wärmefluss über den Rand des Teilgebietes (beschrieben durch denFlussvektor q(x, t) ∈ R3) auftreten. Damit erhalten wir

    d

    dtH(D, t) =

    d

    dt

    ˆDh(x, t) dx =

    ˆDf(x, t) dx+

    ˆ∂D

    q(x, t) · n(x) dS(x).

    Mit Hilfe des Gauss’schen Satzes folgt

    ˆD

    (∂h

    ∂t− divq − f

    )dx = 0.

    Da das Teilgebiet D beliebig gewählt war, erhalten wir die Differentialgleichung

    ∂h

    ∂t− divq = f (1.3)

    4

  • in Ω×R+. Man nennt (1.3) auch Transportgleichung. Die rechte Seite f kann als bekannte Funktion(bestimmt durch externe Quellen) angesehen werden, die Funktionen h und q sind aber noch unbe-kannt. In der obigen Form ist die Beschreibung auch noch unabhängig von der Temperatur u. Manbenötigt deshalb Materialgesetze (im Englischen auch constitutive relations), die solche Relatio-nen herstellen. Im Gegensatz zu Relationen wie (1.3), die wir nur aus dem fundamentalen Prinzipder Energieerhaltung hergeleitet haben, sind Materialgesetze jeweils abhängig von den speziellenSituationen, die betrachtet werden.

    1.1.2 Materialgesetze

    Wir benötigen nun eine Beziehung zwischen der Enthalpie und der Temperatur, die in vielen Fällenals linear modelliert werden kann, d.h.

    h(x, t) = ρcu(x, t), (1.4)

    wobei ρ die Dichte und c die spezifische Wärmekapazität des betrachteten Materials darstellen. Imeinfachsten Fall sind ρ und c gegebene Konstanten, in manchen Situationen ist es aber wichtig,Relationen der Form ρ = ρ(x, u) und c = c(x, u) zu betrachten. Dies ist zum Beispiel der Fall, wennman es mit einer Mischung mehrerer Materialien zu tun hat, die verschiedene (konstante) Dichtenund Kapazitäten haben. Die effektive Dichte und Kapazität sind dann ortsabhängige Funktionen,bestimmt durch das Material an der jeweiligen Position. Manche Materialien dehnen sich auch starkaus wenn die Temperatur steigt. In solchen Fällen ist es wiederum wichtig, die Relation ρ = ρ(u)zu berücksichtigen.

    Die Beziehung zwischen dem Wärmefluss q und der Temperatur wird im Allgemeinen durch dasFick’sche Gesetz (auch Fourier’sches Abkühlungsgesetz) beschrieben:

    q(x, t) = λ∇u(x, t), (1.5)

    wobei λ > 0 den Wärmeleitkoeffizienten bezeichnet. D.h., die Teilchen bewegen sich (mikroskopischmittels einer Brown’schen Bewegung) bevorzugt in Richtungen des stärksten Temperaturgefällesum lokale Schwankungen der Temperatur auszugleichen. Da das lokal stärkste Temperaturgefällein Richtung des Temperaturgradienten auftritt, ergibt sich daraus die obige Form. Die speziel-le Modellierung von λ hängt wieder von der jeweiligen Situation abhängt, und im allgemeinendie Form λ = λ(x, u) annimmt. In manchen Situationen muss man auch Abhängigkeiten von∇u berücksichtigen. Falls das Material anisotrop ist, muss man die verschiedenen Transportei-genschaften in verschiedene Richtungen berücksichtigen und man erhält das anisotrope Fick’scheGesetz

    q(x, t) = Λ∇u(x, t),

    wobei Λ ∈ R3×3 eine symmetrisch positiv definite Matrix (bestimmt durch die Hauptrichtungender Anisotropie) ist.

    5

  • 1.1.3 Die Wärmeleitungsgleichung

    Wir betrachten nun den Fall konstanter skalarer Werte von ρ, c und λ. Durch Kombination von(1.3) mit (1.4) und (1.5) erhalten wir die Differentialgleichung

    ∂u

    ∂t−D∆u = f, in Ω× R+ (1.6)

    wobei D = λcρ der (Temperatur-) Leitwert ist. Die lineare Wärmeleitungsgleichung (1.6) ist eineparabolische Differentialgleichung zweiter Ordnung. Aus der Theorie der partiellen Differentialglei-chungen wissen wir, dass die Lösung nur dann eindeutig bestimmt ist, wenn wir Anfangswerte undRandbedingungen vorschreiben. Die natürliche Anfangsbedingung ist von der Form

    u(x, 0) = u0(x), x ∈ Ω,

    für eine gegebene Anfangstemperatur u0.

    1.1.4 Randbedingungen

    Um die Randbedingungen zu erhalten betrachten wir den Wärmefluss über den Rand ∂Ω undnehmen an, dass ausserhalb von Ω eine Umgebungstemperatur u∗ gegeben ist. Im allgemeinenerfolgt die Wärmeübertragung mit der Umgebung durch Strömung (Konvektion). Dabei wird dieWärme in ein oder aus einem Fluid / Gass übertragen, indem das Fluid / Gas die Oberfläche einesanderen Volumens überströmt und dabei eine Temperaturangleichung erfolgt. Da der Wärmeflussüber den Rand die Temperaturdifferenz auszugleichen versucht, erhalten wir

    q · n = −α(u− u∗)

    mit einem positiven Wärmeübergangskoeffizienten α = α(x, u;u∗). Für die Temperatur u bedeutetdies eine Robin-Randbedingung der Form

    λ∂u

    ∂n= −α(u− u∗).

    Besonders interessant sind zwei Grenzwerte von β := αλ :

    • Für β → 0 erhalten wir eine homogene Neumann-Randbedingung

    ∂u

    ∂n= 0,

    d.h., es erfolgt kein Austausch von Wärme mit der Umgebung. Dies ist bei einem isoliertenRand der Fall.

    • Für β →∞ erhalten wir eine Dirichlet-Randbedingung u = u∗, d.h., der Wärmeaustausch mitder Umgebung ist so stark, dass sich die Temperatur am Rand jener der Umgebung anpasst.

    6

  • Man beachte auch, dass man für f = 0 und im Fall eines isolierten Randes ein abgeschlossenesSystem erhält. Es gilt dann die Energieerhaltung

    d

    dtH(Ω, t) =

    ˆΩ

    ∂h

    ∂t(x, t) dx =

    ˆΩ

    divq(x, t) dx =

    ˆΩq(x, t) · n(x) dx = 0.

    End first lecture (14/10/19)

    1.1.5 Skalierung

    Nun können wir die Wärmeleitungsgleichung (3.8) skalieren und in eine dimensionslose Form brin-gen. Der Einfachheit halber ignorieren wir innere Wärmequellen (f = 0). Dazu wählen wir einetypische Länge für das Gebiet Ω und Zeitskala τ (zunächst noch unbestimmt) und transformierendie Variablen zu

    x̃−1x, t̃ = τ−1t.

    Weiters transformieren wir die Temperatur mittels einer Abschätzung T0 für die auftretende Mini-maltemperatur und einer Abschätzung ∆T der Temperaturschwankung zu

    ũ = (∆T )−1(u− T0).

    Mittels der Kettenregel erhalten wir daraus die skalierte Wärmeleitungsgleichung

    ∂ũ

    ∂t̃=Dτ

    l2∆x̃ũ,

    mit der Randbedingung∂ũ

    ∂n= −αl

    λ(ũ− ũ∗) .

    und einer Anfangsbedingung ũ(x, 0) = ũ0(x), wobei wir ũ∗ und ũ0 mittels derselben Skalierung

    erhalten wie ũ.

    Wir haben nun zwei effektive Parameter, aber die Zeitskala ist noch nicht festgelegt. Es scheintnaheliegend, τ so zu wählen, dass der Diffusionskoeffizient gleich eins ist, d.h. τ = l

    2

    D . Damit erhaltenwir

    ∂ũ

    ∂t̃= ∆x̃ũ,

    und der einzig verbleibende Parameter ist der dimensionslose Wärmeübergangskoeffizient

    β =αl

    λ.

    7

  • 1.2 Interpretation als Diffusionsgleichung

    Consider an interacting particle system in one spatial dimension: For a given periodic lattice ofi = 1, . . . , N lattice cells with width h > 0,

    denote by

    ũi(t) = # of particles at site i and time t, i = 1, . . . , N, t ≥ 0.

    If we further assume that the total number of particles, denoted by M , is conserved, we can definethe number density as

    ui(t) :=ũi(t)

    M∈ [0, 1] with

    N∑i=1

    ui(t) =1

    M

    N∑i=1

    ũi(t) = 1.

    We model the dynamic behaviour of the system as follows: In every time interval ∆t > 0, eachparticle jumps either to its left or right neighbouring site with equal probability 12 . Denoting by j

    ini

    and jouti the local in- and outflux for the i-th cells, the conservation of particles yields the followingmaster equation

    ui(t+ ∆t)− ui(t)∆t︸ ︷︷ ︸

    local rate of change at site i

    = jini − jouti

    =1

    ∆t

    12ui+1(t) + 12ui−1(t)︸ ︷︷ ︸jini

    −(

    1

    2ui(t) +

    1

    2ui(t)

    )︸ ︷︷ ︸

    jouti

    =

    1

    2∆t(ui+1(t) + ui−1(t)− 2ui(t)) , i = 1, . . . , n.

    (1.7)

    Now denote by xi, i = 1, . . . N the cell midpoints and construct a function u = u(x, t) s.t.

    u(xi, t) = ui(t).

    Then, we can rewrite (1.7) as

    ui(xi, t+ ∆t)− u(xi, t)∆t

    =1

    2∆t(u(xi + h, t) + u(xi − h, t)− 2u(xi, t)) .

    Performing a Taylor expansion of the right hand side yields

    ui(xi, t+ ∆t)− u(xi, t)∆t

    =h2

    2∆t∂xxu(xi, t) +O(

    h3

    ∆t).

    8

  • Now to be able to perform the limit ∆t, h→ 0, we introduce the parabolic scaling

    h2 = ∆t.

    We eventually obtain

    ∂tu =1

    2∂xxu (heat equation).

    Remark 1.

    • The limit h → 0 implies that the number of lattice sites goes to infinity, as does the numberof particles.

    • Since the particles are assumed to jump randomly, the number of particles per lattice site isin fact a random variable. What we denote by ui above is actually the expectation of thatrandom variable.

    • This formal argument can be made rigorous in the framework of interaction particle systemsand their hydrodynamic limits, cf. [?].

    Remark 2. Equation (1.7) is in fact also a finite volume discretization of the heat equation.Remark 3. One can easily extend the setting to the case when the probability to jump also dependson a given, space dependent potential V = V (x). Then, instead of the heat equation one obtains aFokker-Planck equation of the form

    ∂tu = ∇ · (∇u+ u∇V ) .

    While most of the results below will (for simplicity) be presented for the heat equation, the Fokker-Planck equation is in fact the much more interesting and relevant case, see [?].Remark 4. If one modifies the model such that there is at most one particle per lattice site (andwith external potential), the limiting equation becomes nonlinear and reads as

    ∂tu = ∇ · (∇u+ u(1− u)∇V ).

    The situation becomes even more involved (interesting) if one allows for more than one type ofparticle, [?]. Note that in these cases, the limit can no longer be established in a rigorous way.

    1.3 Motivation Variationsmethoden

    Betrachten wir die stationäre Wärmeleitungsgleichung: Gegeben f ∈ C([a, b]), finde eine Funktionu mit

    −u′′ = f on [a, b],u(a) = u(b) = 0.

    (1.8)

    Eine klassiche Lösung von (1.8) ist dann eine C2 Funktion auf [a, b] die (1.8) punktweise erfüllt(Wir können sogar leicht explizite Lösungen finden, was wir hier aber nicht weiter verfolgen). Wir

    9

  • multiplizieren nun (1.8) mit ϕ ∈ C1([a, b]) und integrieren partiell. Wir erhaltenˆ bau′φ′ dx =

    ˆ bafφ dx ∀φ ∈ C1([a, b]), φ(a) = φ(b) = 0. (1.9)

    Man beachte, das (1.9) sinn macht, sobald u ∈ C1([a, b]) (während wir für (1.8) zwei Ableitungenvon u benötigen); Tatsächlich reicht es sogar

    u, u′ ∈ L1(a, b) := “{u : [a, b]→ R s.t.ˆ ba|u| dx

  • 2 Strukturen

    Ziel: Einführung von grundlegenden Begriffen und Räumen.

    2.1 Topologische Räume

    Definition 2.1.1. Ein topologischer Raum ist ein Paar (X, T ), bestehend aus einer Menge X undeiner Teilmenge T ⊂ 2X = P(X) mit

    i) ∅, X ∈ T

    ii) U1, . . . , Un, n ∈ N ⇒⋂ni=1 Ui ∈ T

    iii) λ beliebige Menge, Uλ ∈ T für alle λ ∈ Λ. Dann ist⋃λ∈Λ Uλ ∈ T .

    Bemerkungen.

    • 2X = {A : A ⊂ X} ist die Potenzmenge von X (die Menge, die aus allen Teilmengen von Xbesteht).

    • T heisst eine Topologie auf X. A ⊂ X heisst offen, falls A ∈ T . A ⊂ X heisst abgeschlossen,falls Ac ∈ T . Die Topologie bestimmt also, welche Mengen offen und abgeschlossen sind.

    • Punkte (ii) und (iii) bedeuten, dass endlich Durchschnitte und beliebige Vereinigung von of-fenen Mengen, offen ist. Mit der Formel(⋃

    λ∈ΛAλ

    )c=⋂λ∈Λ

    Acλ

    schließen wir, dass beliebige Durchschnitte und endliche Vereinigung von abgeschlossenenMengen abgeschlossen sind.

    Beispiele.

    • Für eine beliebige Menge X, ist T = {∅, X} eine Topologie.

    • Für eine beliebige Menge X, ist T = 2X eine Topologie.

    • Für X = Rn, sagen wir A ⊂ X ist offen, wenn für jedes x ∈ A ein � > 0 mit

    B�(x) = {y ∈ Rn : |x− y| < �} ⊂ A

    existiert. Das definiert eine Topologie auf Rn.

    • (Unterraumtopologie) Falls (X, T ) ein topologischer Raum ist und Y ⊂ X, können wirdie Unterraumtopologie

    TY := {Y ∩A : A ∈ T }

    definieren. Dann ist (Y, TY ) ebenfalls ein topologischer Raum.

    11

  • • (Produkttopologie) Falls (X, T ), (Y, S) topologische Räume sind, können wir auf X×Y ={(x, y) : x ∈ X, y ∈ Y } die Produkttopologie Tprod wie folgt definieren: W ∈ Tprod falls

    ∀(x, y) ∈W : ∃U ∈ T , V ∈ S : (x, y) ∈ U × V ⊂W.

    Äquivalent dazu W ∈ Tprod falls W als Vereinigung von Mengen der Form U × V, U, V ∈ Tgeschrieben werden kann (in diesem Fall sagt man, dass die Mengen der Form U × V eineBasis für Tprod bilden).

    Für beliebige Mengen A ⊂ X, definieren wir den Abschluss Ā ⊂ X und das Innere◦A ⊂ X.

    Definition 2.1.2. (X, T ) sei ein topologischer Raum, und A ⊂ X eine Teilmenge. Dann ist derAbschluss von A definiert durch

    Ā =⋂{B ⊂ X : Bc ∈ T und A ⊂ B},

    d.h. Ā ist die kleinste abgeschlossene Menge, die A enthält. Äquivalent gilt

    Ā = {x ∈ X : Ux ∩A 6= ∅ für alle offenen Umgebungen Ux von x}.

    Das Innere von A ist definiert durch

    ◦A=

    ⋃{B ⊂ A : B ∈ T }

    Das Innere◦A ist die größte offene Menge, die in A enthalten ist. Der Rand von A ist dann definiert

    als ∂A = Ā \◦A

    Definition 2.1.3. Sei (X, T ) ein topologischer Raum. Eine Menge A ⊂ X heisst dicht, falls Ā = X.Der Raum X heisst separabel, falls er eine abzählbare dichte Teilmenge enthält.

    End 2. lecture (15/10/19)

    Remark. Wenn T = {∅, X}, gilt Ā = X,◦A = ∅ für alle A 6= ∅, X (d.h. jede Menge ist dicht und

    X ist immer separabel). Wenn dagegen T = 2X , gilt Ā =◦A = A für jede A ⊂ X (in diesem Fall

    ist X nur dann separabel, wenn X abzählbar ist).Die Topologie erlaubt, die Begriffe Konvergenz und Stetigkeit zu definieren. Dabei spielt der Begriffvon Umgebung eine wichtige Rolle.Definition 2.1.4. (X, T ) sei ein topologischer Raum, x ∈ X.

    i) Eine Menge U ⊂ X ist eine offene Umgebung von x, falls U ∈ T und x ∈ U .

    ii) Für eine beliebige Menge Λ, ist eine Familie {Uλ}λ∈Λ bestehend aus offenen Umgebungen vonx, eine Umgebungsbasis in x ∈ X, falls

    V ⊂ X offene Umgebung von x ⇒ ∃λ ∈ Λ : Uλ ⊂ V

    12

  • Definition 2.1.5 (Konvergenz in topologischen Räumen). Sei (X, T ) ein topologischer Raum und{xn}n∈N eine Folge in X. Dann konvergiert xn zu x ∈ X für n→∞, geschrieben xn → x, wenn

    ∀ offene Umgebung U von x : ∃n0 ∈ N : xn ∈ U ∀n ≥ n0.

    Offenbar genügt es, diese Bedingung für offene Umgebungen in einer Umgebungsbasis zu überprüfen.

    Stetigkeit und Stetigkeit in x werden wie folgt definiert:Definition 2.1.6 (Stetigkeit). Seien (X, T ), (Y, S) zwei topologische Räume. Eine Funktion f :X → Y heißt stetig, falls

    f−1(V ) ∈ T ∀V ∈ S,

    d.h. wenn das Urbild jeder offenen Menge in Y eine offene Menge in X ist.Für x ∈ X sagen wir f ist stetig in x, falls

    ∀ offene Umgebung V von f(x) : ∃ offene Umgebung U von x : f(U) ⊂ V.

    Einfach zu zeigen: f genau sann stetig ist, wenn f in x stetig für alle x ∈ X (Beweis: Übung).Remark. In metrischen Räumen charakterisiert der Begriff von Konvergenz die Topologie (eineMenge A eines metrischen Raumes ist genau dann abgeschlossen, falls sie alle Limites von Folgenin A enthält). Das ist nicht der Fall in allgemeinen topologischen Räumen. Falls (X, T ) ein to-pologischer Raum ist, und A abgeschlossen gilt aber nur, wenn jeder Punkt in X eine abzählbareUmgebungsbasis besitzt (das ist immer der Fall in metrischen Räumen, nicht aber in topologischenRäumen).

    Die pathologischen Beispiele T = {∅, X}, T = 2X zeigen, dass die Topologie oft nicht genug ist,um einen nützlichen Begriff von Konvergenz (und Stetigkeit) zu haben. Dafür ist es z.B. wichtig zuwissen, dass die Topologie genügend viele offene Mengen enthält, um verschiedene Punkte in X zuseparieren. Deswegen führen wir den Begriff von Hausdorff-Räumen ein.Definition 2.1.7. Ein topologischer Raum (X, T ) heißt Hausdorff, falls beliebige Punkte x, y ∈ X,mit x 6= y, disjunkte offene Umgebungen besitzen, d.h.

    x 6= y ⇒ ∃Ux, Uy ∈ T mit x ∈ Ux, y ∈ Uy und Ux ∩ Uy = ∅.

    Unter allen Hausdorff-Räumen spielen die kompakten Räume eine wichtige Rolle.Definition 2.1.8. Ein topologischer Raum (X, T ) heißt kompakt, falls (X, T ) Hausdorff ist, undfalls

    {Uλ}λ∈Λ Familie in T mit⋃λ∈Λ

    Uλ = X ⇒ ∃n ∈ N und λ1, . . . , λn ∈ Λ :n⋃j=1

    Uλ = X,

    d.h., falls jede offene Überdeckung eine endliche Teilüberdeckung besitzt.Remark. Sei (X, T ) ein kompakter Raum, und A ⊂ X abgeschlossen. Dann ist A, versehen mitder Unterraumtopologie, ein kompakter Raum. In der Tat ist klar, dass A Hausdorff ist. Weiter,wenn {Uλ}λ∈Λ eine offene Überdeckung von X. Deswegen existieren n ∈ N, λ1, . . . , λn ∈ Λ, so dass

    13

  • X = Ac ∪⋃nj=1 Uλj , d.h. {Uλ}nj=1 ist eine endliche Teilüberdeckung von A.

    Auf topologischen Räumen impliziert i.A. Kompaktheit nicht Folgenkompaktheit (Folgenkompaktheitbedeutet, dass jede Folge eine konvergente Teilfolge hat). Aber zumindest folgt aus der Kompaktheitdie Tatsache, dass jede Folge mindestens einen Häufungspunkt besitzt (x ∈ K ist ein Häufungspunktvon (xn), wenn für jede offene Umgebung U von x, unendlich viele Punkte aus (xn) existieren, diein U sind).Satz 2.1.9. Sei (X, T ) ein kompakter Raum und (xn)n∈N eine Folge von X. Dann existiert min-destens ein Häufungspunkt von (xn) in X.Definition 2.1.10. Es sei K ein kompakter Raum. Dann definieren wir

    C(K) = {f : K → R stetig} (analog für C).

    R ist mit der Standardtopologie versehen und C(K) separiert die Punkte von K.

    2.2 Metrische Räume

    Definition 2.2.1. Ein metrischer Raum ist ein Paar (X, d), wobei X eine Menge und d eineAbbildung d : X ×X → [0,∞), genannt Metrik, mit folgenden Eigenschaften ist:

    (i) d(x, y) = 0 genau dann wenn x = y.

    (ii) d(x, y) = d(y, x).

    (iii) d(x, y) ≤ d(x, z) + d(z, y) für alle x, y, z ∈ X (Dreiecksungleichung).

    Induzierte Topologie: Jeder metrische Raum (X, d) ist ein topologischer Raum (X, Td) mit dervon der Metrik induzierten Topologie Td definiert wie folgt. A ∈ Td genau dann, wenn für alle x ∈ Aein � > 0 existiert mit

    B�(x) = {y ∈ X : d(x, y) < �} ⊂ A.

    (Beweis: Übung).Die Tatsache, dass die Metrik eine Topologie induziert, wird benutzt, um Eigenschaften von to-pologischen Räumen in Eigenschaften von metrischen Räumen zu übersetzen. Zum Beispiel heißtein metrischer Raum (X, d) kompakt, falls (X, Td) kompakt ist. Ähnlich heißt ein metrischer Raum(X, d) separabel, falls (X; Td) separabel ist.

    Beispiele metrische Räume - separabel:

    • X = Kn (mit K = R oder K = C), mit der Metrik

    d(x, y) =

    n∑j=1

    |xi − yi|21/2

    ist ein metrischer Raum.

    14

  • • Der Folgenraum

    l2(K) = {(x1, x2, . . . ) : xj ∈ K für alle j ∈ N, und∞∑j=1

    |xj |2 0 : ∃n0 ∈ N : d(xn, x) < �∀n ≥ n0.

    Dies folgt aus der Tatsache, dass {B�(x)}�>0 eine Umgebungsbasis in x bzgl. der induzierten To-pologie definiert.Es ist interessant zu bemerken, dass der Begriff von Konvergenz in metrischen Räumen die Topo-logie eindeutig charakterisiert.

    Lemma 2.2.2. Sei (X, d) metrischer Raum. Dann gilt

    A ⊂ X ist abgeschlossen ⇐⇒ Für jede Folge (xn)n∈N ∈ AN mit xnn→α−→ x gilt: x ∈ A.

    Beweis. ”⇒”: Sei A abgeschlossen und limn→α

    xn = x ∈ X. Zu zeigen: x ∈ A:Angenommen, x /∈ A, d.h. x ∈ X \ A und X \ A ist eine offene Menge. Damit existiert ein ε > 0,so dass Bε(x) ⊂ X \A, was ein Widerspruch zur Konvergenz von xn nach x ist.

    ”⇐”: Nehme an, dass jeder Grenzwert in A liegt. Zu Zeigen: A is abgeschlossen, d.h. X \A is offen.

    Angenommen, X \ A wäre nicht offen und x ∈ X \ A beliebig. Dann gilt für alle ε > 0 dasBε(x) 6⊂ X \ A, also äquivalent für alle ε > 0 gilt Bε(x) ∩ A 6= ∅. Wähle nun ε = 1/n und xn ausdem Ball B1/n(x). Dies definiert eine Folge xn ∈ AN mit xn → x. Nach Voraussetzung gilt aberx ∈ A, also Widerspruch.

    Aus diesem Lemma folgt, dass in metrischen Räumen der Abschluss von A ⊂ X durch

    Ā = {x ∈ X : ∃(xn)n∈N Folge in A mit xn → x als n→∞}

    gegeben ist. Deswegen ist A ⊂ X auf metrischen Räumen genau dann dicht, wenn

    ∀x ∈ X,∃(xn)n∈N Folge in A mit xn → x als n→∞.

    15

  • Auch der Begriff von Stetigkeit kann für metrische Räume durch Konvergenz von Folgen ausge-drückt werden. Seien (X, d1), (Y, d2) zwei metrische Räume. Dann ist die Funktion f : X → Ystetig in x ∈ X genau dann wenn

    (xn)n∈N Folge in X mit xn → x⇒ f(xn)→ f(x).

    f : X → Y ist genau dann stetig, wenn f in jedem Punkt x ∈ X stetig ist.Remark. Während es immer möglich ist, eine Topologie auf einem metrischen Raum zu definieren,ist es nicht immer möglich, auf einen topologischen Raum eine Metrik so zu definieren, dass dieinduzierte Topologie mit der ursprünglichen Topologie übereinstimmt. Nicht alle Topologien sindmetrisierbar. Zum Beispiel ist es klar, dass Topologien, die aus einer Metrik induziert werden,immer Hausdorff sind (wenn x, y ∈ X, mit x 6= y, dann d(x, y) > 0 und Bd(x,y)/3(x)∩Bd(x,y)/3(y) =∅.) Also kann jede Topologie, die nicht Hausdorff ist, nicht metrisiert werden.

    End 3. lecture (21/10/19)

    Definition 2.2.3. Sei (X, d) ein metrischer Raum. Eine Folge (xn)n∈N in X heißt Cauchy, fallsd(xn, xm) → 0 für n,m → ∞. Jede konvergente Folge ist offensichtlich Cauchy. Der metrischeRaum (X, d) heißt vollständig, falls jede Cauchy-Folge konvergent ist.Beispiel. Q mit d(x, y) = |x − y| ist nicht vollständig. R ist vollständig (es kann als die Ver-vollständigung von Q definiert werden; wir diskutieren später Vervollständigung von normierten

    Räumen). C mit d(x, y) = |x− y|, ist vollständig. Rn,Cn, mit d(x, y) =(∑n

    j=1 |xi − yi|2)1/2

    sind

    auch vollständig.Beachten Sie, dass die Cauchy Bedingung in allgemeinen topologischen Räumen keinen Sinn ergibt.Man braucht die metrische Struktur, um den Begriff Vollständigkeit zu definieren.

    2.3 Normierte Räume

    Definition 2.3.1. Ein normierter Raum (X, ‖ ·‖) ist ein Paar bestehend aus einem K-VektorraumX und einer Abbildung ‖ · ‖ : X → [0,∞) mit

    (i) ‖x‖ = 0, genau dann, wenn x = 0.

    (ii) ‖λx‖ = |λ|‖x‖ für alle λ ∈ K, x ∈ X.

    (iii) ‖x+ y‖ ≤ ‖x‖+ ‖y‖, für alle x, y ∈ X.

    Die Norm ‖ ·‖ induziert auf X die Metrik d(x, y) = ‖x−y‖ und damit auch die Topologie Td. Jedernormierte Raum ist also automatisch ein metrischer und ein topologischer Raum.

    Eine Metrik d auf einem Vektorraum X definiert umgekehrt die Norm ‖x‖ = d(x, 0) nur dann,wenn

    • d(λx, λy) = |λ|d(x, y) für alle λ ∈ K, x, y ∈ X (Homogenität) und

    • d(x+ z, y + z) = d(x, y) für alle z ∈ X (Translationsinvarianz).

    16

  • Definition 2.3.2. Ein normierter Raum (X, d) heißt vollständig, falls X verstanden als metrischerRaum mit der induzierten Metrik

    d(x, y) = ‖x− y‖,

    vollständig ist. Ein vollständig normierter Raum heißt Banachraum.Beispiele.

    • Rn,Cn, mit der euklidischen Norm ‖x‖2 =∑n

    j=1 |xj |2, sind alle Beispiele von Banachräumen.

    • Sei K ein kompakter Raum. Dann ist CK(K), versehen mit der Norm ‖f‖∞ := maxx∈K |f(x)|ein Banachraum (wir werden dieses Beispiel später im Detail untersuchen; insbesondere wer-den wir zeigen, dass CK(K) ein Banachraum ist).

    • Falls (X, ‖ · ‖x) und (Y, ‖ · ‖Y ) zwei Banachräume sind, so ist auch der Produktraum X ×Y = {(x, y) : x ∈ X, y ∈ Y }, versehen mit der Norm ‖(x, y)‖ = ‖x‖X + ‖y‖Y (oder auch‖(x, y)‖ = (‖x‖2 + ‖y‖2)1/2) ein Banachraum. Beweis: Übung.

    • Für 1 ≤ p

  • Für den 2. Term auf der rechten Seite gilt m∑j=1

    |x(km)j |p

    1/p ≤ ∞∑j=1

    |x(km)j |p

    1/p = ‖x(km)‖p

  • 2.4 Hilberträume

    Definition 2.4.1. Sei H ein K-Vektorraum. Ein Skalarprodukt auf H ist eine Abbildung (·, ·) :H ×H → K mit

    • (z, x+ λy) = (z, x) + λ(z, y), für alle x, y, z ∈ H,λ ∈ K.

    • (x, y) = (y, x) für alle x, y,∈ H.

    • (x, x) > 0 für alle x 6= 0.

    Hier ist λ̄ die komplex konjugierte Zahl von λ, falls K = C, und λ̄ = λ, falls K = R. Ein Paar(H, (·, ·)) bestehend aus einem K-Vektorraum H und einem Skalarprodukt (·, ·) heißt Prähilbertraum.Remark. Für K = C ist das Skalarprodukt so definiert, dass es im zweiten Argument linear, imersten Argument anti-linear ist. In vielen Büchern wird es anders definiert, linear im ersten undanti-linear im zweiten Argument.Die Cauchy-Schwarz’sche Ungleichung erlaubt uns mit dem Skalarprodukt eine Norm zu definieren.Lemma 2.4.2. Sei (H, (·, ·)) ein Prähilbertraum. Dann gilt

    |(x, y)|2 ≤ (x, x)(y, y)

    für alle x, y ∈ H.

    Beweis. Wir bemerken, dass für beliebige t ∈ C,

    0 ≤ (x− ty, x− ty) = (x, x)− 2Re t(x, y) + |t|2(y, y)

    Insbesondere mit t = (y, x)/(y, y) bekommen wir die gewünschte Schranke.

    Korollar 2.4.3. Sei (H, (·, ·)) ein Prähilbertraum. Dann ist

    ‖x‖ :=√

    (x, x)

    eine Norm auf H.

    Beweis. Die Dreiecksungleichung folgt aus der Definition und Cauchy-Schwarz, weil

    ‖x+ y‖2 = ‖x‖2 + ‖y‖2 + 2Re(x, y)≤ ‖x‖2 + ‖y‖2 + 2|(x, y)|≤ ‖x‖2 + ‖y‖2 + 2‖x‖‖y‖ = (‖x‖+ ‖y‖)2

    Definition 2.4.4. Ein Prähilbertraum heisst Hilbertraum falls (H, ‖ · ‖) mit ‖x‖ =√

    (x, x) einBanachraum ist (also vollständig ist).Beispiele.

    • Standard Beispiel ist H = Rn, mit dem Skalarprodukt (x, y) =∑n

    j=1 xjyj, oder H = Cn, mit(x, y) =

    ∑nj=1 x̄jyj.

    19

  • • Ein Beispiel eines unendlich dimensionalen Hilbertraums ist l2(K) versehen mit dem Skalar-produkt

    (x, y) =∞∑j=1

    xjyj

    Die Summe konvergiert, weil

    n∑j=1

    |xj‖yj | ≤

    n∑j=1

    |xj |21/2 n∑

    j=1

    |yj |21/2 ≤ ‖x‖l2(K)‖y‖l2(K)

    für alle n ∈ N. Die Norm die von diesem Skalarpunkt induziert wird stimmt mit der Norm‖ · ‖l2 überein. Also ist l2(K) ein Hibertraum. Es ist einfach zu überprüfen, dass l2(K) einseparabler Hilbertraum ist (Beweis: Übung).

    Wir werden sehen, dass jeder separable Hilbertraum mit l2(K) identifiziert werden kann.

    Wir wissen, wie man normierte Räume zu Banachräumen vervollständigt. Die selbe Konstruktionerlaubt uns auch Prähilberträume zu vervollständigen.Satz 2.4.5. Es sei (H, (·, ·)) ein Prähilbertraum. Dann ist die Vervollständigung in natürlicherWeise ein Hilbertraum.

    Beweis. Sei (H̃, ‖ · ‖H̃ , φ) die Vervollständigung von H, verstanden als normierter Raum. Dannexistieren für u, v ∈ H̃ Folgen (xk)k∈N, (yk)k∈N in H mit φ(xk)→ u, φ(yk)→ v (da das Bild von φDicht in H̃ ist). Da φ isometrisch ist, sind dann xk, yk Cauchy-Folgen in H. Wir definieren dann

    (u, v)H̃ := limk→∞(xk, yk). (2.2)

    Der Limes ist wohldefiniert, weil (xk), (yk) Cauchy-Folgen sind (also insbesondere beschränkt) unddeswegen

    |(xk, yk)− (xm, ym)| ≤ ‖xk − xm‖‖yk‖+ ‖xm‖‖yk − ym‖ → 0

    für k,m→∞. Weiterhin ist der Limes in (2.2) unabhängig von der Wahl der Folgen xk, yk.

    Bleibt zu überprüfen, dass (2.2) wirklich ein Skalarprodukt auf H̃ definiert und dass die Norm, dieaus dem Skalarprodukt induziert wird, mit der auf H̃ gegebenen Norm übereinstimmt.

    End 4. lecture (22/10/19)

    Hilberträume haben mehr Struktur als Banachräume. Viele Eigenschaften, die für Hilberträumegelten, gelten i.A. für Banachräume nicht. Das nächste Theorem ist ein Beispiel einer solchenEigenschaft (Aber: jeder reflexive Banachraum besitzt dieselbe Eigenschaft).Satz 2.4.6. Es sei (H, (·, ·)) ein Hilbertraum, K ⊂ H eine abgeschlossene, konvexe Menge undx0 ∈ H. Dann existiert ein eindeutig bestimmtes y ∈ K mit

    ‖x0 − y‖ = dist(x0,K) = infx∈K‖x0 − x‖. (2.3)

    20

  • Das Element y ∈ K ist äquivalent über die Eigenschaft

    y ∈ K and (x0 − y, v − y) ≤ 0 ∀v ∈ K (2.4)

    charakterisiert.

    Beweis. Sei d = dist(x0,K) und (yn)n∈N eine Folge in K mit ‖x0 − yn‖ → d für n → ∞ (Def.Infimum und untere Schranke). Mit der Parallelogramm Identität

    ‖x+ y‖2 + ‖x− y‖2 = 2(‖x‖2 + ‖y‖2)

    angewendet auf x = x0 − yn und y = x0 − ym erhalten wir

    ‖yn − ym‖2 = 2(‖yn − x0‖2 + ‖ym − x0‖2)− 4

    ∥∥∥∥∥∥∥∥yn + ym

    2︸ ︷︷ ︸∈K

    −x0

    ∥∥∥∥∥∥∥∥2

    ≤ 2(‖yn − x0‖2 + ‖ym − x0‖2)− 4d2

    → 2(d2 + d2)− 4d2 = 0 für m, n→∞,

    (2.5)

    wobei wir benutzt haben, dass wegen der Konvexität von K gilt das (yn + ym)/2 ∈ K und somit‖(yn+ym)/2−x0‖ ≥ d. Also ist yn eine Cauchy-Folge. Da H vollständig und K abgeschlossen sind,existiert y ∈ K mit yn → y. Es folgt, dass d = limn→∞ ‖x0 − yn‖ = ‖x0 − y‖.

    Für die Eindeutigkeit: Wenn wir annehmen, dass y1, y2 ∈ K existieren, so dass d = ‖x0 − y1‖ =‖x0 − y2‖, dann ist die Folge (zn) = (y1, y2, y1, y2, . . . ), so dass ‖zn − x0‖ → d ist. Aus (2.5) folgtaber, dass (zn) eine Cauchy-Folge ist, was natürlich nur dann möglich ist, wenn y1 = y2.

    Äquivalenz von (2.3) und (2.4): Nehme an, y ∈ K erfüllt (2.3) und sei z ∈ K. Dann ist

    vt := (1− t)y + tz ∈ K ∀t ∈ [0, 1](Konvexität).

    und daher

    ‖x0 − y‖ ≤ ‖x0 − vt‖ = ‖x0 − [(1− t)y + tz]‖ = ‖(x0 − y) + t(z − y)‖,

    d.h.‖x0 − y‖2 ≤ ‖x0 − y‖2 − 2t(x0 − y, z − y) + t2‖z − y‖2,

    also 2(x0 − y, z − y) ≤ t‖z − y‖2 für all t ∈ (0, 1]. Letting t→ 0 we obtain (2.4).

    Fall (2.4) gilt, so folgt

    ‖y − x0‖2 − ‖z − x0‖2 = 2(x0 − y, z − y)− ‖x0 − z‖2 ≤ 0 ∀v ∈ K,

    also (2.3).

    Remark. Bemerkung: Das Element y wird dann die Projektion PK von x0 auf K genannt. Of-fensichtlich gilt PK(PK(x)) = PK(x) für alle x ∈ H. Allgemein definieren wir: Let V be a vectorspace. A map P : V → V is a projection operator if it is linear and satisfies P 2 = P .

    21

  • Remark. Minimierungsproblem wird mit einem System aus Ungleichungen verknüpft: Nicht ver-wunderlich, wie folgendes Beispiel zeigt: Sei F : R→ R stetig diffbar, u ∈ [0, 1] der Punkt, an demF sein Minimum (auf [0, 1]) annimmt. Dann gilt

    (i) u ∈ (0, 1) und F ′(u) = 0 oder

    (ii) (u = 0 und F ′(u) ≤ 0) oder (u = 1 und F ′(1) ≥ 0)

    Diese Fälle fassen wir zusammen: u ∈ [0, 1] und

    F ′(u)(v − u) ≤ 0 ∀v ∈ [0, 1]

    Weiter gilt für abgeschlossene Unterräume:Korollar 2.4.7. Sei K ⊂ H ein abgeschlossener linearer Unterraum. Sei x0 ∈ H. Dann ist dasminimale Element y ∈ K aus Satz 2.4.6 charakterisiert durch

    (y − x0, z) = 0 ∀z ∈ K (2.6)

    Beweis. Nach Satz 2.4.6 gilt(x0 − y, z − y) ≤ 0 ∀z ∈ K.

    also auch(x0 − y, tz − y) ≤ 0 ∀z ∈ K, t ∈ R (da K lin. Unteraum).

    Dies impliziert

    (x0 − y, z) ≤(x0 − y, y)

    t→ 0 as t→∞,

    i.e. (x0 − y, z) ≤ 0, replacing z by −z yields (x0 − y, z) ≥ 0, i.e (x0 − y, z) = 0.Umgekehrt folgt aus 2.6 auch (x0 − y, z − y︸ ︷︷ ︸

    ∈K

    ) = 0 ∀z ∈ K.

    Remark. In this case we speak about the orthogonal projection, i.e. a projection for which theRange and the null space are orthogonal.

    Als Anwendung des letzten Satzes zeigen wir, wie H in die direkte Summe von einem beliebeigenabgeschlossenen Unterraum und seinem orthogonalen Komplement zerlegt werden kann.Satz 2.4.8. Sei (H, (·, ·)) ein Hilbertraum und M ⊂ H ein linearer abgeschlossener Unterraum.Dann ist

    M⊥ = {x ∈ H : (x,m) = 0 ∀m ∈M}

    auch ein linearer und abgeschlossener Unterraum und H = M ⊕M⊥ (d.h. H = M + M⊥ undM ∩M⊥ = {0}) wird als das orthogonale Komplement von M bezeichnet.

    Beweis. 1. Es gilt M⊥ linear und abgeschlossen: Falls xk eine Folge in M⊥ ist und xk → x für

    k → ∞, dann gilt auch |(x − xk,m)| ≤ ‖x − xk‖‖m‖ → 0, also (x,m) = limk→∞(xk,m) = 0 unddamit x ∈M⊥

    2. M ∩ M⊥ = {0} folgt, weil wir dann in der Definition von M⊥ m = x wählen könnten was(x, x) = 0 impliziert, also x = 0.

    22

  • 3. Es bleibt zu zeigen, dass M +M⊥ = H. Dazu wählen wir x ∈ H und wir finden (mit Satz 2.4.6)ein z ∈M , so dass dist(M,x) = ‖x− z‖.Wir behaupten jetzt, dass x − z ∈ M⊥. Denn wäre (x − z) /∈ M⊥, dann würde α ∈ M existierenmit (x− z, α) > 0. Für t ∈ [−1, 1] definieren wir zt := z + tα. Dann ist zt ∈M für alle t, und

    ‖x− zt‖2 = ‖x− z‖2 + t2‖α‖2 − 2t(x− z, α) < ‖x− z‖2 = dist(x,M)

    für t > 0 klein genug (so dass t2‖α‖2 − 2t(x − z, α) < 0). Das widerspricht der Definition vondist(x,M).

    Wir führen nun die wichtigen Begriffe: Orthonormalsystem und Orthonormalbasis (oder Hilber-traumbasis) ein.Definition 2.4.9. Sei A eine beliebige Menge. Ein Orthonormalsystem in (H, (·, ·)) ist eine Familie(xα)α∈A ⊂ H mit (xα, xβ) = δα,β.

    Orthonormalsysteme erfüllen die Bessel’sche Ungleichung:Lemma 2.4.10. Sei (H, (·, ·)) ein Prähilbertraum, A ⊂ N und (xn)n∈A ein Orthonormalsystem(eine Orthonormalfolge). Dann gilt∑

    α∈A|(xα, x)|2 ≤ (x, x) = ‖x‖2

    End 5. lecture (28/10/19)

    Beweis. Wir betrachten

    0 ≤

    x−∑α∈A

    (xα, x)xα, x−∑β∈A

    (xβ, x)xβ

    = (x, x)− 2

    ∑α∈A|(x, xα)|2 +

    ∑α∈A,β∈A

    (x, xα)(xβ, x) (xα, xβ)︸ ︷︷ ︸=δα,β

    = (x, x)−∑α∈A|(x, xα)|2.

    Remark. Man sollte zunächst den Fall |A|

  • (iii) Falls∑∞

    k=1 αkxk konvertiert, so ist der Limes unabhängig von der Reihenfolge der Summan-den. D.h., falls φ : N→ N eine Bijektion ist, so gilt

    ∞∑k=1

    αφ(k)xφ(k) =∞∑k=1

    αkxk

    Beweis. (ii): Folgt aus der Orthogonalität der xk.

    (i) Da H vollständig ist, konvertiert∑∞

    k=1 αkxk genau dann, wenn die Folge der Partialsumme eineCauchy-Folge ist. Da ∥∥∥∥∥

    m∑k=n

    αkxk

    ∥∥∥∥∥2

    =

    m∑k=n

    |αk|2 (da (xα, xβ) = δα,β),

    erhalten wir die Behauptung (i).Um (iii) zu beweisen, sei φ : N→ N eine Bijektion. Dann gilt∥∥∥∥∥

    n∑k=1

    αφ(k)xφ(k)

    ∥∥∥∥∥2

    =n∑k=1

    |αφ(k)|2

    Da∑∞

    k=1 αkxk konvergiert, konvergiert auch∑n

    k=1 |αk|2. Also∞∑k=1

    |αφ(k)|2 =∞∑k=1

    |αk|2

  • Wir haben bis jetzt Orthogonalfolgen, also Orthonormalsysteme mit abzählbar vielen Termen be-trachtet. Viele Eigenschaften von Orthonormalfolgen lassen sich, auf Grund des folgenden Resul-tates, auch auf Orthonormalsysteme mit überabzählbar vielen Termen verallgemeinern.Lemma 2.4.12. Sei (H, (·, ·)) ein Hilbertraum, A eine beliebige Menge und (xα)α∈A ein Ortho-normalsystem. Dann ist für jedes x ∈ H die Menge

    θx = {α : (x, xα) 6= 0}

    abzählbar.

    Beweis. Wenn θx überabzählbar wäre, dann gäbe es N ∈ N, so dass auch

    θNx = {α : |(x, xα)| ≥ 1/N}

    überabzählbar würe (denn θx =⋃N∈N θ

    Nx ). Dann gilt aber, mit M = ‖x‖2, und nach Bessel-

    Ungleichung

    MN2 = N2‖x‖2 ≥∑α∈θNx

    N2|(x, xα)| ≥∑α∈θNx

    1,

    d.h. θNx hat höchstens MN2 Elemente, Widerspruch.

    Orthonormalsysteme sind sehr nützlich, weil man Vektoren sehr einfach auf Unterräume projezierenkann, die von einem Orthonormalsystem aufgespannt werden.Lemma 2.4.13. Es sei (H, (·, ·)) ein Hilbertraum, A eine beliebige Menge und (xα)α∈A ein Ortho-normalsystem in H. Dann konvertiert

    ∑α∈A(xα, x)xα für beliebige x ∈ H und die lineare Abbildung

    PA : H → H definiert durch PA(x) =∑

    α∈A(xα, x)xα ist die Projektion auf

    M := span{xα : α ∈ A} =

    {n∑i=1

    βjxj : βj ∈ K, xj ∈ {(xα)α∈A}, n ∈ N

    }.

    Insbesondere gilt für x ∈ span {xα : α ∈ A} die Darstellung

    x =∑α∈A

    (xα, x)xα (2.9)

    Beweis. Für x ∈ H folgt nach Lemma 2.4.12 (Abzählbarkeit) und Lemma 2.4.10 (Besselsche Un-gleichung), dass ∑

    α∈A| (xα, x)︸ ︷︷ ︸

    ”α”

    |2 ≤ ‖x‖2

  • konvergiert. Die Abbildung PA ist also wohldefiniert. Um die Stetigkeit von PA zu zeigen, bemerkenwir, dass

    ‖PA(x)‖2 =

    ∥∥∥∥∥∑α∈A

    (xα, x)xα

    ∥∥∥∥∥2

    =∑α∈A|(xα, x)|2 ≤ ‖x‖2.

    Da PA linear ist (Linearität des Skalarprodukts) folgt:

    ‖PA(x)− PA(y)‖ = ‖PA(x− y)‖ ≤ ‖x− y‖ (allg. Prinzip).

    Um zu zeigen, dass PA eine Projektion ist, bemerken wir, dass für x ∈ span{xα : α ∈ A} gilt

    x =

    n∑j=1

    βjxj ⇒ PA(x) =∑α∈A

    (xα,

    n∑j=1

    βjxj)︸ ︷︷ ︸βjδαj

    xα =

    n∑j=1

    βjxj

    und eine einfache Berechnung zeigt, dass PA(x) = x.

    Wegen der Stetigkeit von PA, erhalten wir damit auch PA(x) = x für alle x im Abschluss derlinearen Hülle M = span{xα : α ∈ A}. Weil anderseits, nach Definition, PA(x) ∈ span{xα : α ∈ A}für alle x ∈ H, gilt folgt, dass PA ◦ PA = PA also ist PA eine Projektion. Für x im orthogonalenKomplement von span{xα : α ∈ A} gilt (x, xα) = 0 für alle α ∈ A und deswegen PA(x) = 0.

    Falls alsoM = span{xα : α ∈ A}

    dicht in H ist, d.h. falls M = H, liefert (2.9) eine Darstellung jedes Vektors in H. In diesem Fallsagt man, dass die (xα)α∈A eine Hilbertraumbasis ist.Definition 2.4.14. Sei H ein Hilbertraum. Eine Hilbertraumbasis ist ein Orthonormalsystem(xα)α∈A mit

    span{xα : α ∈ A} = H

    Beispiel. H = l2(K). Sei ek = (0, . . . , 0, 1, 0, . . . ) mit 1 an der k-ten Stelle, und sonst nur 0. Dannist (ek)k∈N eine Hilbertraumbasis.Es gibt einige equivalente Charakterisierungen für Hilbertraumbasis.

    End 6. lecture (29/10/19)

    Satz 2.4.15. Sei H ein Hilbertraum, und (xα)α∈A ein Orthonormalsystem. Equivalent sind

    (i) (xα) ist Hilbertraumbasis.

    (ii) x =∑

    α∈A(xα, x)xα, für alle x ∈ H.

    (iii) ‖x‖2 =∑

    α∈A |(xα, x)|2, für alle x ∈ H.

    (iv) (xα, x) = 0 für alle α in A impliziert, dass x = 0.

    (v) (xα)α∈A ist ein maximales Orthonormalsystem im Sinne der Inklusionen.

    26

  • Beweis. Das Theorem folgt aus den Implikationen:(i) ⇒ (ii) Folgt aus Lemma 2.4.13.(ii) ⇒ (iii) Lemma 2.4.11.(iii) ⇒ (iv) Offensichtlich.(iv) ⇒ (v) Nehmen wir an (xα)α∈A ist nicht maximal. Dann gibt es x∞ ∈ H mit ‖x∞‖ = 1 und(xα, x∞) = 0 für alle α ∈ A. (iv) impliziert dann, dass x∞ = 0, was in Widerspruch zu ‖x∞‖ = 1steht.(v) ⇒ (i) Setze M = span{xα : α ∈ A}. Falls M 6= H, dann ist M⊥ 6= {0}, und H = M ⊕M⊥.Wähle x∞ ∈ M⊥ mit ‖x∞‖ = 1. Dann ist (xα)α∈A ∪ x∞ ein Orthonormalsystem, in Widerspruchzur Maximalität von (xα)α∈A. Also M = H.

    Remark. Durch Benutzung der Maximalität als Charakterisierung für eine Hilbertraumbasis folgtaus dem Lemma von Zorn, dass jeder Hilbertraum eine Hilbertraumbasis besitzt.

    Ist der Hilbertraum H separabel, dann kann er also mit l2(K) identifiziert werden.Satz 2.4.16. Sei H ein (unendlich dimensionaler) separabler Hilbertraum über K. Dann existiertein linearer Isomorphismus φ : H → l2(K) mit

    (φ(x), φ(y))l2 = (x, y)H

    für alle x, y ∈ H (insbesondere ist der Isomorphismus isometrisch).

    Beweis. Sei (xα)α∈A eine Hilbertraumbasis für H. Da H separabel ist, ist A abzählbar und da|A| =∞, können wir annehmen, dass A = N. Definiere φ : H → l2(K) durch

    φ(x) = ((x, xk))k∈N.

    Die Besselungleichung liefert, dass ‖φ(x)‖l2 = ‖x‖H

  • Bemerkung: Man kann dann auch die Norm auf H darstellen als

    ‖x‖ = supf∈H∗,‖f‖H∗≤1

    |〈f, x〉|.

    Weiter existiert die kanonische Injektion J : H → H∗∗, definiert wie folgt: Für x ∈ H ist f 7→〈f, x〉H∗,H ein stetiges, lineares Funktienal auf H∗, also Element von H∗∗, dass wir mit Jx bezeich-nen, also

    J :H → H∗∗

    x 7→ (f 7→ 〈f, x〉H∗,H)︸ ︷︷ ︸Jx

    .

    Es gilt:〈Jx, f〉H∗∗,H∗ = 〈f, x〉H∗,H ∀x ∈ H, f ∈ H∗.

    J ist offensichtlich linear und wegen

    ‖Jx‖H∗∗ = supf∈H∗‖f‖≤1

    |〈Jx, f〉| = supf∈H∗‖f‖≤1

    |〈f, x〉| = ‖x‖,

    auch eine Isometrie.Definition 2.5.2. Ist J surjektiv, so nennt man den Raum reflexiv.Satz 2.5.3. Jeder Hilbertraum (H, (·, ·)) ist reflexiv (aber nicht jeder Hilbertraum ist separabel!).

    (Ohne Beweis)

    It is very easy, in a Hilbert space, to write down continuous linear functionals: Pick any x ∈ H,then the map u 7→ (x, u) is a continuous linear functional on H. It is a remarkable fact that allcontinuous linear functionals on H are obtained in this fashion:Satz 2.5.4 (Riesz-Fréchet representation theorem). Given any f ∈ H∗ there exists a unique x ∈ Hsuch that

    〈f, v〉H∗,H = (x, v) ∀v ∈ H.

    Moreover,‖x‖ = ‖f‖H∗ .

    Beweis. Let M = f−1({0}), so that M is a closed subspace of H (why?). We may always assumethat M 6= H (otherwise f ≡ 0 and the conclusion of Theorem 2.5.4 is obvious - just take x = 0).Due to Theorem 2.4.8 we conclude H : M ⊕M⊥ und M⊥ 6= ∅. Now choose v ∈M⊥. Then, for allu ∈ H,

    u− f(u)f(v)

    v ∈M (well-defined since f(v) 6= 0),

    as

    f

    (u− f(u)

    f(v)v

    )= f(u)− f(u)

    f(v)f(v) = 0.

    28

  • Then we also have

    0 =

    v↑∈M⊥

    , u− f(u)f(v)

    v︸ ︷︷ ︸∈M

    = (v, u)− f(u)f(v)‖v‖2,i.e.

    f(u) =f(v)

    ‖v‖2(v, u) =

    f(v)‖v‖2 v︸ ︷︷ ︸=:x

    , u

    = (x, u) ∀u ∈ H.

    Remark. Wir hätten auch ‖v‖ normieren können.Remark. H and H∗: to identify or not to identify? The triplet V ⊂ H ⊂ V ∗.Satz 2.5.4 asserts that there is a canonical isometry from H onto H∗. It is therefore ”legitimate” toidentify H and H∗. We shall often do so but not always. Here is a typical situation - which arisesin many applications - where one should be cautious with identifications.

    Assume that H is a Hilbert space with a scalar product (·, ·) and a corresponding norm ‖·‖. Assumethat V ⊂ H is a linear subspace that is dense in H. Assume that V has its own ‖ · ‖V , and that Vis a Banach space with ‖ · ‖V . Assume that the injection V ⊂ H is continous, i.e.,

    ‖v‖ ≤ C‖v‖V ∀v ∈ V.

    There is a canonical map T : H∗ → V ∗ that is simply the restriction to V of continuous linearfunctionals ϕ on H, i.e.,

    〈Tϕ, v〉V ∗,V = 〈ϕ, v〉H∗,H .

    It is easy to see that T has the following properties:

    (i) ‖Tϕ‖V ∗ ≤ C‖ϕ‖H∗ ∀ϕ ∈ H∗,

    (ii) T is injective,

    (iii) R(T ) is dense in V ∗ if V is reflexive.

    End 7. lecture (4/11/19) Identifying H∗ with H and using T as a canonical embedding from H∗

    into V ∗, one usually writes

    V ⊂ H ' H∗ ⊂ V ∗ , (2.10)

    where all the injections are continuous and dense (provided V is reflexive). One says that H is thepivot space. Note that 〈·, ·〉V ∗,V and (·, ·) coincide whenever both make sense, i.e.,

    〈f, v〉V ∗,V = (f, v) ∀f ∈ H, ∀v ∈ V.

    The situation becomes more delicate if V turns out to be a Hilbert space with its own scalar product((·, ·)) associated to the norm |||·|||. We could, of course, intentify V an V ∗ with the help of ((·, ·)).However, (2.10) becomes absurd. This shows that one cannot identify simultaneously V and H with

    29

  • their dual spaces: one has to make a choice. The common habit is to identify H∗ with H, to write(2.10), and not to identify V ∗ with V [naturally, there is still an isometry from V onto V ∗, but itis not viewed as the identify map]. Here is a very instructive example.Let

    H = l2 =

    {u = (un)n≥1;

    ∞∑n=1

    u2n

  • Satz 2.6.2. (Stampacchia). Assume that a(u, v) is a continuous coercive bilinear form on H. LetK ⊂ H be a nonempty closed and convex subset. Then, given any f ∈ H∗, there exists a uniqueelement u ∈ K such that

    a(u, v − u) ≥ 〈f, v − u〉 ∀v ∈ K. (2.11)

    Moreover, if a is symmetric, then u is characterized by the property

    u ∈ K and 12a(u, u)− 〈f, u〉 = min

    v∈K

    {1

    2a(v, v)− 〈f, v〉

    }. (2.12)

    The proof of Theorem 2.6.2 relies on the following very classical result.Satz 2.6.3 (Banach fixed-point theorem /contraction mapping principle). Let X be a nonemptycomplete metric space and let S : X → X be a strict contraction, i.e. there exists k < 1 s.t.

    d(Sv1, Sv2) ≤ kd(v1, v2) ∀ v1, v2 ∈ X.

    Then S has a unique fixed point, u = Su.

    For a proof see, e.g., T.M. Apostol [1], G. Choquet [1], A. Friedman [3].We also need the following result on projections:Proposition 2.6.4. Let K ⊂ H be non-empty, closed and convex. Then the projection PK doesnot increase distance, i.e.

    ‖PKu1 − PKu2‖ ≤ ‖u1 − u2‖ ∀u1, u2 ∈ H.

    Beweis. The definition if PK (see Theorem 2.4.6) yields

    (u1 − PKu1, v − PKu1) ≤ 0 ∀v ∈ K ← choose v = PKu2(u2 − PKu2, v − PKu2) ≤ 0 ∀v ∈ K ← choose v = PKu1

    Adding these inequalities results in

    ‖PKu1 − PKu2‖2 ≤ (u1 − u2, PKu1 − PKu2) ≤ ‖u1 − u2‖ ‖PKu1 − PKu2‖.

    Proof of Theorem 2.6.2. From the Riesz-Fréchet representation theorem (Theorem 2.5.4) we knowthat there exists a unique x ∈ H such that

    〈f, v〉 = (x, v) ∀v ∈ H.

    On the other hand, if we fix u ∈ H, the map v 7→ a(u, v) is a continuous linear functional onH. Using once more the Riesz-Fréchet representation theorem we find some unique element in H,denoted by Au, such that a(u, v) = (Au, v) ∀v ∈ H. Clearly A is a linear operator (see Übung)from H onto H satisfying

    ‖Au‖ ≤ C‖u‖ ∀u ∈ H,(Au, u) ≥ α‖u‖2 ∀u ∈ H.

    31

  • Problem (2.11) amounts to finding some u ∈ K such that

    (Au, v − u) ≥ (f, v − u) ∀v ∈ K. (2.13)

    Let ρ > 0 be a constant (to be determined later). Note that 2.13 is equivalent to

    (ρf − ρAu+ u− u, v − u) ≤ 0 ∀v ∈ K.

    i.e.,u = PK(ρf − ρAu+ u).

    For every v ∈ K, define S : K → K via Sv = PK(ρf − ρAv+ v). We claim that if ρ > 0 is properlychosen then S is a strict contraction. Indeed, since PK does not increase distance (see Proposition2.6.4 we have

    ‖Sv1 − Sv2‖ ≤ ‖(v1 − v2)− ρ(Av1 −Av2)‖

    and thus

    ‖Sv1 − Sv2‖2 = ‖v1 − v2‖2 − 2ρ(Au1 −Av2, v1 − v2) + ρ2‖Av1 −Av2‖2≤ ‖v1 − v2‖2(1− 2ρα+ ρ2C2).

    Choosing ρ > 0 in such a way that k2 = 1− 2ρα+ ρ2C2 < 1 (i.e., 0 < ρ < 2α/C2) we find that Shas a unique fixed point. 1

    End 8. lecture (5/11/19) Assume now that the form a(u, v) is also symmetric. Then a(u, v) defi-

    nes a new scalar product on H and the corresponding norm a(u, v)1/2 is equivalent to the originalnorm ‖u‖, i.e. there exist constants c1, c2 > 0 s.t.

    c1‖u‖ ≤ a(u, u)1/2 ≤ c2‖u‖.

    It follows that H is also Hilbert space for this new scalar product. Using the Riesz-Fréchet theoremwe may now represent the functional f through the new scalar product, i.e., there exists someunique element g ∈ H such that

    〈f, v〉 = a(g, v) ∀v ∈ H.

    In this situation Problem (2.11) amounts to finding some u ∈ K such that

    a(g − u, v − u) ≤ 0 ∀v ∈ K. (2.14)

    The solution of (2.14) is an old friend: u is simply the projection of g onto K for the new scalarproduct a. We also know by Theorem 2.4.6 that u is the unique element K that achieves

    minv∈K

    a(g − v, g − v)1/2.

    This amounts to minimizing on K the function

    v 7→ a(g − v, g − v) = a(v, v)− 2a(g, v) + a(g, g) = a(v, v)− 2〈f, v〉+ a(g, g).1If one has to compute the fixed point numerically, it pays to choose ρ = α/C2 in order to minimize k and to

    accelerate the convergence of the iterates of S.

    32

  • or equivalently the function (as the term a(g, g) does not depend on v)

    v 7→ 12a(v, v)− 〈f, v〉H∗,H .

    Remark 6. It is easy to check that if a(u, v) is a bilinear form with the property

    a(v, v) ≥ 0 ∀v ∈ H

    then the function v 7→ a(v, v) is convex.Lemma 2.6.5 (Lax-Milgram). Assume that a(u, v) is a continuous coercive bilinear form on H.Then, given any f ∈ H∗, there exists a unique element u ∈ H such that

    a(u, v) = 〈f, v〉H∗,H ∀v ∈ H. (2.15)

    Moreover, if a is symmetric, then u is characterized by the property

    u ∈ H and 12a(u, u)− 〈f, u〉 = min

    v∈H

    {1

    2a(v, v)− 〈f, v〉H∗,H

    }. (2.16)

    Beweis. Use Theorem 2.6.2 with K = H and argue as in the proof of Corollary 2.4.7.

    Remark 7. The Lax-Milgram theorem is a very simple and efficient tool for solving linear ellipticpartial differential equation (see Section 5). It is interesting to note the connection between equation(2.15) and the minimization problem (2.16). When such questions arise in mechanics or in physicsthey often have a natural interpretation: Least action principle, minimization of the energy, etc. Inthe language of the calculus of variations one says that (2.15) is the Euler equation associated tothe minimization problem (2.16). Roughly speaking, (2.16) says that ”F ′(u) = 0” where F is thefunction F (v) = 12a(v, v)− 〈f, v〉.Remark 8. There is a direct and elementary argument proving that (2.15) has a unique solution(i.e. a direct proof of Lax-Milgram). Indeed, this amounts to showing that

    ∀g ∈ H ∃!u ∈ H such that Au = g,

    i.e., A is bijective from H onto H. This is a trivial consequence of the following facts:

    (a) A is injective (α‖v‖ ≤ ‖Av‖ since A is coercive),

    (b) R(A) is closed, (also consequence of the coerciveness),

    (c) R(A) is dense; indeed, suppose v ∈ H satisfies

    (Au, v) = 0 ∀u ∈ H,

    then v = 0 (again coercivity - choose u = v)

    33

  • 3 LP Spaces

    Let (Ω,M, µ) denote a measure space, i.e. Ω is a set and

    (i) M is a σ-algebra in Ω, i.e. M is a collection of subsets of Ω such that:

    (a) ∅ ∈ M,

    (b) A ∈M⇒ Ac ∈M,

    (c)⋃∞n=1An ∈M whenever An ∈M ∀n,

    (ii) µ is a measure, i.e., µ :M→ [0,∞] satisfies

    (a) µ(∅) = 0,

    (b) {µ (⋃∞n=1An) =

    ⋃∞n=1 µ(An) whenever (An) is a disjoint

    countable family of members of M.

    The members of M are called the measurable sets. Sometimes we shall write |A| instead of µ(A).We shall assume - even though this is not essential - that.

    (iii) Ω is σ-finite, i.e., there exists a countable family (Ωn) in M such that Ω =⋃∞n=1 Ωn and

    µ(Ωn)

  • 3.1 Some Results about Integration That Everyone Must Know

    Satz 3.1.1 (Monotone convergence theorem, Beppo Levi). Let (fn)n∈N be a sequence of functionsf : Ω→ R in L1(Ω, µ) that satisfy

    (a) f1 ≤ f2 ≤ . . . ≤ fn ≤ fn+1 ≤ . . . a.e. on Ω,

    (b) supn´

    Ω fn dµ

  • Then F ∈ L1(Ω1 × Ω2).

    Satz 3.1.6 (Fubini). Assume that F ∈ L1(Ω1 × Ω2). Then for a.e. x ∈ Ω1, F (x, y) ∈ L1y(Ω2) and´Ω2F (x, y)dµ2 ∈ L1x(Ω1). Similarly, for a.e. y ∈ Ω2, F (x, y) ∈ L1x(Ω1) and

    ´Ω1F (x, y)dµ1 ∈ L1y(Ω2).

    Moreover, one has

    ˆΩ1

    (ˆΩ2

    F (x, y)dµ2

    )dµ1 =

    ˆΩ2

    (ˆΩ1

    F (x, y)dµ1

    )dµ2 =

    ¨Ω1×Ω2

    F (x, y)dµ1dµ2.

    36

  • 3.2 Definition and Elementary Properties of Lp Spaces

    Definition 3.2.1. Let p ∈ R with 1 < p 0

    such that |f(x)| ≤ C a.e. on Ω

    }with

    ‖f‖L∞ = ‖f‖∞ = inf{C; |f(x)| ≤ C a.e. on Ω}.

    Remark 9. If f ∈ L∞ then we have

    |f(x)| ≤ ‖f‖∞ a.e. on Ω.

    Indeed, there exists a sequence Cn such that Cn → ‖f‖∞ and for each n, |f(x)| ≤ Cn a.e. on Ω.Therefore |f(x)| ≤ Cn for all x ∈ Ω \En, with |En| = 0. We set E =

    ⋃∞n=1En, so that |E| = 0 and

    |f(x)| ≤ Cn ∀n, ∀x ∈ Ω \ E;

    it follows that |f(x)| ≤ ‖f‖∞ ∀x ∈ Ω \ E.Notation 1. Let 1 ≤ p ≤ ∞; we denote by p∗ (often also q or p∗) the conjugate exponent,

    1

    p+

    1

    p∗= 1. (keep in mind: p = p∗(1− p))

    Satz 3.2.2 (Hölder’s inequality). Assume that f ∈ Lp(Ω) and g ∈ Lp∗(Ω) with 1 ≤ p ≤ ∞. Thenfg ∈ L1(Ω) and

    ˆ|fg| ≤ ‖f‖p‖g‖p∗ . (3.1)

    Beweis. The conclusion is obvious if p = 1 or p = ∞. Therefore we assume that 1 < p < ∞. Werecall Young’s inequality: 2

    ab ≤ 1pap +

    1

    p∗bp∗ ∀a ≥ 0, b ≥ 0. (3.2)

    2It is sometimes convenient to use the form ab ≤ �ap + C�bp∗

    with C� = �−1/(p−1).

    37

  • Inequality (3.2) is a straightforward consequence of the concavity of the function log on (0,∞):

    log

    (1

    pap +

    1

    p∗bp∗)≥ 1p

    log ap +1

    p∗log bp

    ∗= log ab.

    We have

    |f(x)g(x)| ≤ 1p|f(x)|p + 1

    p∗|g(x)|p∗ a.e. x ∈ Ω.

    It follows that fg ∈ L1 andˆ|fg| ≤ 1

    p‖f‖pp +

    1

    p∗‖g‖p

    p∗ . (3.3)

    Replacing f by λf (λ > 0) in (3.3), yields

    ˆ|fg| ≤ λ

    p−1

    p‖f‖pp +

    1

    λp∗‖g‖p

    p∗ .

    Choosing λ = ‖f‖−1p ‖g‖p∗/pp (so as to minimize the right-hand side above), we obtain (3.1).

    End 9. lecture (11/11/19)

    Remark. It is useful to keep in mind the following extension of Hölder’s inequality: Assume thatf1, f2, . . . , fk are functions such that

    fi ∈ Lpi , 1 ≤ i ≤ k with1

    p=

    1

    p1+

    1

    p2+ · · ·+ 1

    pk≤ 1.

    Then the product f = f1f2 · · · fk belongs to Lp(Ω) and

    ‖f‖p ≤ ‖f1‖p1‖f2‖p2 · · · ‖fk‖pk .

    In particular, if f ∈ Lp ∩ Lq with 1 ≤ p ≤ q ≤ ∞, then f ∈ Lr for all r with p ≤ r ≤ q, and thefollowing ”interpolation inequality” holds:

    ‖f‖r ≤ ‖f‖αp ‖f‖1−αq , were1

    r=α

    p+

    1− αq

    , 0 ≤ α ≤ 1;

    see Exercise 4.4.Satz 3.2.3. Lp is a vector space and ‖ · ‖p is a norm for any 1 ≤ p ≤ ∞.

    Beweis. Only have to show that the norm satisfies the triangle inequality. The cases p = 1 andp =∞ are clear. Therefore we assume 1 < p

  • But |f + g|p−1 ∈ Lp∗ , and by Hölder’s inequality we obtain

    ‖f + g‖pp ≤ ‖f + g‖p−1p (‖f‖p + ‖g‖p),

    i.e., ‖f + g‖p ≤ ‖f‖p + ‖g‖p, so that the triangle inequality is satisfied.

    Satz 3.2.4 (Fischer-Riesz). Lp is a Banach space for any 1 ≤ p ≤ ∞.Korollar 3.2.5. Let (fn) be a sequence in L

    p(Ω), 1 ≤ p ≤ ∞ and let f ∈ Lp(Ω) be such that‖fn − f‖p → 0.Then, there exist a subsequence (fnk)k∈N and a function h ∈ Lp(Ω) such that

    (a) fnk(x)→ f(x) a.e. on Ω,

    (b) |fnk(x)| ≤ h(x) ∀k, a.e. on Ω.

    Remark: ”Reverse dominated convergence”.

    3.3 Reflexivity, separability, dual space of Lp

    We shall consider the cases

    (A) 1 < p

  • Satz 3.3.3. The space Cc(Rd) is dence in Lp(Rd) for any 1 ≤ p n

    =

    {r if |r| ≤ n,nsign(r) if |r| > n.

    Given a set E ⊂ Ω, we define the characteristic function χE to be

    χE(x) =

    {1 if x ∈ E,0 if x ∈ Ω \ E.

    Beweis. First, we claim that given f ∈ Lp(Rd) and � > 0 there exist a function g ∈ L∞(Rd) and acompact set K in Rd such that g = 0 outside K and

    ‖f − g‖p < �/2. (3.4)

    Indeed for χBn(0) the characteristic function of the open ball Bn(0) let fn = χBn(0)Tnf . By domi-nated convergence we see that ‖fn− f‖p → 0 and thus we may choose g = fn with n large enough.Next, given δ > 0 there exists (by Theorem 3.1.4 and as g ∈ L1(Rd)) a function g1 ∈ Cc(Rd) suchthat

    ‖g − g1‖1 < δ.

    We may always assume that ‖g1‖∞ ≤ ‖g‖∞ (otherwise, we replace g1 by Tng1 with n = ‖g‖∞noting that then |g − Tng1| ≤ |g − g1|). Finally, by interpolation, we have

    ‖g − g1‖p ≤ ‖g − g1‖(1/p)1 ‖g − g1‖1−(1/p)∞ ≤ δ1/p(2‖g‖∞)1−(1/p).

    We conclude by choosing δ > 0 small enough that

    δ1/p(2‖g‖∞)1−(1/p) < �/2,

    and thus‖f − g1‖p = ‖f − g + g − g1‖p ≤ ε/2 + ε/2 = ε.

    Definition 3.3.4. The measure space (Ω,M) is called separable if there is a countable family(En)n∈N of elements of M such that the σ-algebra generated by (En)n∈N coincides with M (i.e.,M is the smallest σ-algebra containing all the En’s).Example. The measure space (Rd,B(Rd)) consisting of Ω = Rd and the Borel σ-algebra is separa-ble.Satz 3.3.5. Assume that Ω is a separable measure space. Then Lp(Ω) is separable for any 1 ≤ p <∞.

    B. The spaces L1(Ω) and L∞(Ω).

    40

  • Satz 3.3.6 (Riesz representation theorem). Let f ∈ (L1(Ω))∗. Then there exists a unique functionu ∈ L∞(Ω) such that

    〈f, v〉 =ˆuv dx ∀v ∈ L1(Ω).

    Moreover‖u‖L∞(Ω) = ‖f‖(L1(Ω))∗ .

    Remark.

    • But: As we are not working in a Hilbert space we cannot conclude that L1(Ω) is reflexive.Indeed: L1(Ω) is never reflexive (unless Ω is finite!)Furthermore, we have that L∞(Ω) is also never reflexive (unless Ω finite) and also not sepa-rabel.

    • The dual space of L∞ can be identified with the space of Radon measures.

    We thus have the following situation:

    Reflexiv Seperabel Dualraum

    Lp, 1 < p

  • (ii) 1 < p

  • Notation. Given a function f on Rd we set f̌(x) = f(−x).Proposition 3.4.2. Let f ∈ L1(Rd), g ∈ Lp(Rd) and h ∈ Lp∗(Rd). Then we have

    ˆRd

    (f ∗ g)h =ˆRdg(f̌ ∗ h).

    Support and convolutionThe notion of support of a function f is standard: supp f is the complement of the biggest openset on which f vanishes; in other words supp f is the closure of the set {x : f(x) 6= 0}.This notion is not adequade when dealing with equivalence classes, such as the space Lp(Ω). Weneed a definition which is intrinsic, that is, supp f1 and supp f2 should be the same (or differ by anull set) if f1 = f2 a.e.. The reader will easily admit that the usual notion does not make sense forf =XQ on R. In the following proposition we introduce the appropriate notion.Proposition 3.4.3. (and definition of the support). Let f : Rd → R be any function. Considerthe family (wi)i∈I of all open sets on Rd such that for each i ∈ I, f = 0 a.e. on ωi. Set ω =

    ⋃i∈I ωi.

    Thenf = 0 a.e. on ω.

    By definition, supp f is the complement of ω in Rd.

    Beweis. Since the set I need not be countable it is not clear that f = 0 a.e. on ω. However we mayrecover the countable case as follows: There is a countable family (On)n∈N of open sets in Rd suchthat every open set on Rd is the union of some On’s. Write ωi =

    ⋃n∈Ai On and with B =

    ⋃i∈I Ai

    we havew =

    ⋃n∈B

    On.

    Since there are only countable many On’s, this is a countable union. This is indeed a countableunion and thus f = 0 a.e. on ω.

    Remark 10. (a) Assume f1 = f2 a.e. on Rd; clearly we have supp f1 = supp f2. Hence we maytalk about supp f for a function f ∈ Lp-without saying what representative we pick in theequivalence class.

    (b) if f is a continuous function on Rd it is easy to check that the new definition of supp fcoincides with the usual definition.

    Proposition 3.4.4. Let f ∈ L1(Rd) and g ∈ Lp(Rd) with 1 ≤ p ≤ ∞. Then

    supp(f ∗ g) ⊂ supp f + supp g.

    Remark. If both f and g have compact support, then f ∗ g also has compact support. However,f ∗ g need not have compact support if only one of them has compact support.Definition 3.4.5. Let Ω ⊂ Rd be open and let 1 ≤ p ≤ ∞. We say that a function f : Ω → Rbelongs to Lploc(Ω) if fχK ∈ L

    p(Ω) for every compact set K contained in Ω.Note that if f ∈ Lploc(Ω), then f ∈ L

    1loc(Ω). (Hölder)

    43

  • Proposition 3.4.6. Let f ∈ Cc(Rd) and g ∈ L1loc(Rn). Then (f ∗ g)(x) is well defined for everyx ∈ Rd, and moreover, (f ∗ g) ∈ C(Rd).

    Beweis. Note that for every x ∈ Rd the function y 7→ f(x−y)g(y) is integrable on Rd and therefore(f ∗ g)(x) is defined for every x ∈ Rd.Let xn → x and let K be a fixed compact set in Rd such that (xn − supp f) ⊂ K for all n ∈ N.Therefore, we have f(xn − y) = 0 ∀n,∀y /∈ K. We deduce from the uniform continuity of f on Kthat.

    |f(xn − y)− f(x− y)| ≤ �nχK(y) ∀n ∀y ∈ Rd

    with �n → 0. We conclude that

    |(f ∗ g)(xn)− (f ∗ g)(x)| ≤ �nˆK|g(y)|dy → 0.

    Notation. Let Ω ⊂ Rd be an open set. We denote

    • C(Ω) is the space of continuous functions on Ω.

    • Ck(Ω) is the space of functions k times continuously differentiable on Ω (k ≥ 1 is an integer).

    • C∞(Ω) = ∩kCk(Ω).

    • Cc(Ω) is the space of continuous functions on Ω with compact support in Ω, i.e., which vanishoutside some compact set K ⊂ Ω.

    • Ckc (Ω) = Ck(Ω) ∩ Cc(Ω).

    • C∞c (Ω) = C∞(Ω) ∩ Cc(Ω), (some authors write D(Ω) or C∞0 (Ω) instead of C∞c (Ω)).

    If f ∈ C1(Ω), its gradient is defined by

    ∇f =(∂f

    ∂x1,∂f

    ∂x2, . . . ,

    ∂f

    ∂xd

    ).

    If f ∈ Ck(Ω) and α = (α1, α2, . . . , αd) is a multi-index of length |α| = α1 +α2 + . . .+αd, less thank, we write

    Dαf =∂α1

    ∂xα11

    ∂α2

    ∂xα22. . .

    ∂αd

    ∂xαddf.

    Proposition 3.4.7. Let f ∈ Ckc (Rd)(k ≥ 1) and let g ∈ L1loc(Rd). Then f ∗ g ∈ Ck(Rd) and

    Dα(f ∗ g) = (Dαf) ∗ g ∀α with |α| ≤ k.

    In particular, if f ∈ C∞c (Rd) and g ∈ L1loc(Rd), then f ∗ g ∈ C∞(Rd).

    44

  • Beweis. By induction it suffices to consider the case k = 1. Given x ∈ Rd we claim that f ∗ g isdifferentiable at x and that

    ∇(f ∗ g)(x) = (∇f) ∗ g(x).

    Let h ∈ Rd with |h| < 1. We have, for all y ∈ Rd.

    |f(x+ h− y)− f(x− y)− h · ∇f(x− y)|

    =∣∣∣´ 10 [h · ∇f(x+ sh− y)− h · ∇f(x− y)]ds∣∣∣ ≤ |h|�(|h|)

    with �(|h|)→ 0 as |h| → 0 (since ∇f is uniformly continuous on Rd).Let K be a fixed compact set in Rd large enough that x+B(0, 1)− supp f ⊂ K.We have

    f(x+ h− y)− f(x− y)− h · ∇f(x− y) = 0 ∀y /∈ K, ∀h ∈ B(0, 1)

    and therefore

    |f(x+ h− y)− f(x− y)− h · ∇f(x− y)| ≤ |h|�(|h|)χK(y)∀y ∈ Rd, ∀h ∈ B(0, 1).

    We conclude that for h ∈ B(0, 1),

    |(f ∗ g)(x+ h)− (f ∗ g)(x)− h · (∇f ∗ g)(x)| ≤ |h|�(|h|)ˆK|g(y)|dy.

    it follows that f ∗ g is differentiable at x and ∇(f ∗ g)(x) = (∇f) ∗ g(x).

    Mollifiers:Definition 3.4.8. A sequence of mollifiers (”Glättungskernen”) (ρn)n≥1 is any sequence of func-tions on Rd such that

    ρn ∈ C∞c (Rd), supp ρn ⊂ B1/n(0),ˆRd

    ρn dx = 1, ρn ≥ 0 on Rd.

    In what follows we shall systematically use the notation (ρn)n∈N to denote a sequence of mollifiers.

    End 11. lecture (18/11/19)

    It is easy to generate a sequence of mollifiers starting with a single function ρ ∈ C∞c (Rd) such thatsupp ρ ⊂ B1(0), ρ ≥ 0 on Rd, and p does not vanish identically - for example the function

    ρ(x) =

    {e1/(|x|

    2−1) it |x| < 1,0 it |x| > 1.

    We obtain a sequence of mollifiers by letting ρn(x) = CnNρ(nx) with C = 1/

    ´ρ dx.

    Proposition 3.4.9. Assume f ∈ C(Rd). Then (ρn ∗ f) −→n→∞

    f uniformly on compact sets of Rd.Remark. The technique of regularization by convolution was originally introduced by Leray andFriedrichs.

    45

  • Beweis. Let K ⊂ Rd be a fixed compact set. Given � > 0 there exists δ > 0 (depending on K and�) such that

    |f(x− y)− f(x)| < � ∀x ∈ K, ∀y ∈ Bδ(0).

    We have, for x ∈ Rd,

    (ρn ∗ f)(x)− f(x) =´Rd [f(x− y)− f(x)]ρn(y)dy

    =´B1/n(0)

    [f(x− y)− f(x)]ρn(y)dy.

    For n > 1/δ and x ∈ K we obtain

    |(ρn ∗ f)(x)− f(x)| ≤ �ˆρn = �.

    Satz 3.4.10. Assume f ∈ Lp(Rd) with 1 ≤ p 0, we fix a function f1 ∈ Cc(Rd) such that ‖f − f1‖p < � (see Theorem 3.3.3).By Proposition 3.4.9 we know that (ρn ∗f1)→ f1 uniformly on every compact set Rd. On the otherhand, we have (by Proposition 3.4.4) that

    supp(ρn ∗ f1) ⊂ B1/n(0) + supp f1 ⊂ B1(0) + supp f1,

    which is a fixed compact set. It follows that

    ‖(ρn ∗ f1)− f1‖p −→n→∞

    0.

    Finally, we write

    (ρn ∗ f)− f = [ρn ∗ (f − f1)] + [(ρn ∗ f1)− f1] + [f1 − f ]

    and thus‖(ρn ∗ f)− f‖p ≤ 2‖f − f1‖p + ‖(ρn ∗ f1)− f1‖p

    (as by Theorem 3.4.1 ‖ρn ∗ (f − f1)‖p ≤ ‖ρn‖1‖f − f1‖p). We conclude that

    lim supn→∞

    ‖(ρn ∗ f)− f‖p ≤ 2� ∀� > 0

    and therefore limn→∞ ‖(ρn ∗ f)− f‖p = 0.

    Korollar 3.4.11. Let Ω ⊂ Rd be an open set. Then C∞c (Ω) is dense in Lp(Ω) for any 1 ≤ p

  • 4 Sobolev Spaces

    This section mostly develops the theory of Sobolev spaces and presents several properties.

    4.1 Weak derivatives.

    We start off by substantially weakening the notion of partial derivatives. Let Ω ∈ Rd be an openand bounded domain.

    Motivation for definition of weak derivative. Assume we are given a function u ∈ C1(Ω).Then if φ ∈ C∞c (Ω), we see from the integration by parts formula thatˆ

    Ωuφxi dx = −

    ˆΩuxiφ dx (i = 1, . . . , n). (4.1)

    There are no boundary terms, since φ has compact support in Ω and thus vanishes near ∂Ω. Moregenerally now, if k is a positive integer, u ∈ Ck(Ω), and α ia a multiindex of order |α| = k,then ˆ

    ΩuDαφ dx = (−1)|α|

    ˆΩDαuφ dx. (4.2)

    This equality holds since

    Dαφ =∂α1

    ∂xα11. . .

    ∂αn

    ∂xαnnφ

    and we can apply formula (4.1) |α| times.We next examine formula (4.2), valid for u ∈ Ck(Ω), and ask whether some variant of it might stillbe true even if u is not k times continuously differentiable. Now the left hand side of 4.2 makessense if u is only locally summable (distributional derivative): the problem is rather that if u is notCk, then the expression ”Dαu” on the right hand side of 4.2 has no obvious meaning. We resolvethis difficulty by asking if there exists a locally summable function v for which formula 4.2 is valid,with v replacing Dαu:Definition 4.1.1. Suppose u, v ∈ L1loc(Ω), and α is a multiindex. We say that v is the αth-weakpartial derivative of u, written

    Dαu = v,

    provided ˆΩuDαφ dx = (−1)|α|

    ˆΩvφ dx (4.3)

    for all test funktions φ ∈ C∞c (Ω).

    In other words, if we are given u and if there happens to exist a function v which verifies 4.3 for allφ, we say that Dαu = v in the weak sense. If there does not exist such a function v, then u doesnot possess a weak αth-partial derivative.Lemma 4.1.2. (Uniqueness of weak derivatives). A weak αth-partial derivative of u, if it exists, isuniquely defined up to a set of measure zero.

    47

  • Beweis. Assume that v, v̄ ∈ L1loc(Ω) satisfyˆΩuDαφ dx = (−1)|α|

    ˆΩvφ dx = (−1)|α|

    ˆΩv̄φ dx

    for all φ ∈ C∞c (Ω). Then ˆΩ

    (v − v̄)φ dx = 0 (4.4)

    for all φ ∈ C∞c (Ω); whence v − v̄ = 0 a.e.

    Example. Let n = 1,Ω = (0, 2), and

    u(x) =

    {x if 0 < x ≤ 11 if 1 ≤ x < 2.

    Define

    v(x) =

    {1 if 0 < x ≤ 10 if 1 < x < 2.

    Let us show u′ = v in the weak sense. To see this, choose any φ ∈ C∞c (Ω). We must demonstrateˆ 2

    0uφ′ dx = −

    ˆ 20vφ dx.

    Indeed:ˆ 2

    0uφ′ dx =

    ˆ 10xφ′ dx+

    ˆ 21φ′ dx

    = −ˆ 1

    0φ dx+ φ(1)− φ(1) = −

    ˆ 20vφ dx,

    as required.Example. Let n = 1,Ω = (0, 2), and

    u(x) =

    {x if 0 < x ≤ 12 if 1 < x < 2.

    We assert u′ does not exist in the weak sense. To check this, we must show there does not exist anyfunction v ∈ L1loc(Ω) satisfying ˆ 2

    0uφ′ dx = −

    ˆ 20vφ dx (4.5)

    for all φ ∈ C∞c (Ω). Suppose, to the contrary, 4.5 were valid for some v and all φ. Then

    −ˆ 2

    0vφ dx =

    ˆ 20uφ′ dx =

    ˆ 10xφ′ dx+ 2

    ˆ 21φ′ dx (4.6)

    = −ˆ 1

    0φ dx− φ(1).

    48

  • Choose a sequence (φm)∞m=1 of smooth functions satisfying

    0 ≤ φm ≤ 1, φm(1) = 1, φm(x)→ 0 for all x 6= 1.

    Replacing φ by φm in (4.6) and sending m→∞, we discover

    1 = limm→∞

    φm(1) = limm→∞

    [ˆ 20vφm dx−

    ˆ 10φm dx

    ]= 0,

    a contradiction (where we used dominated convergence since v ∈ L1).

    Definition of Sobolev spaces.

    Fix 1 ≤ p ≤ ∞ and let k be a nonnegative integer.Definition 4.1.3. The Sobolev space

    W k,p(Ω)

    consists of all locally summable functions u : Ω → R such that for each multiindex α with |α| ≤k,Dαu exists in the weak sense and belongs to Lp(Ω). For u ∈W k,p(Ω), we define its norm to be

    ‖u‖Wk,p(Ω) :=

    (∑|α|≤k

    ´Ω

    |Dαu|p dx)1/p 1 ≤ p

  • Definition 4.1.5. We denote by W k,p0 (Ω) the closure of C∞c (Ω) with respect to the W

    k,p-norm.Remark.

    • Not yet clear how W k,p and W k,p0 are related.

    • Thus u ∈ W k,p0 (Ω) if and only if there exist functions um ∈ C∞c (Ω) such that um → u inW k,p(Ω). We interpret W k,p(Ω) as comprising those functions u ∈W k,p(Ω) such that

    ”Dαu = 0 on ∂Ω” for all |α| ≤ k − 1.

    This will all be made clearer with the discussion of traces in §5.5.

    • It is customary to writeHk0 (Ω) = W

    k,20 (Ω).

    Beispiel. Let {rk}∞k=1 be a countable, dense subset of B1(0). Write

    u(x) =∞∑k=1

    1

    2k|x− rk|−α (x ∈ Ω).

    Then u ∈ W 1,p(Ω) if and only if α < n−pp . If 0 < α <n−pp , we see that u belongs to W

    1,p(Ω) andyet is unbounded on each open subset of Ω.

    This last example illustrates a fundamental fact of life, that although a function u belonging to aSobolev space possesses certain smoothness properties, it can still be rather badly behaved in otherways.

    4.2 Elementary properties.

    Next we verify certain properties of weak derivatives. Note very carefully that whereas these variousrules are obviously true for smooth functions, functions in Sobolev space are not necessarily smooth:we must always rely solely upon the definition of weak derivatives.Satz 4.2.1. (Properties of weak derivatives). Assume u, v ∈W k,p(Ω), |α| ≤ k. Then

    (i) Dαu ∈ W k−|α|,p(Ω) and Dβ(Dαu) = Dα(Dβu) = Dα+βu for all multiindices α, β with |α| +|β| ≤ k.

    (ii) For each λ, µ ∈ R, λu+ µv ∈W k,p(Ω) and Dα(λu+ µv) = λDαu+ µDαv, |α| ≤ k.

    (iii) If V is an open subset of Ω, then u ∈W k,p(V ).

    (iv) If ζ ∈ C∞c (Ω), then ζu ∈W k,p(Ω) and

    Dα(ζu) =∑β≤α

    β

    )DβζDα−βu (Leibnitz’ formula), (4.7)

    where(αβ

    )= α!β!(α−β)! .

    50

  • Beweis. 1. To prove (i), first fix φ ∈ C∞c (Ω). Then Dβφ ∈ C∞c (Ω), and so´ΩD

    αuDβφ dx = (−1)|α|´

    Ω uDα+βφ dx

    = (−1)|α|(−1)|α+β|´

    ΩDα+βuφ dx

    = (−1)|β|´

    ΩDα+βuφ dx.

    Thus Dβ(Dαu) = Dα+βu in the weak sense.

    2. Assertions (ii) and (iii) are easy, and the proofs are omitted.

    3. We prove (4.7) by induction on |α|. Suppose first |α| = 1. Choose any φ ∈ C∞c (Ω). Then´Ω ζuD

    αφ dx =´

    Ω uDα(ζφ)− u(Dαζ)φ dx

    = −´

    Ω(ζDαu+ uDαζ)φ dx.

    Thus Dα(ζu) = ζDαu+ uDαζ, as required.Next assume l < k and formula (4.7) is valid for all |α| ≤ l and all functions ζ. Choose a multiindexα with |α| = l + 1. Then α = β + γ for some |β| = l, |γ| = 1. Then for φ as above,´

    Ω ζuDαφ dx =

    ´Ω ζuD

    β(Dγφ) dx

    = (−1)|β|´

    ∑σ≤β

    (βσ

    )DσζDβ−σuDγφ dx

    (by the induction assumption)

    = (−1)|β|+|γ|ˆ

    ∑σ≤β

    σ

    )Dγ(DσζDβ−σu)φ dx

    (by the induction assumption again)

    = (−1)|α|ˆ

    ∑σ≤β

    σ

    )[DpζDα−ρu+DσζDα−σu]φ dx

    (where ρ = σ + γ)

    = (−1)|α|ˆ

    ∑σ≤α

    σ

    )(DσζDα−σu)

    φ dx,By splitting the sum into two parts and using since∑

    σ≤β

    σ

    )DρζDα−ρu+

    ∑σ≤β

    σ

    )DσζDα−σu

    =∑

    γ≤ρ≤α

    ρ− γ

    )DρζDα−ρu+

    ∑σ≤β

    σ

    )DσζDα−σu

    =∑

    γ≤σ≤α

    σ − γ

    )DσζDα−σu+

    ∑σ≤β

    σ

    )DσζDα−σu

    51

  • and (β

    σ − γ

    )+

    σ

    )=

    σ

    ).

    Not only do many of the usual rules of calculus apply to weak derivatives, but the Sobolev spacesthemselves have a good mathematical structure:Satz 4.2.2. (Sobolev spaces as function spaces). For each k ∈ N and 1 ≤ p ≤ ∞, the Sobolev spaceW k,p(Ω) is a Banach space.

    Beweis. 1. Let us first of all check that ‖u‖wk,p(Ω) is a norm. Clearly

    ‖λu‖Wk,p(Ω) = |λ|‖u‖Wk,p(Ω),

    and‖u‖Wk,p(Ω) = 0 if and only if u = 0 a.e.

    Next assume u, v ∈ W k,p(Ω). Then if 1 ≤ p < ∞, the triangle inequality in Lp (Minkowski’sinequality) implies

    ‖u+ v‖Wk,p(Ω) =(∑

    |α|≤k ‖Dαu+Dαv‖pLp(Ω)

    )1/p≤

    (∑|α|≤k(‖Dαu‖Lp(Ω) + ‖Dαv‖Lp(Ω))p

    )1/p≤

    (∑|α|≤k ‖Dαu‖

    pLp(Ω)

    )1/p+(∑

    |α|≤k ‖Dαv‖pLp(Ω)

    )1/p= ‖u‖Wk,p(Ω) + ‖v‖Wk,p(Ω).

    2. It remains to show that W k,p(Ω) is complete. So assume (um)∞m=1 is a Cauchy sequence in

    W k,p(Ω). Then for each |α| ≤ k, (Dαum)∞m=1 is a Cauchy sequence in Lp(Ω). Since Lp(Ω) iscomplete, there exist functions uα ∈ Lp(Ω) such that

    Dαum → uα in Lp(Ω)

    for each |α| ≤ k. In particular,

    um → u(0,...,0) =: u in Lp(Ω)

    3. We now claimu ∈W k,p(Ω), Dαu = uα (|α| ≤ k). (4.8)

    52

  • To verify this assertion, fix φ ∈ C∞c (Ω). Then´Ω uD

    αφ dx = limm→∞

    ´Ω umD

    αφ dx

    = limm→∞

    (−1)|α|´

    ΩDαumφ dx

    = (−1)|α|´

    Ω uαφ dx,

    as Hölder’s inequality implies

    limm→∞

    ∣∣∣∣ˆΩumD

    αφ dx−ˆ

    ΩuDαφ dx

    ∣∣∣∣ = limm→∞∣∣∣∣ˆ

    Ω(um − u)Dαφ dx

    ∣∣∣∣ ≤ limm→∞‖um−u‖Lp(Ω)‖Dαφ‖Lp∗ (Ω) = 0.and

    limm→∞

    ∣∣∣∣ˆΩDαumφ dx−

    ˆΩuαφ dx

    ∣∣∣∣ = limm→∞∣∣∣∣ˆ

    Ω(Dαum − uα)φ dx

    ∣∣∣∣ ≤ limm→∞‖Dαum−uα‖Lp(Ω)‖φ‖Lp∗ (Ω) = 0.Thus Dαu = uα (|α| ≤ k) is valid. Since therefore Dαum → Dαu in Lp(Ω) for all |α| ≤ kwe see that um → u in W k,p(Ω), as required.

    End XX. lecture (26/11/19)

    4.3 Approximation

    Let f ∈W 1,p(Ω) we given. We want to extend f to the complete Rd. First approach:

    f̄(x) =

    {f(x) x ∈ Ω,

    0 otherwise.

    Problem: Can create jump discontinuity at ∂Ω so in general f̄ /∈W 1,p(Rd).

    Second approach: fε := ρε ∗ f . Convergence in Lp based on uniform convergence available oncompact sets!

    Interior approximation by smooth functions.

    Notation. From now on fix a positive integer k and 1 ≤ p ε}.

    Notation. For a set V ⊂ Rd write V ⊂⊂ Ω if V̄ ⊂ Ω and V̄ compact. We say V is a relativelycompact subset of Ω.

    53

  • Satz 4.3.1. (Local approximation by smooth Functions). Assume u ∈W k,p(Ω) for some 1 ≤ p 0,

    ii) uε → u in Lp(Ω), as ε→ 0.

    iii) uε → u in W k,ploc (Ω), as ε→ 0.

    Beweis.

    i) and ii) In this case we can extend u by zero and obtain ū ∈ Lp(Rd). Then uε ∈ C∞(Ωε) by Proposi-tions 3.4.4, 3.4.7 and the convergence follows from Theorem 3.4.10.

    iii) First we claim that if |α| ≤ k, then

    Dαuε = ρε ∗Dαu in Ωε. (4.9)

    That is, the orinary αth-partial derivative of the smooth function uε is the ε-mollification ofthe αth-weak partial derivative of u. To confirm this, we compute for x ∈ Ωε

    Dαxuε(x) = Dαx

    ˆΩρε(x− y)u(y)dy

    =

    ˆΩ

    (Dαxρε(x− y))u(y)dy (dominated convergence)

    = (−1)|α|ˆ

    Ω(Dαy ρε(x− y))u(y)dy. (using

    d

    dxf(x− y) = − d

    dyf(x− y))

    Now for fixed x ∈ Ωε the function φ(y) := ρε(x − y) belongs to C∞c (Ω). Consequently thedefinition of the αth-weak partial derivative implies:

    ˆΩDαy ρε(x− y)u(y)dy = (−1)|α|

    ˆΩρε(x− y)Dαu(y)dy.

    ThusDαuε(x) = (−1)|α|+|α|

    ´Ω ρε(x− y)D

    αu(y)dy

    = [ρε ∗Dαu](x).

    This establishes (4.9).

    Now choose an open set V ⊂⊂ Ω. In view of Theorem 3.4.10, Dαuε → Dαu in Lp(V ) asε→ 0, for each |α| ≤ k, Consequently

    ‖uε − u‖pWk,p(V )

    =∑|α|≤k

    ‖Dαuε −Dαu‖pLp(V ) → 0

    as ε→ 0. This proves assertion (ii).

    54

  • Remark 12. If we work on Ω = Rd, the ”loc” in the convergence statement disappears (no moreissues at the boundary).

    Next we show that we can find smooth functions which approximate inW k,p(Ω), not just inW k,ploc (Ω).Notice in the following that we make no assumptions about the smoothness of ∂Ω.Satz 4.3.2 (Meyers and Serrin). Assume Ω is bounded and suppose as well that u ∈ W k,p(Ω) forsome 1 ≤ p 1/i} (i = 1, 2, . . . ).

    Write Vi := Ui+3 \ Ūi+1. (Note that we do not work with Ui+2 \U i+1 since then ∂Ui+1 wouldnot be covered.)Choose also any open set V0 ⊂⊂ Ω so that Ω =

    ⋃∞i=0 Vi. Now let {ζi}∞i=0 be a smooth partition

    of unity subordinate to the open sets {Vi}∞i=0; that is, suppose{0 ≤ ζi ≤ 1, ζi ∈ C∞c (Vi)∑∞

    i=0 ζi = 1 on Ω.(4.10)

    Next, choose any function u ∈ W k,p(Ω). According to Theorem 4.2.1 we have ζiu ∈ W k,p(Ω)and supp(ζiu) ⊂ Vi.

    2. Fix δ > 0. Choose then εi > 0 so small that ui := ηεi ∗ (ζiu) satisfies{

    ‖ui − ζiu‖Wk,p(Ω) ≤ δ2i+1 (i = 0, 1 . . . )suppui ⊂Wi (i = 1, . . . ),

    (4.11)

    for Wi := Ui+4 \ Ūi ⊃ Vi for i = 1, . . . .

    3. Write v :=∑∞

    i=0 ui. This function belongs to C∞(Ω), since for each open set V ⊂⊂ Ω there

    are most finitely many non-zero terms in the sum. Since u =∑∞

    i=0 ζiu, we have for eachV ⊂⊂ Ω

    ‖v − u‖Wk,p(V ) ≤∑∞

    i=0 ‖ui − ζiu‖Wk,p(Ω)

    ≤ δ∑∞

    i=01

    2i+1by (4.11)

    = δ.

    Take the supremum over sets V ⊂⊂ Ω, to conclude ‖v − u‖Wk,p(Ω) ≤ δ.

    55

  • Remark 14. The case p = ∞ is excluded as shown by the following example: Take Ω = (−1, 1)and f(x) = |x|. Then f ∈W 1,∞(Ω) but there is no ϕ ∈ C1(Ω) s.t.

    ‖f ′ − ϕ′‖L∞(Ω) < ε,

    for ε < ε0 with suitable, given ε0 > 0.Remark 15. If we define

    Hk,p(Ω) := Closure of {u ∈ Ck(Ω) : ‖u‖Wk,p(Ω) 0 and a Ck-function γ : Rd−1 → R s.t. (after possible rearrangementof coordinates)

    Ω ∩Br(x0) = {x ∈ Br(x0) : xd > γ(x1, . . . , xd−1)}Same way: ∂Ω ∈ C∞ and ∂Ω analytic.Satz 4.3.4 (Global approximation by functions smooth up to the boundary). . Assume is boundedand ∂Ω is C1. Suppose u ∈W k,p(Ω) for some 1 ≤ p 0 and a C1 functionγ : Rd−1 → R such that - upon relabelling the coordinate axes if necessary - we have

    Ω ∩Br(x0) = {x ∈ Br(x0, r)|xd > γ(x1, . . . , xd−1)}.

    Set V := Ω ∩Br/2(x0).

    2. Define the shifted pointxε := x+ λεen (x ∈ V, ε > 0),

    and observe that for some fixed, sufficiently large number λ > 0 the ball Bε(xε) lies in

    Ω ∩Br(x0) for all x ∈ V and all ε > 0 sufficiently small.Now define uε(x) := u(x

    ε) (x ∈ V ); this is the function u translated a distance λε in the endirection. Next write vε = ηε ∗ uε. The idea is that we have moved up enough so that ”thereis room to mollify within Ω”. Clearly vε ∈ C∞(V̄ ).

    56