Upload
others
View
8
Download
0
Embed Size (px)
Citation preview
1. A quick review of convex analysisconvex_analysis
We discuss here basic properties of convex functions on Rn.By definition, a subset C of Rn is convex if and only if
(1− t)x+ ty ∈ C for all x, y ∈ C, 0 < t < 1.
For a given function f : U ⊂ Rn → [−∞, ∞], its epigraph epi(f) isdefined as
epi(f) = (x, y) ∈ U × R : y ≥ f(x).A function f : U → [−∞, ∞] is said to be convex if epi(f) is a convexsubset of Rn+1.
We are henceforth concerned with functions defined on Rn. Whenwe are given a function f on U with U being a proper subset of Rn, wemay think of f as a function defined on Rn having value ∞ on the setRn \ U .
It is easily checked that a function f : Rn → [−∞, ∞] is convex ifand only if for all x, y ∈ Rn, t, s ∈ R and λ ∈ [0, 1],
f((1− λ)x+ λy) ≤ (1− λ)t+ λs if t ≥ f(x) and s ≥ f(y).
From this, we see that a function f : Rn → (−∞, ∞] is convex if andonly if for all x, y ∈ Rn and λ ∈ [0, 1],
f((1− λ)x+ λy) ≤ (1− λ)f(x) + λf(y).
Here we use the convention for extended real numbers, i.e., for anyx ∈ R, −∞ < x < ∞, x ± ∞ = ±∞, x · (±∞) = ±∞ if x > 0,0 · (±∞) = 0, etc.
Any affine function f(x) = a · x + b, where a ∈ Rn and b ∈ R, is aconvex function on Rn. Moreover, if A ⊂ Rn and B ⊂ R are nonemptysets, then the function on Rn given by
f(x) = supa · x+ b : (a, b) ∈ A×Bis a convex function. Note that this function f is lower semicontinuouson Rn. We restrict our attention to those functions which take valuesonly in (−∞, ∞].
global-subd Proposition 1. Let f : Rn → (−∞, ∞] be a convex function. As-sume that p ∈ D−f(y) for some y, p ∈ Rn. Then
f(x) ≥ f(y) + p · (x− y) for all x ∈ Rn.
証明. By the definition of D−f(y), we have
f(x) ≥ f(y) + p · (x− y) + o(|x− y|) as x → y.
Hence, fixing x ∈ Rn, we get
f(y) ≤ f(tx+ (1− t)y)− tp · (x− y) + o(t) as t → 0 + .1
2
Using the convexity of f , we rearrange the above inequality and divideby t > 0, to get
f(y) ≤ f(x)− p · (x− y) + o(1) as t → 0 + .
Sending t → 0+ yields
f(x) ≥ f(y) + p · (x− y) for all x ∈ Rn. sup-convex Proposition 2. Let F be a nonempty set of convex functions on Rn
with values in (−∞, ∞]. Then supF is a convex function on Rn havingvalues in (−∞, ∞].
証明. It is clear that (supF)(x) ∈ (−∞, ∞] for all x ∈ Rn. If f ∈ F ,x, y ∈ Rn and t ∈ [0, 1], then we have
f((1− t)x+ ty) ≤ (1− t)f(x)+ tf(y) ≤ (1− t)(supF)(x)+ t(supF)(y)
and hence
(supF)((1− t)x+ ty) ≤ (1− t)(supF)(x) + t(supF)(y),
which proves the convexity of supF . We call a function f : Rn → (−∞, ∞] proper convex if the following
three conditions hold.
(i) f is convex on Rn.(ii) f ∈ LSC(Rn).(iii) f(x) ≡ ∞.
Let f : Rn → [−∞, ∞]. The conjugate convex function (or theLegendre-Fenchel transform) of f is the function f ⋆ : Rn → [−∞, ∞]given by
f ⋆(x) = supy∈Rn
(x · y − f(y)).
properness Proposition 3. If f is a proper convex function, then so is f ⋆.
subdifferentiability Lemma 1. If f is a proper convex function on Rn, then D−f(y) = ∅for some y ∈ Rn.
証明. We choose a point x0 ∈ Rn so that f(x0) ∈ R. Let k ∈ N, anddefine the function gk on B1(x0) by the formula gk(x) = f(x) + k|x−x0|2. Since gk ∈ LSC(B1(x0) and gk(x0) = g(x0) ∈ R, the functiongk has a finite minimum at a point xk ∈ B1(x0). Note that if k issufficiently large, then
min∂B1(x0)
gk = min∂B1(x0)
f + k > f(x0).
Fix such a large k, and observe that xk ∈ B1(x0) and, therefore,−2k(xk − x0) ∈ D−f(xk).
3
Propositionproperness3. The function x 7→ x · y − f(y) is an affine function for
any y ∈ Rn. By Propositionsup-convex2, the function f ⋆ is convex on Rn. Also,
since the function x 7→ x · y− f(y) is continuous on Rn for any y ∈ Rn,as stated in Proposition
semicon:sup-inf??, the function f ⋆ is lower semicontinuous on
Rn.Since f is proper convex on Rn, there is a point x0 ∈ Rn such that
f(x0) ∈ R. Hence, we have
f ⋆(y) ≥ y · x0 − f(x0) > −∞ for all y ∈ Rn.
By Lemmasubdifferentiability1, there exist points y, p ∈ Rn such that p ∈ D−f(y). By
Propositionglobal-subd1, we have
f(x) ≥ f(y) + p · (x− y) for all x ∈ Rn.
That is,p · y − f(y) ≥ p · x− f(x) for all x ∈ Rn,
which implies that f ⋆(p) = p · y − f(y) ∈ R. Thus, we concludethat f ⋆ : Rn → (−∞, ∞], f ⋆ is convex on Rn, f ⋆ ∈ LSC(Rn) andf ⋆(x) ≡ ∞.
The following duality (called convex duality or Legendre-Fenchel du-ality) holds.
convex-duality Theorem 4. Let f : Rn → (−∞, ∞] be a proper convex function.Then
f ⋆⋆ = f.
証明. By the definition of f ⋆, we have
f ⋆(x) ≥ x · y − f(y) for all x, y ∈ Rn,
which reads
f(y) ≥ y · x− f ⋆(x) for all x, y ∈ Rn.
Hence,f(y) ≥ f ⋆⋆(y) for all y ∈ Rn.
Next, we show that
f ⋆⋆(x) ≥ f(x) for all x ∈ Rn.
We fix any a ∈ Rn and choose a point y ∈ Rn so that f(y) ∈ R. Wefix a number R > 0 so that |y − a| < R. Let k ∈ N, and consider thefunction gk ∈ LSC(BR(a)) defined by gk(x) = f(x) + k|x − a|2. Letxk ∈ BR(a) be a minimum point of the function gk. Noting that if k issufficiently large, then
gk(xk) ≤ f(y) + k|y − a|2 < min∂BR(a)
f + kR2 = min∂BR(a)
gk,
4
we see that xk ∈ BR(a) for k sufficiently large. We henceforth assumethat k is large enough so that xk ∈ BR(a). We have
D−gk(xk) = D−f(xk) + 2k(xk − a) ∋ 0.
Accordingly, if we set ξk = −2k(xk − a), then we have ξk ∈ D−f(xk).By Proposition
global-subd1, we get
f(x) ≥ f(xk) + ξk · (x− xk) for all x ∈ Rn,
or, equivalently,
ξk · xk − f(xk) ≥ ξk · x− f(x) for all x ∈ Rn.
Hence,
ξk · xk − f(xk) = f ⋆(ξk).
Using this, we compute that
f ⋆⋆(a) ≥ a · ξk − f ⋆(ξk) = ξk · a− ξk · xk + f(xk)
= 2k|xk − a|2 + f(xk).
We divide our argument into the following cases, (a) and (b).Case (a): limk→∞ k|xk − a|2 = ∞. In this case, if we set m =
minBR(a) f , then we have
f ⋆⋆(a) ≥ lim infk→∞
2k|xk − a|2 +m = ∞,
and, therefore, f ⋆⋆(a) ≥ f(a).Case (b): lim infk→∞ k|xk − a|2 < ∞. We may choose a subsequence
xkjj∈N of xk so that limj→∞ xkj = a. Then we have
f ⋆⋆(a) ≥ lim infj→∞
(2kj|xkj − a|2 + f(xkj)
)≥ lim inf
j→∞f(xkj) ≥ f(a).
Thus, in both cases we have f ⋆⋆(a) ≥ f(a), which completes theproof.
convex-duality2 Theorem 5. Let f : Rn → (−∞, ∞] be proper convex and x, ξ ∈ Rn.Then the following three conditions are equivalent each other.
(i) ξ ∈ D−f(x).(ii) x ∈ D−f ⋆(ξ).(iii) x · ξ = f(x) + f ⋆(ξ).
証明. Assume first that (i) holds. By Propositionglobal-subd1, we have
f(y) ≥ f(x) + ξ · (y − x) for all y ∈ Rn,
which reads
ξ · x− f(x) ≥ ξ · y − f(y) for all y ∈ Rn.
5
Hence,
ξ · x− f(x) = maxy∈Rn
(ξ · y − f(y)) = f ⋆(ξ).
Thus, (iii) is valid.Next, we assume that (iii) holds. Then the function y 7→ ξ · y− f(y)
attains a maximum at x. Therefore, ξ ∈ D−f(x). That is, (i) is valid.Now, by the convex duality (Theorem
convex-duality4), (iii) reads
x · ξ = f ⋆⋆(x) + f ⋆(ξ).
The equivalence between (i) and (iii), with f replaced by f ⋆, is exactlythe equivalence between (ii) and (iii). The proof is complete.
Finally, we give a Lipschitz regularity estimate for convex functions.
convex-Lip-estimate Theorem 6. Let f : Rn → (−∞, ∞] be a convex function. Assumethat there are constants M > 0 and R > 0 such that
|f(x)| ≤ M for all x ∈ B3R.
Then
|f(x)− f(y)| ≤ M
R|x− y| for all x, y ∈ BR.
証明. Let x, y ∈ BR and note that |x− y| < 2R. We may assume thatx = y. Setting ξ = (x − y)/|x − y| and z = y + 2Rξ and noting thatz ∈ B3R,
x− y =|x− y|2R
(z − y),
and
x = y +|x− y|2R
(z − y) =|x− y|2R
z +
(1− |x− y|
2R
)y,
we obtain
f(x) ≤ |x− y|2R
f(z) +
(1− |x− y|
2R
)f(y),
and
f(x)−f(y) ≤ |x− y|2R
(f(z)−f(y)) ≤ |x− y|2R
(|f(z)|+|f(y)|) ≤ M |x− y|R
.
In view of the symmetry in x and y, we see that
|f(x)− f(y)| ≤ M
R|x− y| for all x, y ∈ BR.
6
2. Rademacher’s theoremsec:Rade
We give here a proof of Rademacher’s theorem.
Theorem 7 (Rademacher). Let B = B1 ⊂ Rn and f ∈ Lip(B). Thenf is differentiable almost everywhere in B.
To prove the above thoerem, we mainly follow the proof given in[AmbrosioTilli04?AmbrosioTilli04].
証明. We first show that f has a distributional gradient Df ∈ L∞(B).Let L > 0 be a Lipschitz bound of the function f . Let i ∈ 1, 2, ..., n
and ei denote the unit vector in Rn with unity as the i-th entry. Fixany ϕ ∈ C1
0(B) and observe that∫B
f(x)ϕxi(x) d x = lim
r→0+
∫B
f(x)ϕ(x+ rei)− ϕ(x)
rd x
= limr→0+
∫B
f(x− rei)− f(x)
rϕ(x) d x
and ∣∣∣ ∫B
f(x)ϕxi(x) d x
∣∣∣ ≤ L
∫B
|ϕ(x)| dx ≤ L|B|1/2∥ϕ∥L2(B).
Thus, the map
C10(B) ∋ ϕ 7→ −
∫B
f(x)ϕxi(x) d x ∈ R
extends uniquely to a bounded linear functional Gi on L2(B). By theRiesz representation theorem, there is a function gi ∈ L2(B) such that
Gi(ϕ) =
∫B
gi(x)ϕ(x) d x for all ϕ ∈ L2(B).
This shows that g = (g1, ..., gn) is the distributional gradient of f .We plug the function ϕ ∈ L2(B) given by ϕ(x) = (gi(x)/|gi(x)|)1Ek
(x),where k ∈ N and Ek = x ∈ B : |gi(x)| > L+1/k, into the inequality|Gi(ϕ)| ≤ L∥ϕ∥L1(B), to obtain∫
B
|gi(x)|1Ek(x) d x ≤ L
∫B
1Ek(x) d x = L|Ek|,
which yields
(L+ 1/k)|Ek| ≤ L|Ek|.Hence, we get |Ek| = 0 for all k ∈ N and |x ∈ B : |gi(x)| > L| = 0.That is, gi ∈ L∞(B) and |gi(x)| ≤ L a.e. in B.
7
The Lebesgue differentiation theorem (see [SteinShakarchi05?SteinShakarchi05])
states that for a.e. x ∈ B, we have g(x) ∈ Rn and
Rade-1Rade-1 (2.1) limr→0+
1
rn
∫Br
|g(x+ y)− g(x)| d y = 0.
Now, we fix such a point x ∈ B and show that f is differentiableat x. Fix an r > 0 so that Br(x) ⊂ B. For δ ∈ (0, r), consider thefunction hδ ∈ C(B) given by
hδ(y) =f(x+ δy)− f(x)
δ.
We claim that
Rade-2Rade-2 (2.2) limδ→0
hδ(y) = g(x) · y uniformly for y ∈ B.
Note that hδ(0) = 0 and hδ is Lipschitz continuous with Lipschitzbound L. By the Ascoli-Arzela theorem, for any sequence δj ⊂ (0, r)converging to zero, there exist a subsequence δjkk∈N of δj and afunction h0 ∈ C(B) such that
limk→∞
hδjk(x) = h0(y) uniformly for y ∈ B.
In order to prove (Rade-22.2), we need only to show that h0(y) = g(x) · y for
all y ∈ B.Since hδ(0) = 0 for all δ ∈ (0, r), we have h0(0) = 0. We observe
from (Rade-12.1) that∫
B
|g(x+δy)−g(x)| d y =
∫Bδ
|g(x+y)−g(x)|δ−n d y → 0 as δ → 0.
Using this, we compute that for all ϕ ∈ C10(B),∫
B
h0(y)ϕyi(y) d y = limk→∞
∫B
hδjk(y)ϕyi(y) d y
= − limk→∞
∫B
gi(x+ δjky)ϕ(y) d y
= −∫B
gi(x)ϕ(y) d y =
∫B
g(x) · yϕyi(y) d y.
This guarantees that h0(y) − g(x) · y is constant for all y ∈ B whileh0(0) = 0. Thus, we see that h0(y) = g(x) · y for all y ∈ B, whichproves (
Rade-22.2).
Finally, we note that (Rade-22.2) yields
f(x+ y) = f(x) + g(x) · y + o(|y|) as y → 0.
1. 凸関数の 2次微分
補題 1.1. J : Rn → Rnは Lipschitz関数とする.E ⊂ Rnを
E = x ∈ Rn : J は xで微分可能, det DJ(x) = 0
と定める.このとき,|J(E)| = 0.
形式的には,積分の変数変換の公式
|J(E)| =
∫J(E)
dy =
∫E
| det J(x)|dx = 0
から分かる.以下ではヴィタリの被覆定理の応用として証明する.
補題 1.2 (Vitali). E ⊂ Rnは可測集合,Bは球の族から成るEの被覆とする.
supB∈B
diam B < ∞
を仮定する.このとき
E ⊂∪j∈J
B∗j , Bj ∈ B ∀j ∈ J, Bi ∩ Bj = ∅ (i = j)
となる J ⊂ Nが存在する.ただし,球Bに対して,B∗は半径が 5倍のBの同心球を表す.
補題 1.1の証明. 次に注意する.
|J(E)| ≤∞∑
k=1
|J(E ∩ Bk(0))|
これより,任意のR > 0に対して
|J(E ∩ BR(0))| = 0
を示せばよい.R > 0を固定し,
ER = E ∩ BR(0)
とおく.これは可測集合である.JのLipschitz定数をL > 0とする.x ∈ ERを固定する.det DJ(x)∗ =
det DJ(x) = 0より (A∗で Aの転置行列を表す),DJ(x)∗の固有ベクトル e ∈ Rn, DJ(x)∗e = 0, |e| = 1,が存在する.このとき,
J(y) − J(x) = DJ(x)(y − x) + o(|y − x|) as y → x,
1
2
であり,
(J(y) − J(x)) · e = DJ(x)(y − x) · e + o(|y − x|)= (y − x) · DJ(x)∗e + o(|y − x|)= o(|y − x|) as y → x.(1)
一方,|J(y) − J(x)| ≤ L|y − x| ∀y ∈ Rn
であり,J(y) ∈ BLr(J(x)) ∀y ∈ Br(x), r > 0.
ε > 0を固定する.(1)によれば,r ∈ (0, 1)を
|J(y) − J(x) · e| ≤ εr ∀y ∈ B5r(x)
が成り立つように取ることができる.このとき,
J(B5r(x)) ⊂ B5Lr(J(x)) ∩ y ∈ Rn : |y · e| ≤ εr.ここで,
|B5Lr(J(x)) ∩ y ∈ Rn : |y · e| ≤ εr|≤ ωn−1(5Lr)n−12εr = εC(n, L)rn
に注意する(高さ 2εrで半径 5Lrの円柱の体積).ただし,
C(n, L) = 2ωn−1(5L)n−1.
このように,それぞれの x ∈ ERに対して,rx ∈ (0, 1)が存在して,
(2) |J(B5rx(x))| ≤ εC(n, L)rnx .
各々の x ∈ ERに対して,このような rxを固定し,
B = Brx(x) : x ∈ ERと定めるとき,BはERの被覆である.
diam Brx(x) < 2 ∀x ∈ ER
に注意する.補題 1.2によれば,J ⊂ N, xjj∈J ⊂ ERが存在し,
(3) ER ⊂∪j∈J
B5rxj(xj), Brxi
(xi) ∩ Brxj(xj) = ∅ (i = j).
この包含関係より,
J(ER) ⊂∪j∈J
J(B5rxj(xj)).
したがって,(2)を用いて,
(4) |J(ER)| ≤∑j∈J
|J(B5rxj(xj))| ≤ εC(n, L)
∑j∈J
rnxj
.
3
一方で,xj ∈ ER ⊂ BR(0), rxj
∈ (0, 1) ∀j ∈ J
なので,Brxj
(xj) ⊂ BR+1(0).
これと (3)の後者より,
ωn(R + 1)n = |BR+1(0)| ≥ |∪j∈J
Brxj(xj)| =
∑j∈J
|Brxj(xj)| = ωn
∑j∈J
rnxj
.
これと (4)より,|J(ER)| ≤ εC(n, L)(R + 1)n.
ここで,εは任意だから,|J(ER)| = 0.
補題 1.3. N ⊂ Rnとする.つぎの (1)と (2)は同値である.
(1) N は零集合(2) ∀ε > 0, ∃ 球の族 Bjj∈N such that
N ⊂∪j∈N
Bj,∑j∈N
|Bj| < ε.
証明. (2) =⇒ (1)を示す.(2)を仮定する.ε > 0とし,球の族Bjj∈Nを
N ⊂∪j∈N
Bj,∑j∈N
|Bj| < ε
をみたすように取る.いま,球Bj = Brj(xj)に対して,立方体Qjを
Qj =n∏
i=1
(xj,i − r, xj,i + r), xj = (xj,1, ..., xj,n)
とおけば,Bj ⊂ Qj, |Bj| = ωnr
nj , |Qj| = (2rj)
n
となる.したがって,
N ⊂∞∪
j=1
Qj,∞∑
j=1
|Qj| =ωn
2n
∞∑j=1
|Bj| <ωn
2nε.
よって,N は零集合である.(1) =⇒ (2)を示す.辺が座標軸に平行な直方体
P =n∏
i=1
(ai, bi), ai < bi
4
を考える.P は開集合であり,各々の x ∈ P に対して,xを中心とする球Bxで,Bx ⊂ P をみたすものがある.このように選んだBxの族を Bと表す.このとき,
P =∪B∈B
B, diamB∈B B ≤ diam P < ∞.
補題 1.2によれば,可算集合 J ⊂ Nと Bjj∈J ⊂ Bが存在し,
P ⊂∪j∈J
B∗j , Bi ∩ Bj = ∅ (i = j)
が成り立つ.ただし,B∗j は半径が 5倍のBjの同心球を表す.このとき,
|P | ≥ |∪j∈J
Bj| =∑j∈J
|Bj|
であり, ∑j∈J
|B∗j | = 5n
∑j∈J
|Bj| ≤ 5n|P |.
B∗j をBjと書き直し,以上を纏めると
P ⊂∪j∈J
Bj,∑j∈J
|Bj| ≤ 5n|P |
をみたす球の族 Bjj∈J (J ⊂ N)が存在することが言える.(1)を仮定する.ε > 0とする.辺が座標軸に平行な直方体の族Pjj∈N
が存在し,
N ⊂∞∪
j=1
Pj,∑j∈N
|Pj| < ε
が成り立つ.上でみたように,各 Pj に対して,球の列 Bj,kk∈Nが存在し (Bj,k = ∅の可能性も許す),
Pj ⊂∪k∈N
Bj,k,∑k∈N
|Bj,k| ≤ 5n|Pj|
をみたす.以上より,
N ⊂∪
(j,k)∈N2
Bj,k,∑
(j,k)∈N2
|Bj,k| < 5nε.
よって,(2)が成立する.
補題 1.4. N ⊂ Rnは零集合,J : N → Rnは Lipschitz連続な関数とするとき,J(N)は零集合である.
5
証明. J の Lipschitz定数を Lとする.ε > 0とするとき,N が零集合なので,球の族 Bjj∈Nが存在して,
N ⊂∪j∈N
Bj,∑j∈N
|Bj| < ε
が成り立つ.Bj = Brj(xj)とする.このとき,
|J(x) − J(xj)| ≤ L|x − xj| < Lrj ∀x ∈ Bj.
したがって,J(x) ∈ BLrj
(J(xj)) ∀x ∈ Bj.
すなわち,J(Bj) ⊂ BLrj
(J(xj)) ∀j ∈ N.
よって,J(N) ⊂
∪j∈N
J(Bj) ⊂∪j∈N
BLrj(J(xj)).
ここで, ∑j∈N
|BLrj(J(xj))| =
∑j∈N
Ln|Bj| < Lnε.
これより,J(N)は零集合である. 定理 1.5. f : Rn → Rは凸関数とする.このとき,ほとんどすべてのx ∈ Rnにおいて,f は 2次微分をもつ.すなわち,p ∈ RnとX ∈ Sn
が存在し,y → xのときに
f(y) = f(x) + p · (y − x) +1
2X(y − x) · (y − x) + o(|y − x|2).
Snは n × n実対称行列の全体を表す.以下では,凸関数 f : Rn → Rを固定して考えていく.
補題 1.6. すべての x ∈ Rnに対して,
y + D−f(y) ∋ x
は解 y ∈ Rnをもつ.
補題 1.7. g : Rn → Rを凸関数とする.y ∈ Rnとする.つぎは同値な命題である.
(1) 0 ∈ D−g(y).(2) gは yで最小値をとる.
証明. (1) =⇒ (2): 0 ∈ D−g(y)を仮定する.Proposition 1により,
g(x) ≥ g(y) + 0 · (x − y) = g(y) ∀x ∈ Rn
が成り立ち,gは yで最小値をとる.
6
(2) =⇒ (1): gが yで最小値をとるとき,
g(x) ≥ g(y) = g(y) + 0 · (x − y) ∀x ∈ Rn
が成り立ち,0 ∈ D−g(y). 補題 1.8. g : Rn → Rは凸関数であるとする.R > 0とするとき,MR > 0が存在して,つぎが成り立つ.
x ∈ BR(0), p ∈ D−g(x) =⇒ |p| ≤ MR.
証明. Theorem 6によれば,gは局所Lipschitz関数である.したがって,
(1) |g(x) − g(y)| ≤ MR|x − y| ∀x, y ∈ BR(0)
となる定数MR > 0がある.x ∈ BR(0)を固定し,p ∈ D−g(x)となる p ∈ Rnを固定する.
(2) |p| ≤ MR
を示す.
(3) g(y) ≥ g(x) + p · (y − x) ∀y ∈ Rn
が成り立つ.p = 0ならば,明らかに,(2)が成り立つ.p = 0の場合を考える.t > 0を十分小さく選び,
x + tp ∈ BR(0)(開球)
とする.(3)と (1)より,
p · tp ≤ g(x + tp) − g(x) ≤ MRt|p|.これの各辺を t|p|で割って,|p| ≤ MRを得る. 補題 1.9. g : Rn → Rは凸関数とする.このとき,
D−g(x) = ∅ ∀x ∈ Rn.
証明. x ∈ Rnを固定する.gはほとんどいたる所で微分可能なので,
limk→∞
xk = x, D−g(xk) = Dg(xk) ∀k ∈ N
となる点列 xkk∈Nが存在する.各 k ∈ Nに対して,(1) g(y) ≥ g(xk) + pk · (y − xk) ∀y ∈ Rn.
補題 1.8によれば,|pk| ≤ M ∀k ∈ N
となるM > 0が存在する.BWの定理によれば,pkの収束部分列pkj
j が存在する.不等式 (1)において,k = kj, j → ∞とすれば,g(y) ≥ g(x) + p · (y − x) ∀y ∈ Rn
が得られる.ただし,p = limj→∞ pkj. したがって,p ∈ D−g(x)とな
り,D−g(x) = ∅.
7
補題 1.6の証明. x ∈ Rnを固定する.関数
g(y) := f(y) +1
2|y − x|2
を考える.gはふたつの凸関数の和であり,凸関数である.補題 1.9をf に適用し,
f(y) ≥ f(0) + p · y ∀y ∈ Rn
が成り立つような p ∈ Rnが存在する.したがって,|y| → ∞のとき,
g(y) ≥ f(0)+p ·y+1
2|y−x|2 = f(0)+
1
2|y−x+p|2+p ·x− 1
2|p|2 → ∞.
よって,gはある点 z ∈ Rnで最小値をとる.補題 1.7によれば,
0 ∈ D−g(z) = D−f(z) + z − x.
すなわち,z + D−f(z) ∋ x.
補題 1.10. xi, yi ∈ Rn (i = 1, 2)はつぎをみたすとする.
yi + D−f(yi) ∋ xi i = 1, 2.
このとき,|y1 − y2| ≤ |x1 − x2|
が成り立つ.
証明. xi − yi ∈ D−f(yi)だから,
f(z) − f(yi) ≥ (xi − yi) · (z − yi) ∀z ∈ Rn, i = 1, 2.
したがって, f(y2) − f(y1) ≥ (x1 − y1) · (y2 − y1)
f(y1) − f(y2) ≥ (x2 − y2) · (y1 − y2).
差を取れば,
0 ≥ ((x1 − y1)− (x2 − y2)) · (y2 − y1) = |y1 − y2|2 − (x1 − x2) · (y1 − y2).
よって,|y1 − y2|2 ≤ |x1 − x2||y1 − y2|,
となり,|y1 − y2| ≤ |x1 − x2|.
補題 1.6と補題 1.10より,任意の x ∈ Rnに対して,
y + D−f(y) ∋ x
の解 y ∈ Rnがただ一つ存在する.そこで,xに対して,この yを対応させる写像 J : Rn → Rnを考える.J(x) = yであり,
J(x) + D−f(J(x)) ∋ x
8
が成り立つ.補題 1.10によれば,Jは縮小写像 (contraction mapping)である.
|J(x) − J(y)| ≤ |x − y| ∀x, y ∈ Rn.
特に,Lipschitz連続関数である.
補題 1.11. 関数 J : Rn → Rnは全射である.
証明. y ∈ Rn を固定する.補題 1.9により,D−f(y) = ∅. そこで,p ∈ D−f(y)を選ぶ.このとき,
y + D−f(y) ∋ p + y.
すなわち,J(p + y) = y.
補題 1.12. J のグラフは閉集合である.
証明. 点列 (xk, yk) ⊂ R2nは (x, y) ∈ R2nに収束し,
J(xk) = yk ∀k ∈ Nが成り立つとする.J の定義より,
yk + D−f(yk) ∋ xk ∀k ∈ N.
さらに,
f(z) − f(yk) ≥ (xk − yk) · (z − yk) ∀z ∈ Rn, k ∈ N.
この式で,k → ∞とすれば,f(z) − f(y) ≥ (x − y) · (z − y) ∀z ∈ Rn.
これより,x − y ∈ D−f(y).
すなわち,y = J(x). よって,(x, y)は J のグラフ上の点である. 補題 1.13. x, y ∈ Rnとし,x = J(y)が成り立つとする.さらに,f はxで微分可能であるとする.このとき,
limr→0+
diamz ∈ Rn : J(z) ∈ Br(x) = 0.
例 1.1. n = 1とし,f(x) = |x|とする.このとき,
J(y) =
y + 1 (y < −1),
0 (−1 ≤ y ≤ 1),
y − 1 (y > 1).
f は x = 0で微分可能でない.r ∈ (0, 1)のとき,
z : J(z) ∈ Br(0) = z : J(z) ∈ (−r, r)⊃ z : J(z) = 0 = [−1, 1].
9
証明. 背理法で示す.
lim supr→0+
diamz ∈ Rn : J(z) ∈ Br(x) > 0.
関数r 7→ diamz ∈ Rn : J(z) ∈ Br(x)
は単調増加関数である.したがって,上の lim supは limと等しい.δ > 0が存在して,
(1) diamz ∈ Rn : J(z) ∈ Br(x) ≥ δ ∀r > 0.
これから,
(2) z ∈ Rn : J(z) ∈ Br(x) ⊂ Bδ/2(y) ∀r > 0
が分かる.なぜなら,仮に,上の式で⊂が成り立つとすれば,
diamz ∈ Rn : J(z) ∈ Br(x) < 2 × δ
2= δ
となり,(1)と矛盾する.(2)により,k ∈ Nに対して,zk ∈ Rnが存在し,
(3) |J(zk) − x| <1
k, |zk − y| ≥ δ
2.
(3)の第1式より,limk→∞
J(zk) = x.
さらに,J(zk) + D−f(J(zk)) ∋ zk
と補題 1.8より,あるR > 0に対して,
D−f(J(zk)) ⊂ BR(0) ∀k ∈ N.
従って,zkは有界列である.BW定理より,収束する部分列 zkjj∈N
が存在する.補題 1.12より,
z = limj→∞
zkj
とおけば,limj→∞
(zkj, J(zkj
) = (z, x)
となり,x = J(z).
これはx + Df(x) = z
と書くことができる.一方で,x = J(y)であり,
x + Df(x) = y.
10
よって,y = zが分かる.また,(3)の第 2式より,
|zkj− y| ≥ δ
2∀j ∈ N.
j → ∞とすれば,|z − y| ≥ δ/2. 矛盾である. 補題 1.14. 集合N ⊂ Rnを
N = x ∈ Rn : x において J は微分可能で, DJ(x) ∈ Snと定義する.N は零集合である.
証明. DJ で超関数の意味の導関数も表せば,DJ ∈ L∞(Rn, Rn×n) である.この補題の主張は
DJ(x) ∈ Sn a.e. x ∈ Rn
と言ってもよい.Theorem 7 (Rademacher)の証明を見ると,ほとんどすべての x ∈ Rnに対して
J(x + h) = J(x) + DJ(x) · h + o(|h|) (h → 0)
が示されている.ただし,右辺のDJは超関数の意味の導関数である.(要するに,通常の意味の微分係数と超関数の意味の微分係数が a.e.で一致する.)軟化子 ρεを用いて,f を近似する.すなわち,
fε(x) =
∫Rn
ρε(x − y)f(y) d y
とおいて,fε ∈ C∞(Rn)を定義する.fεは凸関数である.J と同様にJε ∈ Lip(Rn, Rn)が条件
Jε(x) + Dfε(Jε(x)) = x
により定義できる.この式から,直ぐに Jεが単射であることが分かり,Jεは関数
F : y 7→ y + Dfε(y), Rn → Rn
の逆関数である.Fi,yj
(y) = δij + fε,yiyj(y)
であり,DF (y) = I + D2fε(y)
と書き直すこともできる.D2fε(y)は非負定値行列であり,固有値はすべて 0以上である.したがって,DF (y)の固有値はすべて 1上であり,DF (y)は正則行列である.従って,逆関数定理が使えて,F の逆関数J もC∞級である.さらに,
DJε(x) = DF (Jε(x))−1 = (I + D2fε(Jε(x)))−1 ∈ Sn
が分かる.
11
関数族 Jεε∈(0, 1)の局所一様有界性について調べる.f は局所 Lips-chitz連続であるから,Df ∈ L∞(B1(0))となる.このとき,
|fε(0)| ≤ ∥f∥L∞(B1(0)) ∀ε ∈ (0, 1).
以下では,ε ∈ (0, 1)とする.
0 + Dfε(0) = Dfε(0)
と考えると,Jε(Dfε(0)) = 0.
一方,Jεは縮小写像であるから,x ∈ Rnに対して
|Jε(x)| = |Jε(x) − Jε(Dfε(0))| ≤ |x − Dfε(0)| ≤ |x| + |Dfε(0)|
となり,
(1) |Jε(x)| ≤ |x| + ∥Df∥L∞(B1(0)).
J , Jεの定義より,z ∈ Rnに対して,fε(z) − fε(Jε(x)) ≥ (x − Jε(x)) · (z − Jε(x)),
f(z) − f(J(x)) ≥ (x − J(x)) · (z − J(x)).
したがってfε(J(x)) − fε(Jε(x)) ≥ (x − Jε(x)) · (J(x) − Jε(x)),
f(Jε(x)) − f(J(x)) ≥ (x − J(x)) · (Jε(x) − J(x)).
これより,
|J(x) − Jε(x)|2 ≤ (fε − f)(J(x)) + (f − fε)(Jε(x)).
これと (1)より,
limε→0
Jε(x) = J(x) 局所一様収束.
最後に,超関数として
Ji,xj= Jj,xi
∀i, j
を示す.ϕ ∈ C∞0 (Rn)とする.∫
Ji,xj(x)ϕ(x) d x = −
∫Ji(x)ϕxj
(x) d x = − limε→0
∫Jε,i(x)ϕxj
(x) d x
= limε→0
∫Jε,i,xj
(x)ϕ(x) d x.
12
よって, ∫Ji,xj
(x)ϕ(x) d x = limε→0
∫Jε,i,xj
(x)ϕ(x) d x
= limε→0
∫Jε,j,xi
(x)ϕ(x) d x =
∫Jj,xi
(x)ϕ(x) d x.
これより,超関数として,
Ji,xj= Jj,xi
.
定理 1.5の証明. f が局所 Lipschitz なことを思い起こしながら,零集合N1を
N1 = x ∈ Rn : f は x で微分可能ではない
と定義する.J : Rn → Rnを x ∈ Rnに
y + D−f(y) ∋ x
をみたす yを対応させる写像として定義する.補題 1.10により,J は縮小写像である.したがって,J はほとんどいたる所で微分可能である.零集合N2を
N2 = x ∈ Rn : J は xで微分可能でない
と定義する.N3 ⊂ Rnを
N3 = x ∈ Rn : J は xで微分可能, DJ(x) ∈ Sn
補題 1.14より,N3は零集合である.補題 1.4より,
N4 := J(N2 ∪ N3)
は零集合である.
S := x ∈ Rn \ N2, det DJ(x) = 0
とおくとき,補題 1.1より,N5 := J(S)は零集合である.補題 1.11より,J : Rn → Rnは全射であり,
Rn = J(Rn) = J(N2 ∪ N3 ∪ S ∪ x ∈ Rn \ (N2 ∪ N3) : det DJ(x) = 0)= N4 ∪ N5 ∪ J(x ∈ Rn \ (N2 ∪ N3) : det DJ(x) = 0).
N = N1 ∪ N4 ∪ N5とおき,
F = J(x ∈ Rn \ (N2 ∪ N3) : det DJ(x) = 0) \ N1
とおく.このとき,
F ∪ N = Rn, |N | = 0.
13
したがって,x ∈ F に対して,ある p ∈ Rn, A ∈ Snが存在して
(1) f(x + h) = f(x) + p · h +1
2Ah · h + o(|h|2) (h → 0)
を示せばよい.x ∈ F とする.F の定義より,f は xで微分可能で,したがって,
y := x + Df(x)
とおけば,J(y) = xとなり,さらに,
x + D−f(x) ∋ y
ような y は一意に定まる.F の定義より,J は y で微分可能であり,det DJ(y) = 0, DJ(y) ∈ Sn が成り立つ.したがって,
(2) f(x + h) = f(x) + Df(x) · h + o(|h|) (h → 0),
および
(3) J(y + k) = J(y) + DJ(y)k + o(|k|) (k → 0)
が成り立つ.C > 0を
|DJ(y)−1ξ| ≤ C|ξ| ∀ξ ∈ Rn
が成り立つように定める.(3)により,
(4) DJ(y)−1(J(y + k) − J(y)) = k + o(|k|) (k → 0).
J は全射なので,h ∈ Rnに対して
x + h = J(y + k)
となる k ∈ Rnが存在する.このような kを一つ選んで,k(h)と表す.補題 1.13によれば,
limr→0+
diamy + k(h) : h ∈ Br(0) = 0.
したがって,limh→0
k(h) = 0.
これと (4)より,δ > 0が存在し,
(5)|k(h)| = |DJ(y)−1(J(y + k(h)) − J(y))| + o(|k(h)|)
≤ C|h| + 1
2|k(h)| ∀h ∈ Bδ(0).
h ∈ Bδ(0)とすると,上の不等式から,
|k(h)| ≤ 2C|h|また,
|h| = |J(y + k(h)) − J(y)| ≤ |k(h)|.
14
よって,
(6) |h| ≤ |k(h)| ≤ 2C|h| ∀h ∈ Bδ(0).
h ∈ Bδ(0), x + h ∈ F とする.関係 x = J(y), x + h = J(y + k(h))とJ の定義より,
x + Df(x) = y, x + h + Df(x + h) = y + k(h).
したがって,Df(x + h) = Df(x) + k(h) − h.
また,(4), (6)より,
k(h) = DJ(y)−1h + o(|h|).したがって,
(7) Df(x + h) = Df(x) + (DJ(y)−1 − I)h + o(|h|).以下では
A = DJ(y)−1 − I
とおく.A ∈ Snである.以上により,
(8) f(x + h) = f(x) + Df(x) · h +1
2Ah · h + o(|h|2)
が推測できる.以下では (8)を証明する.そこで,
g(h) = f(x + h) − f(x) − Df(x) · h − 1
2Ah · h
とおき,g : Bδ(0) → Rを定義する.h ∈ Bδ(0), x + h ∈ F とする.このとき,
g(0) = 0, Dg(h) = Df(x + h) − Df(x) − Ah, Dg(0) = 0.
さらに,補題 7より,
Dg(h) = o(|h|) (h → 0).
すなわち,ある非減少関数 ω ∈ C([0, 1))に対して
|Dg(h)| ≤ ω(|h|)|h|.仮に g ∈ C1(Bδ(0))であれば,
|g(h)| =∣∣∣g(0) +
∫ 1
0
Dg(th) · h d t∣∣∣ ≤ |h|
∫ 1
0
|Dg(th)| d t
≤ |h|2∫ 1
0
ω(t|h|) d t ≤ ω(|h|)|h|2 = o(|h|2).
g ∈ Lip(Bδ(0))の場合は,次の補題に譲る. 補題 1.15. g ∈ Lip(B1(0))とする.次の (1)と (2)は同値である.
15
(1) |Dg(x)| ≤ 1 a.e. x ∈ B1(0).(2) |g(x) − g(y)| ≤ |x − y| ∀x, y ∈ B1(0).
証明. (1) =⇒ (2): δ ∈ (0, 1)として,(2)の不等式を x, y ∈ Bδ(0)に対して示せばよい.δ ∈ (0, 1)とし,ε ∈ (0, 1 − δ)となるように取る.ρεを標準的軟化子とする.
gε(x) =
∫Bε(0)
ρε(y)g(x − y) d y (x ∈ Bδ(0))
とおく.
Dg(x) = Dx
∫B1(x)
ρε(x − y)g(y) d y
=
∫B1(x)
(Dρε)(x − y)g(y) d y =
∫B1(x)
ρε(x − y)Dg(y) d y
となり,|Dg(x)| ≤ 1 ∀x ∈ Bδ(0)
が分かる.このとき,平均値の定理より
|g(x) − g(y)| ≤ |x − y| ∀x, y ∈ Bδ(0).
(2) =⇒ (1): δ ∈ (0, 1)として
|Dg(x)| ≤ 1 a.e. x ∈ Bδ(0)
を示せばよい.ϕ ∈ C10(Bδ(0))とする.h ∈ (0, 1 − δ)として,∫
Bδ(0)
g(x + hei)ϕ(x) d x =
∫B1(0)
g(x)ϕ(x − hei) d x
に注意する.これから,∣∣∣ ∫B1(0)
g(x)(ϕ(x − hei) − ϕ(x)) d x∣∣∣
=∣∣∣ ∫
Bδ(0)
g(x + hei)ϕ(x) d x −∫
Bδ(0)
g(x)ϕ(x) d x∣∣∣
≤ h
∫Bδ(0)
|ϕ(x)| d x,
さらに,h → 0として,∣∣∣ ∫B1(0)
g(x)ϕxi(x) d x
∣∣∣ ≤ ∫B1(0)
|ϕ(x)| d x.
よって, ∣∣∣ ∫B1(0)
gxi(x)ϕ(x) d x
∣∣∣ ≤ ∫B1(0)
|ϕ(x)| d x.
16
ここで,ε > 0とし,関数
f(x) := 1A − 1B, ただし,A := gxi > 1 + ε, B := gxi< −1 − ε
を L1(B1(0))で近似する関数列 ϕk ⊂ C∞0 (B1(0))を考える.∣∣∣ ∫
B1(0)
gxi(x)ϕk(x) d x
∣∣∣ ≤ ∫B1(0)
|ϕk(x)| d x
において,k → ∞とすれば∫A∪B
|gxi| d x ≤
∫A∪B
d x = |A| + |B|.
よって,(1 + ε)(|A| + |B|) ≤ |A| + |B|.
すなわち,|A| = |B| = 0. これから,
|gxi| ≤ 1 a.e. in Bδ(0).
少し工夫すれば,|Dg| ≤ 1 a.e. in Bδ(0).
補題 1.16. g ∈ Lip(B1(0))とし,ω ∈ C([0, 1))が存在し,
g(0) = 0, |Dg(x)| ≤ ω(|x|)|x| a.e. in B1(0)
が成り立つとする.ただし,ω(0) = 0, ωは非減少関数であるとする.このとき,
g(x) = o(|x|2) (x → 0).
証明. r ∈ (0, 1)とする.
|Dg(x) ≤ ω(r)r a.e. in Br(0)
が成り立つ.補題 1.15より,
|g(x) − g(y)| ≤ ω(r)r|x − y| ∀x, y ∈ Br(0).
特に,|g(x)| = |g(x) − g(0)| ≤ ω(r)r|x| ≤ ω(r)r2.
これから,|g(x)| ≤ ω(|x|)|x|2 ∀x ∈ B1(0).
が分かる.
Jensenの補題のための準備
ここの Jensenは Loyola大学のRobert Jensen教授を参照している.
http://www.luc.edu/math/ftfaculty/jensenrobert.shtml
f : Ω → Rを考える.次を仮定する.Ω は有界開集合, f ∈ C2(Ω),
f(x) < 0 on ∂Ω, maxΩ f > 0.
a ∈ Rn, b ∈ Rのとき,関数 l(x) := a · x+ bを1次関数という.1次関数の全体をLと表す.
Γ = x ∈ Ω : ∃l ∈ L s.t. l ≥ 0 ∨ f on Ω, l(x) = f(x)とおいて,関数 f の(上方)接触集合 (upper contact set)を定義する.x ∈ Γ とする.Γ の定義における l ∈ Lは
l(z) = f(x) +Df(x) · (z − x)
と表すことができる.さらに,l(x) ≥ 0 > f(x) ∀x ∈ ∂Ω なので,Γ ⊂ Ω. f − lは xで最大値をとるので,
0 ≥ D2(f − l)(x) = D2f(x).
Γ ∗ ⊂ Γ をつぎで定義する.
Γ ∗ = x ∈ Γ : detD2f(x) = 0,
f(x) +Df(x) · (z − x) > f(z) ∀z ∈ Ω \ x.x ∈ Γ ∗のとき,D2f(x) ≤ 0, detD2f(x) = 0であるから,D2f(x) < 0.
補題 1. Γ ∗ は開集合である.
証明. x ∈ Γ ∗とし,δ > 0を
Bδ(x) ⊂ Ω, D2f(x) < 0 ∀x ∈ Bδ(x)
満たすものとする.l ∈ Lをl(z) = f(x) +Df(x) · (z − x)
と定める.l(z) > f(z) ∀z ∈ Ω \ x
だから,γ = min(l − f)(z) : Ω \Bδ(x)
とおくとき,γ > 0となる.ε > 0を ε < δとし,さらに y ∈ Bε(x)に対して,
ly(z) = f(y) +Df(y) · (z − y)
とおく.ε ∈ (0, δ)を十分に小さく取れば,
|l(z)− ly(z)| < γ ∀z ∈ Ω \Bδ(x).1
2
このとき,
ly(z) > l(z)− γ = l(z)− f(z)− γ + f(z) ≥ f(z) ∀z ∈ Ω \Bδ(x).
一方,y ∈ Bε(x)とし,z ∈ Bδ(x) \ yとする.テイラーの定理より,ある θ ∈ (0, 1)に対して
f(z) = f(y) +Df(y) · (z − y) +1
2D2f(y + θ(z − y))(z − y) · (z − y).
y + θ(z − y) ∈ Bδ(x)であり,D2f(y + θ(z − y)) < 0が成り立つので,
f(z) = f(y) +Df(y) · (z − y) +1
2D2f(y + θ(z − y))(z − y) · (z − y)
< f(y) +Df(y) · (z − y) = ly(z).
以上より,y ∈ Bε(x)ならば,D2f(y) < 0,
ly(z) > f(z) ∀z ∈ Ω \ y.
よって,Bε(x) ⊂ Γ ∗であり,Γ ∗は開集合である. 補題 2. Df(Γ ∗)は開集合である.
証明. p ∈ Df(Γ ∗)とする.p = Df(x)となる x ∈ Γ ∗が対応する.補題 3により,ε > 0が存在し,Bε(x) ⊂ Γ ∗が成り立つ.detD2f(x) = 0だから,逆関数定理により,xと pのそれぞれの近傍U ⊂ Bε(x), V が存在し,Df : U → V は微分同型になる.V = Df(U) ⊂ Df(Γ ∗)は pの近傍であるから,Df(Γ ∗)は開集合である. つぎの集合 S1, S2 ⊂ Rnを考える.
S1 = x ∈ Γ : detD2f(x) = 0.l ∈ Lと x ∈ Ωに対して,2条件
(1) l ≥ f on Ω,
と
(2) l(x) = f(x)
を考えて,
S2 = x ∈ Γ : ∃l ∈ L, y ∈ Ω\x s.t. (1), (2), l(y) = f(y) が成り立つ(1), (2)が成り立つとき,l − f は xで最小値を取る.
f ∈ C2(Ω) だから,Df : Ω → Rnは Lipschitz連続である.「凸関数の 2次微分」における補題 1.1により,
補題 3. Df(S1)は零集合である.
補題 4. Df(S2)は零集合である.
3
証明. 関数 g : Rn → Rを
g(p) = maxx∈Ω
(f(x)− p · x)
とおいて定義する.この関数 gは Lipschitz連続,かつ凸関数である.Lipschitz連続だから,殆どいたる所で微分可能である.
N = p ∈ Rn : g は pで微分不可能
とおくと,N は零集合である.p ∈ Rn \N を固定する.x ∈ Ωを
g(p) = f(x)− p · x
をみたす点(最大点)とする.p → pとするとき,
f(x)− p · x ≤ g(p) = g(p) +Dg(p) · (p− p) + o(|p− p|)= f(x)− p · x+Dg(p) · (p− p) + o(|p− p|).
したがって,p → pのとき,
(Dg(p) + x) · (p− p) = o(|p− p|).
上の式に p = p+ ε(Dg(p) + x)を代入し,ε → 0+とすれば,
|Dg(p) + x| = 0
を得る.すなわち,
x = −Dg(p).
これは,関数
x 7→ f(x)− p · x, Ω → Rが最大値を取る点が−Dg(p)に限られる(1点でのみ最大値をとる)ことを意味する.
p ∈ Df(S2)とする.p = Df(x)となる x ∈ S2を取る.(1)と (2)をみたす l ∈ Lがある.
(f − l)(x) = 0, (f − l)(z) ≤ 0 ∀z ∈ Ω
が成り立つので,f − lは最大値を xで取る.x ∈ S2なので,y ∈ Ω,y = x, が存在し,f − lは yにおいても最大値を取る.Df(x) = Dl(x)だから,l(z) = p · z + qとなる q ∈ Rがある.関数
z 7→ f(z)− p · z, Ω → R
は xと yで最大値をとる.したがって,p ∈ N が分かる.すなわち,Df(S2) ⊂ Nであり,Nは零集合だから,Df(S2)も零集合である.
補題 5. Df : Γ ∗ → Df(Γ ∗)は単射である.
4
証明. Df(x1) = Df(x2), x1, x2 ∈ Γ ∗とする.p := Df(x1) = Df(x2)とおく.
li(x) = f(xi) + p · (x− xi), i = 1, 2
とおくとき,Γ ∗の定義から,i = 1, 2に対して
f(xi) = li(xi), li(x) > f(x) ∀x ∈ Ω \ xi
が成り立つ.これから,仮に x1 = x2と仮定すれば
l1(x2) > f(x2) = l2(x2), l2(x1) > f(x1) = l1(x1).
これから,0 < l1(x2)− l2(x2) = f(x1)− f(x2) + p · (x2 − x1),
0 < l2(x1)− l1(x1) = f(x2)− f(x1) + p · (x1 − x2)
が分かるが,これは矛盾である.
以上より,変換
Df : Γ ∗ → Df(Γ ∗)
は全単射であり,Γ ∗, Df(Γ ∗)は開集合であり,Γ ∗ 上で detD2f = 0であるから,変数変換の公式が使える.従って,次の定理が成立する.(The Formula for Change in Variables in a Multiple Integral, J. T.Schwartz, The American Mathematical Monthly, Vol. 61, No. 2 (Feb.,1954), pp. 81-85.
http://www.jstor.org/stable/2307790?seq=1#page_scan_tab_contents
を参照)
定理 6. h ∈ L1(Df(Γ ∗))であれば,∫Df(Γ ∗)
h(p) d p =
∫Γ ∗
h(Df(x))| detD2f(x)| dx.
Jensenの補題
以下では,「f ∈ C2(Ω」の仮定を削除する.代わりに
(3) f(x) = g(x)− A
2|x|2 ∀x ∈ Rn
を仮定する.ただし,A ≥ 0は定数であり,g : Rn → Rは凸関数であるとする.このような関数 f を semi-convex(半凸)関数と呼ぶ.以前と同じく,
(4) max∂Ω
f < 0, maxΩ
f > 0
を仮定する.
5
ρεを通常の軟化子とする.特に,supp ρε ⊂ Bε, ρε ≥ 0を満たすとする.
gε = g ∗ ρε, fε(x) = gε(x)−A
2|x|2
とおく.以下では,ε > 0は十分に小さいものとして,
(5) max∂Ω
fε < 0, maxΩ
fε > 0
が成り立つものとする.前節の Γ と Γ ∗と同様に,
Γε : = x ∈ Ω : fε(x) +Dfε(x) · (y − x) ≥ 0 ∨ fε(y) ∀y ∈ Ω,Γ ∗ε : = x ∈ Γε : fε(x) +Dfε(x) · (y − x) > fε(y) ∀y ∈ Ω \ x,
detD2fε(x) < 0
とおく.さらに,
Γ := x ∈ Ω : ∃l ∈ L s.t. l(y) ≥ 0 ∨ f(y) ∀y ∈ Ω, l(x) = f(x)
とおく.
補題 7. 次が成り立つ.
lim supε→0+
Γε ⊂ Γ.
証明. xj ∈ Γεj , εj → 0+とし,xj → x0とする.x0 ∈ Ωである.さらに,
lj(y) = fεj(xj) +Dfεj(xj) · (y − xj)
と置くとき,
(6) lj(y) ≥ fεj(y) ∨ 0 ∀y ∈ Ω
が成り立つ.R > 0を十分に大きく取って,
Ω ⊂ BR−1
が成り立つとする.εj ∈ (0, 1)が成り立つものとするとき,
∥Dgεj∥L∞(Ω) ≤ ∥Dg∥L∞(BR)
となり,
∥Dfεj∥L∞(Ω) ≤ ∥Dg∥L∞(BR) + AR
が成り立つ.特に,
|Dfεj(xj)| ≤ ∥Dg∥L∞(BR) + AR
となり,BW定理より,必要に応じて部分列に話を置き換えることにより,
Dfεj(xj) → p0
6
が成り立つものと仮定してよい.(6)において,yは固定し,j → ∞とすれば,
f(x0) + p0 · (y − x0) ≥ f(y) ∨ 0 ∀y ∈ Ω
が成り立つことが分かる.特に,x0 ∈ Ωである.また,(f(x0) + p0 · (y − x0)
)∣∣y=x0
= f(x0).
よって,x0 ∈ Γ . すなわち,
lim supε→0+
Γε ⊂ Γ.
が成り立つ. 補題 8. r > 0を
r <maxΩ f
diam(Ω)
が成り立つものとするとき,ε > 0を十分に小さく取れば
Br ⊂ Dfε(Γε)
が成り立つ.
証明. ε > 0は十分小さく,
max∂Ω
fε < 0, maxΩ
fε > 0,maxΩ fεdiam(Ω)
> r
が成り立つものとする.x ∈ ΩをfεのΩにおける最大点とする.p ∈ Br
とし,関数
y 7→ (0 ∨ fε)(y)− p · (y − x)
のΩ上での最大点を zとするとき,
(0 ∨ fε)(z)− p · (z − x) ≥ (0 ∨ fε)(x) = fε(x) > 0
が成り立つ.さらに,
0 ∨ fε(z) ≥ fε(x)− |p||z − x|> fε(x)− r diam(Ω) > fε(x)− fε(x) = 0
が成り立ち,fε(z) > 0と z ∈ Ωが分かる.さらに,Dfε(z) = pが分かる.
(0 ∨ fε)(y)− p · (y − x) ≤ (0 ∨ fε)(z)− p · (z − x) ∀y ∈ Ω
だから,
(0 ∨ fε)(y) ≤ p · (y − z) + fε(z) ∀y ∈ Ω
であり,z ∈ Γ が分かる.従って,p = Dfε(z) ∈ Dfε(Γ )である.よって,Br ⊂ Dfε(Γ ).
7
定理 9. max∂Ω f < 0, maxΩ f > 0,
f(x) = g(x)− A
2|x|2 ∀x ∈ Rn
が成り立つとする.ただし,gは凸関数であるとする.
R :=maxΩ f
diam(Ω)
とおく.h ∈ C(Ω)が h ≥ 0 (on Ω)を満たすとき,∫BR
h(p) d p ≤ An
∫Γ
h(Df(x)) d x
が成り立つ.
証明. r ∈ (0, R)を固定する.ε > 0は十分に小さいものとし,前の議論のように fεを定義する.補題 8によれば,Br ⊂ Dfε(Γε)が成り立つ.したがって,定理 6によれば,∫
Br
h(p) d p ≤∫Dfε(Γε)
h(p) d p ≤∫Γε
h(Dfε(x))| detD2fε(x)| dx
が成り立つ.次に注意する:
D2gε(x) ≥ 0 ∀x ∈ Rn.
したがって,
D2fε(x) = D2gε(x)− AI ≥ −AI ∀x ∈ Rn
である.一方,x ∈ Γεのとき,
fε(y) ≤ fε(x) +Dfε(x) · (y − x) ∀y ∈ Ω
であり,
D2fε(x) ≤ 0.
以上より,
| detD2fε(x)| = An ∀x ∈ Γε
が分かる.よって,∫Br
h(p) d p ≤ An
∫Γε
h(Dfε(x))| d x.
補題 7により,lim supε→0+
1Γε(x) ≤ 1Γ (x) ∀x ∈ Ω.
また,M > 0をΩ ⊂ BMが成り立つように選んだとき,Dg ∈ L∞(BM)であり,従って,ε → 0+のとき,
Dgε = ρε ∗Dg → Dg in Lp(Ω)
8
が成り立つ.特に,
limε→0+
Dgε(x) = Dg(x) a.e. in Ω
が成り立つ.Fatouの補題により,∫Ω
lim supε→0+
h(Dfε(x))1Γε(x) d x ≥ lim supε→0+
∫Ω
h(Dfε(x))1Γε(x) d x
であるから,
lim supε→0+
∫Γε
h(Dfε(x)) d x ≤∫Γ
h(Df(x)) d x.
が成り立ち,よって∫Br
h(p) d p ≤ An
∫Γ
h(Df(x)) d x.
が成り立つ.最後に,r → Rとして,∫BR
h(p) d p ≤ An
∫Γ
h(Df(x)) d x.
を得る. 定理 9において,h(p) ≡ 1と取れば,
系 10. つぎが成り立つ.
ωnRn ≤ An|Γ |.
特に,|Γ | > 0.
系 11 (Jensenの補題). f : Rn → Rは半凸 (semi-convex)関数であり,原点 0で狭義の極大値を取るとする.このとき,Rnの点列 xk, pkが存在し,つぎが成り立つ.
limk→∞
xk = limk→∞
pk = 0,
x 7→ f(x)− pk · x は xkで極大値を取る,
f は xkで 2次微分を持つ.
証明. f が 0で狭義の極大値を取るので,
max∂B1/k
f < f(0) ∀k ≫ 1
が成り立つ.以下では,k ≫ 1に対して,xk, pkを定める.a ∈ Rをmax∂B1/k
f < a < f(0)
と取り,fa(x) = f(x)− aと定義する.
max∂B1/k
fa < 0 < fa(0)
9
が成り立つ.
Γa = x ∈ B1/k : ∃l ∈ L s.t. l(x) = fa(x), l ≥ 0 ∨ fa on B1/k系 10によれば,|Γa| > 0である.一方,
F = x ∈ B1/k : fa は xで 2次微分を持つ と置くと,|F | = |B1/k|であり,|F∩Γa| = |Γa| > 0. 従って,xa ∈ F∩Γa
が存在する.Γaの定義によれば,
(7) fa(xa) +Dfa(xa) · (x− xa) ≥ (fa ∨ 0)(x) ∀x ∈ B1/k
を満たす.pa = Dfa(xa) = Df(xa)と置き,上の式 (7)で x = xaと取れば,
f(xa)− a ≥ 0.
従って,a → f(0)− 0とするとき,xa → 0となることが分かる.以下では,
|xa| ≤ 1/(2k), f(xa)− a ≤ 1
4k2
が成り立つ程度に aを f(0)に近く取っておく.式 (7)において,x =xa − pa/(2k|pa|+ 1)と取れば,
f(xa)− a− |pa|2
2k|pa|+ 1≥ 0.
よって,|pa|2
2k|pa|+ 1≤ 1
4k2
であり,さらに,
|pa|2 ≤|pa|2k
+1
4k2≤ |pa|2
2+
1
2k2.
従って,
|pa| ≤1
k.
このとき,xk = xa, pk = paと取ればよい.