A quick review of convex analysis convex analysis

1. A quick review of convex analysisconvex_analysis

We discuss here basic properties of convex functions on Rn.By definition, a subset C of Rn is convex if and only if

(1− t)x+ ty ∈ C for all x, y ∈ C, 0 < t < 1.

For a given function f : U ⊂ Rn → [−∞, ∞], its epigraph epi(f) isdefined as

epi(f) = (x, y) ∈ U × R : y ≥ f(x).A function f : U → [−∞, ∞] is said to be convex if epi(f) is a convexsubset of Rn+1.

We are henceforth concerned with functions defined on Rn. Whenwe are given a function f on U with U being a proper subset of Rn, wemay think of f as a function defined on Rn having value ∞ on the setRn \ U .

It is easily checked that a function f : Rn → [−∞, ∞] is convex ifand only if for all x, y ∈ Rn, t, s ∈ R and λ ∈ [0, 1],

f((1− λ)x+ λy) ≤ (1− λ)t+ λs if t ≥ f(x) and s ≥ f(y).

From this, we see that a function f : Rn → (−∞, ∞] is convex if andonly if for all x, y ∈ Rn and λ ∈ [0, 1],

f((1− λ)x+ λy) ≤ (1− λ)f(x) + λf(y).

Here we use the convention for extended real numbers, i.e., for anyx ∈ R, −∞ < x < ∞, x ± ∞ = ±∞, x · (±∞) = ±∞ if x > 0,0 · (±∞) = 0, etc.

Any affine function f(x) = a · x + b, where a ∈ Rn and b ∈ R, is aconvex function on Rn. Moreover, if A ⊂ Rn and B ⊂ R are nonemptysets, then the function on Rn given by

f(x) = supa · x+ b : (a, b) ∈ A×Bis a convex function. Note that this function f is lower semicontinuouson Rn. We restrict our attention to those functions which take valuesonly in (−∞, ∞].

global-subd Proposition 1. Let f : Rn → (−∞, ∞] be a convex function. As-sume that p ∈ D−f(y) for some y, p ∈ Rn. Then

f(x) ≥ f(y) + p · (x− y) for all x ∈ Rn.

証明. By the definition of D−f(y), we have

f(x) ≥ f(y) + p · (x− y) + o(|x− y|) as x → y.

Hence, fixing x ∈ Rn, we get

f(y) ≤ f(tx+ (1− t)y)− tp · (x− y) + o(t) as t → 0 + .1

2

Using the convexity of f , we rearrange the above inequality and divideby t > 0, to get

f(y) ≤ f(x)− p · (x− y) + o(1) as t → 0 + .

Sending t → 0+ yields

f(x) ≥ f(y) + p · (x− y) for all x ∈ Rn. sup-convex Proposition 2. Let F be a nonempty set of convex functions on Rn

with values in (−∞, ∞]. Then supF is a convex function on Rn havingvalues in (−∞, ∞].

証明. It is clear that (supF)(x) ∈ (−∞, ∞] for all x ∈ Rn. If f ∈ F ,x, y ∈ Rn and t ∈ [0, 1], then we have

f((1− t)x+ ty) ≤ (1− t)f(x)+ tf(y) ≤ (1− t)(supF)(x)+ t(supF)(y)

and hence

(supF)((1− t)x+ ty) ≤ (1− t)(supF)(x) + t(supF)(y),

which proves the convexity of supF . We call a function f : Rn → (−∞, ∞] proper convex if the following

three conditions hold.

(i) f is convex on Rn.(ii) f ∈ LSC(Rn).(iii) f(x) ≡ ∞.

Let f : Rn → [−∞, ∞]. The conjugate convex function (or theLegendre-Fenchel transform) of f is the function f ⋆ : Rn → [−∞, ∞]given by

f ⋆(x) = supy∈Rn

(x · y − f(y)).

properness Proposition 3. If f is a proper convex function, then so is f ⋆.

subdifferentiability Lemma 1. If f is a proper convex function on Rn, then D−f(y) = ∅for some y ∈ Rn.

証明. We choose a point x0 ∈ Rn so that f(x0) ∈ R. Let k ∈ N, anddefine the function gk on B1(x0) by the formula gk(x) = f(x) + k|x−x0|2. Since gk ∈ LSC(B1(x0) and gk(x0) = g(x0) ∈ R, the functiongk has a finite minimum at a point xk ∈ B1(x0). Note that if k issufficiently large, then

min∂B1(x0)

gk = min∂B1(x0)

f + k > f(x0).

Fix such a large k, and observe that xk ∈ B1(x0) and, therefore,−2k(xk − x0) ∈ D−f(xk).

3

Propositionproperness3. The function x 7→ x · y − f(y) is an affine function for

any y ∈ Rn. By Propositionsup-convex2, the function f ⋆ is convex on Rn. Also,

since the function x 7→ x · y− f(y) is continuous on Rn for any y ∈ Rn,as stated in Proposition

semicon:sup-inf??, the function f ⋆ is lower semicontinuous on

Rn.Since f is proper convex on Rn, there is a point x0 ∈ Rn such that

f(x0) ∈ R. Hence, we have

f ⋆(y) ≥ y · x0 − f(x0) > −∞ for all y ∈ Rn.

By Lemmasubdifferentiability1, there exist points y, p ∈ Rn such that p ∈ D−f(y). By

Propositionglobal-subd1, we have

f(x) ≥ f(y) + p · (x− y) for all x ∈ Rn.

That is,p · y − f(y) ≥ p · x− f(x) for all x ∈ Rn,

which implies that f ⋆(p) = p · y − f(y) ∈ R. Thus, we concludethat f ⋆ : Rn → (−∞, ∞], f ⋆ is convex on Rn, f ⋆ ∈ LSC(Rn) andf ⋆(x) ≡ ∞.

The following duality (called convex duality or Legendre-Fenchel du-ality) holds.

convex-duality Theorem 4. Let f : Rn → (−∞, ∞] be a proper convex function.Then

f ⋆⋆ = f.

証明. By the definition of f ⋆, we have

f ⋆(x) ≥ x · y − f(y) for all x, y ∈ Rn,

which reads

f(y) ≥ y · x− f ⋆(x) for all x, y ∈ Rn.

Hence,f(y) ≥ f ⋆⋆(y) for all y ∈ Rn.

Next, we show that

f ⋆⋆(x) ≥ f(x) for all x ∈ Rn.

We fix any a ∈ Rn and choose a point y ∈ Rn so that f(y) ∈ R. Wefix a number R > 0 so that |y − a| < R. Let k ∈ N, and consider thefunction gk ∈ LSC(BR(a)) defined by gk(x) = f(x) + k|x − a|2. Letxk ∈ BR(a) be a minimum point of the function gk. Noting that if k issufficiently large, then

gk(xk) ≤ f(y) + k|y − a|2 < min∂BR(a)

f + kR2 = min∂BR(a)

gk,

4

we see that xk ∈ BR(a) for k sufficiently large. We henceforth assumethat k is large enough so that xk ∈ BR(a). We have

D−gk(xk) = D−f(xk) + 2k(xk − a) ∋ 0.

Accordingly, if we set ξk = −2k(xk − a), then we have ξk ∈ D−f(xk).By Proposition

global-subd1, we get

f(x) ≥ f(xk) + ξk · (x− xk) for all x ∈ Rn,

or, equivalently,

ξk · xk − f(xk) ≥ ξk · x− f(x) for all x ∈ Rn.

Hence,

ξk · xk − f(xk) = f ⋆(ξk).

Using this, we compute that

f ⋆⋆(a) ≥ a · ξk − f ⋆(ξk) = ξk · a− ξk · xk + f(xk)

= 2k|xk − a|2 + f(xk).

We divide our argument into the following cases, (a) and (b).Case (a): limk→∞ k|xk − a|2 = ∞. In this case, if we set m =

minBR(a) f , then we have

f ⋆⋆(a) ≥ lim infk→∞

2k|xk − a|2 +m = ∞,

and, therefore, f ⋆⋆(a) ≥ f(a).Case (b): lim infk→∞ k|xk − a|2 < ∞. We may choose a subsequence

xkjj∈N of xk so that limj→∞ xkj = a. Then we have

f ⋆⋆(a) ≥ lim infj→∞

(2kj|xkj − a|2 + f(xkj)

)≥ lim inf

j→∞f(xkj) ≥ f(a).

Thus, in both cases we have f ⋆⋆(a) ≥ f(a), which completes theproof.

convex-duality2 Theorem 5. Let f : Rn → (−∞, ∞] be proper convex and x, ξ ∈ Rn.Then the following three conditions are equivalent each other.

(i) ξ ∈ D−f(x).(ii) x ∈ D−f ⋆(ξ).(iii) x · ξ = f(x) + f ⋆(ξ).

証明. Assume first that (i) holds. By Propositionglobal-subd1, we have

f(y) ≥ f(x) + ξ · (y − x) for all y ∈ Rn,

which reads

ξ · x− f(x) ≥ ξ · y − f(y) for all y ∈ Rn.

5

Hence,

ξ · x− f(x) = maxy∈Rn

(ξ · y − f(y)) = f ⋆(ξ).

Thus, (iii) is valid.Next, we assume that (iii) holds. Then the function y 7→ ξ · y− f(y)

attains a maximum at x. Therefore, ξ ∈ D−f(x). That is, (i) is valid.Now, by the convex duality (Theorem

convex-duality4), (iii) reads

x · ξ = f ⋆⋆(x) + f ⋆(ξ).

The equivalence between (i) and (iii), with f replaced by f ⋆, is exactlythe equivalence between (ii) and (iii). The proof is complete.

Finally, we give a Lipschitz regularity estimate for convex functions.

convex-Lip-estimate Theorem 6. Let f : Rn → (−∞, ∞] be a convex function. Assumethat there are constants M > 0 and R > 0 such that

|f(x)| ≤ M for all x ∈ B3R.

Then

|f(x)− f(y)| ≤ M

R|x− y| for all x, y ∈ BR.

証明. Let x, y ∈ BR and note that |x− y| < 2R. We may assume thatx = y. Setting ξ = (x − y)/|x − y| and z = y + 2Rξ and noting thatz ∈ B3R,

x− y =|x− y|2R

(z − y),

and

x = y +|x− y|2R

(z − y) =|x− y|2R

z +

(1− |x− y|

2R

)y,

we obtain

f(x) ≤ |x− y|2R

f(z) +

(1− |x− y|

2R

)f(y),

and

f(x)−f(y) ≤ |x− y|2R

(f(z)−f(y)) ≤ |x− y|2R

(|f(z)|+|f(y)|) ≤ M |x− y|R

.

In view of the symmetry in x and y, we see that

|f(x)− f(y)| ≤ M

R|x− y| for all x, y ∈ BR.

6

2. Rademacher’s theoremsec:Rade

We give here a proof of Rademacher’s theorem.

Theorem 7 (Rademacher). Let B = B1 ⊂ Rn and f ∈ Lip(B). Thenf is differentiable almost everywhere in B.

To prove the above thoerem, we mainly follow the proof given in[AmbrosioTilli04?AmbrosioTilli04].

証明. We first show that f has a distributional gradient Df ∈ L∞(B).Let L > 0 be a Lipschitz bound of the function f . Let i ∈ 1, 2, ..., n

and ei denote the unit vector in Rn with unity as the i-th entry. Fixany ϕ ∈ C1

0(B) and observe that∫B

f(x)ϕxi(x) d x = lim

r→0+

∫B

f(x)ϕ(x+ rei)− ϕ(x)

rd x

= limr→0+

∫B

f(x− rei)− f(x)

rϕ(x) d x

and ∣∣∣ ∫B

f(x)ϕxi(x) d x

∣∣∣ ≤ L

∫B

|ϕ(x)| dx ≤ L|B|1/2∥ϕ∥L2(B).

Thus, the map

C10(B) ∋ ϕ 7→ −

∫B

f(x)ϕxi(x) d x ∈ R

extends uniquely to a bounded linear functional Gi on L2(B). By theRiesz representation theorem, there is a function gi ∈ L2(B) such that

Gi(ϕ) =

∫B

gi(x)ϕ(x) d x for all ϕ ∈ L2(B).

This shows that g = (g1, ..., gn) is the distributional gradient of f .We plug the function ϕ ∈ L2(B) given by ϕ(x) = (gi(x)/|gi(x)|)1Ek

(x),where k ∈ N and Ek = x ∈ B : |gi(x)| > L+1/k, into the inequality|Gi(ϕ)| ≤ L∥ϕ∥L1(B), to obtain∫

B

|gi(x)|1Ek(x) d x ≤ L

∫B

1Ek(x) d x = L|Ek|,

which yields

(L+ 1/k)|Ek| ≤ L|Ek|.Hence, we get |Ek| = 0 for all k ∈ N and |x ∈ B : |gi(x)| > L| = 0.That is, gi ∈ L∞(B) and |gi(x)| ≤ L a.e. in B.

7

The Lebesgue differentiation theorem (see [SteinShakarchi05?SteinShakarchi05])

states that for a.e. x ∈ B, we have g(x) ∈ Rn and

Rade-1Rade-1 (2.1) limr→0+

1

rn

∫Br

|g(x+ y)− g(x)| d y = 0.

Now, we fix such a point x ∈ B and show that f is differentiableat x. Fix an r > 0 so that Br(x) ⊂ B. For δ ∈ (0, r), consider thefunction hδ ∈ C(B) given by

hδ(y) =f(x+ δy)− f(x)

δ.

We claim that

Rade-2Rade-2 (2.2) limδ→0

hδ(y) = g(x) · y uniformly for y ∈ B.

Note that hδ(0) = 0 and hδ is Lipschitz continuous with Lipschitzbound L. By the Ascoli-Arzela theorem, for any sequence δj ⊂ (0, r)converging to zero, there exist a subsequence δjkk∈N of δj and afunction h0 ∈ C(B) such that

limk→∞

hδjk(x) = h0(y) uniformly for y ∈ B.

In order to prove (Rade-22.2), we need only to show that h0(y) = g(x) · y for

all y ∈ B.Since hδ(0) = 0 for all δ ∈ (0, r), we have h0(0) = 0. We observe

from (Rade-12.1) that∫

B

|g(x+δy)−g(x)| d y =

∫Bδ

|g(x+y)−g(x)|δ−n d y → 0 as δ → 0.

Using this, we compute that for all ϕ ∈ C10(B),∫

B

h0(y)ϕyi(y) d y = limk→∞

∫B

hδjk(y)ϕyi(y) d y

= − limk→∞

∫B

gi(x+ δjky)ϕ(y) d y

= −∫B

gi(x)ϕ(y) d y =

∫B

g(x) · yϕyi(y) d y.

This guarantees that h0(y) − g(x) · y is constant for all y ∈ B whileh0(0) = 0. Thus, we see that h0(y) = g(x) · y for all y ∈ B, whichproves (

Rade-22.2).

Finally, we note that (Rade-22.2) yields

f(x+ y) = f(x) + g(x) · y + o(|y|) as y → 0.

1. 凸関数の 2次微分

補題 1.1. J : Rn → Rnは Lipschitz関数とする．E ⊂ Rnを

E = x ∈ Rn : J は xで微分可能, det DJ(x) = 0

と定める．このとき，|J(E)| = 0.

形式的には，積分の変数変換の公式

|J(E)| =

∫J(E)

dy =

∫E

| det J(x)|dx = 0

から分かる．以下ではヴィタリの被覆定理の応用として証明する．

補題 1.2 (Vitali). E ⊂ Rnは可測集合，Bは球の族から成るEの被覆とする．

supB∈B

diam B < ∞

を仮定する．このとき

E ⊂∪j∈J

B∗j , Bj ∈ B ∀j ∈ J, Bi ∩ Bj = ∅ (i = j)

となる J ⊂ Nが存在する．ただし，球Bに対して，B∗は半径が 5倍のBの同心球を表す．

補題 1.1の証明. 次に注意する．

|J(E)| ≤∞∑

k=1

|J(E ∩ Bk(0))|

これより，任意のR > 0に対して

|J(E ∩ BR(0))| = 0

を示せばよい．R > 0を固定し，

ER = E ∩ BR(0)

とおく．これは可測集合である．JのLipschitz定数をL > 0とする．x ∈ ERを固定する．det DJ(x)∗ =

det DJ(x) = 0より (A∗で Aの転置行列を表す)，DJ(x)∗の固有ベクトル e ∈ Rn, DJ(x)∗e = 0, |e| = 1,が存在する．このとき，

J(y) − J(x) = DJ(x)(y − x) + o(|y − x|) as y → x,

1

2

であり，

(J(y) − J(x)) · e = DJ(x)(y − x) · e + o(|y − x|)= (y − x) · DJ(x)∗e + o(|y − x|)= o(|y − x|) as y → x.(1)

一方，|J(y) − J(x)| ≤ L|y − x| ∀y ∈ Rn

であり，J(y) ∈ BLr(J(x)) ∀y ∈ Br(x), r > 0.

ε > 0を固定する．(1)によれば，r ∈ (0, 1)を

|J(y) − J(x) · e| ≤ εr ∀y ∈ B5r(x)

が成り立つように取ることができる．このとき，

J(B5r(x)) ⊂ B5Lr(J(x)) ∩ y ∈ Rn : |y · e| ≤ εr.ここで，

|B5Lr(J(x)) ∩ y ∈ Rn : |y · e| ≤ εr|≤ ωn−1(5Lr)n−12εr = εC(n, L)rn

に注意する（高さ 2εrで半径 5Lrの円柱の体積）．ただし，

C(n, L) = 2ωn−1(5L)n−1.

このように，それぞれの x ∈ ERに対して，rx ∈ (0, 1)が存在して，

(2) |J(B5rx(x))| ≤ εC(n, L)rnx .

各々の x ∈ ERに対して，このような rxを固定し，

B = Brx(x) : x ∈ ERと定めるとき，BはERの被覆である．

diam Brx(x) < 2 ∀x ∈ ER

に注意する．補題 1.2によれば，J ⊂ N, xjj∈J ⊂ ERが存在し，

(3) ER ⊂∪j∈J

B5rxj(xj), Brxi

(xi) ∩ Brxj(xj) = ∅ (i = j).

この包含関係より，

J(ER) ⊂∪j∈J

J(B5rxj(xj)).

したがって，(2)を用いて，

(4) |J(ER)| ≤∑j∈J

|J(B5rxj(xj))| ≤ εC(n, L)

∑j∈J

rnxj

.

3

一方で，xj ∈ ER ⊂ BR(0), rxj

∈ (0, 1) ∀j ∈ J

なので，Brxj

(xj) ⊂ BR+1(0).

これと (3)の後者より，

ωn(R + 1)n = |BR+1(0)| ≥ |∪j∈J

Brxj(xj)| =

∑j∈J

|Brxj(xj)| = ωn

∑j∈J

rnxj

.

これと (4)より，|J(ER)| ≤ εC(n, L)(R + 1)n.

ここで，εは任意だから，|J(ER)| = 0.

補題 1.3. N ⊂ Rnとする．つぎの (1)と (2)は同値である．

(1) N は零集合(2) ∀ε > 0, ∃ 球の族 Bjj∈N such that

N ⊂∪j∈N

Bj,∑j∈N

|Bj| < ε.

証明. (2) =⇒ (1)を示す．(2)を仮定する．ε > 0とし，球の族Bjj∈Nを

N ⊂∪j∈N

Bj,∑j∈N

|Bj| < ε

をみたすように取る．いま，球Bj = Brj(xj)に対して，立方体Qjを

Qj =n∏

i=1

(xj,i − r, xj,i + r), xj = (xj,1, ..., xj,n)

とおけば，Bj ⊂ Qj, |Bj| = ωnr

nj , |Qj| = (2rj)

n

となる．したがって，

N ⊂∞∪

j=1

Qj,∞∑

j=1

|Qj| =ωn

2n

∞∑j=1

|Bj| <ωn

2nε.

よって，N は零集合である．(1) =⇒ (2)を示す．辺が座標軸に平行な直方体

P =n∏

i=1

(ai, bi), ai < bi

4

を考える．P は開集合であり，各々の x ∈ P に対して，xを中心とする球Bxで，Bx ⊂ P をみたすものがある．このように選んだBxの族を Bと表す．このとき，

P =∪B∈B

B, diamB∈B B ≤ diam P < ∞.

補題 1.2によれば，可算集合 J ⊂ Nと Bjj∈J ⊂ Bが存在し，

P ⊂∪j∈J

B∗j , Bi ∩ Bj = ∅ (i = j)

が成り立つ．ただし，B∗j は半径が 5倍のBjの同心球を表す．このとき，

|P | ≥ |∪j∈J

Bj| =∑j∈J

|Bj|

であり， ∑j∈J

|B∗j | = 5n

∑j∈J

|Bj| ≤ 5n|P |.

B∗j をBjと書き直し，以上を纏めると

P ⊂∪j∈J

Bj,∑j∈J

|Bj| ≤ 5n|P |

をみたす球の族 Bjj∈J (J ⊂ N)が存在することが言える．(1)を仮定する．ε > 0とする．辺が座標軸に平行な直方体の族Pjj∈N

が存在し，

N ⊂∞∪

j=1

Pj,∑j∈N

|Pj| < ε

が成り立つ．上でみたように，各 Pj に対して，球の列 Bj,kk∈Nが存在し (Bj,k = ∅の可能性も許す)，

Pj ⊂∪k∈N

Bj,k,∑k∈N

|Bj,k| ≤ 5n|Pj|

をみたす．以上より，

N ⊂∪

(j,k)∈N2

Bj,k,∑

(j,k)∈N2

|Bj,k| < 5nε.

よって，(2)が成立する．

補題 1.4. N ⊂ Rnは零集合，J : N → Rnは Lipschitz連続な関数とするとき，J(N)は零集合である．

5

証明. J の Lipschitz定数を Lとする．ε > 0とするとき，N が零集合なので，球の族 Bjj∈Nが存在して，

N ⊂∪j∈N

Bj,∑j∈N

|Bj| < ε

が成り立つ．Bj = Brj(xj)とする．このとき，

|J(x) − J(xj)| ≤ L|x − xj| < Lrj ∀x ∈ Bj.

したがって，J(x) ∈ BLrj

(J(xj)) ∀x ∈ Bj.

すなわち，J(Bj) ⊂ BLrj

(J(xj)) ∀j ∈ N.

よって，J(N) ⊂

∪j∈N

J(Bj) ⊂∪j∈N

BLrj(J(xj)).

ここで， ∑j∈N

|BLrj(J(xj))| =

∑j∈N

Ln|Bj| < Lnε.

これより，J(N)は零集合である．定理 1.5. f : Rn → Rは凸関数とする．このとき，ほとんどすべてのx ∈ Rnにおいて，f は 2次微分をもつ．すなわち，p ∈ RnとX ∈ Sn

が存在し，y → xのときに

f(y) = f(x) + p · (y − x) +1

2X(y − x) · (y − x) + o(|y − x|2).

Snは n × n実対称行列の全体を表す．以下では，凸関数 f : Rn → Rを固定して考えていく．

補題 1.6. すべての x ∈ Rnに対して，

y + D−f(y) ∋ x

は解 y ∈ Rnをもつ．

補題 1.7. g : Rn → Rを凸関数とする．y ∈ Rnとする．つぎは同値な命題である．

(1) 0 ∈ D−g(y).(2) gは yで最小値をとる．

証明. (1) =⇒ (2): 0 ∈ D−g(y)を仮定する．Proposition 1により，

g(x) ≥ g(y) + 0 · (x − y) = g(y) ∀x ∈ Rn

が成り立ち，gは yで最小値をとる．

6

(2) =⇒ (1): gが yで最小値をとるとき，

g(x) ≥ g(y) = g(y) + 0 · (x − y) ∀x ∈ Rn

が成り立ち，0 ∈ D−g(y). 補題 1.8. g : Rn → Rは凸関数であるとする．R > 0とするとき，MR > 0が存在して，つぎが成り立つ．

x ∈ BR(0), p ∈ D−g(x) =⇒ |p| ≤ MR.

証明. Theorem 6によれば，gは局所Lipschitz関数である．したがって，

(1) |g(x) − g(y)| ≤ MR|x − y| ∀x, y ∈ BR(0)

となる定数MR > 0がある．x ∈ BR(0)を固定し，p ∈ D−g(x)となる p ∈ Rnを固定する．

(2) |p| ≤ MR

を示す．

(3) g(y) ≥ g(x) + p · (y − x) ∀y ∈ Rn

が成り立つ．p = 0ならば，明らかに，(2)が成り立つ．p = 0の場合を考える．t > 0を十分小さく選び，

x + tp ∈ BR(0)(開球)

とする．(3)と (1)より，

p · tp ≤ g(x + tp) − g(x) ≤ MRt|p|.これの各辺を t|p|で割って，|p| ≤ MRを得る．補題 1.9. g : Rn → Rは凸関数とする．このとき，

D−g(x) = ∅ ∀x ∈ Rn.

証明. x ∈ Rnを固定する．gはほとんどいたる所で微分可能なので，

limk→∞

xk = x, D−g(xk) = Dg(xk) ∀k ∈ N

となる点列 xkk∈Nが存在する．各 k ∈ Nに対して，(1) g(y) ≥ g(xk) + pk · (y − xk) ∀y ∈ Rn.

補題 1.8によれば，|pk| ≤ M ∀k ∈ N

となるM > 0が存在する．BWの定理によれば，pkの収束部分列pkj

j が存在する．不等式 (1)において，k = kj, j → ∞とすれば，g(y) ≥ g(x) + p · (y − x) ∀y ∈ Rn

が得られる．ただし，p = limj→∞ pkj. したがって，p ∈ D−g(x)とな

り，D−g(x) = ∅.

7

補題 1.6の証明. x ∈ Rnを固定する．関数

g(y) := f(y) +1

2|y − x|2

を考える．gはふたつの凸関数の和であり，凸関数である．補題 1.9をf に適用し，

f(y) ≥ f(0) + p · y ∀y ∈ Rn

が成り立つような p ∈ Rnが存在する．したがって，|y| → ∞のとき，

g(y) ≥ f(0)+p ·y+1

2|y−x|2 = f(0)+

1

2|y−x+p|2+p ·x− 1

2|p|2 → ∞.

よって，gはある点 z ∈ Rnで最小値をとる．補題 1.7によれば，

0 ∈ D−g(z) = D−f(z) + z − x.

すなわち，z + D−f(z) ∋ x.

補題 1.10. xi, yi ∈ Rn (i = 1, 2)はつぎをみたすとする．

yi + D−f(yi) ∋ xi i = 1, 2.

このとき，|y1 − y2| ≤ |x1 − x2|

が成り立つ．

証明. xi − yi ∈ D−f(yi)だから，

f(z) − f(yi) ≥ (xi − yi) · (z − yi) ∀z ∈ Rn, i = 1, 2.

したがって， f(y2) − f(y1) ≥ (x1 − y1) · (y2 − y1)

f(y1) − f(y2) ≥ (x2 − y2) · (y1 − y2).

差を取れば，

0 ≥ ((x1 − y1)− (x2 − y2)) · (y2 − y1) = |y1 − y2|2 − (x1 − x2) · (y1 − y2).

よって，|y1 − y2|2 ≤ |x1 − x2||y1 − y2|,

となり，|y1 − y2| ≤ |x1 − x2|.

補題 1.6と補題 1.10より，任意の x ∈ Rnに対して，

y + D−f(y) ∋ x

の解 y ∈ Rnがただ一つ存在する．そこで，xに対して，この yを対応させる写像 J : Rn → Rnを考える．J(x) = yであり，

J(x) + D−f(J(x)) ∋ x

8

が成り立つ．補題 1.10によれば，Jは縮小写像 (contraction mapping)である．

|J(x) − J(y)| ≤ |x − y| ∀x, y ∈ Rn.

特に，Lipschitz連続関数である．

補題 1.11. 関数 J : Rn → Rnは全射である．

証明. y ∈ Rn を固定する．補題 1.9により，D−f(y) = ∅. そこで，p ∈ D−f(y)を選ぶ．このとき，

y + D−f(y) ∋ p + y.

すなわち，J(p + y) = y.

補題 1.12. J のグラフは閉集合である．

証明. 点列 (xk, yk) ⊂ R2nは (x, y) ∈ R2nに収束し，

J(xk) = yk ∀k ∈ Nが成り立つとする．J の定義より，

yk + D−f(yk) ∋ xk ∀k ∈ N.

さらに，

f(z) − f(yk) ≥ (xk − yk) · (z − yk) ∀z ∈ Rn, k ∈ N.

この式で，k → ∞とすれば，f(z) − f(y) ≥ (x − y) · (z − y) ∀z ∈ Rn.

これより，x − y ∈ D−f(y).

すなわち，y = J(x). よって，(x, y)は J のグラフ上の点である．補題 1.13. x, y ∈ Rnとし，x = J(y)が成り立つとする．さらに，f はxで微分可能であるとする．このとき，

limr→0+

diamz ∈ Rn : J(z) ∈ Br(x) = 0.

例 1.1. n = 1とし，f(x) = |x|とする．このとき，

J(y) =

y + 1 (y < −1),

0 (−1 ≤ y ≤ 1),

y − 1 (y > 1).

f は x = 0で微分可能でない．r ∈ (0, 1)のとき，

z : J(z) ∈ Br(0) = z : J(z) ∈ (−r, r)⊃ z : J(z) = 0 = [−1, 1].

9

証明. 背理法で示す．

lim supr→0+

diamz ∈ Rn : J(z) ∈ Br(x) > 0.

関数r 7→ diamz ∈ Rn : J(z) ∈ Br(x)

は単調増加関数である．したがって，上の lim supは limと等しい．δ > 0が存在して，

(1) diamz ∈ Rn : J(z) ∈ Br(x) ≥ δ ∀r > 0.

これから，

(2) z ∈ Rn : J(z) ∈ Br(x) ⊂ Bδ/2(y) ∀r > 0

が分かる．なぜなら，仮に，上の式で⊂が成り立つとすれば，

diamz ∈ Rn : J(z) ∈ Br(x) < 2 × δ

2= δ

となり，(1)と矛盾する．(2)により，k ∈ Nに対して，zk ∈ Rnが存在し，

(3) |J(zk) − x| <1

k, |zk − y| ≥ δ

2.

(3)の第１式より，limk→∞

J(zk) = x.

さらに，J(zk) + D−f(J(zk)) ∋ zk

と補題 1.8より，あるR > 0に対して，

D−f(J(zk)) ⊂ BR(0) ∀k ∈ N.

従って，zkは有界列である．BW定理より，収束する部分列 zkjj∈N

が存在する．補題 1.12より，

z = limj→∞

zkj

とおけば，limj→∞

(zkj, J(zkj

) = (z, x)

となり，x = J(z).

これはx + Df(x) = z

と書くことができる．一方で，x = J(y)であり，

x + Df(x) = y.

10

よって，y = zが分かる．また，(3)の第 2式より，

|zkj− y| ≥ δ

2∀j ∈ N.

j → ∞とすれば，|z − y| ≥ δ/2. 矛盾である．補題 1.14. 集合N ⊂ Rnを

N = x ∈ Rn : x において J は微分可能で, DJ(x) ∈ Snと定義する．N は零集合である．

証明. DJ で超関数の意味の導関数も表せば，DJ ∈ L∞(Rn, Rn×n) である．この補題の主張は

DJ(x) ∈ Sn a.e. x ∈ Rn

と言ってもよい．Theorem 7 (Rademacher)の証明を見ると，ほとんどすべての x ∈ Rnに対して

J(x + h) = J(x) + DJ(x) · h + o(|h|) (h → 0)

が示されている．ただし，右辺のDJは超関数の意味の導関数である．（要するに，通常の意味の微分係数と超関数の意味の微分係数が a.e.で一致する．）軟化子 ρεを用いて，f を近似する．すなわち，

fε(x) =

∫Rn

ρε(x − y)f(y) d y

とおいて，fε ∈ C∞(Rn)を定義する．fεは凸関数である．J と同様にJε ∈ Lip(Rn, Rn)が条件

Jε(x) + Dfε(Jε(x)) = x

により定義できる．この式から，直ぐに Jεが単射であることが分かり，Jεは関数

F : y 7→ y + Dfε(y), Rn → Rn

の逆関数である．Fi,yj

(y) = δij + fε,yiyj(y)

であり，DF (y) = I + D2fε(y)

と書き直すこともできる．D2fε(y)は非負定値行列であり，固有値はすべて 0以上である．したがって，DF (y)の固有値はすべて 1上であり，DF (y)は正則行列である．従って，逆関数定理が使えて，F の逆関数J もC∞級である．さらに，

DJε(x) = DF (Jε(x))−1 = (I + D2fε(Jε(x)))−1 ∈ Sn

が分かる．

11

関数族 Jεε∈(0, 1)の局所一様有界性について調べる．f は局所 Lips-chitz連続であるから，Df ∈ L∞(B1(0))となる．このとき，

|fε(0)| ≤ ∥f∥L∞(B1(0)) ∀ε ∈ (0, 1).

以下では，ε ∈ (0, 1)とする．

0 + Dfε(0) = Dfε(0)

と考えると，Jε(Dfε(0)) = 0.

一方，Jεは縮小写像であるから，x ∈ Rnに対して

|Jε(x)| = |Jε(x) − Jε(Dfε(0))| ≤ |x − Dfε(0)| ≤ |x| + |Dfε(0)|

となり，

(1) |Jε(x)| ≤ |x| + ∥Df∥L∞(B1(0)).

J , Jεの定義より，z ∈ Rnに対して，fε(z) − fε(Jε(x)) ≥ (x − Jε(x)) · (z − Jε(x)),

f(z) − f(J(x)) ≥ (x − J(x)) · (z − J(x)).

したがってfε(J(x)) − fε(Jε(x)) ≥ (x − Jε(x)) · (J(x) − Jε(x)),

f(Jε(x)) − f(J(x)) ≥ (x − J(x)) · (Jε(x) − J(x)).

これより，

|J(x) − Jε(x)|2 ≤ (fε − f)(J(x)) + (f − fε)(Jε(x)).

これと (1)より，

limε→0

Jε(x) = J(x) 局所一様収束.

最後に，超関数として

Ji,xj= Jj,xi

∀i, j

を示す．ϕ ∈ C∞0 (Rn)とする．∫

Ji,xj(x)ϕ(x) d x = −

∫Ji(x)ϕxj

(x) d x = − limε→0

∫Jε,i(x)ϕxj

(x) d x

= limε→0

∫Jε,i,xj

(x)ϕ(x) d x.

12

よって， ∫Ji,xj

(x)ϕ(x) d x = limε→0

∫Jε,i,xj

(x)ϕ(x) d x

= limε→0

∫Jε,j,xi

(x)ϕ(x) d x =

∫Jj,xi

(x)ϕ(x) d x.

これより，超関数として，

Ji,xj= Jj,xi

.

定理 1.5の証明. f が局所 Lipschitz なことを思い起こしながら，零集合N1を

N1 = x ∈ Rn : f は x で微分可能ではない

と定義する．J : Rn → Rnを x ∈ Rnに

y + D−f(y) ∋ x

をみたす yを対応させる写像として定義する．補題 1.10により，J は縮小写像である．したがって，J はほとんどいたる所で微分可能である．零集合N2を

N2 = x ∈ Rn : J は xで微分可能でない

と定義する．N3 ⊂ Rnを

N3 = x ∈ Rn : J は xで微分可能, DJ(x) ∈ Sn

補題 1.14より，N3は零集合である．補題 1.4より，

N4 := J(N2 ∪ N3)

は零集合である．

S := x ∈ Rn \ N2, det DJ(x) = 0

とおくとき，補題 1.1より，N5 := J(S)は零集合である．補題 1.11より，J : Rn → Rnは全射であり，

Rn = J(Rn) = J(N2 ∪ N3 ∪ S ∪ x ∈ Rn \ (N2 ∪ N3) : det DJ(x) = 0)= N4 ∪ N5 ∪ J(x ∈ Rn \ (N2 ∪ N3) : det DJ(x) = 0).

N = N1 ∪ N4 ∪ N5とおき，

F = J(x ∈ Rn \ (N2 ∪ N3) : det DJ(x) = 0) \ N1

とおく．このとき，

F ∪ N = Rn, |N | = 0.

13

したがって，x ∈ F に対して，ある p ∈ Rn, A ∈ Snが存在して

(1) f(x + h) = f(x) + p · h +1

2Ah · h + o(|h|2) (h → 0)

を示せばよい．x ∈ F とする．F の定義より，f は xで微分可能で，したがって，

y := x + Df(x)

とおけば，J(y) = xとなり，さらに，

x + D−f(x) ∋ y

ような y は一意に定まる．F の定義より，J は y で微分可能であり，det DJ(y) = 0, DJ(y) ∈ Sn が成り立つ．したがって，

(2) f(x + h) = f(x) + Df(x) · h + o(|h|) (h → 0),

および

(3) J(y + k) = J(y) + DJ(y)k + o(|k|) (k → 0)

が成り立つ．C > 0を

|DJ(y)−1ξ| ≤ C|ξ| ∀ξ ∈ Rn

が成り立つように定める．(3)により，

(4) DJ(y)−1(J(y + k) − J(y)) = k + o(|k|) (k → 0).

J は全射なので，h ∈ Rnに対して

x + h = J(y + k)

となる k ∈ Rnが存在する．このような kを一つ選んで，k(h)と表す．補題 1.13によれば，

limr→0+

diamy + k(h) : h ∈ Br(0) = 0.

したがって，limh→0

k(h) = 0.

これと (4)より，δ > 0が存在し，

(5)|k(h)| = |DJ(y)−1(J(y + k(h)) − J(y))| + o(|k(h)|)

≤ C|h| + 1

2|k(h)| ∀h ∈ Bδ(0).

h ∈ Bδ(0)とすると，上の不等式から，

|k(h)| ≤ 2C|h|また，

|h| = |J(y + k(h)) − J(y)| ≤ |k(h)|.

14

よって，

(6) |h| ≤ |k(h)| ≤ 2C|h| ∀h ∈ Bδ(0).

h ∈ Bδ(0), x + h ∈ F とする．関係 x = J(y), x + h = J(y + k(h))とJ の定義より，

x + Df(x) = y, x + h + Df(x + h) = y + k(h).

したがって，Df(x + h) = Df(x) + k(h) − h.

また，(4), (6)より，

k(h) = DJ(y)−1h + o(|h|).したがって，

(7) Df(x + h) = Df(x) + (DJ(y)−1 − I)h + o(|h|).以下では

A = DJ(y)−1 − I

とおく．A ∈ Snである．以上により，

(8) f(x + h) = f(x) + Df(x) · h +1

2Ah · h + o(|h|2)

が推測できる．以下では (8)を証明する．そこで，

g(h) = f(x + h) − f(x) − Df(x) · h − 1

2Ah · h

とおき，g : Bδ(0) → Rを定義する．h ∈ Bδ(0), x + h ∈ F とする．このとき，

g(0) = 0, Dg(h) = Df(x + h) − Df(x) − Ah, Dg(0) = 0.

さらに，補題 7より，

Dg(h) = o(|h|) (h → 0).

すなわち，ある非減少関数 ω ∈ C([0, 1))に対して

|Dg(h)| ≤ ω(|h|)|h|.仮に g ∈ C1(Bδ(0))であれば，

|g(h)| =∣∣∣g(0) +

∫ 1

0

Dg(th) · h d t∣∣∣ ≤ |h|

∫ 1

0

|Dg(th)| d t

≤ |h|2∫ 1

0

ω(t|h|) d t ≤ ω(|h|)|h|2 = o(|h|2).

g ∈ Lip(Bδ(0))の場合は，次の補題に譲る．補題 1.15. g ∈ Lip(B1(0))とする．次の (1)と (2)は同値である．

15

(1) |Dg(x)| ≤ 1 a.e. x ∈ B1(0).(2) |g(x) − g(y)| ≤ |x − y| ∀x, y ∈ B1(0).

証明. (1) =⇒ (2): δ ∈ (0, 1)として，(2)の不等式を x, y ∈ Bδ(0)に対して示せばよい．δ ∈ (0, 1)とし，ε ∈ (0, 1 − δ)となるように取る．ρεを標準的軟化子とする．

gε(x) =

∫Bε(0)

ρε(y)g(x − y) d y (x ∈ Bδ(0))

とおく．

Dg(x) = Dx

∫B1(x)

ρε(x − y)g(y) d y

=

∫B1(x)

(Dρε)(x − y)g(y) d y =

∫B1(x)

ρε(x − y)Dg(y) d y

となり，|Dg(x)| ≤ 1 ∀x ∈ Bδ(0)

が分かる．このとき，平均値の定理より

|g(x) − g(y)| ≤ |x − y| ∀x, y ∈ Bδ(0).

(2) =⇒ (1): δ ∈ (0, 1)として

|Dg(x)| ≤ 1 a.e. x ∈ Bδ(0)

を示せばよい．ϕ ∈ C10(Bδ(0))とする．h ∈ (0, 1 − δ)として，∫

Bδ(0)

g(x + hei)ϕ(x) d x =

∫B1(0)

g(x)ϕ(x − hei) d x

に注意する．これから，∣∣∣ ∫B1(0)

g(x)(ϕ(x − hei) − ϕ(x)) d x∣∣∣

=∣∣∣ ∫

Bδ(0)

g(x + hei)ϕ(x) d x −∫

Bδ(0)

g(x)ϕ(x) d x∣∣∣

≤ h

∫Bδ(0)

|ϕ(x)| d x,

さらに，h → 0として，∣∣∣ ∫B1(0)

g(x)ϕxi(x) d x

∣∣∣ ≤ ∫B1(0)

|ϕ(x)| d x.

よって， ∣∣∣ ∫B1(0)

gxi(x)ϕ(x) d x

∣∣∣ ≤ ∫B1(0)

|ϕ(x)| d x.

16

ここで，ε > 0とし，関数

f(x) := 1A − 1B, ただし，A := gxi > 1 + ε, B := gxi< −1 − ε

を L1(B1(0))で近似する関数列 ϕk ⊂ C∞0 (B1(0))を考える．∣∣∣ ∫

B1(0)

gxi(x)ϕk(x) d x

∣∣∣ ≤ ∫B1(0)

|ϕk(x)| d x

において，k → ∞とすれば∫A∪B

|gxi| d x ≤

∫A∪B

d x = |A| + |B|.

よって，(1 + ε)(|A| + |B|) ≤ |A| + |B|.

すなわち，|A| = |B| = 0. これから，

|gxi| ≤ 1 a.e. in Bδ(0).

少し工夫すれば，|Dg| ≤ 1 a.e. in Bδ(0).

補題 1.16. g ∈ Lip(B1(0))とし，ω ∈ C([0, 1))が存在し，

g(0) = 0, |Dg(x)| ≤ ω(|x|)|x| a.e. in B1(0)

が成り立つとする．ただし，ω(0) = 0, ωは非減少関数であるとする．このとき，

g(x) = o(|x|2) (x → 0).

証明. r ∈ (0, 1)とする．

|Dg(x) ≤ ω(r)r a.e. in Br(0)

が成り立つ．補題 1.15より，

|g(x) − g(y)| ≤ ω(r)r|x − y| ∀x, y ∈ Br(0).

特に，|g(x)| = |g(x) − g(0)| ≤ ω(r)r|x| ≤ ω(r)r2.

これから，|g(x)| ≤ ω(|x|)|x|2 ∀x ∈ B1(0).

が分かる．

Jensenの補題のための準備

ここの Jensenは Loyola大学のRobert Jensen教授を参照している．

http://www.luc.edu/math/ftfaculty/jensenrobert.shtml

f : Ω → Rを考える．次を仮定する．Ω は有界開集合, f ∈ C2(Ω),

f(x) < 0 on ∂Ω, maxΩ f > 0.

a ∈ Rn, b ∈ Rのとき，関数 l(x) := a · x+ bを１次関数という．１次関数の全体をLと表す．

Γ = x ∈ Ω : ∃l ∈ L s.t. l ≥ 0 ∨ f on Ω, l(x) = f(x)とおいて，関数 f の（上方）接触集合 (upper contact set)を定義する．x ∈ Γ とする．Γ の定義における l ∈ Lは

l(z) = f(x) +Df(x) · (z − x)

と表すことができる．さらに，l(x) ≥ 0 > f(x) ∀x ∈ ∂Ω なので，Γ ⊂ Ω. f − lは xで最大値をとるので，

0 ≥ D2(f − l)(x) = D2f(x).

Γ ∗ ⊂ Γ をつぎで定義する．

Γ ∗ = x ∈ Γ : detD2f(x) = 0,

f(x) +Df(x) · (z − x) > f(z) ∀z ∈ Ω \ x.x ∈ Γ ∗のとき，D2f(x) ≤ 0, detD2f(x) = 0であるから，D2f(x) < 0.

補題 1. Γ ∗ は開集合である．

証明. x ∈ Γ ∗とし，δ > 0を

Bδ(x) ⊂ Ω, D2f(x) < 0 ∀x ∈ Bδ(x)

満たすものとする．l ∈ Lをl(z) = f(x) +Df(x) · (z − x)

と定める．l(z) > f(z) ∀z ∈ Ω \ x

だから，γ = min(l − f)(z) : Ω \Bδ(x)

とおくとき，γ > 0となる．ε > 0を ε < δとし，さらに y ∈ Bε(x)に対して，

ly(z) = f(y) +Df(y) · (z − y)

とおく．ε ∈ (0, δ)を十分に小さく取れば，

|l(z)− ly(z)| < γ ∀z ∈ Ω \Bδ(x).1

2

このとき，

ly(z) > l(z)− γ = l(z)− f(z)− γ + f(z) ≥ f(z) ∀z ∈ Ω \Bδ(x).

一方，y ∈ Bε(x)とし，z ∈ Bδ(x) \ yとする．テイラーの定理より，ある θ ∈ (0, 1)に対して

f(z) = f(y) +Df(y) · (z − y) +1

2D2f(y + θ(z − y))(z − y) · (z − y).

y + θ(z − y) ∈ Bδ(x)であり，D2f(y + θ(z − y)) < 0が成り立つので，

f(z) = f(y) +Df(y) · (z − y) +1

2D2f(y + θ(z − y))(z − y) · (z − y)

< f(y) +Df(y) · (z − y) = ly(z).

以上より，y ∈ Bε(x)ならば，D2f(y) < 0,

ly(z) > f(z) ∀z ∈ Ω \ y.

よって，Bε(x) ⊂ Γ ∗であり，Γ ∗は開集合である．補題 2. Df(Γ ∗)は開集合である．

証明. p ∈ Df(Γ ∗)とする．p = Df(x)となる x ∈ Γ ∗が対応する．補題 3により，ε > 0が存在し，Bε(x) ⊂ Γ ∗が成り立つ．detD2f(x) = 0だから，逆関数定理により，xと pのそれぞれの近傍U ⊂ Bε(x), V が存在し，Df : U → V は微分同型になる．V = Df(U) ⊂ Df(Γ ∗)は pの近傍であるから，Df(Γ ∗)は開集合である．つぎの集合 S1, S2 ⊂ Rnを考える．

S1 = x ∈ Γ : detD2f(x) = 0.l ∈ Lと x ∈ Ωに対して，2条件

(1) l ≥ f on Ω,

と

(2) l(x) = f(x)

を考えて，

S2 = x ∈ Γ : ∃l ∈ L, y ∈ Ω\x s.t. (1), (2), l(y) = f(y) が成り立つ(1), (2)が成り立つとき，l − f は xで最小値を取る．

f ∈ C2(Ω) だから，Df : Ω → Rnは Lipschitz連続である．「凸関数の 2次微分」における補題 1.1により，

補題 3. Df(S1)は零集合である．

補題 4. Df(S2)は零集合である．

3

証明. 関数 g : Rn → Rを

g(p) = maxx∈Ω

(f(x)− p · x)

とおいて定義する．この関数 gは Lipschitz連続，かつ凸関数である．Lipschitz連続だから，殆どいたる所で微分可能である．

N = p ∈ Rn : g は pで微分不可能

とおくと，N は零集合である．p ∈ Rn \N を固定する．x ∈ Ωを

g(p) = f(x)− p · x

をみたす点（最大点）とする．p → pとするとき，

f(x)− p · x ≤ g(p) = g(p) +Dg(p) · (p− p) + o(|p− p|)= f(x)− p · x+Dg(p) · (p− p) + o(|p− p|).

したがって，p → pのとき，

(Dg(p) + x) · (p− p) = o(|p− p|).

上の式に p = p+ ε(Dg(p) + x)を代入し，ε → 0+とすれば，

|Dg(p) + x| = 0

を得る．すなわち，

x = −Dg(p).

これは，関数

x 7→ f(x)− p · x, Ω → Rが最大値を取る点が−Dg(p)に限られる（1点でのみ最大値をとる）ことを意味する．

p ∈ Df(S2)とする．p = Df(x)となる x ∈ S2を取る．(1)と (2)をみたす l ∈ Lがある．

(f − l)(x) = 0, (f − l)(z) ≤ 0 ∀z ∈ Ω

が成り立つので，f − lは最大値を xで取る．x ∈ S2なので，y ∈ Ω,y = x, が存在し，f − lは yにおいても最大値を取る．Df(x) = Dl(x)だから，l(z) = p · z + qとなる q ∈ Rがある．関数

z 7→ f(z)− p · z, Ω → R

は xと yで最大値をとる．したがって，p ∈ N が分かる．すなわち，Df(S2) ⊂ Nであり，Nは零集合だから，Df(S2)も零集合である．

補題 5. Df : Γ ∗ → Df(Γ ∗)は単射である．

4

証明. Df(x1) = Df(x2), x1, x2 ∈ Γ ∗とする．p := Df(x1) = Df(x2)とおく．

li(x) = f(xi) + p · (x− xi), i = 1, 2

とおくとき，Γ ∗の定義から，i = 1, 2に対して

f(xi) = li(xi), li(x) > f(x) ∀x ∈ Ω \ xi

が成り立つ．これから，仮に x1 = x2と仮定すれば

l1(x2) > f(x2) = l2(x2), l2(x1) > f(x1) = l1(x1).

これから，0 < l1(x2)− l2(x2) = f(x1)− f(x2) + p · (x2 − x1),

0 < l2(x1)− l1(x1) = f(x2)− f(x1) + p · (x1 − x2)

が分かるが，これは矛盾である．

以上より，変換

Df : Γ ∗ → Df(Γ ∗)

は全単射であり，Γ ∗, Df(Γ ∗)は開集合であり，Γ ∗ 上で detD2f = 0であるから，変数変換の公式が使える．従って，次の定理が成立する．(The Formula for Change in Variables in a Multiple Integral, J. T.Schwartz, The American Mathematical Monthly, Vol. 61, No. 2 (Feb.,1954), pp. 81-85.

http://www.jstor.org/stable/2307790?seq=1#page_scan_tab_contents

を参照)

定理 6. h ∈ L1(Df(Γ ∗))であれば，∫Df(Γ ∗)

h(p) d p =

∫Γ ∗

h(Df(x))| detD2f(x)| dx.

Jensenの補題

以下では，「f ∈ C2(Ω」の仮定を削除する．代わりに

(3) f(x) = g(x)− A

2|x|2 ∀x ∈ Rn

を仮定する．ただし，A ≥ 0は定数であり，g : Rn → Rは凸関数であるとする．このような関数 f を semi-convex（半凸）関数と呼ぶ．以前と同じく，

(4) max∂Ω

f < 0, maxΩ

f > 0

を仮定する．

5

ρεを通常の軟化子とする．特に，supp ρε ⊂ Bε, ρε ≥ 0を満たすとする．

gε = g ∗ ρε, fε(x) = gε(x)−A

2|x|2

とおく．以下では，ε > 0は十分に小さいものとして，

(5) max∂Ω

fε < 0, maxΩ

fε > 0

が成り立つものとする．前節の Γ と Γ ∗と同様に，

Γε : = x ∈ Ω : fε(x) +Dfε(x) · (y − x) ≥ 0 ∨ fε(y) ∀y ∈ Ω,Γ ∗ε : = x ∈ Γε : fε(x) +Dfε(x) · (y − x) > fε(y) ∀y ∈ Ω \ x,

detD2fε(x) < 0

とおく．さらに，

Γ := x ∈ Ω : ∃l ∈ L s.t. l(y) ≥ 0 ∨ f(y) ∀y ∈ Ω, l(x) = f(x)

とおく．

補題 7. 次が成り立つ．

lim supε→0+

Γε ⊂ Γ.

証明. xj ∈ Γεj , εj → 0+とし，xj → x0とする．x0 ∈ Ωである．さらに，

lj(y) = fεj(xj) +Dfεj(xj) · (y − xj)

と置くとき，

(6) lj(y) ≥ fεj(y) ∨ 0 ∀y ∈ Ω

が成り立つ．R > 0を十分に大きく取って，

Ω ⊂ BR−1

が成り立つとする．εj ∈ (0, 1)が成り立つものとするとき，

∥Dgεj∥L∞(Ω) ≤ ∥Dg∥L∞(BR)

となり，

∥Dfεj∥L∞(Ω) ≤ ∥Dg∥L∞(BR) + AR

が成り立つ．特に，

|Dfεj(xj)| ≤ ∥Dg∥L∞(BR) + AR

となり，BW定理より，必要に応じて部分列に話を置き換えることにより，

Dfεj(xj) → p0

6

が成り立つものと仮定してよい．(6)において，yは固定し，j → ∞とすれば，

f(x0) + p0 · (y − x0) ≥ f(y) ∨ 0 ∀y ∈ Ω

が成り立つことが分かる．特に，x0 ∈ Ωである．また，(f(x0) + p0 · (y − x0)

)∣∣y=x0

= f(x0).

よって，x0 ∈ Γ . すなわち，

lim supε→0+

Γε ⊂ Γ.

が成り立つ．補題 8. r > 0を

r <maxΩ f

diam(Ω)

が成り立つものとするとき，ε > 0を十分に小さく取れば

Br ⊂ Dfε(Γε)

が成り立つ．

証明. ε > 0は十分小さく，

max∂Ω

fε < 0, maxΩ

fε > 0,maxΩ fεdiam(Ω)

> r

が成り立つものとする．x ∈ ΩをfεのΩにおける最大点とする．p ∈ Br

とし，関数

y 7→ (0 ∨ fε)(y)− p · (y − x)

のΩ上での最大点を zとするとき，

(0 ∨ fε)(z)− p · (z − x) ≥ (0 ∨ fε)(x) = fε(x) > 0

が成り立つ．さらに，

0 ∨ fε(z) ≥ fε(x)− |p||z − x|> fε(x)− r diam(Ω) > fε(x)− fε(x) = 0

が成り立ち，fε(z) > 0と z ∈ Ωが分かる．さらに，Dfε(z) = pが分かる．

(0 ∨ fε)(y)− p · (y − x) ≤ (0 ∨ fε)(z)− p · (z − x) ∀y ∈ Ω

だから，

(0 ∨ fε)(y) ≤ p · (y − z) + fε(z) ∀y ∈ Ω

であり，z ∈ Γ が分かる．従って，p = Dfε(z) ∈ Dfε(Γ )である．よって，Br ⊂ Dfε(Γ ).

7

定理 9. max∂Ω f < 0, maxΩ f > 0,

f(x) = g(x)− A

2|x|2 ∀x ∈ Rn

が成り立つとする．ただし，gは凸関数であるとする．

R :=maxΩ f

diam(Ω)

とおく．h ∈ C(Ω)が h ≥ 0 (on Ω)を満たすとき，∫BR

h(p) d p ≤ An

∫Γ

h(Df(x)) d x

が成り立つ．

証明. r ∈ (0, R)を固定する．ε > 0は十分に小さいものとし，前の議論のように fεを定義する．補題 8によれば，Br ⊂ Dfε(Γε)が成り立つ．したがって，定理 6によれば，∫

Br

h(p) d p ≤∫Dfε(Γε)

h(p) d p ≤∫Γε

h(Dfε(x))| detD2fε(x)| dx

が成り立つ．次に注意する：

D2gε(x) ≥ 0 ∀x ∈ Rn.

したがって，

D2fε(x) = D2gε(x)− AI ≥ −AI ∀x ∈ Rn

である．一方，x ∈ Γεのとき，

fε(y) ≤ fε(x) +Dfε(x) · (y − x) ∀y ∈ Ω

であり，

D2fε(x) ≤ 0.

以上より，

| detD2fε(x)| = An ∀x ∈ Γε

が分かる．よって，∫Br

h(p) d p ≤ An

∫Γε

h(Dfε(x))| d x.

補題 7により，lim supε→0+

1Γε(x) ≤ 1Γ (x) ∀x ∈ Ω.

また，M > 0をΩ ⊂ BMが成り立つように選んだとき，Dg ∈ L∞(BM)であり，従って，ε → 0+のとき，

Dgε = ρε ∗Dg → Dg in Lp(Ω)

8

が成り立つ．特に，

limε→0+

Dgε(x) = Dg(x) a.e. in Ω

が成り立つ．Fatouの補題により，∫Ω

lim supε→0+

h(Dfε(x))1Γε(x) d x ≥ lim supε→0+

∫Ω

h(Dfε(x))1Γε(x) d x

であるから，

lim supε→0+

∫Γε

h(Dfε(x)) d x ≤∫Γ

h(Df(x)) d x.

が成り立ち，よって∫Br

h(p) d p ≤ An

∫Γ

h(Df(x)) d x.

が成り立つ．最後に，r → Rとして，∫BR

h(p) d p ≤ An

∫Γ

h(Df(x)) d x.

を得る．定理 9において，h(p) ≡ 1と取れば，

系 10. つぎが成り立つ．

ωnRn ≤ An|Γ |.

特に，|Γ | > 0.

系 11 (Jensenの補題). f : Rn → Rは半凸 (semi-convex)関数であり，原点 0で狭義の極大値を取るとする．このとき，Rnの点列 xk, pkが存在し，つぎが成り立つ．

limk→∞

xk = limk→∞

pk = 0,

x 7→ f(x)− pk · x は xkで極大値を取る，

f は xkで 2次微分を持つ．

証明. f が 0で狭義の極大値を取るので，

max∂B1/k

f < f(0) ∀k ≫ 1

が成り立つ．以下では，k ≫ 1に対して，xk, pkを定める．a ∈ Rをmax∂B1/k

f < a < f(0)

と取り，fa(x) = f(x)− aと定義する．

max∂B1/k

fa < 0 < fa(0)

9

が成り立つ．

Γa = x ∈ B1/k : ∃l ∈ L s.t. l(x) = fa(x), l ≥ 0 ∨ fa on B1/k系 10によれば，|Γa| > 0である．一方，

F = x ∈ B1/k : fa は xで 2次微分を持つと置くと，|F | = |B1/k|であり，|F∩Γa| = |Γa| > 0. 従って，xa ∈ F∩Γa

が存在する．Γaの定義によれば，

(7) fa(xa) +Dfa(xa) · (x− xa) ≥ (fa ∨ 0)(x) ∀x ∈ B1/k

を満たす．pa = Dfa(xa) = Df(xa)と置き，上の式 (7)で x = xaと取れば，

f(xa)− a ≥ 0.

従って，a → f(0)− 0とするとき，xa → 0となることが分かる．以下では，

|xa| ≤ 1/(2k), f(xa)− a ≤ 1

4k2

が成り立つ程度に aを f(0)に近く取っておく．式 (7)において，x =xa − pa/(2k|pa|+ 1)と取れば，

f(xa)− a− |pa|2

2k|pa|+ 1≥ 0.

よって，|pa|2

2k|pa|+ 1≤ 1

4k2

であり，さらに，

|pa|2 ≤|pa|2k

+1

4k2≤ |pa|2

2+

1

2k2.

従って，

|pa| ≤1

k.

このとき，xk = xa, pk = paと取ればよい．

Documents

A quick review of convex analysis convex analysis