32
1. A quick review of convex analysis convex_analysis We discuss here basic properties of convex functions on R n . By definition, a subset C of R n is convex if and only if (1 t)x + ty C for all x, y C, 0 <t< 1. For a given function f : U R n [−∞, ], its epigraph epi(f ) is defined as epi(f )= {(x, y) U × R : y f (x)}. A function f : U [−∞, ] is said to be convex if epi(f ) is a convex subset of R n+1 . We are henceforth concerned with functions defined on R n . When we are given a function f on U with U being a proper subset of R n , we may think of f as a function defined on R n having value on the set R n \ U . It is easily checked that a function f : R n [−∞, ] is convex if and only if for all x, y R n , t, s R and λ [0, 1], f ((1 λ)x + λy) (1 λ)t + λs if t f (x) and s f (y). From this, we see that a function f : R n (−∞, ] is convex if and only if for all x, y R n and λ [0, 1], f ((1 λ)x + λy) (1 λ)f (x)+ λf (y). Here we use the convention for extended real numbers, i.e., for any x R, −∞ <x< , x ±∞ = ±∞, x · (±∞)= ±∞ if x> 0, 0 · (±∞) = 0, etc. Any affine function f (x)= a · x + b, where a R n and b R, is a convex function on R n . Moreover, if A R n and B R are nonempty sets, then the function on R n given by f (x) = sup{a · x + b :(a, b) A × B} is a convex function. Note that this function f is lower semicontinuous on R n . We restrict our attention to those functions which take values only in (−∞, ]. global-subd Proposition 1. Let f : R n (−∞, ] be a convex function. As- sume that p D - f (y) for some y,p R n . Then f (x) f (y)+ p · (x y) for all x R n . 証明. By the definition of D - f (y), we have f (x) f (y)+ p · (x y)+ o(|x y|) as x y. Hence, fixing x R n , we get f (y) f (tx + (1 t)y) tp · (x y)+ o(t) as t 0+ . 1

A quick review of convex analysis convex analysis

  • Upload
    others

  • View
    8

  • Download
    0

Embed Size (px)

Citation preview

Page 1: A quick review of convex analysis convex analysis

1. A quick review of convex analysisconvex_analysis

We discuss here basic properties of convex functions on Rn.By definition, a subset C of Rn is convex if and only if

(1− t)x+ ty ∈ C for all x, y ∈ C, 0 < t < 1.

For a given function f : U ⊂ Rn → [−∞, ∞], its epigraph epi(f) isdefined as

epi(f) = (x, y) ∈ U × R : y ≥ f(x).A function f : U → [−∞, ∞] is said to be convex if epi(f) is a convexsubset of Rn+1.

We are henceforth concerned with functions defined on Rn. Whenwe are given a function f on U with U being a proper subset of Rn, wemay think of f as a function defined on Rn having value ∞ on the setRn \ U .

It is easily checked that a function f : Rn → [−∞, ∞] is convex ifand only if for all x, y ∈ Rn, t, s ∈ R and λ ∈ [0, 1],

f((1− λ)x+ λy) ≤ (1− λ)t+ λs if t ≥ f(x) and s ≥ f(y).

From this, we see that a function f : Rn → (−∞, ∞] is convex if andonly if for all x, y ∈ Rn and λ ∈ [0, 1],

f((1− λ)x+ λy) ≤ (1− λ)f(x) + λf(y).

Here we use the convention for extended real numbers, i.e., for anyx ∈ R, −∞ < x < ∞, x ± ∞ = ±∞, x · (±∞) = ±∞ if x > 0,0 · (±∞) = 0, etc.

Any affine function f(x) = a · x + b, where a ∈ Rn and b ∈ R, is aconvex function on Rn. Moreover, if A ⊂ Rn and B ⊂ R are nonemptysets, then the function on Rn given by

f(x) = supa · x+ b : (a, b) ∈ A×Bis a convex function. Note that this function f is lower semicontinuouson Rn. We restrict our attention to those functions which take valuesonly in (−∞, ∞].

global-subd Proposition 1. Let f : Rn → (−∞, ∞] be a convex function. As-sume that p ∈ D−f(y) for some y, p ∈ Rn. Then

f(x) ≥ f(y) + p · (x− y) for all x ∈ Rn.

証明. By the definition of D−f(y), we have

f(x) ≥ f(y) + p · (x− y) + o(|x− y|) as x → y.

Hence, fixing x ∈ Rn, we get

f(y) ≤ f(tx+ (1− t)y)− tp · (x− y) + o(t) as t → 0 + .1

Page 2: A quick review of convex analysis convex analysis

2

Using the convexity of f , we rearrange the above inequality and divideby t > 0, to get

f(y) ≤ f(x)− p · (x− y) + o(1) as t → 0 + .

Sending t → 0+ yields

f(x) ≥ f(y) + p · (x− y) for all x ∈ Rn. sup-convex Proposition 2. Let F be a nonempty set of convex functions on Rn

with values in (−∞, ∞]. Then supF is a convex function on Rn havingvalues in (−∞, ∞].

証明. It is clear that (supF)(x) ∈ (−∞, ∞] for all x ∈ Rn. If f ∈ F ,x, y ∈ Rn and t ∈ [0, 1], then we have

f((1− t)x+ ty) ≤ (1− t)f(x)+ tf(y) ≤ (1− t)(supF)(x)+ t(supF)(y)

and hence

(supF)((1− t)x+ ty) ≤ (1− t)(supF)(x) + t(supF)(y),

which proves the convexity of supF . We call a function f : Rn → (−∞, ∞] proper convex if the following

three conditions hold.

(i) f is convex on Rn.(ii) f ∈ LSC(Rn).(iii) f(x) ≡ ∞.

Let f : Rn → [−∞, ∞]. The conjugate convex function (or theLegendre-Fenchel transform) of f is the function f ⋆ : Rn → [−∞, ∞]given by

f ⋆(x) = supy∈Rn

(x · y − f(y)).

properness Proposition 3. If f is a proper convex function, then so is f ⋆.

subdifferentiability Lemma 1. If f is a proper convex function on Rn, then D−f(y) = ∅for some y ∈ Rn.

証明. We choose a point x0 ∈ Rn so that f(x0) ∈ R. Let k ∈ N, anddefine the function gk on B1(x0) by the formula gk(x) = f(x) + k|x−x0|2. Since gk ∈ LSC(B1(x0) and gk(x0) = g(x0) ∈ R, the functiongk has a finite minimum at a point xk ∈ B1(x0). Note that if k issufficiently large, then

min∂B1(x0)

gk = min∂B1(x0)

f + k > f(x0).

Fix such a large k, and observe that xk ∈ B1(x0) and, therefore,−2k(xk − x0) ∈ D−f(xk).

Page 3: A quick review of convex analysis convex analysis

3

Propositionproperness3. The function x 7→ x · y − f(y) is an affine function for

any y ∈ Rn. By Propositionsup-convex2, the function f ⋆ is convex on Rn. Also,

since the function x 7→ x · y− f(y) is continuous on Rn for any y ∈ Rn,as stated in Proposition

semicon:sup-inf??, the function f ⋆ is lower semicontinuous on

Rn.Since f is proper convex on Rn, there is a point x0 ∈ Rn such that

f(x0) ∈ R. Hence, we have

f ⋆(y) ≥ y · x0 − f(x0) > −∞ for all y ∈ Rn.

By Lemmasubdifferentiability1, there exist points y, p ∈ Rn such that p ∈ D−f(y). By

Propositionglobal-subd1, we have

f(x) ≥ f(y) + p · (x− y) for all x ∈ Rn.

That is,p · y − f(y) ≥ p · x− f(x) for all x ∈ Rn,

which implies that f ⋆(p) = p · y − f(y) ∈ R. Thus, we concludethat f ⋆ : Rn → (−∞, ∞], f ⋆ is convex on Rn, f ⋆ ∈ LSC(Rn) andf ⋆(x) ≡ ∞.

The following duality (called convex duality or Legendre-Fenchel du-ality) holds.

convex-duality Theorem 4. Let f : Rn → (−∞, ∞] be a proper convex function.Then

f ⋆⋆ = f.

証明. By the definition of f ⋆, we have

f ⋆(x) ≥ x · y − f(y) for all x, y ∈ Rn,

which reads

f(y) ≥ y · x− f ⋆(x) for all x, y ∈ Rn.

Hence,f(y) ≥ f ⋆⋆(y) for all y ∈ Rn.

Next, we show that

f ⋆⋆(x) ≥ f(x) for all x ∈ Rn.

We fix any a ∈ Rn and choose a point y ∈ Rn so that f(y) ∈ R. Wefix a number R > 0 so that |y − a| < R. Let k ∈ N, and consider thefunction gk ∈ LSC(BR(a)) defined by gk(x) = f(x) + k|x − a|2. Letxk ∈ BR(a) be a minimum point of the function gk. Noting that if k issufficiently large, then

gk(xk) ≤ f(y) + k|y − a|2 < min∂BR(a)

f + kR2 = min∂BR(a)

gk,

Page 4: A quick review of convex analysis convex analysis

4

we see that xk ∈ BR(a) for k sufficiently large. We henceforth assumethat k is large enough so that xk ∈ BR(a). We have

D−gk(xk) = D−f(xk) + 2k(xk − a) ∋ 0.

Accordingly, if we set ξk = −2k(xk − a), then we have ξk ∈ D−f(xk).By Proposition

global-subd1, we get

f(x) ≥ f(xk) + ξk · (x− xk) for all x ∈ Rn,

or, equivalently,

ξk · xk − f(xk) ≥ ξk · x− f(x) for all x ∈ Rn.

Hence,

ξk · xk − f(xk) = f ⋆(ξk).

Using this, we compute that

f ⋆⋆(a) ≥ a · ξk − f ⋆(ξk) = ξk · a− ξk · xk + f(xk)

= 2k|xk − a|2 + f(xk).

We divide our argument into the following cases, (a) and (b).Case (a): limk→∞ k|xk − a|2 = ∞. In this case, if we set m =

minBR(a) f , then we have

f ⋆⋆(a) ≥ lim infk→∞

2k|xk − a|2 +m = ∞,

and, therefore, f ⋆⋆(a) ≥ f(a).Case (b): lim infk→∞ k|xk − a|2 < ∞. We may choose a subsequence

xkjj∈N of xk so that limj→∞ xkj = a. Then we have

f ⋆⋆(a) ≥ lim infj→∞

(2kj|xkj − a|2 + f(xkj)

)≥ lim inf

j→∞f(xkj) ≥ f(a).

Thus, in both cases we have f ⋆⋆(a) ≥ f(a), which completes theproof.

convex-duality2 Theorem 5. Let f : Rn → (−∞, ∞] be proper convex and x, ξ ∈ Rn.Then the following three conditions are equivalent each other.

(i) ξ ∈ D−f(x).(ii) x ∈ D−f ⋆(ξ).(iii) x · ξ = f(x) + f ⋆(ξ).

証明. Assume first that (i) holds. By Propositionglobal-subd1, we have

f(y) ≥ f(x) + ξ · (y − x) for all y ∈ Rn,

which reads

ξ · x− f(x) ≥ ξ · y − f(y) for all y ∈ Rn.

Page 5: A quick review of convex analysis convex analysis

5

Hence,

ξ · x− f(x) = maxy∈Rn

(ξ · y − f(y)) = f ⋆(ξ).

Thus, (iii) is valid.Next, we assume that (iii) holds. Then the function y 7→ ξ · y− f(y)

attains a maximum at x. Therefore, ξ ∈ D−f(x). That is, (i) is valid.Now, by the convex duality (Theorem

convex-duality4), (iii) reads

x · ξ = f ⋆⋆(x) + f ⋆(ξ).

The equivalence between (i) and (iii), with f replaced by f ⋆, is exactlythe equivalence between (ii) and (iii). The proof is complete.

Finally, we give a Lipschitz regularity estimate for convex functions.

convex-Lip-estimate Theorem 6. Let f : Rn → (−∞, ∞] be a convex function. Assumethat there are constants M > 0 and R > 0 such that

|f(x)| ≤ M for all x ∈ B3R.

Then

|f(x)− f(y)| ≤ M

R|x− y| for all x, y ∈ BR.

証明. Let x, y ∈ BR and note that |x− y| < 2R. We may assume thatx = y. Setting ξ = (x − y)/|x − y| and z = y + 2Rξ and noting thatz ∈ B3R,

x− y =|x− y|2R

(z − y),

and

x = y +|x− y|2R

(z − y) =|x− y|2R

z +

(1− |x− y|

2R

)y,

we obtain

f(x) ≤ |x− y|2R

f(z) +

(1− |x− y|

2R

)f(y),

and

f(x)−f(y) ≤ |x− y|2R

(f(z)−f(y)) ≤ |x− y|2R

(|f(z)|+|f(y)|) ≤ M |x− y|R

.

In view of the symmetry in x and y, we see that

|f(x)− f(y)| ≤ M

R|x− y| for all x, y ∈ BR.

Page 6: A quick review of convex analysis convex analysis

6

2. Rademacher’s theoremsec:Rade

We give here a proof of Rademacher’s theorem.

Theorem 7 (Rademacher). Let B = B1 ⊂ Rn and f ∈ Lip(B). Thenf is differentiable almost everywhere in B.

To prove the above thoerem, we mainly follow the proof given in[AmbrosioTilli04?AmbrosioTilli04].

証明. We first show that f has a distributional gradient Df ∈ L∞(B).Let L > 0 be a Lipschitz bound of the function f . Let i ∈ 1, 2, ..., n

and ei denote the unit vector in Rn with unity as the i-th entry. Fixany ϕ ∈ C1

0(B) and observe that∫B

f(x)ϕxi(x) d x = lim

r→0+

∫B

f(x)ϕ(x+ rei)− ϕ(x)

rd x

= limr→0+

∫B

f(x− rei)− f(x)

rϕ(x) d x

and ∣∣∣ ∫B

f(x)ϕxi(x) d x

∣∣∣ ≤ L

∫B

|ϕ(x)| dx ≤ L|B|1/2∥ϕ∥L2(B).

Thus, the map

C10(B) ∋ ϕ 7→ −

∫B

f(x)ϕxi(x) d x ∈ R

extends uniquely to a bounded linear functional Gi on L2(B). By theRiesz representation theorem, there is a function gi ∈ L2(B) such that

Gi(ϕ) =

∫B

gi(x)ϕ(x) d x for all ϕ ∈ L2(B).

This shows that g = (g1, ..., gn) is the distributional gradient of f .We plug the function ϕ ∈ L2(B) given by ϕ(x) = (gi(x)/|gi(x)|)1Ek

(x),where k ∈ N and Ek = x ∈ B : |gi(x)| > L+1/k, into the inequality|Gi(ϕ)| ≤ L∥ϕ∥L1(B), to obtain∫

B

|gi(x)|1Ek(x) d x ≤ L

∫B

1Ek(x) d x = L|Ek|,

which yields

(L+ 1/k)|Ek| ≤ L|Ek|.Hence, we get |Ek| = 0 for all k ∈ N and |x ∈ B : |gi(x)| > L| = 0.That is, gi ∈ L∞(B) and |gi(x)| ≤ L a.e. in B.

Page 7: A quick review of convex analysis convex analysis

7

The Lebesgue differentiation theorem (see [SteinShakarchi05?SteinShakarchi05])

states that for a.e. x ∈ B, we have g(x) ∈ Rn and

Rade-1Rade-1 (2.1) limr→0+

1

rn

∫Br

|g(x+ y)− g(x)| d y = 0.

Now, we fix such a point x ∈ B and show that f is differentiableat x. Fix an r > 0 so that Br(x) ⊂ B. For δ ∈ (0, r), consider thefunction hδ ∈ C(B) given by

hδ(y) =f(x+ δy)− f(x)

δ.

We claim that

Rade-2Rade-2 (2.2) limδ→0

hδ(y) = g(x) · y uniformly for y ∈ B.

Note that hδ(0) = 0 and hδ is Lipschitz continuous with Lipschitzbound L. By the Ascoli-Arzela theorem, for any sequence δj ⊂ (0, r)converging to zero, there exist a subsequence δjkk∈N of δj and afunction h0 ∈ C(B) such that

limk→∞

hδjk(x) = h0(y) uniformly for y ∈ B.

In order to prove (Rade-22.2), we need only to show that h0(y) = g(x) · y for

all y ∈ B.Since hδ(0) = 0 for all δ ∈ (0, r), we have h0(0) = 0. We observe

from (Rade-12.1) that∫

B

|g(x+δy)−g(x)| d y =

∫Bδ

|g(x+y)−g(x)|δ−n d y → 0 as δ → 0.

Using this, we compute that for all ϕ ∈ C10(B),∫

B

h0(y)ϕyi(y) d y = limk→∞

∫B

hδjk(y)ϕyi(y) d y

= − limk→∞

∫B

gi(x+ δjky)ϕ(y) d y

= −∫B

gi(x)ϕ(y) d y =

∫B

g(x) · yϕyi(y) d y.

This guarantees that h0(y) − g(x) · y is constant for all y ∈ B whileh0(0) = 0. Thus, we see that h0(y) = g(x) · y for all y ∈ B, whichproves (

Rade-22.2).

Finally, we note that (Rade-22.2) yields

f(x+ y) = f(x) + g(x) · y + o(|y|) as y → 0.

Page 8: A quick review of convex analysis convex analysis

1. 凸関数の 2次微分

補題 1.1. J : Rn → Rnは Lipschitz関数とする.E ⊂ Rnを

E = x ∈ Rn : J は xで微分可能, det DJ(x) = 0

と定める.このとき,|J(E)| = 0.

形式的には,積分の変数変換の公式

|J(E)| =

∫J(E)

dy =

∫E

| det J(x)|dx = 0

から分かる.以下ではヴィタリの被覆定理の応用として証明する.

補題 1.2 (Vitali). E ⊂ Rnは可測集合,Bは球の族から成るEの被覆とする.

supB∈B

diam B < ∞

を仮定する.このとき

E ⊂∪j∈J

B∗j , Bj ∈ B ∀j ∈ J, Bi ∩ Bj = ∅ (i = j)

となる J ⊂ Nが存在する.ただし,球Bに対して,B∗は半径が 5倍のBの同心球を表す.

補題 1.1の証明. 次に注意する.

|J(E)| ≤∞∑

k=1

|J(E ∩ Bk(0))|

これより,任意のR > 0に対して

|J(E ∩ BR(0))| = 0

を示せばよい.R > 0を固定し,

ER = E ∩ BR(0)

とおく.これは可測集合である.JのLipschitz定数をL > 0とする.x ∈ ERを固定する.det DJ(x)∗ =

det DJ(x) = 0より (A∗で Aの転置行列を表す),DJ(x)∗の固有ベクトル e ∈ Rn, DJ(x)∗e = 0, |e| = 1,が存在する.このとき,

J(y) − J(x) = DJ(x)(y − x) + o(|y − x|) as y → x,

1

Page 9: A quick review of convex analysis convex analysis

2

であり,

(J(y) − J(x)) · e = DJ(x)(y − x) · e + o(|y − x|)= (y − x) · DJ(x)∗e + o(|y − x|)= o(|y − x|) as y → x.(1)

一方,|J(y) − J(x)| ≤ L|y − x| ∀y ∈ Rn

であり,J(y) ∈ BLr(J(x)) ∀y ∈ Br(x), r > 0.

ε > 0を固定する.(1)によれば,r ∈ (0, 1)を

|J(y) − J(x) · e| ≤ εr ∀y ∈ B5r(x)

が成り立つように取ることができる.このとき,

J(B5r(x)) ⊂ B5Lr(J(x)) ∩ y ∈ Rn : |y · e| ≤ εr.ここで,

|B5Lr(J(x)) ∩ y ∈ Rn : |y · e| ≤ εr|≤ ωn−1(5Lr)n−12εr = εC(n, L)rn

に注意する(高さ 2εrで半径 5Lrの円柱の体積).ただし,

C(n, L) = 2ωn−1(5L)n−1.

このように,それぞれの x ∈ ERに対して,rx ∈ (0, 1)が存在して,

(2) |J(B5rx(x))| ≤ εC(n, L)rnx .

各々の x ∈ ERに対して,このような rxを固定し,

B = Brx(x) : x ∈ ERと定めるとき,BはERの被覆である.

diam Brx(x) < 2 ∀x ∈ ER

に注意する.補題 1.2によれば,J ⊂ N, xjj∈J ⊂ ERが存在し,

(3) ER ⊂∪j∈J

B5rxj(xj), Brxi

(xi) ∩ Brxj(xj) = ∅ (i = j).

この包含関係より,

J(ER) ⊂∪j∈J

J(B5rxj(xj)).

したがって,(2)を用いて,

(4) |J(ER)| ≤∑j∈J

|J(B5rxj(xj))| ≤ εC(n, L)

∑j∈J

rnxj

.

Page 10: A quick review of convex analysis convex analysis

3

一方で,xj ∈ ER ⊂ BR(0), rxj

∈ (0, 1) ∀j ∈ J

なので,Brxj

(xj) ⊂ BR+1(0).

これと (3)の後者より,

ωn(R + 1)n = |BR+1(0)| ≥ |∪j∈J

Brxj(xj)| =

∑j∈J

|Brxj(xj)| = ωn

∑j∈J

rnxj

.

これと (4)より,|J(ER)| ≤ εC(n, L)(R + 1)n.

ここで,εは任意だから,|J(ER)| = 0.

補題 1.3. N ⊂ Rnとする.つぎの (1)と (2)は同値である.

(1) N は零集合(2) ∀ε > 0, ∃ 球の族 Bjj∈N such that

N ⊂∪j∈N

Bj,∑j∈N

|Bj| < ε.

証明. (2) =⇒ (1)を示す.(2)を仮定する.ε > 0とし,球の族Bjj∈Nを

N ⊂∪j∈N

Bj,∑j∈N

|Bj| < ε

をみたすように取る.いま,球Bj = Brj(xj)に対して,立方体Qjを

Qj =n∏

i=1

(xj,i − r, xj,i + r), xj = (xj,1, ..., xj,n)

とおけば,Bj ⊂ Qj, |Bj| = ωnr

nj , |Qj| = (2rj)

n

となる.したがって,

N ⊂∞∪

j=1

Qj,∞∑

j=1

|Qj| =ωn

2n

∞∑j=1

|Bj| <ωn

2nε.

よって,N は零集合である.(1) =⇒ (2)を示す.辺が座標軸に平行な直方体

P =n∏

i=1

(ai, bi), ai < bi

Page 11: A quick review of convex analysis convex analysis

4

を考える.P は開集合であり,各々の x ∈ P に対して,xを中心とする球Bxで,Bx ⊂ P をみたすものがある.このように選んだBxの族を Bと表す.このとき,

P =∪B∈B

B, diamB∈B B ≤ diam P < ∞.

補題 1.2によれば,可算集合 J ⊂ Nと Bjj∈J ⊂ Bが存在し,

P ⊂∪j∈J

B∗j , Bi ∩ Bj = ∅ (i = j)

が成り立つ.ただし,B∗j は半径が 5倍のBjの同心球を表す.このとき,

|P | ≥ |∪j∈J

Bj| =∑j∈J

|Bj|

であり, ∑j∈J

|B∗j | = 5n

∑j∈J

|Bj| ≤ 5n|P |.

B∗j をBjと書き直し,以上を纏めると

P ⊂∪j∈J

Bj,∑j∈J

|Bj| ≤ 5n|P |

をみたす球の族 Bjj∈J (J ⊂ N)が存在することが言える.(1)を仮定する.ε > 0とする.辺が座標軸に平行な直方体の族Pjj∈N

が存在し,

N ⊂∞∪

j=1

Pj,∑j∈N

|Pj| < ε

が成り立つ.上でみたように,各 Pj に対して,球の列 Bj,kk∈Nが存在し (Bj,k = ∅の可能性も許す),

Pj ⊂∪k∈N

Bj,k,∑k∈N

|Bj,k| ≤ 5n|Pj|

をみたす.以上より,

N ⊂∪

(j,k)∈N2

Bj,k,∑

(j,k)∈N2

|Bj,k| < 5nε.

よって,(2)が成立する.

補題 1.4. N ⊂ Rnは零集合,J : N → Rnは Lipschitz連続な関数とするとき,J(N)は零集合である.

Page 12: A quick review of convex analysis convex analysis

5

証明. J の Lipschitz定数を Lとする.ε > 0とするとき,N が零集合なので,球の族 Bjj∈Nが存在して,

N ⊂∪j∈N

Bj,∑j∈N

|Bj| < ε

が成り立つ.Bj = Brj(xj)とする.このとき,

|J(x) − J(xj)| ≤ L|x − xj| < Lrj ∀x ∈ Bj.

したがって,J(x) ∈ BLrj

(J(xj)) ∀x ∈ Bj.

すなわち,J(Bj) ⊂ BLrj

(J(xj)) ∀j ∈ N.

よって,J(N) ⊂

∪j∈N

J(Bj) ⊂∪j∈N

BLrj(J(xj)).

ここで, ∑j∈N

|BLrj(J(xj))| =

∑j∈N

Ln|Bj| < Lnε.

これより,J(N)は零集合である. 定理 1.5. f : Rn → Rは凸関数とする.このとき,ほとんどすべてのx ∈ Rnにおいて,f は 2次微分をもつ.すなわち,p ∈ RnとX ∈ Sn

が存在し,y → xのときに

f(y) = f(x) + p · (y − x) +1

2X(y − x) · (y − x) + o(|y − x|2).

Snは n × n実対称行列の全体を表す.以下では,凸関数 f : Rn → Rを固定して考えていく.

補題 1.6. すべての x ∈ Rnに対して,

y + D−f(y) ∋ x

は解 y ∈ Rnをもつ.

補題 1.7. g : Rn → Rを凸関数とする.y ∈ Rnとする.つぎは同値な命題である.

(1) 0 ∈ D−g(y).(2) gは yで最小値をとる.

証明. (1) =⇒ (2): 0 ∈ D−g(y)を仮定する.Proposition 1により,

g(x) ≥ g(y) + 0 · (x − y) = g(y) ∀x ∈ Rn

が成り立ち,gは yで最小値をとる.

Page 13: A quick review of convex analysis convex analysis

6

(2) =⇒ (1): gが yで最小値をとるとき,

g(x) ≥ g(y) = g(y) + 0 · (x − y) ∀x ∈ Rn

が成り立ち,0 ∈ D−g(y). 補題 1.8. g : Rn → Rは凸関数であるとする.R > 0とするとき,MR > 0が存在して,つぎが成り立つ.

x ∈ BR(0), p ∈ D−g(x) =⇒ |p| ≤ MR.

証明. Theorem 6によれば,gは局所Lipschitz関数である.したがって,

(1) |g(x) − g(y)| ≤ MR|x − y| ∀x, y ∈ BR(0)

となる定数MR > 0がある.x ∈ BR(0)を固定し,p ∈ D−g(x)となる p ∈ Rnを固定する.

(2) |p| ≤ MR

を示す.

(3) g(y) ≥ g(x) + p · (y − x) ∀y ∈ Rn

が成り立つ.p = 0ならば,明らかに,(2)が成り立つ.p = 0の場合を考える.t > 0を十分小さく選び,

x + tp ∈ BR(0)(開球)

とする.(3)と (1)より,

p · tp ≤ g(x + tp) − g(x) ≤ MRt|p|.これの各辺を t|p|で割って,|p| ≤ MRを得る. 補題 1.9. g : Rn → Rは凸関数とする.このとき,

D−g(x) = ∅ ∀x ∈ Rn.

証明. x ∈ Rnを固定する.gはほとんどいたる所で微分可能なので,

limk→∞

xk = x, D−g(xk) = Dg(xk) ∀k ∈ N

となる点列 xkk∈Nが存在する.各 k ∈ Nに対して,(1) g(y) ≥ g(xk) + pk · (y − xk) ∀y ∈ Rn.

補題 1.8によれば,|pk| ≤ M ∀k ∈ N

となるM > 0が存在する.BWの定理によれば,pkの収束部分列pkj

j が存在する.不等式 (1)において,k = kj, j → ∞とすれば,g(y) ≥ g(x) + p · (y − x) ∀y ∈ Rn

が得られる.ただし,p = limj→∞ pkj. したがって,p ∈ D−g(x)とな

り,D−g(x) = ∅.

Page 14: A quick review of convex analysis convex analysis

7

補題 1.6の証明. x ∈ Rnを固定する.関数

g(y) := f(y) +1

2|y − x|2

を考える.gはふたつの凸関数の和であり,凸関数である.補題 1.9をf に適用し,

f(y) ≥ f(0) + p · y ∀y ∈ Rn

が成り立つような p ∈ Rnが存在する.したがって,|y| → ∞のとき,

g(y) ≥ f(0)+p ·y+1

2|y−x|2 = f(0)+

1

2|y−x+p|2+p ·x− 1

2|p|2 → ∞.

よって,gはある点 z ∈ Rnで最小値をとる.補題 1.7によれば,

0 ∈ D−g(z) = D−f(z) + z − x.

すなわち,z + D−f(z) ∋ x.

補題 1.10. xi, yi ∈ Rn (i = 1, 2)はつぎをみたすとする.

yi + D−f(yi) ∋ xi i = 1, 2.

このとき,|y1 − y2| ≤ |x1 − x2|

が成り立つ.

証明. xi − yi ∈ D−f(yi)だから,

f(z) − f(yi) ≥ (xi − yi) · (z − yi) ∀z ∈ Rn, i = 1, 2.

したがって, f(y2) − f(y1) ≥ (x1 − y1) · (y2 − y1)

f(y1) − f(y2) ≥ (x2 − y2) · (y1 − y2).

差を取れば,

0 ≥ ((x1 − y1)− (x2 − y2)) · (y2 − y1) = |y1 − y2|2 − (x1 − x2) · (y1 − y2).

よって,|y1 − y2|2 ≤ |x1 − x2||y1 − y2|,

となり,|y1 − y2| ≤ |x1 − x2|.

補題 1.6と補題 1.10より,任意の x ∈ Rnに対して,

y + D−f(y) ∋ x

の解 y ∈ Rnがただ一つ存在する.そこで,xに対して,この yを対応させる写像 J : Rn → Rnを考える.J(x) = yであり,

J(x) + D−f(J(x)) ∋ x

Page 15: A quick review of convex analysis convex analysis

8

が成り立つ.補題 1.10によれば,Jは縮小写像 (contraction mapping)である.

|J(x) − J(y)| ≤ |x − y| ∀x, y ∈ Rn.

特に,Lipschitz連続関数である.

補題 1.11. 関数 J : Rn → Rnは全射である.

証明. y ∈ Rn を固定する.補題 1.9により,D−f(y) = ∅. そこで,p ∈ D−f(y)を選ぶ.このとき,

y + D−f(y) ∋ p + y.

すなわち,J(p + y) = y.

補題 1.12. J のグラフは閉集合である.

証明. 点列 (xk, yk) ⊂ R2nは (x, y) ∈ R2nに収束し,

J(xk) = yk ∀k ∈ Nが成り立つとする.J の定義より,

yk + D−f(yk) ∋ xk ∀k ∈ N.

さらに,

f(z) − f(yk) ≥ (xk − yk) · (z − yk) ∀z ∈ Rn, k ∈ N.

この式で,k → ∞とすれば,f(z) − f(y) ≥ (x − y) · (z − y) ∀z ∈ Rn.

これより,x − y ∈ D−f(y).

すなわち,y = J(x). よって,(x, y)は J のグラフ上の点である. 補題 1.13. x, y ∈ Rnとし,x = J(y)が成り立つとする.さらに,f はxで微分可能であるとする.このとき,

limr→0+

diamz ∈ Rn : J(z) ∈ Br(x) = 0.

例 1.1. n = 1とし,f(x) = |x|とする.このとき,

J(y) =

y + 1 (y < −1),

0 (−1 ≤ y ≤ 1),

y − 1 (y > 1).

f は x = 0で微分可能でない.r ∈ (0, 1)のとき,

z : J(z) ∈ Br(0) = z : J(z) ∈ (−r, r)⊃ z : J(z) = 0 = [−1, 1].

Page 16: A quick review of convex analysis convex analysis

9

証明. 背理法で示す.

lim supr→0+

diamz ∈ Rn : J(z) ∈ Br(x) > 0.

関数r 7→ diamz ∈ Rn : J(z) ∈ Br(x)

は単調増加関数である.したがって,上の lim supは limと等しい.δ > 0が存在して,

(1) diamz ∈ Rn : J(z) ∈ Br(x) ≥ δ ∀r > 0.

これから,

(2) z ∈ Rn : J(z) ∈ Br(x) ⊂ Bδ/2(y) ∀r > 0

が分かる.なぜなら,仮に,上の式で⊂が成り立つとすれば,

diamz ∈ Rn : J(z) ∈ Br(x) < 2 × δ

2= δ

となり,(1)と矛盾する.(2)により,k ∈ Nに対して,zk ∈ Rnが存在し,

(3) |J(zk) − x| <1

k, |zk − y| ≥ δ

2.

(3)の第1式より,limk→∞

J(zk) = x.

さらに,J(zk) + D−f(J(zk)) ∋ zk

と補題 1.8より,あるR > 0に対して,

D−f(J(zk)) ⊂ BR(0) ∀k ∈ N.

従って,zkは有界列である.BW定理より,収束する部分列 zkjj∈N

が存在する.補題 1.12より,

z = limj→∞

zkj

とおけば,limj→∞

(zkj, J(zkj

) = (z, x)

となり,x = J(z).

これはx + Df(x) = z

と書くことができる.一方で,x = J(y)であり,

x + Df(x) = y.

Page 17: A quick review of convex analysis convex analysis

10

よって,y = zが分かる.また,(3)の第 2式より,

|zkj− y| ≥ δ

2∀j ∈ N.

j → ∞とすれば,|z − y| ≥ δ/2. 矛盾である. 補題 1.14. 集合N ⊂ Rnを

N = x ∈ Rn : x において J は微分可能で, DJ(x) ∈ Snと定義する.N は零集合である.

証明. DJ で超関数の意味の導関数も表せば,DJ ∈ L∞(Rn, Rn×n) である.この補題の主張は

DJ(x) ∈ Sn a.e. x ∈ Rn

と言ってもよい.Theorem 7 (Rademacher)の証明を見ると,ほとんどすべての x ∈ Rnに対して

J(x + h) = J(x) + DJ(x) · h + o(|h|) (h → 0)

が示されている.ただし,右辺のDJは超関数の意味の導関数である.(要するに,通常の意味の微分係数と超関数の意味の微分係数が a.e.で一致する.)軟化子 ρεを用いて,f を近似する.すなわち,

fε(x) =

∫Rn

ρε(x − y)f(y) d y

とおいて,fε ∈ C∞(Rn)を定義する.fεは凸関数である.J と同様にJε ∈ Lip(Rn, Rn)が条件

Jε(x) + Dfε(Jε(x)) = x

により定義できる.この式から,直ぐに Jεが単射であることが分かり,Jεは関数

F : y 7→ y + Dfε(y), Rn → Rn

の逆関数である.Fi,yj

(y) = δij + fε,yiyj(y)

であり,DF (y) = I + D2fε(y)

と書き直すこともできる.D2fε(y)は非負定値行列であり,固有値はすべて 0以上である.したがって,DF (y)の固有値はすべて 1上であり,DF (y)は正則行列である.従って,逆関数定理が使えて,F の逆関数J もC∞級である.さらに,

DJε(x) = DF (Jε(x))−1 = (I + D2fε(Jε(x)))−1 ∈ Sn

が分かる.

Page 18: A quick review of convex analysis convex analysis

11

関数族 Jεε∈(0, 1)の局所一様有界性について調べる.f は局所 Lips-chitz連続であるから,Df ∈ L∞(B1(0))となる.このとき,

|fε(0)| ≤ ∥f∥L∞(B1(0)) ∀ε ∈ (0, 1).

以下では,ε ∈ (0, 1)とする.

0 + Dfε(0) = Dfε(0)

と考えると,Jε(Dfε(0)) = 0.

一方,Jεは縮小写像であるから,x ∈ Rnに対して

|Jε(x)| = |Jε(x) − Jε(Dfε(0))| ≤ |x − Dfε(0)| ≤ |x| + |Dfε(0)|

となり,

(1) |Jε(x)| ≤ |x| + ∥Df∥L∞(B1(0)).

J , Jεの定義より,z ∈ Rnに対して,fε(z) − fε(Jε(x)) ≥ (x − Jε(x)) · (z − Jε(x)),

f(z) − f(J(x)) ≥ (x − J(x)) · (z − J(x)).

したがってfε(J(x)) − fε(Jε(x)) ≥ (x − Jε(x)) · (J(x) − Jε(x)),

f(Jε(x)) − f(J(x)) ≥ (x − J(x)) · (Jε(x) − J(x)).

これより,

|J(x) − Jε(x)|2 ≤ (fε − f)(J(x)) + (f − fε)(Jε(x)).

これと (1)より,

limε→0

Jε(x) = J(x) 局所一様収束.

最後に,超関数として

Ji,xj= Jj,xi

∀i, j

を示す.ϕ ∈ C∞0 (Rn)とする.∫

Ji,xj(x)ϕ(x) d x = −

∫Ji(x)ϕxj

(x) d x = − limε→0

∫Jε,i(x)ϕxj

(x) d x

= limε→0

∫Jε,i,xj

(x)ϕ(x) d x.

Page 19: A quick review of convex analysis convex analysis

12

よって, ∫Ji,xj

(x)ϕ(x) d x = limε→0

∫Jε,i,xj

(x)ϕ(x) d x

= limε→0

∫Jε,j,xi

(x)ϕ(x) d x =

∫Jj,xi

(x)ϕ(x) d x.

これより,超関数として,

Ji,xj= Jj,xi

.

定理 1.5の証明. f が局所 Lipschitz なことを思い起こしながら,零集合N1を

N1 = x ∈ Rn : f は x で微分可能ではない

と定義する.J : Rn → Rnを x ∈ Rnに

y + D−f(y) ∋ x

をみたす yを対応させる写像として定義する.補題 1.10により,J は縮小写像である.したがって,J はほとんどいたる所で微分可能である.零集合N2を

N2 = x ∈ Rn : J は xで微分可能でない

と定義する.N3 ⊂ Rnを

N3 = x ∈ Rn : J は xで微分可能, DJ(x) ∈ Sn

補題 1.14より,N3は零集合である.補題 1.4より,

N4 := J(N2 ∪ N3)

は零集合である.

S := x ∈ Rn \ N2, det DJ(x) = 0

とおくとき,補題 1.1より,N5 := J(S)は零集合である.補題 1.11より,J : Rn → Rnは全射であり,

Rn = J(Rn) = J(N2 ∪ N3 ∪ S ∪ x ∈ Rn \ (N2 ∪ N3) : det DJ(x) = 0)= N4 ∪ N5 ∪ J(x ∈ Rn \ (N2 ∪ N3) : det DJ(x) = 0).

N = N1 ∪ N4 ∪ N5とおき,

F = J(x ∈ Rn \ (N2 ∪ N3) : det DJ(x) = 0) \ N1

とおく.このとき,

F ∪ N = Rn, |N | = 0.

Page 20: A quick review of convex analysis convex analysis

13

したがって,x ∈ F に対して,ある p ∈ Rn, A ∈ Snが存在して

(1) f(x + h) = f(x) + p · h +1

2Ah · h + o(|h|2) (h → 0)

を示せばよい.x ∈ F とする.F の定義より,f は xで微分可能で,したがって,

y := x + Df(x)

とおけば,J(y) = xとなり,さらに,

x + D−f(x) ∋ y

ような y は一意に定まる.F の定義より,J は y で微分可能であり,det DJ(y) = 0, DJ(y) ∈ Sn が成り立つ.したがって,

(2) f(x + h) = f(x) + Df(x) · h + o(|h|) (h → 0),

および

(3) J(y + k) = J(y) + DJ(y)k + o(|k|) (k → 0)

が成り立つ.C > 0を

|DJ(y)−1ξ| ≤ C|ξ| ∀ξ ∈ Rn

が成り立つように定める.(3)により,

(4) DJ(y)−1(J(y + k) − J(y)) = k + o(|k|) (k → 0).

J は全射なので,h ∈ Rnに対して

x + h = J(y + k)

となる k ∈ Rnが存在する.このような kを一つ選んで,k(h)と表す.補題 1.13によれば,

limr→0+

diamy + k(h) : h ∈ Br(0) = 0.

したがって,limh→0

k(h) = 0.

これと (4)より,δ > 0が存在し,

(5)|k(h)| = |DJ(y)−1(J(y + k(h)) − J(y))| + o(|k(h)|)

≤ C|h| + 1

2|k(h)| ∀h ∈ Bδ(0).

h ∈ Bδ(0)とすると,上の不等式から,

|k(h)| ≤ 2C|h|また,

|h| = |J(y + k(h)) − J(y)| ≤ |k(h)|.

Page 21: A quick review of convex analysis convex analysis

14

よって,

(6) |h| ≤ |k(h)| ≤ 2C|h| ∀h ∈ Bδ(0).

h ∈ Bδ(0), x + h ∈ F とする.関係 x = J(y), x + h = J(y + k(h))とJ の定義より,

x + Df(x) = y, x + h + Df(x + h) = y + k(h).

したがって,Df(x + h) = Df(x) + k(h) − h.

また,(4), (6)より,

k(h) = DJ(y)−1h + o(|h|).したがって,

(7) Df(x + h) = Df(x) + (DJ(y)−1 − I)h + o(|h|).以下では

A = DJ(y)−1 − I

とおく.A ∈ Snである.以上により,

(8) f(x + h) = f(x) + Df(x) · h +1

2Ah · h + o(|h|2)

が推測できる.以下では (8)を証明する.そこで,

g(h) = f(x + h) − f(x) − Df(x) · h − 1

2Ah · h

とおき,g : Bδ(0) → Rを定義する.h ∈ Bδ(0), x + h ∈ F とする.このとき,

g(0) = 0, Dg(h) = Df(x + h) − Df(x) − Ah, Dg(0) = 0.

さらに,補題 7より,

Dg(h) = o(|h|) (h → 0).

すなわち,ある非減少関数 ω ∈ C([0, 1))に対して

|Dg(h)| ≤ ω(|h|)|h|.仮に g ∈ C1(Bδ(0))であれば,

|g(h)| =∣∣∣g(0) +

∫ 1

0

Dg(th) · h d t∣∣∣ ≤ |h|

∫ 1

0

|Dg(th)| d t

≤ |h|2∫ 1

0

ω(t|h|) d t ≤ ω(|h|)|h|2 = o(|h|2).

g ∈ Lip(Bδ(0))の場合は,次の補題に譲る. 補題 1.15. g ∈ Lip(B1(0))とする.次の (1)と (2)は同値である.

Page 22: A quick review of convex analysis convex analysis

15

(1) |Dg(x)| ≤ 1 a.e. x ∈ B1(0).(2) |g(x) − g(y)| ≤ |x − y| ∀x, y ∈ B1(0).

証明. (1) =⇒ (2): δ ∈ (0, 1)として,(2)の不等式を x, y ∈ Bδ(0)に対して示せばよい.δ ∈ (0, 1)とし,ε ∈ (0, 1 − δ)となるように取る.ρεを標準的軟化子とする.

gε(x) =

∫Bε(0)

ρε(y)g(x − y) d y (x ∈ Bδ(0))

とおく.

Dg(x) = Dx

∫B1(x)

ρε(x − y)g(y) d y

=

∫B1(x)

(Dρε)(x − y)g(y) d y =

∫B1(x)

ρε(x − y)Dg(y) d y

となり,|Dg(x)| ≤ 1 ∀x ∈ Bδ(0)

が分かる.このとき,平均値の定理より

|g(x) − g(y)| ≤ |x − y| ∀x, y ∈ Bδ(0).

(2) =⇒ (1): δ ∈ (0, 1)として

|Dg(x)| ≤ 1 a.e. x ∈ Bδ(0)

を示せばよい.ϕ ∈ C10(Bδ(0))とする.h ∈ (0, 1 − δ)として,∫

Bδ(0)

g(x + hei)ϕ(x) d x =

∫B1(0)

g(x)ϕ(x − hei) d x

に注意する.これから,∣∣∣ ∫B1(0)

g(x)(ϕ(x − hei) − ϕ(x)) d x∣∣∣

=∣∣∣ ∫

Bδ(0)

g(x + hei)ϕ(x) d x −∫

Bδ(0)

g(x)ϕ(x) d x∣∣∣

≤ h

∫Bδ(0)

|ϕ(x)| d x,

さらに,h → 0として,∣∣∣ ∫B1(0)

g(x)ϕxi(x) d x

∣∣∣ ≤ ∫B1(0)

|ϕ(x)| d x.

よって, ∣∣∣ ∫B1(0)

gxi(x)ϕ(x) d x

∣∣∣ ≤ ∫B1(0)

|ϕ(x)| d x.

Page 23: A quick review of convex analysis convex analysis

16

ここで,ε > 0とし,関数

f(x) := 1A − 1B, ただし,A := gxi > 1 + ε, B := gxi< −1 − ε

を L1(B1(0))で近似する関数列 ϕk ⊂ C∞0 (B1(0))を考える.∣∣∣ ∫

B1(0)

gxi(x)ϕk(x) d x

∣∣∣ ≤ ∫B1(0)

|ϕk(x)| d x

において,k → ∞とすれば∫A∪B

|gxi| d x ≤

∫A∪B

d x = |A| + |B|.

よって,(1 + ε)(|A| + |B|) ≤ |A| + |B|.

すなわち,|A| = |B| = 0. これから,

|gxi| ≤ 1 a.e. in Bδ(0).

少し工夫すれば,|Dg| ≤ 1 a.e. in Bδ(0).

補題 1.16. g ∈ Lip(B1(0))とし,ω ∈ C([0, 1))が存在し,

g(0) = 0, |Dg(x)| ≤ ω(|x|)|x| a.e. in B1(0)

が成り立つとする.ただし,ω(0) = 0, ωは非減少関数であるとする.このとき,

g(x) = o(|x|2) (x → 0).

証明. r ∈ (0, 1)とする.

|Dg(x) ≤ ω(r)r a.e. in Br(0)

が成り立つ.補題 1.15より,

|g(x) − g(y)| ≤ ω(r)r|x − y| ∀x, y ∈ Br(0).

特に,|g(x)| = |g(x) − g(0)| ≤ ω(r)r|x| ≤ ω(r)r2.

これから,|g(x)| ≤ ω(|x|)|x|2 ∀x ∈ B1(0).

が分かる.

Page 24: A quick review of convex analysis convex analysis

Jensenの補題のための準備

ここの Jensenは Loyola大学のRobert Jensen教授を参照している.

http://www.luc.edu/math/ftfaculty/jensenrobert.shtml

f : Ω → Rを考える.次を仮定する.Ω は有界開集合, f ∈ C2(Ω),

f(x) < 0 on ∂Ω, maxΩ f > 0.

a ∈ Rn, b ∈ Rのとき,関数 l(x) := a · x+ bを1次関数という.1次関数の全体をLと表す.

Γ = x ∈ Ω : ∃l ∈ L s.t. l ≥ 0 ∨ f on Ω, l(x) = f(x)とおいて,関数 f の(上方)接触集合 (upper contact set)を定義する.x ∈ Γ とする.Γ の定義における l ∈ Lは

l(z) = f(x) +Df(x) · (z − x)

と表すことができる.さらに,l(x) ≥ 0 > f(x) ∀x ∈ ∂Ω なので,Γ ⊂ Ω. f − lは xで最大値をとるので,

0 ≥ D2(f − l)(x) = D2f(x).

Γ ∗ ⊂ Γ をつぎで定義する.

Γ ∗ = x ∈ Γ : detD2f(x) = 0,

f(x) +Df(x) · (z − x) > f(z) ∀z ∈ Ω \ x.x ∈ Γ ∗のとき,D2f(x) ≤ 0, detD2f(x) = 0であるから,D2f(x) < 0.

補題 1. Γ ∗ は開集合である.

証明. x ∈ Γ ∗とし,δ > 0を

Bδ(x) ⊂ Ω, D2f(x) < 0 ∀x ∈ Bδ(x)

満たすものとする.l ∈ Lをl(z) = f(x) +Df(x) · (z − x)

と定める.l(z) > f(z) ∀z ∈ Ω \ x

だから,γ = min(l − f)(z) : Ω \Bδ(x)

とおくとき,γ > 0となる.ε > 0を ε < δとし,さらに y ∈ Bε(x)に対して,

ly(z) = f(y) +Df(y) · (z − y)

とおく.ε ∈ (0, δ)を十分に小さく取れば,

|l(z)− ly(z)| < γ ∀z ∈ Ω \Bδ(x).1

Page 25: A quick review of convex analysis convex analysis

2

このとき,

ly(z) > l(z)− γ = l(z)− f(z)− γ + f(z) ≥ f(z) ∀z ∈ Ω \Bδ(x).

一方,y ∈ Bε(x)とし,z ∈ Bδ(x) \ yとする.テイラーの定理より,ある θ ∈ (0, 1)に対して

f(z) = f(y) +Df(y) · (z − y) +1

2D2f(y + θ(z − y))(z − y) · (z − y).

y + θ(z − y) ∈ Bδ(x)であり,D2f(y + θ(z − y)) < 0が成り立つので,

f(z) = f(y) +Df(y) · (z − y) +1

2D2f(y + θ(z − y))(z − y) · (z − y)

< f(y) +Df(y) · (z − y) = ly(z).

以上より,y ∈ Bε(x)ならば,D2f(y) < 0,

ly(z) > f(z) ∀z ∈ Ω \ y.

よって,Bε(x) ⊂ Γ ∗であり,Γ ∗は開集合である. 補題 2. Df(Γ ∗)は開集合である.

証明. p ∈ Df(Γ ∗)とする.p = Df(x)となる x ∈ Γ ∗が対応する.補題 3により,ε > 0が存在し,Bε(x) ⊂ Γ ∗が成り立つ.detD2f(x) = 0だから,逆関数定理により,xと pのそれぞれの近傍U ⊂ Bε(x), V が存在し,Df : U → V は微分同型になる.V = Df(U) ⊂ Df(Γ ∗)は pの近傍であるから,Df(Γ ∗)は開集合である. つぎの集合 S1, S2 ⊂ Rnを考える.

S1 = x ∈ Γ : detD2f(x) = 0.l ∈ Lと x ∈ Ωに対して,2条件

(1) l ≥ f on Ω,

(2) l(x) = f(x)

を考えて,

S2 = x ∈ Γ : ∃l ∈ L, y ∈ Ω\x s.t. (1), (2), l(y) = f(y) が成り立つ(1), (2)が成り立つとき,l − f は xで最小値を取る.

f ∈ C2(Ω) だから,Df : Ω → Rnは Lipschitz連続である.「凸関数の 2次微分」における補題 1.1により,

補題 3. Df(S1)は零集合である.

補題 4. Df(S2)は零集合である.

Page 26: A quick review of convex analysis convex analysis

3

証明. 関数 g : Rn → Rを

g(p) = maxx∈Ω

(f(x)− p · x)

とおいて定義する.この関数 gは Lipschitz連続,かつ凸関数である.Lipschitz連続だから,殆どいたる所で微分可能である.

N = p ∈ Rn : g は pで微分不可能

とおくと,N は零集合である.p ∈ Rn \N を固定する.x ∈ Ωを

g(p) = f(x)− p · x

をみたす点(最大点)とする.p → pとするとき,

f(x)− p · x ≤ g(p) = g(p) +Dg(p) · (p− p) + o(|p− p|)= f(x)− p · x+Dg(p) · (p− p) + o(|p− p|).

したがって,p → pのとき,

(Dg(p) + x) · (p− p) = o(|p− p|).

上の式に p = p+ ε(Dg(p) + x)を代入し,ε → 0+とすれば,

|Dg(p) + x| = 0

を得る.すなわち,

x = −Dg(p).

これは,関数

x 7→ f(x)− p · x, Ω → Rが最大値を取る点が−Dg(p)に限られる(1点でのみ最大値をとる)ことを意味する.

p ∈ Df(S2)とする.p = Df(x)となる x ∈ S2を取る.(1)と (2)をみたす l ∈ Lがある.

(f − l)(x) = 0, (f − l)(z) ≤ 0 ∀z ∈ Ω

が成り立つので,f − lは最大値を xで取る.x ∈ S2なので,y ∈ Ω,y = x, が存在し,f − lは yにおいても最大値を取る.Df(x) = Dl(x)だから,l(z) = p · z + qとなる q ∈ Rがある.関数

z 7→ f(z)− p · z, Ω → R

は xと yで最大値をとる.したがって,p ∈ N が分かる.すなわち,Df(S2) ⊂ Nであり,Nは零集合だから,Df(S2)も零集合である.

補題 5. Df : Γ ∗ → Df(Γ ∗)は単射である.

Page 27: A quick review of convex analysis convex analysis

4

証明. Df(x1) = Df(x2), x1, x2 ∈ Γ ∗とする.p := Df(x1) = Df(x2)とおく.

li(x) = f(xi) + p · (x− xi), i = 1, 2

とおくとき,Γ ∗の定義から,i = 1, 2に対して

f(xi) = li(xi), li(x) > f(x) ∀x ∈ Ω \ xi

が成り立つ.これから,仮に x1 = x2と仮定すれば

l1(x2) > f(x2) = l2(x2), l2(x1) > f(x1) = l1(x1).

これから,0 < l1(x2)− l2(x2) = f(x1)− f(x2) + p · (x2 − x1),

0 < l2(x1)− l1(x1) = f(x2)− f(x1) + p · (x1 − x2)

が分かるが,これは矛盾である.

以上より,変換

Df : Γ ∗ → Df(Γ ∗)

は全単射であり,Γ ∗, Df(Γ ∗)は開集合であり,Γ ∗ 上で detD2f = 0であるから,変数変換の公式が使える.従って,次の定理が成立する.(The Formula for Change in Variables in a Multiple Integral, J. T.Schwartz, The American Mathematical Monthly, Vol. 61, No. 2 (Feb.,1954), pp. 81-85.

http://www.jstor.org/stable/2307790?seq=1#page_scan_tab_contents

を参照)

定理 6. h ∈ L1(Df(Γ ∗))であれば,∫Df(Γ ∗)

h(p) d p =

∫Γ ∗

h(Df(x))| detD2f(x)| dx.

Jensenの補題

以下では,「f ∈ C2(Ω」の仮定を削除する.代わりに

(3) f(x) = g(x)− A

2|x|2 ∀x ∈ Rn

を仮定する.ただし,A ≥ 0は定数であり,g : Rn → Rは凸関数であるとする.このような関数 f を semi-convex(半凸)関数と呼ぶ.以前と同じく,

(4) max∂Ω

f < 0, maxΩ

f > 0

を仮定する.

Page 28: A quick review of convex analysis convex analysis

5

ρεを通常の軟化子とする.特に,supp ρε ⊂ Bε, ρε ≥ 0を満たすとする.

gε = g ∗ ρε, fε(x) = gε(x)−A

2|x|2

とおく.以下では,ε > 0は十分に小さいものとして,

(5) max∂Ω

fε < 0, maxΩ

fε > 0

が成り立つものとする.前節の Γ と Γ ∗と同様に,

Γε : = x ∈ Ω : fε(x) +Dfε(x) · (y − x) ≥ 0 ∨ fε(y) ∀y ∈ Ω,Γ ∗ε : = x ∈ Γε : fε(x) +Dfε(x) · (y − x) > fε(y) ∀y ∈ Ω \ x,

detD2fε(x) < 0

とおく.さらに,

Γ := x ∈ Ω : ∃l ∈ L s.t. l(y) ≥ 0 ∨ f(y) ∀y ∈ Ω, l(x) = f(x)

とおく.

補題 7. 次が成り立つ.

lim supε→0+

Γε ⊂ Γ.

証明. xj ∈ Γεj , εj → 0+とし,xj → x0とする.x0 ∈ Ωである.さらに,

lj(y) = fεj(xj) +Dfεj(xj) · (y − xj)

と置くとき,

(6) lj(y) ≥ fεj(y) ∨ 0 ∀y ∈ Ω

が成り立つ.R > 0を十分に大きく取って,

Ω ⊂ BR−1

が成り立つとする.εj ∈ (0, 1)が成り立つものとするとき,

∥Dgεj∥L∞(Ω) ≤ ∥Dg∥L∞(BR)

となり,

∥Dfεj∥L∞(Ω) ≤ ∥Dg∥L∞(BR) + AR

が成り立つ.特に,

|Dfεj(xj)| ≤ ∥Dg∥L∞(BR) + AR

となり,BW定理より,必要に応じて部分列に話を置き換えることにより,

Dfεj(xj) → p0

Page 29: A quick review of convex analysis convex analysis

6

が成り立つものと仮定してよい.(6)において,yは固定し,j → ∞とすれば,

f(x0) + p0 · (y − x0) ≥ f(y) ∨ 0 ∀y ∈ Ω

が成り立つことが分かる.特に,x0 ∈ Ωである.また,(f(x0) + p0 · (y − x0)

)∣∣y=x0

= f(x0).

よって,x0 ∈ Γ . すなわち,

lim supε→0+

Γε ⊂ Γ.

が成り立つ. 補題 8. r > 0を

r <maxΩ f

diam(Ω)

が成り立つものとするとき,ε > 0を十分に小さく取れば

Br ⊂ Dfε(Γε)

が成り立つ.

証明. ε > 0は十分小さく,

max∂Ω

fε < 0, maxΩ

fε > 0,maxΩ fεdiam(Ω)

> r

が成り立つものとする.x ∈ ΩをfεのΩにおける最大点とする.p ∈ Br

とし,関数

y 7→ (0 ∨ fε)(y)− p · (y − x)

のΩ上での最大点を zとするとき,

(0 ∨ fε)(z)− p · (z − x) ≥ (0 ∨ fε)(x) = fε(x) > 0

が成り立つ.さらに,

0 ∨ fε(z) ≥ fε(x)− |p||z − x|> fε(x)− r diam(Ω) > fε(x)− fε(x) = 0

が成り立ち,fε(z) > 0と z ∈ Ωが分かる.さらに,Dfε(z) = pが分かる.

(0 ∨ fε)(y)− p · (y − x) ≤ (0 ∨ fε)(z)− p · (z − x) ∀y ∈ Ω

だから,

(0 ∨ fε)(y) ≤ p · (y − z) + fε(z) ∀y ∈ Ω

であり,z ∈ Γ が分かる.従って,p = Dfε(z) ∈ Dfε(Γ )である.よって,Br ⊂ Dfε(Γ ).

Page 30: A quick review of convex analysis convex analysis

7

定理 9. max∂Ω f < 0, maxΩ f > 0,

f(x) = g(x)− A

2|x|2 ∀x ∈ Rn

が成り立つとする.ただし,gは凸関数であるとする.

R :=maxΩ f

diam(Ω)

とおく.h ∈ C(Ω)が h ≥ 0 (on Ω)を満たすとき,∫BR

h(p) d p ≤ An

∫Γ

h(Df(x)) d x

が成り立つ.

証明. r ∈ (0, R)を固定する.ε > 0は十分に小さいものとし,前の議論のように fεを定義する.補題 8によれば,Br ⊂ Dfε(Γε)が成り立つ.したがって,定理 6によれば,∫

Br

h(p) d p ≤∫Dfε(Γε)

h(p) d p ≤∫Γε

h(Dfε(x))| detD2fε(x)| dx

が成り立つ.次に注意する:

D2gε(x) ≥ 0 ∀x ∈ Rn.

したがって,

D2fε(x) = D2gε(x)− AI ≥ −AI ∀x ∈ Rn

である.一方,x ∈ Γεのとき,

fε(y) ≤ fε(x) +Dfε(x) · (y − x) ∀y ∈ Ω

であり,

D2fε(x) ≤ 0.

以上より,

| detD2fε(x)| = An ∀x ∈ Γε

が分かる.よって,∫Br

h(p) d p ≤ An

∫Γε

h(Dfε(x))| d x.

補題 7により,lim supε→0+

1Γε(x) ≤ 1Γ (x) ∀x ∈ Ω.

また,M > 0をΩ ⊂ BMが成り立つように選んだとき,Dg ∈ L∞(BM)であり,従って,ε → 0+のとき,

Dgε = ρε ∗Dg → Dg in Lp(Ω)

Page 31: A quick review of convex analysis convex analysis

8

が成り立つ.特に,

limε→0+

Dgε(x) = Dg(x) a.e. in Ω

が成り立つ.Fatouの補題により,∫Ω

lim supε→0+

h(Dfε(x))1Γε(x) d x ≥ lim supε→0+

∫Ω

h(Dfε(x))1Γε(x) d x

であるから,

lim supε→0+

∫Γε

h(Dfε(x)) d x ≤∫Γ

h(Df(x)) d x.

が成り立ち,よって∫Br

h(p) d p ≤ An

∫Γ

h(Df(x)) d x.

が成り立つ.最後に,r → Rとして,∫BR

h(p) d p ≤ An

∫Γ

h(Df(x)) d x.

を得る. 定理 9において,h(p) ≡ 1と取れば,

系 10. つぎが成り立つ.

ωnRn ≤ An|Γ |.

特に,|Γ | > 0.

系 11 (Jensenの補題). f : Rn → Rは半凸 (semi-convex)関数であり,原点 0で狭義の極大値を取るとする.このとき,Rnの点列 xk, pkが存在し,つぎが成り立つ.

limk→∞

xk = limk→∞

pk = 0,

x 7→ f(x)− pk · x は xkで極大値を取る,

f は xkで 2次微分を持つ.

証明. f が 0で狭義の極大値を取るので,

max∂B1/k

f < f(0) ∀k ≫ 1

が成り立つ.以下では,k ≫ 1に対して,xk, pkを定める.a ∈ Rをmax∂B1/k

f < a < f(0)

と取り,fa(x) = f(x)− aと定義する.

max∂B1/k

fa < 0 < fa(0)

Page 32: A quick review of convex analysis convex analysis

9

が成り立つ.

Γa = x ∈ B1/k : ∃l ∈ L s.t. l(x) = fa(x), l ≥ 0 ∨ fa on B1/k系 10によれば,|Γa| > 0である.一方,

F = x ∈ B1/k : fa は xで 2次微分を持つ と置くと,|F | = |B1/k|であり,|F∩Γa| = |Γa| > 0. 従って,xa ∈ F∩Γa

が存在する.Γaの定義によれば,

(7) fa(xa) +Dfa(xa) · (x− xa) ≥ (fa ∨ 0)(x) ∀x ∈ B1/k

を満たす.pa = Dfa(xa) = Df(xa)と置き,上の式 (7)で x = xaと取れば,

f(xa)− a ≥ 0.

従って,a → f(0)− 0とするとき,xa → 0となることが分かる.以下では,

|xa| ≤ 1/(2k), f(xa)− a ≤ 1

4k2

が成り立つ程度に aを f(0)に近く取っておく.式 (7)において,x =xa − pa/(2k|pa|+ 1)と取れば,

f(xa)− a− |pa|2

2k|pa|+ 1≥ 0.

よって,|pa|2

2k|pa|+ 1≤ 1

4k2

であり,さらに,

|pa|2 ≤|pa|2k

+1

4k2≤ |pa|2

2+

1

2k2.

従って,

|pa| ≤1

k.

このとき,xk = xa, pk = paと取ればよい.