21
2011 IA 2 変数関数の極大極小 I 16, 17, 18, 19, 20, 21 7 4 前書き すが、 2 っています。しか 、そ 「多変 いう 題を扱う っています。演 題に るこ プリントを するこ にしました。 プリント するこ 2 す。 ヘッセ行列 いう し、それが正定値負定値非定値 ある いうこ して する います が、そ 2 次式の判別式の正負ぎません。そこ 、こ プリント あえてヘッセ さず、「 2 える きる か」 いうこ きま した。 にする 、そ 意して さい。 1 テイラーの定理と極大極小 1 において、x = a におけるテイラー x = a しているように、多変 テイラー えるこ き、それを って多変 をある るこ きます。 1.1 なぜ極大極小を知りたいのか 1 るこ きます。テイラー いません。しかし、 2 に拡 するこ きません。 1 変数関数では増減表が書けるが 2 変数関数では書けない から す。 そこ 2 くようにするために、1 を「 から してみましょう。1 大雑把な 印をつ いだ されています。こ ように、 よい ら、 いうより、むしろ り」 り」に っている す。それさえ かれ だけ につかむこ きるわけ す。しか 、こ 2 きる しょう。つまり、2 グラフにおいて 」が こか

変数関数の極大極小 - lecture.ecc.u-tokyo.ac.jp2 変数関数の極大極小 2 という情報だけ得られればとりあえず満足としようじゃないか、というわけです。そこで、以下では「山折り」や「山頂」および「谷折り」や「谷底」がどこであるかを、増加減

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 変数関数の極大極小 - lecture.ecc.u-tokyo.ac.jp2 変数関数の極大極小 2 という情報だけ得られればとりあえず満足としようじゃないか、というわけです。そこで、以下では「山折り」や「山頂」および「谷折り」や「谷底」がどこであるかを、増加減

2011年度数学 IA演習補足

2変数関数の極大極小理 I 16, 17, 18, 19, 20, 21組

7月 4日 清野和彦

前書き

演習は今回が夏学期最後ですが、講義はあと 2回残っています。しかも、その講義で「多変数関数の極大極小の判定法」という重要な話題を扱う予定になっています。演習でその話題に全く触れ

ることができないので、補足プリントを配布することにしました。

このプリントで説明することは 2変数関数の極大極小の判定法です。講義ではヘッセ行列というものが登場し、それが正定値、負定値、非定値であるということを定義して判定すると思います

が、その本質は 2次式の判別式の正負に過ぎません。そこで、このプリントではあえてヘッセ行列

は出さず、「なぜ 2階偏微分を考えると極値判定ができるのか」ということの説明に重点を置きました。講義との対応を気にする場合には、その点に注意して下さい。

1 テイラーの定理と極大極小

1変数関数において、x = a におけるテイラー近似多項式が元の関数の x = a の近くでの様子を

近似しているように、多変数関数でもテイラー近似多項式を考えることができ、それを使って多変

数関数の様子をある程度調べることができます。

1.1 なぜ極大極小を知りたいのか

1変数関数の増減を調べることは高校生でもできます。テイラーの定理など使いません。しかし、その方法は 2変数関数の場合に拡張することができません。

1変数関数では増減表が書けるが 2変数関数では書けない

からです。

そこで、2変数関数の場合に応用が利くようにするために、1変数関数の増減を「増減」ではない視点から捉え直してみましょう。1変数関数の増減の大雑把な様子は増減表の矢印をつないだ折れ線で十分表されています。このように、折れ線程度の概形でよいなら、重要なのは増加や減少そ

のものというより、むしろ

「山折り」や「谷折り」になっている場所

です。それさえ分かれば関数の増加と減少だけは完全につかむことができるわけです。しかも、こ

の視点なら 2変数関数にも適用できるでしょう。つまり、2変数関数のグラフにおいて

「山頂」と「谷底」がどこか

Page 2: 変数関数の極大極小 - lecture.ecc.u-tokyo.ac.jp2 変数関数の極大極小 2 という情報だけ得られればとりあえず満足としようじゃないか、というわけです。そこで、以下では「山折り」や「山頂」および「谷折り」や「谷底」がどこであるかを、増加減

2 変数関数の極大極小 2

という情報だけ得られればとりあえず満足としようじゃないか、というわけです。

そこで、以下では「山折り」や「山頂」および「谷折り」や「谷底」がどこであるかを、増加減

少という視点を使わずに調べる方法を手に入れることが目標となります。目標物を「山折り」とか

呼ぶのはちょっと恥ずかしいので、ちゃんとした名前が用意されています。それが極大と極小です。

高校で 1変数関数の極大極小について学んでいますが、そこでの定義は

関数が増加から減少に転じるところを極大、減少から増加に転じるところを極小と呼ぶ

だったようです。しかし、この定義は「増加減少」という概念を使ってしまっているので 2変数関数に適用することはできません。そこで、1変数でも 2変数でも(一般の多変数でも)通じるように、次のように定義し直します。

� �定義 1. x = a が 1変数関数 f の極大点であるとは、区間 (a− r, a+ r) の範囲では f(a) が最大値であるような正実数 r が存在することを言う。a が f の極大点であるとき f(a) を極大値という。

極小点と極小値も同様に定義する。� �このように定義すれば 2変数(や一般の多変数)での極大極小の定義も次のようにすればよいことがわかるでしょう。

� �定義 2. (a, b) が 2変数関数 f の極大点であるとは、(a, b) を中心とした半径 r の円の内部で

は f(a, b) が最大値であるような正実数 r が存在することを言う。(a, b) が f の極大点である

とき f(a, b) を極大値という。極小点と極小値も同様に定義する。� �なお、極大か極小かを問題にしないときには「(a, b) で極値をとる」とか「f(a, b) は極値である」とかと「大」や「小」を省略した言い方を使います。

さて、上の定義は関数 f が微分可能でなくても、それどころか連続でなくても意味をなす定義

です。しかし、我々は微分を使って極大点や極小点を探そうとしているのですから、以下では f は

微分可能であることを仮定します。本題の節に移る前に、1変数関数の場合にはおなじみの事実をキチンと確認しておきましょう。� �

x = a が f の極大点または極小点ならば f ′(a) = 0 である。� �証明. どちらでも同じなので x = a で極大であるとします。つまり、(a− r, a+ r) においては f(a)は f(x) の最大値だということです。ということは、この範囲においては f(x) − f(a) ≤ 0 です。よって、

a− r < x < a =⇒ f(x) − f(a)x− a

≥ 0

a < x < a+ r =⇒ f(x) − f(a)x− a

≤ 0

Page 3: 変数関数の極大極小 - lecture.ecc.u-tokyo.ac.jp2 変数関数の極大極小 2 という情報だけ得られればとりあえず満足としようじゃないか、というわけです。そこで、以下では「山折り」や「山頂」および「谷折り」や「谷底」がどこであるかを、増加減

2 変数関数の極大極小 3

が成り立ちます。今 f は微分可能としているので、上の二つの式の左辺は x→ a の極限において

どちらも f ′(a) に収束します。つまり、

f ′(a) =

lim

x→a−0

f(x) − f(a)x− a

≥ 0

limx→a+0

f(x) − f(a)x− a

≤ 0

となります。0以上 0以下の実数は 0しかありませんので f ′(a) = 0 です。 □

グラフで言えば、極大や極小の点では接線は傾き 0(x 軸に平行)になっているということを意味します。これに対応することを 2変数関数のグラフで想像してみれば、極大や極小の点では接平面は xy 平面に平行になっているだろうと考えられるでしょう。確かにそのとおりです。� �偏微分可能な 2変数関数 f が (a, b) で極値をとるなら

∂f

∂x(a, b) =

∂f

∂y(a, b) = 0

が成り立つ。� �証明. f が (a, b) で極値をとるなら、y に b を代入してできる x の 1変数関数 f(x, b) は x = a で

極値を取ります。よって、上で証明したように f(x, b) の x での微分の値は x = a で 0です。すなわち fx(a, b) = 0 が成り立ちます。fy(a, b) = 0 も同様です。 □

このことは微分可能でなくても(つまり、その点に接平面がなくても)偏微分可能だけで成り立

つわけです。が、以下、我々が扱える関数は微分可能ですので、「接平面が xy 平面に平行」とい

うイメージの方がこの証明より大切です。

さて、これで「極値をとるなら微分が 0」ということが分かったわけですが、もちろん、f(x) = x3

などでお馴染みのように、微分が 0でも極値をとるとは限りません。そこで、次節の目標は、

微分が 0の点のうちどれが極大点でどれが極小点でどれがどちらでもないのかを、関数の増減という概念を使わずに判定する

こととなります。

1.2 テイラーの定理と極大極小 : 1変数関数の場合

実は、1変数関数に関しては、高校のとき既に f ′(a) = 0 を満たす点 a が極大点や極小点である

ための一つの十分条件を学んでいます。それは、2階微分を使う方法です。

f ′′(a) > 0 ならば極大、f ′′(a) < 0 ならば極小

というものです。十分条件でしかない理由は、f ′′(a) = 0 のとき「極大・極小・どちらでもない」がすべて起こりうるからです。例えば f(x) = x4, −x4, x3 における x = 0 がこの三つの例になっています。しかし、f ′ が 0の場所で f ′′ まで 0というのは少々特殊っぽい気がします。(詳しくは説明しませんが。)だから、十分条件ではあるけれども、この条件を 2変数関数の場合に拡張することができればいいじゃないか、と考えることにするのです。

ところが、高校でこの条件を導くとき「増加減少」という概念を使ってしまっているのです。例

えば、「f ′(a) = 0 かつ f ′′(a) > 0 ならば極小」をどうやって導いたかを思い出してみましょう。

Page 4: 変数関数の極大極小 - lecture.ecc.u-tokyo.ac.jp2 変数関数の極大極小 2 という情報だけ得られればとりあえず満足としようじゃないか、というわけです。そこで、以下では「山折り」や「山頂」および「谷折り」や「谷底」がどこであるかを、増加減

2 変数関数の極大極小 4

(f が C2 級、つまり f ′′ が連続なら、)f ′′(a) = (f ′)′(a) > 0 であることから f ′(x) はa の近くで増加している。今 f ′(a) = 0 なのだから、a− r < x < a ならば f ′(x) < 0、すなわち f(x) は減少、a < x < a+ r ならば f ′(x) > 0、すなわち f(x) は増加。よって、x = a で f は減少から増加に転じているので極小である。 □

後半で「f ′ > 0 なら f は増加」などを使っているところは、高校での極値の定義に持ち込むため

なので仕方がないのですが、問題は

f ′′(a) > 0 だから f ′(x) は a の近くで増加

の部分です。もし 2変数関数の 2階微分に当たるものが然るべく定義できたとしても、この部分の議論は適用できないことになってしまいます。

詰まるところ、視点を変えなければダメなわけです。ではどのように視点を変えるか、というと

1次近似よりもよい近似を使う

というのが標語としての答です。つまり、

微分の値が 0でなければ 1次近似で関数の増減がよく近似できていたのに、微分の値が 0だと 1次近似からでは「極大・極小・どちらでもない」の情報が取り出せないので、もっとよい近似が必要なのだ

と考えるわけです。そして、「もっとよい近似」を与えてくれるものとしてテイラー近似多項式を

考えることにするのです。なぜなら、調べたいことが f ′(a) = 0 を満たす 1点 a の近くの様子だ

けだからです。

1.2.1 2次近似と極大極小

1次近似では必要な情報が得られないで困っていたわけですから、一足飛びに 3次近似や 10次近似などに手を出すのではなく、2次近似を考えるのが自然でしょう1。2次近似は x = a 近くで

f(x) にとてもよく似ているだろうと期待されます。この「期待」が本当に正しいことの説明(テイラーの定理です)は後に回して、とりあえずこのことを信じるとどうなるか考えてみましょう。

x = a が極値の候補点、すなわち f ′(a) = 0 とします。すると、そこでの 2次近似は 1次の項が消えて

f(a) +f ′′(a)

2(x− a)2

となります。これは f ′′(a) > 0 ならば下に凸の放物線なので x = a で最小であり、f ′′(a) < 0 ならば上に凸の放物線なので x = a で最大です。よって、x = a の近くでは 2次近似は f(x) に似ているということを信じるなら、

f ′′(a) > 0 ならば x = a は極小点 f ′′(a) < 0 ならば x = a は極大点

であることが「増加減少」という考え方を使わずに説明できました。

12次近似とか 3次近似とは、2次のテイラー近似多項式や 3次のテイラー近似多項式のことです。しかし、この名前は長すぎるし、物理学や工学などではテイラーとか多項式を省いて呼ぶのが普通なので、このプリントでは n 次のテイラー近似多項式のことを n 次近似と呼ぶことにしました。

Page 5: 変数関数の極大極小 - lecture.ecc.u-tokyo.ac.jp2 変数関数の極大極小 2 という情報だけ得られればとりあえず満足としようじゃないか、というわけです。そこで、以下では「山折り」や「山頂」および「谷折り」や「谷底」がどこであるかを、増加減

2 変数関数の極大極小 5

残ったのは「2次近似が元の関数に似ている」ということの証明です。このことの証明は、2次まで近似しきってしまわずに、1次近似と元の関数との剰余を表すラグランジュの剰余項、すなわちテイラーの定理を使うとできます。テイラーの定理とは

f(x) = f(a) + f ′(a)(x− a) +12f ′′(a+ θ(x− a))(x− a)2

となる θ が 0と 1の間に存在する、というものでした。ここで a が極値の候補、つまり f ′(a) = 0だとしてみましょう。すると、テイラーの定理は

f(x) = f(a) +12f ′′(a+ θ(x− a))(x− a)2

となります。ここで、x を a の近くに限定すると、f ′′ が連続、すなわち f が C2 級なら f ′′(a) とf ′′(a+ θ(x− a)) の正負は一致します。よって、

f ′′(a) > 0 ならば f(x) = f(a) +12f ′′(a+ θ(x− a))(x− a)2 > f(a)

すなわち f(a) は極小値、

f ′′(a) < 0 ならば f(x) = f(a) +12f ′′(a+ θ(x− a))(x− a)2 < f(a)

すなわち f(a) は極大値ということがキチンと証明できました。

1.3 テイラーの定理と極大極小 : 2変数関数の場合

前節で論じた、1変数関数の場合に 2次近似を使って極大極小を判定する方法を 2変数関数の場合に拡張しましょう。既に 3ページで確認したように、偏微分可能な関数 f(x, y) が点 (a, b) で極値を取るなら fx(a, b) = fy(a, b) = 0 が成り立ちます。つまり fx(a, b) = fy(a, b) = 0 は f が (a, b)で極値を取るための必要条件です。だから、以降の目標は、この条件を満たす点それぞれが極大点

や極小点なのかどうかを判定する方法を見つけることです。毎度「極値をとる点であるための必要

条件を満たす点」とか「極値をとる点の候補」とかというのは長いので名前が用意されています。

(講義では、長い名前のままかも知れません。)� �定義 3. 偏微分可能な 2変数関数 f(x, y) に対し、

∂f

∂x(a, b) =

∂f

∂y(a, b) = 0

を満たす点 (a, b) を f の停留点または臨界点と言う。� �極値をとらない停留点もあります。例えば f(x, y) = x2 + y3 とすると (0, 0) は停留点ですが極大でも極小でもありません。なぜなら、f(0, y) は y が正なら正、y が負なら負なので、(0, 0) のどんなに近くにも値が f(0, 0) = 0 より大きい点も小さい点もあるからです。よって、1変数関数の場合と同様に、以降の目標は「2次近似」というものを使って各停留点が「極大点」なのか「極小点」なのか「どちらでもない」なのかを判定することです。1変数関数の場合には、f ′′(a) = 0となってしまうと三つのどれも起こり得ます。つまり、1変数関数の場合には、この方法では「極大と判定できる」「極小と判定できる」「全く何も言えない」の三つの場合が起こり得るわけです。

ところが、2変数関数の場合の結論は、2次近似を使った判定法で判定した結果は

Page 6: 変数関数の極大極小 - lecture.ecc.u-tokyo.ac.jp2 変数関数の極大極小 2 という情報だけ得られればとりあえず満足としようじゃないか、というわけです。そこで、以下では「山折り」や「山頂」および「谷折り」や「谷底」がどこであるかを、増加減

2 変数関数の極大極小 6

「極大と判定できる」「極小と判定できる」「極大でも極小でもないと判定できる」「全

く何も言えない」

の四つの場合に起こり得る可能性が増えます。

では、2次近似の定義からそれを使った判定法までを順を追って説明して行きましょう。

1.3.1 2次近似

1次(以下の)関数 P (x) = f(a) + p(x− a) が 1変数関数 f(x) の x = a における 1次近似であるとは

limx→a

f(x) − P (x)x− a

= 0

を満たすことであり、これは p = f ′(a) と同値でした。これのまねをして、

P (x, y) = f(a, b) + p(x− a) + q(x− a)

が 2変数関数 f(x, y) の (a, b) での 1次近似であることを

lim(x,y)→(a,b)

f(x, y) − P (x, y)√(x− a)2 + (y − b)2

= 0

が成り立つこととして定義したのでした。(1次近似が存在することを微分可能と名付けました。)そして、1次近似 P (x, y) が存在する場合、その係数 p と q は

p =∂f

∂x(a, b), q =

∂f

∂y(a, b)

でなければならないことが 1次近似の定義(上の極限の式)から導かれました。一方、2次関数 Q(x) が 1変数関数 f(x) の x = a における 2次近似であることは、

limx→a

f(x) −Q(x)(x− a)2

= 0

で特徴付けられました。つまり、これを満たす Q(x) は存在するとしてもただ一つで、存在する場合

Q(x) = f(a) + f ′(a)(x− a) +f ′′(a)

2(x− a)2

となります。(第 5回のプリントを参照して下さい。)だから、2変数の 2次式 Q(x, y) が f(x, y)の (a, b) における 2次近似であることは

lim(x,y)→(a,b)

f(x, y) −Q(x, y)√(x− a)2 + (y − b)2

2 = 0 (1)

が成り立つこととして定義されるべきでしょう。そこで、式 (1)の成り立つ Q(x, y) はどのような2次式でなければならないかを調べてみましょう。

(x, y) → (a, b) とは (a, b) へのあらゆる近づき方を意味しますのでやっかいです。そこで、x =a+ r cos θ, y = b+ r sin θ と変数を変換して考えることにします。こうすると、(x, y) → (a, b) がr → 0 と一つの変数の振る舞いだけに還元されて扱いやすいからです。ただし、r → 0 とは「θについては何が起きていてもよい」ということを意味していることを忘れないで下さい。つまり、

r → 0 のときある値に収束するとは、r が 0に近づく間 θ がどんなに暴れ回っていようともいつ

もその値に収束するということを意味しています。

Page 7: 変数関数の極大極小 - lecture.ecc.u-tokyo.ac.jp2 変数関数の極大極小 2 という情報だけ得られればとりあえず満足としようじゃないか、というわけです。そこで、以下では「山折り」や「山頂」および「谷折り」や「谷底」がどこであるかを、増加減

2 変数関数の極大極小 7

この変換を式 (1)に施す前に、Q(x, y) を x− a と y − b の 2次式として具体的に

c+ p(x− a) + q(y − b) +A(x− a)2 + 2B(x− a)(y − b) + C(y − b)2

と書くことにしましょう。やりたいことは、c, p, q, A,B,C の値を決定することです。このように

記号を決めた上で式 (1)に x = a+ r cos θ, y = b+ r sin θ を代入すると、

limr→0

1r2{f(a+ r cos θ,b+ r sin θ) − c− pr cos θ − qr sin θ

−Ar2 cos2 θ − 2Br2 cos θ sin θ − Cr2 sin2 θ}

= 0(2)

となります。r → 0 のとき r2 → 0 ですので、r2 を掛けてから極限を取っても 0になります。つまり、分子に r = 0 を代入すると 0になるわけです。(f(x, y) の連続性は仮定しています。)よって、

c = f(a, b)

が得られます。その上で r2 を掛ける代わりに r だけを掛けて r → 0 の極限を考えてみましょう。つまり分子を r2 で割るのではなく r だけで割って r → 0 とするわけです。分子の項のうち r2 の

掛かっているものは 0になってしまうので、結局

limr→0

f(a+ r cos θ, b+ r sin θ) − f(a, b) − pr cos θ − qr sin θr

= 0

となります。これの変数を x, y に戻すと、

lim(x,y)→(a,b)

f(x, y) − f(a, b) − p(x− a) − q(y − b)√(x− a)2 + (y − b)2

= 0

となります。これは (a, b) における 1次近似の定義式です。つまり 2次近似の 1次までの部分は 1次近似になっているわけです。(1変数関数のときもそうでしたね。)よって、

p =∂f

∂x(a, b), q =

∂f

∂y(a, b)

です。

最後に A,B,C という 2次の項の係数が残りました。これを計算するために、式 (2)の左辺の極限を取る前の式に r の 1変数関数としてコーシーの平均値定理を適用しましょう。つまり、θ を一つ固定して、式 (2)の分子を h(r)、分母(すなわち r2)を g(r) とおいてコーシーの平均値定理を適用するわけです。θ の値によらずに h(0) = g(0) = 0 ですので、

h(r)g(r)

=h(r) − h(0)g(r) − g(0)

=h′(ρ)g′(ρ)

を満たす ρ が 0 と r の間に存在します。(ρ は r だけでなく θ にも依存しています。)具体的に計

算してみると、g′(ρ) = 2ρ はすぐ分かり、h′(ρ) の方は合成関数の微分公式により

h′(ρ) =∂f

∂x(a+ ρ cos θ, b+ ρ sin θ) cos θ +

∂f

∂y(a+ ρ cos θ, b+ ρ sin θ) sin θ

− ∂f

∂x(a, b) cos θ − ∂f

∂y(a, b) sin θ − 2Aρ cos2 θ − 4Bρ cos θ sin θ − 2Cρ sin2 θ

と計算されます。よって、

limr→0

h′(r)g′(r)

= 0

Page 8: 変数関数の極大極小 - lecture.ecc.u-tokyo.ac.jp2 変数関数の極大極小 2 という情報だけ得られればとりあえず満足としようじゃないか、というわけです。そこで、以下では「山折り」や「山頂」および「谷折り」や「谷底」がどこであるかを、増加減

2 変数関数の極大極小 8

すなわち

limr→0

(fx(a+ r cos θ, b+ r sin θ) − fx(a, b)) cos θ + (fy(a+ r cos θ, b+ r sin θ) − fy(a, b)) sin θ2r

= A cos2 θ + 2B cos θ sin θ + C sin2 θ (3)

が θ によらずに成り立てば、式 (2)も成り立つことになります。(式 (3)が成り立つことは式 (2)が成り立つための十分条件であって必要十分条件ではありません。ロピタルの定理と同じ仕組み

です。)

ここで fx も fy も微分可能であると仮定しましょう。すると、

φ(r) = fx(a+ r cos θ, b+ r sin θ), ψ(r) = fy(a+ r cos θ, b+ r sin θ)

という二つの 1変数関数に合成関数の微分公式を使うことにより、

limr→0

fx(a+ r cos θ, b+ r sin θ) − fx(a, b)r

= φ′(r) =∂fx

∂x(a, b) cos θ +

∂fx

∂y(a, b) sin θ

limr→0

fy(a+ r cos θ, b+ r sin θ) − fy(a, b)r

= ψ′(r) =∂fy

∂x(a, b) cos θ +

∂fy

∂y(a, b) sin θ

(4)

となります。(左辺の二つの式が、それぞれ φ(r) と ψ(r) の微分の定義式になっていることに注意して下さい。)

さて、式 (4)の右辺を式 (3)の左辺に代入し、2階偏微分の記号で書き直すと、

12∂2f

∂x2(a, b) cos2 θ +

12

(∂2f

∂y∂x(a, b) +

∂2f

∂x∂y(a, b)

)cos θ sin θ +

12∂2f

∂y2(a, b) sin2 θ

= A cos2 θ + 2B cos θ sin θ + C sin2 θ

となります。これが任意の θ で成り立たなければならないのですから、例えば θ = 0 と θ = π/2を代入することで

A =12∂2f

∂x2(a, b) C =

12∂2f

∂y2(a, b)

となり、これを元の式に戻すことで、

2B =12

(∂2f

∂y∂x(a, b) +

∂2f

∂x∂y(a, b)

)が得られます。

以上、大分長い計算になってしまったので、何を仮定すると何が結論できたのかをはっきり書い

ておきましょう。� �f(x, y) が (a, b) で微分可能で、さらに fx(x, y) も fy(x, y) も (a, b) で微分可能なら、(a, b)における f(x, y) の 2次近似 Q(x, y) が存在し、

Q(x, y) =f(a, b) +∂f

∂x(a, b)(x− a) +

∂f

∂y(a, b)(y − b) +

12∂2f

∂x2(a, b)(x− a)2

+12

(∂2f

∂y∂x(a, b) +

∂2f

∂x∂y(a, b)

)(x− a)(y − b) +

12∂2f

∂y2(a, b)(y − b)2

が成り立つ。� �

Page 9: 変数関数の極大極小 - lecture.ecc.u-tokyo.ac.jp2 変数関数の極大極小 2 という情報だけ得られればとりあえず満足としようじゃないか、というわけです。そこで、以下では「山折り」や「山頂」および「谷折り」や「谷底」がどこであるかを、増加減

2 変数関数の極大極小 9

がここまでで得られた結論です。

この結論のとってもイヤなところは、仮定の「f , fx, fy がすべて微分可能」というところでしょ

う。既に何度か経験してきているように、微分可能であることが要求される場合には、もっと強く

C1 級であることを仮定してしまうことがほとんどでした。なぜなら、微分可能性を直接示すのに

比べて、C1 級、すなわち fx と fy がどちらも連続であることの方が偏微分だけで話が済む分扱い

やすいからです。そこで、上で示した命題も条件を強めて

f も fx も fy も C1 級

すなわち

f は C2 級

という仮定にしてしまいましょう。

仮定を強めるというのはなんだかもったいないような気がするかも知れません。しかし、我々は

C2 級の 1変数関数に対する極値判定法を 2変数の場合に拡張しようとしているのですから、2変数関数が C2 級であるという仮定が結局は本質的に効いてくるだろうと予感がするでしょう。(そ

の予感の正しいことがあとで証明されます。)また、既に第 4回の演習で証明したように、C2 級

だと 2階偏微分が偏微分する変数の順序によらないということ、式で書けば fxy = fyx が成り立

つので、結論は (x− a)(y − b) の係数が次のように少し簡単になります。

定理 : C2 級関数の 2次近似� �f(x, y) が C2 級ならば、f は任意の点 (a, b) で 2次近似を持ち、2次近似は具体的には

f(a, b) +∂f

∂x(a, b)(x− a) +

∂f

∂y(a, b)(y − b)

+12∂2f

∂x2(a, b)(x− a)2 +

∂2f

∂x∂y(a, b)(x− a)(y − b) +

12∂2f

∂y2(a, b)(y − b)2

で与えられる。� �1.3.2 停留点における 2次近似との大体の関係

前節で 2変数関数の 2次近似がどういうものであるかが分かったので、この節と次の節でそれを使って各停留点が極値であるかどうか判定する方法を考えましょう。この節で大雑把に把握し、

次節で正確な関係を述べます。言葉を換えていえば、この節で結論である判定法を紹介し、次節で

それを証明するというわけです。だから、(次節での証明も大切ですが、むしろ)この節で述べる

結論を正しく把握することがまず重要です。

さて、2次近似をどのように使うかというと、

2次近似は近似した点の近くでは f(x, y) によく似ている

ということを信じて、停留点 (a, b) が

2次近似で極大なら f でも極大、2次近似で極小なら f でも極小

Page 10: 変数関数の極大極小 - lecture.ecc.u-tokyo.ac.jp2 変数関数の極大極小 2 という情報だけ得られればとりあえず満足としようじゃないか、というわけです。そこで、以下では「山折り」や「山頂」および「谷折り」や「谷底」がどこであるかを、増加減

2 変数関数の極大極小 10

と考えるわけです。1変数のときと全く同じ考え方です。つまり、1変数関数 f(x) において x = a

が停留点、つまり f ′(a) = 0 を満たすとき、x = a における 2次近似が

f(a) +f ′′(a)

2(x− a)2

という放物線になることから、

f ′′(a) > 0 なら放物線は下に凸だから f においても極小

f ′′(a) < 0 なら放物線は上に凸だから f においても極大

と考えたのと同じように考えようというわけです。だから、この節では停留点における 2次近似のグラフの概形を調べることになります。

(a, b) が f の停留点のとき、つまり fx(a, b) = fy(a, b) = 0 が成り立っているとき、f の (a, b)における 2次近似は

f(a, b) +12∂f

∂x2(a, b)(x− a)2 +

∂2f

∂y∂x(a, b)(x− a)(y − b) +

12∂2f

∂y2(y − b)2

となります。知りたいのはこの 2次関数において (a, b) が極大や極小になるときの係数の満たすべき条件式です。ということは、定数 f(a, b) はあってもなくても同じですし、全体を 2倍して 1/2を消してしまってもかまわないでしょう。また、u = x− a, v = y− b と置き換えて u と v の 2次式として (0, 0) が極大や極小になる場合を考えればよいわけです。式がゴチャゴチャするのを避けるために、

A =∂2f

∂x2(a, b) B =

∂2f

∂y∂x(a, b) C =

∂2f

∂y2(a, b)

と置きましょう。すると、結局我々が調べるべき 2次式 Q(u, v) は

Q(u, v) = Au2 + 2Buv + Cv2

となり、することは z = Q(u, v) のグラフにおいて (0, 0, 0) が極大か極小かどれでもないかを調べることです。

どうやって調べるのかというと、u と v の式に直してもまだ俄にはグラフの概形が思い描けな

いので、u や v の 2次式と見て平方完成するのです。A,B,C が全部 0なら Q(u, v) は値が 0の定数関数です。A,B,C のうち少なくとも一つは 0でないとします。とりあえず A ̸= 0 としてみましょう。すると、

Q(x, y) = A

((u+

B

Av

)2

+AC −B2

A2v2

)と変形できます。ここで、二つの 1変数関数のグラフ v = u2 と v = 2u2 が「開き具合」こそ違う

けれどもどちらも下に凸の放物線であったことを思い出してください。このように、全体を正の実

数倍してもグラフの大体の形は変わりません。だから、今考えている z = Q(x, y) のグラフも、Aが正なら

z =(u+

B

Av

)2

+AC −B2

A2v2

のグラフと同じ形、A が負なら

z = −(u+

B

Av

)2

− AC −B2

A2v2

Page 11: 変数関数の極大極小 - lecture.ecc.u-tokyo.ac.jp2 変数関数の極大極小 2 という情報だけ得られればとりあえず満足としようじゃないか、というわけです。そこで、以下では「山折り」や「山頂」および「谷折り」や「谷底」がどこであるかを、増加減

2 変数関数の極大極小 11

のグラフと同じ形です。

しかし、これでもまだ式がゴチャゴチャしていてグラフの形を思い浮かべることは難しいでしょ

う。そこで、座標変換をしましょう2。つまり、u と v の適当な 1次式二つを新しい変数 X,Y と

書いてしまおうというわけです。上の二つの式を見ると、まず

X = u+B

Av

と置きたくなるでしょう。すると、もう一つの方は、AC −B2 が正なら

Y =

√AC −B2

A2v

と置き、AC −B2 が負なら

Y =

√B2 −AC

A2v

と置くのが良さそうです。AC −B2 = 0 のときは Y = v のままにしておくことにします。

以上をまとめると、

A > 0, AC −B2 > 0 のときは z = X2 + Y 2

A > 0, AC −B2 = 0 のときは z = X2

A > 0, AC −B2 < 0 のときは z = X2 − Y 2

A < 0, AC −B2 > 0 のときは z = −X2 − Y 2

A < 0, AC −B2 = 0 のときは z = −X2

A < 0, AC −B2 < 0 のときは z = −X2 + Y 2

となります。以上は、A ̸= 0 の場合で考えましたが、A = 0 でも C ̸= 0 なら x と y の役割を取

り替えて全く同じ式変形ができますし、A = C = 0 のときは B ̸= 0 なのですから、

2Buv =B

2((u+ v)2 − (u− v)2

)と式変形すれば、B の正負に従って z = X2 − Y 2 の場合か z = −X2 + Y 2 の場合になりますの

で、グラフの大体の形を調べるだけなら A ̸= 0 の場合の議論だけですべての場合が尽くされていることになります。

さて、ここまで式が簡単になればグラフの大体の形を思い浮かべられそうです。一番簡単なのは

z = X2 の場合でしょう。右辺の関数に Y が現れていないのですから、1変数関数としてのグラフ、つまり下に凸の放物線を Y 軸に沿って滑らせたものです。紙を切り口が下に凸の放物線になるよ

うに曲げたものを思い浮かべてもらえればよいでしょう。z = −X2 の場合は、z = X2 のグラフの

上下をひっくり返したもの、つまり上に凸の放物線をずらーっと並べた感じのものです。(図 1。)以上の二つは実質 1変数関数のグラフでした。ここから先が本質的に 2変数関数のグラフの話です。まず z = X2 + Y 2 の場合を考えてみましょう。これのグラフと XY 平面に平行な平面との交

わりは (x, y) = (0, 0) を中心とした円になります。実際、XY 平面に平行な平面とは z = k とい

う定数関数のグラフなので、この二つの交わりは

X2 + Y 2 = k

2座標変換なんて言う言葉を聞くと胃が痛くなる人もいるかも知れません。しかし、ここでは細かいことを追求したいのではなくだいたいのことを知りたいがためにやっているのですから、z = Q(u, v) のグラフを uv 平面に平行に回したり伸ばしたり縮めたりして見やすくしているのだな、くらいに思っていただければ結構です。

Page 12: 変数関数の極大極小 - lecture.ecc.u-tokyo.ac.jp2 変数関数の極大極小 2 という情報だけ得られればとりあえず満足としようじゃないか、というわけです。そこで、以下では「山折り」や「山頂」および「谷折り」や「谷底」がどこであるかを、増加減

2 変数関数の極大極小 12

� �z = X2 z = −X2

図 1: 放物線をずらーっと並べた曲面。� �という半径

√k の円です。よって、z = X2 + Y 2 は 1変数関数のグラフを z 軸を中心に回転した

ものになります。その 1変数関数のグラフは Xz 平面との交わりに出てくる曲線です。Xz 平面と

は Y = 0 のことですから、結局、x = X2 + Y 2 のグラフは下に凸の放物線 z = X2 を z 軸の回

りに回転してできる曲面になります。同様に、z = −X2 − Y 2 は上に凸の放物線を回転してできる

曲面です。(図 2)。 (これは X,Y という便宜上おいた変数での考察です。元々の変数 u, v につ� �z = X2 + Y 2 z = −X2 − Y 2

図 2: 回転放物面。� �いては普通は回転体にはなりません。uv 平面との交わりは円ではなく楕円になります。ご注意下

さい。)

最後に z = X2 − Y 2 と z = −X2 + Y 2 を考えましょう。この二つは X と Y を取り替えると

一致しますから、グラフの形としては同じものです。そこで、z = X2 − Y 2 の方で考えることに

します。上と同様にまず XY 平面と平行な平面との交わりを考えてみると、それは

X2 − Y 2 = k

という曲線ですので、双曲線です。ただし、k が正のときは X 軸が双曲線の軸であり、k が負の

Page 13: 変数関数の極大極小 - lecture.ecc.u-tokyo.ac.jp2 変数関数の極大極小 2 という情報だけ得られればとりあえず満足としようじゃないか、というわけです。そこで、以下では「山折り」や「山頂」および「谷折り」や「谷底」がどこであるかを、増加減

2 変数関数の極大極小 13

ときは Y 軸が双曲線の軸、k = 0 のときは Y = ±X という二直線です。(図 3。)これだけで大体� �

O

Y

X

z = 0

z = 2

z = 3

z = 1

z = −3z = −2 z = −1

図 3: z = X2 − Y 2 の「等高線」。� �の形が思い浮かぶ人もいるかも知れませんが、慣れないとなかなか難しいので、別な見方もしてみ

ましょう。XY 平面に平行な平面ではなく、Xz 平面に平行な平面、すなわち Y = k で切ってみ

ます。すると、z = X2 − k2 という下に凸の放物線が出てきます。この放物線の頂点は X = 0 の点ですので、k を動かしたときの頂点の軌跡は z = k2 という Y z 平面内の上に凸な放物線です。

つまり、Xz 平面内の z = X2 という放物線を Y z 平面内の z = −Y 2 という上に凸の放物線に頂

点を乗せたまま滑らしたときにできる曲面が z = X2 − Y 2 のグラフだというわけです。思い浮か

べられましたか?(図 4です。)� �z = X2 − Y 2

図 4: z = X2 − Y 2 の概形。山と山の間の峠とか、馬の鞍などを思い浮かべてください。� �さて、我々は今 z = f(x, y) のグラフの停留点 (a, b) の近くの様子が、2次関数 z = Q(u, v) のグラフの原点 (0, 0) の近くの様子に似ていると信じることにしたのでした。そのことと上で調べたz = Q(u, v) の概形を結びつけて、(a, b) が極大点か極小点か何でもないかを考えてみましょう。z = X2 + Y 2 となる場合、X2 + Y 2 > 0 なので、(0, 0) で最小です。だから (a, b) は極小点となります。

z = −X2 −Y 2 となる場合、(X,Y ) ̸= (0, 0) なら −X2 −Y 2 < 0 なので、(0, 0) で最大です。だから (a, b) は極大点となります。

Page 14: 変数関数の極大極小 - lecture.ecc.u-tokyo.ac.jp2 変数関数の極大極小 2 という情報だけ得られればとりあえず満足としようじゃないか、というわけです。そこで、以下では「山折り」や「山頂」および「谷折り」や「谷底」がどこであるかを、増加減

2 変数関数の極大極小 14

z = X2 − Y 2 となる場合、(X,Y ) ̸= (0, 0) でも、X > Y なら X2 − Y 2 > 0 であり、X < Y な

ら X2−Y 2 < 0 なので、(0, 0) のどんなに近くにも値が正の点も負の点もあります。(z = X2−Y 2

のグラフ(図 4)を見て下さい。)よって、この場合極大でも極小でもありません。「極大か極小かどちらでもないか分からない」のではなく、極大でも極小でもないということが 2次近似から分か

るのです。このような点、正確には

f(x, y) の定義域を (a, b) を通るある直線に制限すると (a, b) で極大だが、別の直線に制限すると (a, b) で極小となる

という性質を持つ点を鞍点と言います。

AC −B2 = 0 の場合、2次近似が例えば z = X2 になったとすると、2次近似としては (0, 0) は最小点ですが、(0, 0)以外にも (0, Y )という点はすべて最小値 0をとります。一方、2次近似は関数そのものではなく「似ている」というだけのものですので、元の関数が (0, Y ) に当たる点で (0, 0)に当たる点(すなわち停留点 (a, b))での値と同じ値なのか、大きい値なのか、小さい値なのかを 2

次近似だけから判定することはできません。(0, 0) が極大でないことだけは分かりますが、極小なのか極値をとらないのかを 2次近似から判断することはできないのです。実際、f(x, y) = x2 + y4,g(x, y) = x2 + y3 のどちらも (0, 0) における 2次近似は x2 ですが、f では極小点なのに g では

極値をとりません。(グラフを想像してみて下さい。)

以上をまとめると、次の判定法になります。

極値判定法� �(a, b) が C2 級関数 f(x, y) の停留点のとき、

A =∂2f

∂x2(a, b), B =

∂2f

∂y∂x(a, b), C =

∂2f

∂y2(a, b)

とおくと次が成り立つ。

(1) AC −B2 > 0 かつ A > 0(すなわち C > 0)のとき (a, b) は極小点。

(2) AC −B2 > 0 かつ A < 0(すなわち C < 0)のとき (a, b) は極大点。

(3) AC −B2 < 0 のとき (a, b) は鞍点。

(4) AC − B2 = 0 のとき、2階微分の値だけから (a, b) で極値をとるかとらないかを判定することはできない。� �

1.3.3 正確な関係 : テイラーの定理

この節では、前節の結論である「極値判定法」を証明します。前節では元の関数を 2次近似で置き換えて考えてしまっているところが問題なので、(a, b) に近い (x, y) での f(x, y) の本当の値を2次近似の 2次の係数を「ほんの少し」変えることできっちり実現する、という方法で証明します。要するに、1変数のときと全く同様に証明するということです。実際、証明には 1変数関数のテイラーの定理

φ(x) = φ(a) + φ′(a)(x− a) +φ′′(a+ θ(x− a))

2(x− a)2 0 < ∃θ < 1

Page 15: 変数関数の極大極小 - lecture.ecc.u-tokyo.ac.jp2 変数関数の極大極小 2 という情報だけ得られればとりあえず満足としようじゃないか、というわけです。そこで、以下では「山折り」や「山頂」および「谷折り」や「谷底」がどこであるかを、増加減

2 変数関数の極大極小 15

を使います。

点 (a, b) の近くに f の値を比較したい点 (x0, y0) を一つとります。その上で、(a, b) と (x0, y0)の 2点を通る直線を (

x

y

)=

(a

b

)+ t

(x0 − a

y0 − b

)と t でパラメタ付けし、f(x, y) をここに制限した関数を φ(t) と置きます。つまり、

φ(t) = f(a+ t(x0 − a), b+ t(y0 − b))

と定義するわけです。

φ(0) = f(a, b), φ(1) = f(x0, y0)

となっていることに注意して下さい。

この φ(t) に t = 1, a = 0 でテイラーの定理を適用すると、

φ(1) = φ(0) + φ′(0)1 +φ′′(θ · 1)

212 = φ(0) + φ′(0) +

φ′′(θ)2

(5)

を満たす θ が (0, 1) に存在するということが分かります。合成関数の微分公式を使って φ′(t) を計算すると

φ′(t) =∂f

∂x(a+ t(x0 − a),b+ t(y0 − b))(x0 − a)

+∂f

∂y(a+ t(x0 − a), b+ t(y0 − b))(y0 − b)

となりますので、

φ′(0) =∂f

∂x(a, b)(x0 − a) +

∂f

∂y(a, b)(y0 − b)

となります。また、f が C2 級なので、φ′(t) に合成関数の微分公式を適用し fxy = fyx を使って

式を整理すると、

φ′′(t) =∂2f

∂x2(a+ t(x0 − a), b+ t(y0 − b))(x0 − a)2

+ 2∂2f

∂y∂x(a+ t(x0 − a), b+ t(y0 − b))(x0 − a)(y0 − b)

+∂2f

∂y2(a+ t(x0 − a), b+ t(y0 − b))(y0 − b)2

となります。これらを 1変数関数のテイラーの定理 (5)に戻し、(x0, y0) を (x, y) と書き直すと、2

変数関数のテイラーの定理

f(x, y) = f(a, b)+∂f

∂x(a, b)(x− a) +

∂f

∂y(a, b)(y − b)

+12∂2f

∂x2(a+ θ(x− a), b+ θ(y − b))(x− a)2

+∂2f

∂y∂x(a+ θ(x− a), b+ θ(y − b))(x− a)(y − b)

+12∂2f

∂y2(a+ θ(x− a), b+ θ(y − b))(y − b)2

が得られます。

Page 16: 変数関数の極大極小 - lecture.ecc.u-tokyo.ac.jp2 変数関数の極大極小 2 という情報だけ得られればとりあえず満足としようじゃないか、というわけです。そこで、以下では「山折り」や「山頂」および「谷折り」や「谷底」がどこであるかを、増加減

2 変数関数の極大極小 16

これでやっと前節の判定法を証明する準備が整いました。判定法のうち (4)の「極値をとるかどうか分からない」という場合については、f(x, y) = x2 + y4 と g(x, y) = x2 + y3 という実例によっ

て既に説明済みですので、証明しなければならないのは (1)(2)(3)の三つです。どの場合でもやり方は同じですので (1)だけ、つまり、

(a, b) が C2 級関数 f(x, y) の停留点のとき、

A =∂2f

∂x2(a, b), B =

∂2f

∂y∂x(a, b), C =

∂2f

∂y2(a, b)

とおいた上で

AC −B2 > 0 かつ A > 0

が成り立っているならば (a, b) は極小点である。

だけ証明しましょう。

(x, y) を固定します。すると、テイラーの定理の θ が決まります。そこで、

A′ =∂2f

∂x2(a+ θ(x− a), b+ θ(y − b))

B′ =∂2f

∂y∂x(a+ θ(x− a), b+ θ(y − b))

C ′ =∂2f

∂y2(a+ θ(x− a), b+ θ(y − b))

と置きます。(a, b) は停留点なので fx(a, b) = fy(a, b) = 0 ですから、テイラーの定理の式は

f(x, y) = f(a, b) +12A′(x− a)2 +B′(x− a)(y − b) +

12C ′(y − b)2

となります。見難いので、例によって u = x− a, v = y− b と置いて 2次の部分(の 2倍)を平方完成しましょう。f は C2 級なので fxx は連続です。よって fxx(a, b) = A > 0 であることから、(x, y) が (a, b) に十分近ければ(正確には、ある正実数 r1 が取れて、(a, b) を中心とした半径 r1

の円板の中に (x, y) が入っていれば)、fxx(a+ θ(x− a), b+ θ(y − b)) = A′ > 0 も成り立ちます。よって、A′ で割ることができて、

A′u2 + 2B′uv + C ′v2 = A′(u+

B′

A′ v

)2

+A′C ′ −B′2

A′ v2

となります。再び f が C2 級であることと、連続関数に四則演算を施したものは連続であること

から、連続関数 g(x, y) を

g(x, y) = fxx(x, y)fyy(x, y) − (fxy(x, y))2

と定義すると、g(x, y) は連続関数になります。しかも、

g(a, b) = fxx(a, b)fyy(a, b) − (fxy(a, b))2 = AC −B2 > 0

ですので、(x, y) が (a, b) に十分近ければ(正確には、ある正実数 r2 が取れて、(a, b) を中心とした半径 r2 の円板に (x, y) が入っていれば)、

g(a+ θ(x− a), b+ θ(y − b)) = A′C ′ −B′2 > 0

Page 17: 変数関数の極大極小 - lecture.ecc.u-tokyo.ac.jp2 変数関数の極大極小 2 という情報だけ得られればとりあえず満足としようじゃないか、というわけです。そこで、以下では「山折り」や「山頂」および「谷折り」や「谷底」がどこであるかを、増加減

2 変数関数の極大極小 17

も成り立ちます。以上より、

A′u2 + 2B′uv + C ′v2 =(√

A′(u+

B′

A′ v

))2

+

√A′C ′ −B′2

A′ v

2

と「二乗足す二乗」の形に整理できるので、(u, v) ̸= (0, 0) なら 2次の部分は正であることが分かりました。ということは (x, y) ̸= (a, b) で (x, y) が (a, b) に十分近ければ(正確には、上の二つの実数 r1 と r2 のうち小さい方を r としたとき、(a, b) を中心とした半径 r の円板に (x, y) が入っていれば)

f(x, y) = f(a, b) +正実数 > f(a, b)

が成り立つことになります。これで f(a, b) が極小値であることが証明できました。

1.4 練習問題

次の 2変数関数の極大点・極小点・鞍点とそこでの値をすべて求めよ。

(1)x2

9− y2

25(2) 2x2 − 2xy + 5y2 − 6x+ 12y + 2

(3) x2 + xy + y2 + 3x+ y

xy(4) x3 − 9xy + y3 + 27

(5) xy(x2 + y2 − 1) (6) (x+ y)e−xy (7) (x2 + y2)ex2−y2

1.5 練習問題の解答

(1) この関数は X = x/3, Y = y/5 と置くと X2 − Y 2 となります。よって、(0, 0) が鞍点で値は0。極大点と極小点はありません。

(2) 問題の関数を f と書くことにすると、

fx(x, y) = 4x− 2y − 6 fy(x, y) = −2x+ 10y + 12

ですので、停留点は (1,−1) のみです。f を x− 1 と y + 1 について整理すると

f(x, y) = 2(x− 1)2 − 2(x− 1)(y + 1) + 5(y + 1)2 − 7

となります。2 · 5 − 12 = 9 > 0, 2 > 0 ですので、(1,−1) で極小で値は −7 です。極大点と鞍点はありません。(2階偏微分を計算して判定法を適用しても結構です。)

(3) 問題の関数を f と書くことにすると、

fx(x, y) = 2x+ y − 3x2

fy(x, y) = x+ 2y − 3y2

ですので、停留点は (1, 1) のみです。2階偏微分は

fxx(x, y) = 2 +6x3

fxy(x, y) = 1 fyy(x, y) = 2 +6y3

Page 18: 変数関数の極大極小 - lecture.ecc.u-tokyo.ac.jp2 変数関数の極大極小 2 という情報だけ得られればとりあえず満足としようじゃないか、というわけです。そこで、以下では「山折り」や「山頂」および「谷折り」や「谷底」がどこであるかを、増加減

2 変数関数の極大極小 18

ですので、fxx(1, 1) = fyy(1, 1) = 8, fxy(1, 1) = fyx(1, 1) = 1 となります。よって、

fxx(1, 1)fyy(1, 1) − fxy(1, 1)2 = 63 > 0 fxx(1, 1) > 0

となり (1, 1) は極小点です。値は 9です。極大点と鞍点はありません。

(4) 問題の関数を f とすると、

fx(x, y) = 3x2 − 9y fy(x, y) = −9x+ 3y2

ですので、停留点は (0, 0) と (3, 3) の二つです。2階偏微分は

fxx(x, y) = 6x fxy(x, y) = −9 fxy(x, y) = 6y

です。

fxx(0, 0) = fyy(0, 0) = 0, fxy(0, 0) = fyx(0, 0) = −9 ですので

fxx(0, 0)fyy(0, 0) − fxy(0, 0)2 = −81 < 0

となり、(0, 0) は鞍点です。値は 27です。一方、fxx(3, 3) = fyy(3, 3) = 18, fxy(3, 3) = fyx(3, 3) = −9 ですので

fxx(3, 3)fyy(3, 3) − fxy(3, 3)2 = 243 > 0 fxx(3, 3) > 0

となり、(3, 3) は極小点です。値は 0です。

(5) 問題の関数を f とします。

fx(x, y) = y(3x2 + y2 − 1) fy(x, y) = x(x2 + 3y2 − 1)

ですので、停留点は (0, 0), (±1, 0), (0,±1), (±1/2,±1/2) の 9点です。(複合は任意です。)2階偏微分は

fxx(x, y) = 6xy fxy(x, y) = 3x2 + 3y2 − 1 fyy(x, y) = 6xy

です。

fxx(0, 0) = fyy(0, 0) = 0, fxy(0, 0) = fyx(0, 0) = −1 ですから

fxxfyy − f2xy = −1 < 0

となり、(0, 0) は鞍点です。値は 0です。(±1, 0), (0,±1) の 4点ではすべて fxx = fyy = 0, fxy = fyx = 2 ですから、やはり

fxxfyy − f2xy = −4 < 0

となり、鞍点です。値は 0です。±(1/2, 1/2) では fxx = fyy = 3/2, fxy = fyx = 1/2 ですので、

fxxfyy − f2xy = 2 > 0 fxx > 0

となり極小です。値はどちらも −1/8 です。

Page 19: 変数関数の極大極小 - lecture.ecc.u-tokyo.ac.jp2 変数関数の極大極小 2 という情報だけ得られればとりあえず満足としようじゃないか、というわけです。そこで、以下では「山折り」や「山頂」および「谷折り」や「谷底」がどこであるかを、増加減

2 変数関数の極大極小 19

±(1/2,−1/2) では fxx = fyy = −3/2, fxy = fyx = 1/2 ですので、

fxxfyy − f2xy = 2 > 0 fxx < 0

となり極大です。値はどちらも 1/8 です。

(6) 問題の関数を f とすると、

fx(x, y) = (1 − xy − y2)e−xy fy(x, y) = (1 − x2 − xy)e−xy

ですので、停留点は ±(1/√

2, 1/√

2) の二つです。以下、複合はこの順を表すものとします。2階偏微分は

fxx(x, y) = (xy2 + y3 − 2y)e−xy

fxy(x, y) = (x2y + xy2 − 2x− 2y)e−xy

fyy(x, y) = (x3 + x2y − 2x)e−xy

ですので、2階偏微分の値は fxx = fyy = ∓1/√

2e, fxy = fyx = ∓3/√

2e となります。よって、どちらにおいても

fxxfyy − f2xy =

12e

− 92e

= −4e< 0

となり鞍点です。値は ±√

2/e です。

(7) 問題の関数を f とすると、

fx(x, y) = 2x(1 + x2 + y2)ex2−y2fy(x, y) = 2y(1 − x2 − y2)ex2−y2

ですので、停留点は (0, 0), (0,±1) の三つです。2階偏微分は

fxx(x, y) = 2(1 + 3x2 + y2 + 2x4 + 2x2y2)ex2−y2

fxy(x, y) = −4xy(x2 + y2)ex2−y2

fyy(x, y) = 2(1 − x2 − 3y2 + 2x2y2 + 2y4)ex2−y2

となります。

fxx(0, 0) = fyy(0, 0) = 2, fxy(0, 0) = fyx(0, 0) = 0 なので、

fxx(0, 0)fyy(0, 0) − fxy(0, 0)2 = 4 > 0 fxx(0, 0) > 0

となり (0, 0) は極小点です。値は 0です。(0,±1) ではどちらにおいても fxx = 4/e, fxy = fyx = 0, fyy = −4/e なので、

fxxfyy − f2xy = −16

e2< 0

より鞍点です。値はどちらも 1/e です。

Page 20: 変数関数の極大極小 - lecture.ecc.u-tokyo.ac.jp2 変数関数の極大極小 2 という情報だけ得られればとりあえず満足としようじゃないか、というわけです。そこで、以下では「山折り」や「山頂」および「谷折り」や「谷底」がどこであるかを、増加減

2 変数関数の極大極小 20

2 「常識」による判定と2次近似では判定できない例

これまで議論してきた判定法は、(fxy)2 − fxxfyy = 0 という「判定できない場合」がありました。言葉を換えていえば、この判定法は極大や極小であるための一つの十分条件に過ぎないわけで

す。しかし、極大と極小は 2次近似どころか関数の連続性さえ使わずに定義された概念です。だから、判定法に頼るだけでなく「常識的な判断」で判定のつくこともよくあるのです。例えば、2階微分に頼らずグラフの形を想像してみるということは大切です。その例として

問題� �2変数関数

f(x, y) = (y − x2)(y − 2x2)

の極大点・極小点・鞍点と、そこでの f の値をすべて求めよ。� �という問題を考えてみましょう。

偏微分すると、

fx(x, y) = −2x(3y − 4x2), fy(x, y) = 2y − 3x2

となります。よって、停留点は (0, 0) のみです。2階偏微分を計算すると、

fxx(x, y) = 6(4x2 − y), fxy(x, y) = −6x, fyy(x, y) = 2

です。よって (0, 0) では fxx(0, 0) = fxy(0, 0) = 0, fyy(0, 0) = 2 であり、

fxx(0, 0)fyy(0, 0) − (fxy(0, 0))2 = 0

となるので、前節の判定法では (0, 0) が極大か極小か鞍点か(どれでもないか)を判定することはできません。

そこで、z = f(x, y) のグラフの様子を思い描くことで判定しようとしてみましょう。f(0, 0) = 0 なのですから、f(x, y) = 0 となる (x, y) がどこかをまず調べます。すると、

f(x, y) = (y − x2)(y − 2x2) = 0

より、二つの曲線 y = x2 と y = 2x2 の上で f の値が 0であることが分かります。さらに、x2 < y < 2x2 の範囲では f(x, y) < 0 であり、y < x2 および y > 2x2 の範囲では

f(x, y) > 0ですので、(0, 0)のどんなに近くにも f(x, y)が正の点も負の点もあるので、f(0, 0) = 0は極大でも極小でもありません。

一方、原点を通る直線 x = at, y = bt を f(x, y) に入れると、

f(at, bt) = (bt− a2t2)(bt− 2a2t2) = t2(b− a2t)(b− 2a2t)

となって、t = 0 は a, b にかかわらず f(at, bt) の極小点です。実際、b > 0 のときは −b/2a2 <

t < b/2a2 の範囲で (b− a2t)(b− 2a2t) > 0 だから極小であり、b = 0 のときは f(at, 0) = 2a4t4 だ

からやはり極小です。よって、(0, 0) が極大になるような直線がないので (0, 0) は鞍点でもありません。

以上より、答は「極大点も極小点も鞍点も存在しない」です。 □

Page 21: 変数関数の極大極小 - lecture.ecc.u-tokyo.ac.jp2 変数関数の極大極小 2 という情報だけ得られればとりあえず満足としようじゃないか、というわけです。そこで、以下では「山折り」や「山頂」および「谷折り」や「谷底」がどこであるかを、増加減

2 変数関数の極大極小 21

� �

O

y

x

図 5: f(x, y) の正負。y = x2 と y = 2x2 の上では 0。斜線部で負。それ以外のところでは正。f(x, y) は (0, 0) で極小ではないが、(0, 0) を通る任意の直線上では極小になってしまっている。� �このように、多変数関数になっても最も重要なことは「極大点」や「極小点」とはどういうもの

かという、いわば常識に基づいた判断なのです。決してテクニックに溺れることのないように気を

付けてください。例えば、上と同様の考え方を問題??の (5)に適用してみると、x 軸と y 軸と単

位円周で関数の値が 0になっていることと「最大値の原理」から、2階偏微分を計算してみなくても各停留点の極大・極小・鞍点を判定することができます。考えてみてください。

また、ここで学んだ極値判定法にしても、それを間違いなく憶えることより、それでなぜ極値か

どうかが判定できたことになるのかという理屈を、極大や極小の常識的な意味と照らし合わせて納

得することの方がはるかに重要です。

注意. ところで、f(x, y) が (a, b) で極小とは、

z = f(x, y) のグラフが (a, b) のところで一番下がっている

ことですが、そのことと、

z 軸に平行で (a, b) を通る任意の平面でグラフを切ったとき、断面にあらわれる曲線が(a, b) のところで一番下がっている

ことが同じことだという考えは間違いだということが上の問題で分かります。誤解しやすいところ

なので注意して下さい。★