105
A. Asano, Kansai Univ. 2013年度秋学期 統計学 浅野 晃 関西大学総合情報学部 分布の「型」を考える 確率分布モデルと正規分布

2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

Embed Size (px)

DESCRIPTION

関西大学総合情報学部 2013年度秋学期 統計学 第11回/「分布の「型」を考える - 確率分布モデルと正規分布」 担当・浅野晃 2013/12/5

Citation preview

Page 1: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

A. A

sano

, Kan

sai U

niv.

2013年度秋学期 統計学

浅野 晃 関西大学総合情報学部

分布の「型」を考える ̶ 確率分布モデルと正規分布

Page 2: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

A. A

sano

, Kan

sai U

niv.

Page 3: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

A. A

sano

, Kan

sai U

niv.

ちょっと前回の復習

Page 4: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

「統計的推測」とは

日本男性全員の身長を調べられるか?

データの集まりの一部を調べて度数分布を推測するいや,せめて平均や分散を推測する

調べたい集団の,すべてのデータを調べられるか?

統計的推測

Page 5: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

無作為抽出

\

データの集団から,いくつかのデータを公平なくじびきで選ぶ

[無作為標本抽出]という

調べたい(が全部を調べるのは無理な)集団[母集団]

調べられる程度のデータ[標本(サンプル)]

Page 6: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

度数分布で考えると

階級値162.5165.5172.5

相対度数 15% 20% 20% 10%177.5

母集団の度数分布

無作為抽出

階級値162.5165.5172.5

選ばれる確率 15% 20% 20% 10%177.5

標本の[確率分布]

Page 7: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

確率分布と確率変数

母集団の度数分布(母集団分布) =

つまり

階級値162.5165.5172.5

選ばれる確率 15% 20% 20% 10%177.5

標本の確率分布いくらとは決まっていないが,確率分布が決まっている

[確率変数]という

Page 8: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

母平均の推定標本としてデータをいくつか取り出して,それらの平均

母平均が知りたい

母集団(日本男性全体)

母平均μ

が,日本男性全員は調べられない

[標本平均]

標本平均は母平均に近い値になるか?

Page 9: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

母平均の推定

母集団

母平均μ母分散σ2

X1 X2 … Xn

サイズnの標本1セット 標本平均Xbar

X1 X2 … Xn Xbar

X1 X2 … Xn Xbar

母集団と同じ期待値μ

分散σ2

極端な値はあまりないので分散が小さくなる

期待値μ分散 σ2/n

Page 10: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

母平均の推定母平均がμ母分散がσ2 のとき,

標本平均の期待値がμ標本平均の分散がσ2 /n

仮に何度も標本を抽出して,何度も標本平均を計算したとすると分散が小さくなっているので,たいてい,ほぼ母平均に近い値になるいま1回だけ計算した標本平均も,おそらく,ほぼ母平均に近い値だろう

Page 11: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

母平均の推定いま1回だけ計算した標本平均も,おそらく,ほぼ母平均に近い値だろう

どのくらい近い?

どのくらいの確率で?はずれる確率は?

Page 12: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

母平均の推定いま1回だけ計算した標本平均も,おそらく,ほぼ母平均に近い値だろう

どのくらい近い?

どのくらいの確率で?はずれる確率は?

このあたりを今回から考える

Page 13: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

A. A

sano

, Kan

sai U

niv.

Page 14: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

A. A

sano

, Kan

sai U

niv.

分布の「型」を考える

Page 15: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

母平均の推定いま1回だけ計算した標本平均も,おそらく,ほぼ母平均に近い値だろう

どのくらい近い?

どのくらいの確率で?はずれる確率は?

Page 16: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

母平均の推定いま1回だけ計算した標本平均も,おそらく,ほぼ母平均に近い値だろう

どのくらい近い?

どのくらいの確率で?はずれる確率は?

計算するには,式で表されてないといけない

Page 17: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

母集団分布は

母集団の度数分布(母集団分布) =

つまり

階級値162.5165.5172.5

選ばれる確率 15% 20% 20% 10%177.5

標本の確率分布

Page 18: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

母集団分布は

母集団の度数分布(母集団分布) =

つまり

階級値162.5165.5172.5

選ばれる確率 15% 20% 20% 10%177.5

標本の確率分布

これは式ではなく数値の集まり,計算できない

Page 19: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

式で表す

階級値162.5165.5172.5

選ばれる確率 15% 20% 20% 10%177.5

度数分布を

Page 20: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

式で表す

階級値162.5165.5172.5

選ばれる確率 15% 20% 20% 10%177.5

何かの式で書けるものと仮定する

度数分布を

Page 21: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

式で表す

階級値162.5165.5172.5

選ばれる確率 15% 20% 20% 10%177.5

何かの式で書けるものと仮定する

階級

度数

90 100 110 120 130 140

図 1: ヒストグラムはこんなふうには描かない

階級

各柱の面積 =度数

90 100 110 120 130 140 150

図 2: ヒストグラムはこう描く

ボックスプロット

ヒストグラムをさらに簡略化して表現したのがボックスプロット(箱ひげ図)です。これは図 4のように,最小値,第1(下側)四分位数,中位数(中央値,メディアン),第3(上側)四分位数,最大値だけをグラフの中に表示したものです。分布の形を簡単な図で概略つかむことができます。ここで,中位数とは,データを小さいほうから並べたときに順位が 50% (データが 100個のとき 50位)であるもの,第1(第3)四分位数はそれぞれ 25%,75% になるものをさします。

ボックスプロットを描くときに,最大値や最小値が他のデータから飛び離れている場合は,それを別扱いにして表現することもあります。これは,このような1つだけ飛び離れた値は,他のデータが分布している理由とは別の理由によって生じている場合があるからです。このような飛び離れた値を外れ値(outlier)といいます。外れ値がある場合,最大値・最小値は外れ値を除いたものを表示します。ボックスプロットの利点は,図 5のように複数のボックスプロットを並べたパラレルボックスプロットによって比較しながら見られるところです。ただし,ボックスプロットにはデータから抽出した量しか表示されておらず,データそのものは隠れてしまっているので注意が必要です。

今日の演習

ヒストグラムについて,以下の設問に答えてください。

1. 本文中の度数分布表から,ヒストグラムを描いてください。

2. 「75点以上 85点未満」「85点以上 95点未満」の2つの階級を合わせて「75点以上 95点未満」とした場合のヒストグラムを描いてください。

浅野 晃/統計学(2013 年度秋学期) 第4回 (2013. 10. 17) http://racco.mikeneko.jp/  3/3 ページ

度数分布を ヒストグラムが

Page 22: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

式で表す

階級値162.5165.5172.5

選ばれる確率 15% 20% 20% 10%177.5

何かの式で書けるものと仮定する

階級

度数

90 100 110 120 130 140

図 1: ヒストグラムはこんなふうには描かない

階級

各柱の面積 =度数

90 100 110 120 130 140 150

図 2: ヒストグラムはこう描く

ボックスプロット

ヒストグラムをさらに簡略化して表現したのがボックスプロット(箱ひげ図)です。これは図 4のように,最小値,第1(下側)四分位数,中位数(中央値,メディアン),第3(上側)四分位数,最大値だけをグラフの中に表示したものです。分布の形を簡単な図で概略つかむことができます。ここで,中位数とは,データを小さいほうから並べたときに順位が 50% (データが 100個のとき 50位)であるもの,第1(第3)四分位数はそれぞれ 25%,75% になるものをさします。

ボックスプロットを描くときに,最大値や最小値が他のデータから飛び離れている場合は,それを別扱いにして表現することもあります。これは,このような1つだけ飛び離れた値は,他のデータが分布している理由とは別の理由によって生じている場合があるからです。このような飛び離れた値を外れ値(outlier)といいます。外れ値がある場合,最大値・最小値は外れ値を除いたものを表示します。ボックスプロットの利点は,図 5のように複数のボックスプロットを並べたパラレルボックスプロットによって比較しながら見られるところです。ただし,ボックスプロットにはデータから抽出した量しか表示されておらず,データそのものは隠れてしまっているので注意が必要です。

今日の演習

ヒストグラムについて,以下の設問に答えてください。

1. 本文中の度数分布表から,ヒストグラムを描いてください。

2. 「75点以上 85点未満」「85点以上 95点未満」の2つの階級を合わせて「75点以上 95点未満」とした場合のヒストグラムを描いてください。

浅野 晃/統計学(2013 年度秋学期) 第4回 (2013. 10. 17) http://racco.mikeneko.jp/  3/3 ページ

度数分布を ヒストグラムが

何かの式で表される関数のグラフであると仮定する

Page 23: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

確率分布モデルとパラメータ

階級

度数

90 100 110 120 130 140

図 1: ヒストグラムはこんなふうには描かない

階級

各柱の面積 =度数

90 100 110 120 130 140 150

図 2: ヒストグラムはこう描く

ボックスプロット

ヒストグラムをさらに簡略化して表現したのがボックスプロット(箱ひげ図)です。これは図 4のように,最小値,第1(下側)四分位数,中位数(中央値,メディアン),第3(上側)四分位数,最大値だけをグラフの中に表示したものです。分布の形を簡単な図で概略つかむことができます。ここで,中位数とは,データを小さいほうから並べたときに順位が 50% (データが 100個のとき 50位)であるもの,第1(第3)四分位数はそれぞれ 25%,75% になるものをさします。

ボックスプロットを描くときに,最大値や最小値が他のデータから飛び離れている場合は,それを別扱いにして表現することもあります。これは,このような1つだけ飛び離れた値は,他のデータが分布している理由とは別の理由によって生じている場合があるからです。このような飛び離れた値を外れ値(outlier)といいます。外れ値がある場合,最大値・最小値は外れ値を除いたものを表示します。ボックスプロットの利点は,図 5のように複数のボックスプロットを並べたパラレルボックスプロットによって比較しながら見られるところです。ただし,ボックスプロットにはデータから抽出した量しか表示されておらず,データそのものは隠れてしまっているので注意が必要です。

今日の演習

ヒストグラムについて,以下の設問に答えてください。

1. 本文中の度数分布表から,ヒストグラムを描いてください。

2. 「75点以上 85点未満」「85点以上 95点未満」の2つの階級を合わせて「75点以上 95点未満」とした場合のヒストグラムを描いてください。

浅野 晃/統計学(2013 年度秋学期) 第4回 (2013. 10. 17) http://racco.mikeneko.jp/  3/3 ページ

何かの式のグラフであると仮定する

Page 24: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

確率分布モデルとパラメータ

階級

度数

90 100 110 120 130 140

図 1: ヒストグラムはこんなふうには描かない

階級

各柱の面積 =度数

90 100 110 120 130 140 150

図 2: ヒストグラムはこう描く

ボックスプロット

ヒストグラムをさらに簡略化して表現したのがボックスプロット(箱ひげ図)です。これは図 4のように,最小値,第1(下側)四分位数,中位数(中央値,メディアン),第3(上側)四分位数,最大値だけをグラフの中に表示したものです。分布の形を簡単な図で概略つかむことができます。ここで,中位数とは,データを小さいほうから並べたときに順位が 50% (データが 100個のとき 50位)であるもの,第1(第3)四分位数はそれぞれ 25%,75% になるものをさします。

ボックスプロットを描くときに,最大値や最小値が他のデータから飛び離れている場合は,それを別扱いにして表現することもあります。これは,このような1つだけ飛び離れた値は,他のデータが分布している理由とは別の理由によって生じている場合があるからです。このような飛び離れた値を外れ値(outlier)といいます。外れ値がある場合,最大値・最小値は外れ値を除いたものを表示します。ボックスプロットの利点は,図 5のように複数のボックスプロットを並べたパラレルボックスプロットによって比較しながら見られるところです。ただし,ボックスプロットにはデータから抽出した量しか表示されておらず,データそのものは隠れてしまっているので注意が必要です。

今日の演習

ヒストグラムについて,以下の設問に答えてください。

1. 本文中の度数分布表から,ヒストグラムを描いてください。

2. 「75点以上 85点未満」「85点以上 95点未満」の2つの階級を合わせて「75点以上 95点未満」とした場合のヒストグラムを描いてください。

浅野 晃/統計学(2013 年度秋学期) 第4回 (2013. 10. 17) http://racco.mikeneko.jp/  3/3 ページ

何かの式のグラフであると仮定する

式=確率分布モデル

Page 25: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

確率分布モデルとパラメータ

階級

度数

90 100 110 120 130 140

図 1: ヒストグラムはこんなふうには描かない

階級

各柱の面積 =度数

90 100 110 120 130 140 150

図 2: ヒストグラムはこう描く

ボックスプロット

ヒストグラムをさらに簡略化して表現したのがボックスプロット(箱ひげ図)です。これは図 4のように,最小値,第1(下側)四分位数,中位数(中央値,メディアン),第3(上側)四分位数,最大値だけをグラフの中に表示したものです。分布の形を簡単な図で概略つかむことができます。ここで,中位数とは,データを小さいほうから並べたときに順位が 50% (データが 100個のとき 50位)であるもの,第1(第3)四分位数はそれぞれ 25%,75% になるものをさします。

ボックスプロットを描くときに,最大値や最小値が他のデータから飛び離れている場合は,それを別扱いにして表現することもあります。これは,このような1つだけ飛び離れた値は,他のデータが分布している理由とは別の理由によって生じている場合があるからです。このような飛び離れた値を外れ値(outlier)といいます。外れ値がある場合,最大値・最小値は外れ値を除いたものを表示します。ボックスプロットの利点は,図 5のように複数のボックスプロットを並べたパラレルボックスプロットによって比較しながら見られるところです。ただし,ボックスプロットにはデータから抽出した量しか表示されておらず,データそのものは隠れてしまっているので注意が必要です。

今日の演習

ヒストグラムについて,以下の設問に答えてください。

1. 本文中の度数分布表から,ヒストグラムを描いてください。

2. 「75点以上 85点未満」「85点以上 95点未満」の2つの階級を合わせて「75点以上 95点未満」とした場合のヒストグラムを描いてください。

浅野 晃/統計学(2013 年度秋学期) 第4回 (2013. 10. 17) http://racco.mikeneko.jp/  3/3 ページ

何かの式のグラフであると仮定する

パラメータを推定すればグラフが描ける

式=確率分布モデル

Page 26: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

確率分布モデルとパラメータ

階級

度数

90 100 110 120 130 140

図 1: ヒストグラムはこんなふうには描かない

階級

各柱の面積 =度数

90 100 110 120 130 140 150

図 2: ヒストグラムはこう描く

ボックスプロット

ヒストグラムをさらに簡略化して表現したのがボックスプロット(箱ひげ図)です。これは図 4のように,最小値,第1(下側)四分位数,中位数(中央値,メディアン),第3(上側)四分位数,最大値だけをグラフの中に表示したものです。分布の形を簡単な図で概略つかむことができます。ここで,中位数とは,データを小さいほうから並べたときに順位が 50% (データが 100個のとき 50位)であるもの,第1(第3)四分位数はそれぞれ 25%,75% になるものをさします。

ボックスプロットを描くときに,最大値や最小値が他のデータから飛び離れている場合は,それを別扱いにして表現することもあります。これは,このような1つだけ飛び離れた値は,他のデータが分布している理由とは別の理由によって生じている場合があるからです。このような飛び離れた値を外れ値(outlier)といいます。外れ値がある場合,最大値・最小値は外れ値を除いたものを表示します。ボックスプロットの利点は,図 5のように複数のボックスプロットを並べたパラレルボックスプロットによって比較しながら見られるところです。ただし,ボックスプロットにはデータから抽出した量しか表示されておらず,データそのものは隠れてしまっているので注意が必要です。

今日の演習

ヒストグラムについて,以下の設問に答えてください。

1. 本文中の度数分布表から,ヒストグラムを描いてください。

2. 「75点以上 85点未満」「85点以上 95点未満」の2つの階級を合わせて「75点以上 95点未満」とした場合のヒストグラムを描いてください。

浅野 晃/統計学(2013 年度秋学期) 第4回 (2013. 10. 17) http://racco.mikeneko.jp/  3/3 ページ

何かの式のグラフであると仮定する

パラメータを推定すればグラフが描ける

式=確率分布モデル

直線のモデル

Page 27: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

確率分布モデルとパラメータ

階級

度数

90 100 110 120 130 140

図 1: ヒストグラムはこんなふうには描かない

階級

各柱の面積 =度数

90 100 110 120 130 140 150

図 2: ヒストグラムはこう描く

ボックスプロット

ヒストグラムをさらに簡略化して表現したのがボックスプロット(箱ひげ図)です。これは図 4のように,最小値,第1(下側)四分位数,中位数(中央値,メディアン),第3(上側)四分位数,最大値だけをグラフの中に表示したものです。分布の形を簡単な図で概略つかむことができます。ここで,中位数とは,データを小さいほうから並べたときに順位が 50% (データが 100個のとき 50位)であるもの,第1(第3)四分位数はそれぞれ 25%,75% になるものをさします。

ボックスプロットを描くときに,最大値や最小値が他のデータから飛び離れている場合は,それを別扱いにして表現することもあります。これは,このような1つだけ飛び離れた値は,他のデータが分布している理由とは別の理由によって生じている場合があるからです。このような飛び離れた値を外れ値(outlier)といいます。外れ値がある場合,最大値・最小値は外れ値を除いたものを表示します。ボックスプロットの利点は,図 5のように複数のボックスプロットを並べたパラレルボックスプロットによって比較しながら見られるところです。ただし,ボックスプロットにはデータから抽出した量しか表示されておらず,データそのものは隠れてしまっているので注意が必要です。

今日の演習

ヒストグラムについて,以下の設問に答えてください。

1. 本文中の度数分布表から,ヒストグラムを描いてください。

2. 「75点以上 85点未満」「85点以上 95点未満」の2つの階級を合わせて「75点以上 95点未満」とした場合のヒストグラムを描いてください。

浅野 晃/統計学(2013 年度秋学期) 第4回 (2013. 10. 17) http://racco.mikeneko.jp/  3/3 ページ

何かの式のグラフであると仮定する

パラメータを推定すればグラフが描ける

式=確率分布モデル

直線のモデル

Page 28: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

確率分布モデルとパラメータ

階級

度数

90 100 110 120 130 140

図 1: ヒストグラムはこんなふうには描かない

階級

各柱の面積 =度数

90 100 110 120 130 140 150

図 2: ヒストグラムはこう描く

ボックスプロット

ヒストグラムをさらに簡略化して表現したのがボックスプロット(箱ひげ図)です。これは図 4のように,最小値,第1(下側)四分位数,中位数(中央値,メディアン),第3(上側)四分位数,最大値だけをグラフの中に表示したものです。分布の形を簡単な図で概略つかむことができます。ここで,中位数とは,データを小さいほうから並べたときに順位が 50% (データが 100個のとき 50位)であるもの,第1(第3)四分位数はそれぞれ 25%,75% になるものをさします。

ボックスプロットを描くときに,最大値や最小値が他のデータから飛び離れている場合は,それを別扱いにして表現することもあります。これは,このような1つだけ飛び離れた値は,他のデータが分布している理由とは別の理由によって生じている場合があるからです。このような飛び離れた値を外れ値(outlier)といいます。外れ値がある場合,最大値・最小値は外れ値を除いたものを表示します。ボックスプロットの利点は,図 5のように複数のボックスプロットを並べたパラレルボックスプロットによって比較しながら見られるところです。ただし,ボックスプロットにはデータから抽出した量しか表示されておらず,データそのものは隠れてしまっているので注意が必要です。

今日の演習

ヒストグラムについて,以下の設問に答えてください。

1. 本文中の度数分布表から,ヒストグラムを描いてください。

2. 「75点以上 85点未満」「85点以上 95点未満」の2つの階級を合わせて「75点以上 95点未満」とした場合のヒストグラムを描いてください。

浅野 晃/統計学(2013 年度秋学期) 第4回 (2013. 10. 17) http://racco.mikeneko.jp/  3/3 ページ

何かの式のグラフであると仮定する

パラメータを推定すればグラフが描ける

式=確率分布モデル

直線のモデル

Page 29: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

確率分布モデルとパラメータ

階級

度数

90 100 110 120 130 140

図 1: ヒストグラムはこんなふうには描かない

階級

各柱の面積 =度数

90 100 110 120 130 140 150

図 2: ヒストグラムはこう描く

ボックスプロット

ヒストグラムをさらに簡略化して表現したのがボックスプロット(箱ひげ図)です。これは図 4のように,最小値,第1(下側)四分位数,中位数(中央値,メディアン),第3(上側)四分位数,最大値だけをグラフの中に表示したものです。分布の形を簡単な図で概略つかむことができます。ここで,中位数とは,データを小さいほうから並べたときに順位が 50% (データが 100個のとき 50位)であるもの,第1(第3)四分位数はそれぞれ 25%,75% になるものをさします。

ボックスプロットを描くときに,最大値や最小値が他のデータから飛び離れている場合は,それを別扱いにして表現することもあります。これは,このような1つだけ飛び離れた値は,他のデータが分布している理由とは別の理由によって生じている場合があるからです。このような飛び離れた値を外れ値(outlier)といいます。外れ値がある場合,最大値・最小値は外れ値を除いたものを表示します。ボックスプロットの利点は,図 5のように複数のボックスプロットを並べたパラレルボックスプロットによって比較しながら見られるところです。ただし,ボックスプロットにはデータから抽出した量しか表示されておらず,データそのものは隠れてしまっているので注意が必要です。

今日の演習

ヒストグラムについて,以下の設問に答えてください。

1. 本文中の度数分布表から,ヒストグラムを描いてください。

2. 「75点以上 85点未満」「85点以上 95点未満」の2つの階級を合わせて「75点以上 95点未満」とした場合のヒストグラムを描いてください。

浅野 晃/統計学(2013 年度秋学期) 第4回 (2013. 10. 17) http://racco.mikeneko.jp/  3/3 ページ

何かの式のグラフであると仮定する

パラメータを推定すればグラフが描ける

式=確率分布モデル

直線のモデル

2013年度秋学期 統計学 第11回分布の「型」を考える-確率分布モデルと正規分布

確率分布モデル

前回の講義の最後に,標本平均は母平均の推測結果としてもそうおかしくはない,ただし間違った推測をしてしまう可能性はある,という説明をしました。

では,間違った推測をしてしまう可能性,つまり推測の不確かさを,確率の形で計算するには,どうすればよいでしょうか? 計算をするには,問題が式と数で表されていなければなりません。しかし,この計算のてがかりとなる母集団分布(=標本がしたがう確率分布)は,数字の集まりにすぎず,式ではあらわされていません。これでは,計算はできません。

そこで用いるのが,「モデル」の考え方です。この考えでは,母集団分布(=標本がしたがう確率分布)が,ある数式で表されるものだと仮定してしまいます。いわば,母集団分布のヒストグラムが,ある式であらわされる関数のグラフになっていると考えるのです。この数式を確率分布モデルといい,母集団のなりたちに合わせていろいろなものが考えられています。

関数を式で表す場合,そのグラフの大きさや位置を調整する数字があります。例えば,1次関数を表す式 y = ax + bの aや bです。これらの数字をパラメータといい,確率分布モデルにもパラメータがあります。これから,確率分布モデルのパラメータを標本から推測することで,推測の不確かさを計算してゆきます。

連続型確率分布

ここまでの講義で,度数分布→確率分布→確率変数という順に進めてきた説明では,連続した数値の区間である階級を,ひとつの数値で代表する「階級値」というものをわざわざ導入することで,確率変数は 172.5cmのつぎは 177.5cmというように「とびとび」の値をとる,と考えてきました。

しかし,数学では,とびとびの値をとる数式よりも,連続なグラフになるような数式のほうがずっと簡単なはずです。ですから,ヒストグラムを数式で表すために,「とびとびではなく連続的な値をとる」確率変数というのは考えられないのでしょうか。

そこで,ヒストグラムの説明のところで述べた,「ヒストグラムの柱は,分割することができる」という性質を使います。ヒストグラムの各柱をどんどん細かく分割することで,階級の区切りかたを「十分に」細かくしたとします。このような確率分布は,値がとびとびにならない,「ある範囲内のどんな値にでもなることができる」確率分布と考えることができます(図 2)。このような確率分布を連続型確率分布といい,これに対し,確率変数が(階級に区切ったのではなく)本来とびとびの値(例えば,くじびきの当たり回数)になるような確率分布を離散型確率分布といいます。連続型確率分布では,確率変数が「ある1つの値」をとる確率ではなく,「ある範囲の値」をとる確率を考えます。離散型確率分布で確率変数が「ある範囲の値」をとる確率は,確率変数のある範囲内の値に対応する確率を合計したものです。ヒストグラム上でこれを見ると,ある範囲内にある「柱」の面積を合計したものになります(図 2の左)。「ヒストグラムで度数を表しているのは柱の高さではなく柱の面積」であるからです。

これを,階級の区切りが見えないほど細かくなったヒストグラムで考えると,柱の境目は見えなくなっているので,灰色の部分の面積がそれに相当します(図 2の右)。この面積は,数学では「『ヒストグラ

浅野 晃/統計学(2013 年度秋学期) 第11回 (2013. 12. 5) http://racco.mikeneko.jp/  1/4ページ

Page 30: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

確率分布モデルとパラメータ

階級

度数

90 100 110 120 130 140

図 1: ヒストグラムはこんなふうには描かない

階級

各柱の面積 =度数

90 100 110 120 130 140 150

図 2: ヒストグラムはこう描く

ボックスプロット

ヒストグラムをさらに簡略化して表現したのがボックスプロット(箱ひげ図)です。これは図 4のように,最小値,第1(下側)四分位数,中位数(中央値,メディアン),第3(上側)四分位数,最大値だけをグラフの中に表示したものです。分布の形を簡単な図で概略つかむことができます。ここで,中位数とは,データを小さいほうから並べたときに順位が 50% (データが 100個のとき 50位)であるもの,第1(第3)四分位数はそれぞれ 25%,75% になるものをさします。

ボックスプロットを描くときに,最大値や最小値が他のデータから飛び離れている場合は,それを別扱いにして表現することもあります。これは,このような1つだけ飛び離れた値は,他のデータが分布している理由とは別の理由によって生じている場合があるからです。このような飛び離れた値を外れ値(outlier)といいます。外れ値がある場合,最大値・最小値は外れ値を除いたものを表示します。ボックスプロットの利点は,図 5のように複数のボックスプロットを並べたパラレルボックスプロットによって比較しながら見られるところです。ただし,ボックスプロットにはデータから抽出した量しか表示されておらず,データそのものは隠れてしまっているので注意が必要です。

今日の演習

ヒストグラムについて,以下の設問に答えてください。

1. 本文中の度数分布表から,ヒストグラムを描いてください。

2. 「75点以上 85点未満」「85点以上 95点未満」の2つの階級を合わせて「75点以上 95点未満」とした場合のヒストグラムを描いてください。

浅野 晃/統計学(2013 年度秋学期) 第4回 (2013. 10. 17) http://racco.mikeneko.jp/  3/3 ページ

何かの式のグラフであると仮定する

パラメータを推定すればグラフが描ける

式=確率分布モデル

直線のモデル

2013年度秋学期 統計学 第11回分布の「型」を考える-確率分布モデルと正規分布

確率分布モデル

前回の講義の最後に,標本平均は母平均の推測結果としてもそうおかしくはない,ただし間違った推測をしてしまう可能性はある,という説明をしました。

では,間違った推測をしてしまう可能性,つまり推測の不確かさを,確率の形で計算するには,どうすればよいでしょうか? 計算をするには,問題が式と数で表されていなければなりません。しかし,この計算のてがかりとなる母集団分布(=標本がしたがう確率分布)は,数字の集まりにすぎず,式ではあらわされていません。これでは,計算はできません。

そこで用いるのが,「モデル」の考え方です。この考えでは,母集団分布(=標本がしたがう確率分布)が,ある数式で表されるものだと仮定してしまいます。いわば,母集団分布のヒストグラムが,ある式であらわされる関数のグラフになっていると考えるのです。この数式を確率分布モデルといい,母集団のなりたちに合わせていろいろなものが考えられています。

関数を式で表す場合,そのグラフの大きさや位置を調整する数字があります。例えば,1次関数を表す式 y = ax + bの aや bです。これらの数字をパラメータといい,確率分布モデルにもパラメータがあります。これから,確率分布モデルのパラメータを標本から推測することで,推測の不確かさを計算してゆきます。

連続型確率分布

ここまでの講義で,度数分布→確率分布→確率変数という順に進めてきた説明では,連続した数値の区間である階級を,ひとつの数値で代表する「階級値」というものをわざわざ導入することで,確率変数は 172.5cmのつぎは 177.5cmというように「とびとび」の値をとる,と考えてきました。

しかし,数学では,とびとびの値をとる数式よりも,連続なグラフになるような数式のほうがずっと簡単なはずです。ですから,ヒストグラムを数式で表すために,「とびとびではなく連続的な値をとる」確率変数というのは考えられないのでしょうか。

そこで,ヒストグラムの説明のところで述べた,「ヒストグラムの柱は,分割することができる」という性質を使います。ヒストグラムの各柱をどんどん細かく分割することで,階級の区切りかたを「十分に」細かくしたとします。このような確率分布は,値がとびとびにならない,「ある範囲内のどんな値にでもなることができる」確率分布と考えることができます(図 2)。このような確率分布を連続型確率分布といい,これに対し,確率変数が(階級に区切ったのではなく)本来とびとびの値(例えば,くじびきの当たり回数)になるような確率分布を離散型確率分布といいます。連続型確率分布では,確率変数が「ある1つの値」をとる確率ではなく,「ある範囲の値」をとる確率を考えます。離散型確率分布で確率変数が「ある範囲の値」をとる確率は,確率変数のある範囲内の値に対応する確率を合計したものです。ヒストグラム上でこれを見ると,ある範囲内にある「柱」の面積を合計したものになります(図 2の左)。「ヒストグラムで度数を表しているのは柱の高さではなく柱の面積」であるからです。

これを,階級の区切りが見えないほど細かくなったヒストグラムで考えると,柱の境目は見えなくなっているので,灰色の部分の面積がそれに相当します(図 2の右)。この面積は,数学では「『ヒストグラ

浅野 晃/統計学(2013 年度秋学期) 第11回 (2013. 12. 5) http://racco.mikeneko.jp/  1/4ページ

Page 31: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

確率分布モデルとパラメータ

階級

度数

90 100 110 120 130 140

図 1: ヒストグラムはこんなふうには描かない

階級

各柱の面積 =度数

90 100 110 120 130 140 150

図 2: ヒストグラムはこう描く

ボックスプロット

ヒストグラムをさらに簡略化して表現したのがボックスプロット(箱ひげ図)です。これは図 4のように,最小値,第1(下側)四分位数,中位数(中央値,メディアン),第3(上側)四分位数,最大値だけをグラフの中に表示したものです。分布の形を簡単な図で概略つかむことができます。ここで,中位数とは,データを小さいほうから並べたときに順位が 50% (データが 100個のとき 50位)であるもの,第1(第3)四分位数はそれぞれ 25%,75% になるものをさします。

ボックスプロットを描くときに,最大値や最小値が他のデータから飛び離れている場合は,それを別扱いにして表現することもあります。これは,このような1つだけ飛び離れた値は,他のデータが分布している理由とは別の理由によって生じている場合があるからです。このような飛び離れた値を外れ値(outlier)といいます。外れ値がある場合,最大値・最小値は外れ値を除いたものを表示します。ボックスプロットの利点は,図 5のように複数のボックスプロットを並べたパラレルボックスプロットによって比較しながら見られるところです。ただし,ボックスプロットにはデータから抽出した量しか表示されておらず,データそのものは隠れてしまっているので注意が必要です。

今日の演習

ヒストグラムについて,以下の設問に答えてください。

1. 本文中の度数分布表から,ヒストグラムを描いてください。

2. 「75点以上 85点未満」「85点以上 95点未満」の2つの階級を合わせて「75点以上 95点未満」とした場合のヒストグラムを描いてください。

浅野 晃/統計学(2013 年度秋学期) 第4回 (2013. 10. 17) http://racco.mikeneko.jp/  3/3 ページ

何かの式のグラフであると仮定する

パラメータを推定すればグラフが描ける

式=確率分布モデル

直線のモデル

2013年度秋学期 統計学 第11回分布の「型」を考える-確率分布モデルと正規分布

確率分布モデル

前回の講義の最後に,標本平均は母平均の推測結果としてもそうおかしくはない,ただし間違った推測をしてしまう可能性はある,という説明をしました。

では,間違った推測をしてしまう可能性,つまり推測の不確かさを,確率の形で計算するには,どうすればよいでしょうか? 計算をするには,問題が式と数で表されていなければなりません。しかし,この計算のてがかりとなる母集団分布(=標本がしたがう確率分布)は,数字の集まりにすぎず,式ではあらわされていません。これでは,計算はできません。

そこで用いるのが,「モデル」の考え方です。この考えでは,母集団分布(=標本がしたがう確率分布)が,ある数式で表されるものだと仮定してしまいます。いわば,母集団分布のヒストグラムが,ある式であらわされる関数のグラフになっていると考えるのです。この数式を確率分布モデルといい,母集団のなりたちに合わせていろいろなものが考えられています。

関数を式で表す場合,そのグラフの大きさや位置を調整する数字があります。例えば,1次関数を表す式 y = ax + bの aや bです。これらの数字をパラメータといい,確率分布モデルにもパラメータがあります。これから,確率分布モデルのパラメータを標本から推測することで,推測の不確かさを計算してゆきます。

連続型確率分布

ここまでの講義で,度数分布→確率分布→確率変数という順に進めてきた説明では,連続した数値の区間である階級を,ひとつの数値で代表する「階級値」というものをわざわざ導入することで,確率変数は 172.5cmのつぎは 177.5cmというように「とびとび」の値をとる,と考えてきました。

しかし,数学では,とびとびの値をとる数式よりも,連続なグラフになるような数式のほうがずっと簡単なはずです。ですから,ヒストグラムを数式で表すために,「とびとびではなく連続的な値をとる」確率変数というのは考えられないのでしょうか。

そこで,ヒストグラムの説明のところで述べた,「ヒストグラムの柱は,分割することができる」という性質を使います。ヒストグラムの各柱をどんどん細かく分割することで,階級の区切りかたを「十分に」細かくしたとします。このような確率分布は,値がとびとびにならない,「ある範囲内のどんな値にでもなることができる」確率分布と考えることができます(図 2)。このような確率分布を連続型確率分布といい,これに対し,確率変数が(階級に区切ったのではなく)本来とびとびの値(例えば,くじびきの当たり回数)になるような確率分布を離散型確率分布といいます。連続型確率分布では,確率変数が「ある1つの値」をとる確率ではなく,「ある範囲の値」をとる確率を考えます。離散型確率分布で確率変数が「ある範囲の値」をとる確率は,確率変数のある範囲内の値に対応する確率を合計したものです。ヒストグラム上でこれを見ると,ある範囲内にある「柱」の面積を合計したものになります(図 2の左)。「ヒストグラムで度数を表しているのは柱の高さではなく柱の面積」であるからです。

これを,階級の区切りが見えないほど細かくなったヒストグラムで考えると,柱の境目は見えなくなっているので,灰色の部分の面積がそれに相当します(図 2の右)。この面積は,数学では「『ヒストグラ

浅野 晃/統計学(2013 年度秋学期) 第11回 (2013. 12. 5) http://racco.mikeneko.jp/  1/4ページ

Page 32: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

確率分布モデルとパラメータ

階級

度数

90 100 110 120 130 140

図 1: ヒストグラムはこんなふうには描かない

階級

各柱の面積 =度数

90 100 110 120 130 140 150

図 2: ヒストグラムはこう描く

ボックスプロット

ヒストグラムをさらに簡略化して表現したのがボックスプロット(箱ひげ図)です。これは図 4のように,最小値,第1(下側)四分位数,中位数(中央値,メディアン),第3(上側)四分位数,最大値だけをグラフの中に表示したものです。分布の形を簡単な図で概略つかむことができます。ここで,中位数とは,データを小さいほうから並べたときに順位が 50% (データが 100個のとき 50位)であるもの,第1(第3)四分位数はそれぞれ 25%,75% になるものをさします。

ボックスプロットを描くときに,最大値や最小値が他のデータから飛び離れている場合は,それを別扱いにして表現することもあります。これは,このような1つだけ飛び離れた値は,他のデータが分布している理由とは別の理由によって生じている場合があるからです。このような飛び離れた値を外れ値(outlier)といいます。外れ値がある場合,最大値・最小値は外れ値を除いたものを表示します。ボックスプロットの利点は,図 5のように複数のボックスプロットを並べたパラレルボックスプロットによって比較しながら見られるところです。ただし,ボックスプロットにはデータから抽出した量しか表示されておらず,データそのものは隠れてしまっているので注意が必要です。

今日の演習

ヒストグラムについて,以下の設問に答えてください。

1. 本文中の度数分布表から,ヒストグラムを描いてください。

2. 「75点以上 85点未満」「85点以上 95点未満」の2つの階級を合わせて「75点以上 95点未満」とした場合のヒストグラムを描いてください。

浅野 晃/統計学(2013 年度秋学期) 第4回 (2013. 10. 17) http://racco.mikeneko.jp/  3/3 ページ

何かの式のグラフであると仮定する

パラメータを推定すればグラフが描ける

式=確率分布モデル

直線のモデル

2013年度秋学期 統計学 第11回分布の「型」を考える-確率分布モデルと正規分布

確率分布モデル

前回の講義の最後に,標本平均は母平均の推測結果としてもそうおかしくはない,ただし間違った推測をしてしまう可能性はある,という説明をしました。

では,間違った推測をしてしまう可能性,つまり推測の不確かさを,確率の形で計算するには,どうすればよいでしょうか? 計算をするには,問題が式と数で表されていなければなりません。しかし,この計算のてがかりとなる母集団分布(=標本がしたがう確率分布)は,数字の集まりにすぎず,式ではあらわされていません。これでは,計算はできません。

そこで用いるのが,「モデル」の考え方です。この考えでは,母集団分布(=標本がしたがう確率分布)が,ある数式で表されるものだと仮定してしまいます。いわば,母集団分布のヒストグラムが,ある式であらわされる関数のグラフになっていると考えるのです。この数式を確率分布モデルといい,母集団のなりたちに合わせていろいろなものが考えられています。

関数を式で表す場合,そのグラフの大きさや位置を調整する数字があります。例えば,1次関数を表す式 y = ax + bの aや bです。これらの数字をパラメータといい,確率分布モデルにもパラメータがあります。これから,確率分布モデルのパラメータを標本から推測することで,推測の不確かさを計算してゆきます。

連続型確率分布

ここまでの講義で,度数分布→確率分布→確率変数という順に進めてきた説明では,連続した数値の区間である階級を,ひとつの数値で代表する「階級値」というものをわざわざ導入することで,確率変数は 172.5cmのつぎは 177.5cmというように「とびとび」の値をとる,と考えてきました。

しかし,数学では,とびとびの値をとる数式よりも,連続なグラフになるような数式のほうがずっと簡単なはずです。ですから,ヒストグラムを数式で表すために,「とびとびではなく連続的な値をとる」確率変数というのは考えられないのでしょうか。

そこで,ヒストグラムの説明のところで述べた,「ヒストグラムの柱は,分割することができる」という性質を使います。ヒストグラムの各柱をどんどん細かく分割することで,階級の区切りかたを「十分に」細かくしたとします。このような確率分布は,値がとびとびにならない,「ある範囲内のどんな値にでもなることができる」確率分布と考えることができます(図 2)。このような確率分布を連続型確率分布といい,これに対し,確率変数が(階級に区切ったのではなく)本来とびとびの値(例えば,くじびきの当たり回数)になるような確率分布を離散型確率分布といいます。連続型確率分布では,確率変数が「ある1つの値」をとる確率ではなく,「ある範囲の値」をとる確率を考えます。離散型確率分布で確率変数が「ある範囲の値」をとる確率は,確率変数のある範囲内の値に対応する確率を合計したものです。ヒストグラム上でこれを見ると,ある範囲内にある「柱」の面積を合計したものになります(図 2の左)。「ヒストグラムで度数を表しているのは柱の高さではなく柱の面積」であるからです。

これを,階級の区切りが見えないほど細かくなったヒストグラムで考えると,柱の境目は見えなくなっているので,灰色の部分の面積がそれに相当します(図 2の右)。この面積は,数学では「『ヒストグラ

浅野 晃/統計学(2013 年度秋学期) 第11回 (2013. 12. 5) http://racco.mikeneko.jp/  1/4ページ

パラメータ

Page 33: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

A. A

sano

, Kan

sai U

niv.

Page 34: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

A. A

sano

, Kan

sai U

niv.

連続型確率分布

Page 35: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

ヒストグラムを式で表すこんなヒストグラムを,式で書けるだろうか?

度数分布のヒストグラム

たくさんのデータによって描かれている

関数のグラフで表す

いくつかの「パラメータ」を決めれば描ける

図 1: 確率分布モデル

ムの上端をつないだグラフで表される関数』の『ある範囲』での積分」といいます。この「ヒストグラムの上端をつないだグラフで表される関数」を確率密度関数といいます。この講義では積分の計算をすることはありませんが,特定の確率分布モデルでの積分の値を計算してまとめた数表はよく用います。

「確率変数がある範囲の値に入る確率」 =「確率密度関数のグラフの下の部分のうち,この範囲にあたる部分の面積」(=「確率密度関数のこの範囲での積分」)

という関係は,今後の講義でよく出てきますので,よく理解してください。

確率密度関数は確率変数がとりうる各値の「現れやすさ」を表してはいますが,確率そのものではないことに注意してください。「連続型確率変数がある1つの値をとる確率」は,確率密度関数の値ではありません。「連続型確率変数がある1つの値をとる確率」は,範囲の幅が0ですからその範囲に対応するグラフの下の部分の面積も0で,すなわち0であることに注意しましょう。また,グラフの下の部分全体の面積は,「確率変数の値が,とりうる値の範囲全体のどこかにある確率」ですから 1 (100%)となります。

ところで,現実のデータは,必ず何桁かの数字で表されるわけですから,どんなに細かく表現してても必ず「デジタル」,すなわち「とびとび(離散的)」です。連続型確率分布というのは,あくまで数式で表しやすくするための手段だと考えてください。

正規分布モデル

代表的な連続型確率分布モデルである正規分布モデルは一番応用範囲の広い確率分布モデルで,世の中には正規分布モデルであらわせるような母集団分布がたくさんあります。これは,中心極限定理という定理があるからです。中心極限定理とは,ひとことでいうと「母集団のデータが分布している(ばらついている)原因が,無数の独立な原因によるデータの分布の合計になっているときは,母集団分布は概ね正規分布になる」ということです。

正規分布モデルのパラメータは期待値と分散で,確率変数 Xの確率分布が期待値 µ,分散!2の正規分布であることを,「確率変数 Xは正規分布 N(µ,!2)にしたがう」あるいはさらに短く「X ! N(µ,!2)」と書きます。正規分布の確率密度関数のグラフは図 3のようになります。期待値 µをとる確率密度がいちばん高く,左右対称に広がっています。

浅野 晃/統計学(2013 年度秋学期) 第11回 (2013. 12. 5) http://racco.mikeneko.jp/  2/4ページ

Page 36: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

ヒストグラムを式で表すこんなヒストグラムを,式で書けるだろうか?

度数分布のヒストグラム

たくさんのデータによって描かれている

関数のグラフで表す

いくつかの「パラメータ」を決めれば描ける

図 1: 確率分布モデル

ムの上端をつないだグラフで表される関数』の『ある範囲』での積分」といいます。この「ヒストグラムの上端をつないだグラフで表される関数」を確率密度関数といいます。この講義では積分の計算をすることはありませんが,特定の確率分布モデルでの積分の値を計算してまとめた数表はよく用います。

「確率変数がある範囲の値に入る確率」 =「確率密度関数のグラフの下の部分のうち,この範囲にあたる部分の面積」(=「確率密度関数のこの範囲での積分」)

という関係は,今後の講義でよく出てきますので,よく理解してください。

確率密度関数は確率変数がとりうる各値の「現れやすさ」を表してはいますが,確率そのものではないことに注意してください。「連続型確率変数がある1つの値をとる確率」は,確率密度関数の値ではありません。「連続型確率変数がある1つの値をとる確率」は,範囲の幅が0ですからその範囲に対応するグラフの下の部分の面積も0で,すなわち0であることに注意しましょう。また,グラフの下の部分全体の面積は,「確率変数の値が,とりうる値の範囲全体のどこかにある確率」ですから 1 (100%)となります。

ところで,現実のデータは,必ず何桁かの数字で表されるわけですから,どんなに細かく表現してても必ず「デジタル」,すなわち「とびとび(離散的)」です。連続型確率分布というのは,あくまで数式で表しやすくするための手段だと考えてください。

正規分布モデル

代表的な連続型確率分布モデルである正規分布モデルは一番応用範囲の広い確率分布モデルで,世の中には正規分布モデルであらわせるような母集団分布がたくさんあります。これは,中心極限定理という定理があるからです。中心極限定理とは,ひとことでいうと「母集団のデータが分布している(ばらついている)原因が,無数の独立な原因によるデータの分布の合計になっているときは,母集団分布は概ね正規分布になる」ということです。

正規分布モデルのパラメータは期待値と分散で,確率変数 Xの確率分布が期待値 µ,分散!2の正規分布であることを,「確率変数 Xは正規分布 N(µ,!2)にしたがう」あるいはさらに短く「X ! N(µ,!2)」と書きます。正規分布の確率密度関数のグラフは図 3のようになります。期待値 µをとる確率密度がいちばん高く,左右対称に広がっています。

浅野 晃/統計学(2013 年度秋学期) 第11回 (2013. 12. 5) http://racco.mikeneko.jp/  2/4ページ

度数分布のヒストグラム

たくさんのデータによって描かれている

関数のグラフで表す

いくつかの「パラメータ」を決めれば描ける

図 1: 確率分布モデル

ムの上端をつないだグラフで表される関数』の『ある範囲』での積分」といいます。この「ヒストグラムの上端をつないだグラフで表される関数」を確率密度関数といいます。この講義では積分の計算をすることはありませんが,特定の確率分布モデルでの積分の値を計算してまとめた数表はよく用います。

「確率変数がある範囲の値に入る確率」 =「確率密度関数のグラフの下の部分のうち,この範囲にあたる部分の面積」(=「確率密度関数のこの範囲での積分」)

という関係は,今後の講義でよく出てきますので,よく理解してください。

確率密度関数は確率変数がとりうる各値の「現れやすさ」を表してはいますが,確率そのものではないことに注意してください。「連続型確率変数がある1つの値をとる確率」は,確率密度関数の値ではありません。「連続型確率変数がある1つの値をとる確率」は,範囲の幅が0ですからその範囲に対応するグラフの下の部分の面積も0で,すなわち0であることに注意しましょう。また,グラフの下の部分全体の面積は,「確率変数の値が,とりうる値の範囲全体のどこかにある確率」ですから 1 (100%)となります。

ところで,現実のデータは,必ず何桁かの数字で表されるわけですから,どんなに細かく表現してても必ず「デジタル」,すなわち「とびとび(離散的)」です。連続型確率分布というのは,あくまで数式で表しやすくするための手段だと考えてください。

正規分布モデル

代表的な連続型確率分布モデルである正規分布モデルは一番応用範囲の広い確率分布モデルで,世の中には正規分布モデルであらわせるような母集団分布がたくさんあります。これは,中心極限定理という定理があるからです。中心極限定理とは,ひとことでいうと「母集団のデータが分布している(ばらついている)原因が,無数の独立な原因によるデータの分布の合計になっているときは,母集団分布は概ね正規分布になる」ということです。

正規分布モデルのパラメータは期待値と分散で,確率変数 Xの確率分布が期待値 µ,分散!2の正規分布であることを,「確率変数 Xは正規分布 N(µ,!2)にしたがう」あるいはさらに短く「X ! N(µ,!2)」と書きます。正規分布の確率密度関数のグラフは図 3のようになります。期待値 µをとる確率密度がいちばん高く,左右対称に広がっています。

浅野 晃/統計学(2013 年度秋学期) 第11回 (2013. 12. 5) http://racco.mikeneko.jp/  2/4ページ

これを表す式のほうが数学は簡単。

Page 37: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

ヒストグラムを式で表すこんなヒストグラムを,式で書けるだろうか?

度数分布のヒストグラム

たくさんのデータによって描かれている

関数のグラフで表す

いくつかの「パラメータ」を決めれば描ける

図 1: 確率分布モデル

ムの上端をつないだグラフで表される関数』の『ある範囲』での積分」といいます。この「ヒストグラムの上端をつないだグラフで表される関数」を確率密度関数といいます。この講義では積分の計算をすることはありませんが,特定の確率分布モデルでの積分の値を計算してまとめた数表はよく用います。

「確率変数がある範囲の値に入る確率」 =「確率密度関数のグラフの下の部分のうち,この範囲にあたる部分の面積」(=「確率密度関数のこの範囲での積分」)

という関係は,今後の講義でよく出てきますので,よく理解してください。

確率密度関数は確率変数がとりうる各値の「現れやすさ」を表してはいますが,確率そのものではないことに注意してください。「連続型確率変数がある1つの値をとる確率」は,確率密度関数の値ではありません。「連続型確率変数がある1つの値をとる確率」は,範囲の幅が0ですからその範囲に対応するグラフの下の部分の面積も0で,すなわち0であることに注意しましょう。また,グラフの下の部分全体の面積は,「確率変数の値が,とりうる値の範囲全体のどこかにある確率」ですから 1 (100%)となります。

ところで,現実のデータは,必ず何桁かの数字で表されるわけですから,どんなに細かく表現してても必ず「デジタル」,すなわち「とびとび(離散的)」です。連続型確率分布というのは,あくまで数式で表しやすくするための手段だと考えてください。

正規分布モデル

代表的な連続型確率分布モデルである正規分布モデルは一番応用範囲の広い確率分布モデルで,世の中には正規分布モデルであらわせるような母集団分布がたくさんあります。これは,中心極限定理という定理があるからです。中心極限定理とは,ひとことでいうと「母集団のデータが分布している(ばらついている)原因が,無数の独立な原因によるデータの分布の合計になっているときは,母集団分布は概ね正規分布になる」ということです。

正規分布モデルのパラメータは期待値と分散で,確率変数 Xの確率分布が期待値 µ,分散!2の正規分布であることを,「確率変数 Xは正規分布 N(µ,!2)にしたがう」あるいはさらに短く「X ! N(µ,!2)」と書きます。正規分布の確率密度関数のグラフは図 3のようになります。期待値 µをとる確率密度がいちばん高く,左右対称に広がっています。

浅野 晃/統計学(2013 年度秋学期) 第11回 (2013. 12. 5) http://racco.mikeneko.jp/  2/4ページ

度数分布のヒストグラム

たくさんのデータによって描かれている

関数のグラフで表す

いくつかの「パラメータ」を決めれば描ける

図 1: 確率分布モデル

ムの上端をつないだグラフで表される関数』の『ある範囲』での積分」といいます。この「ヒストグラムの上端をつないだグラフで表される関数」を確率密度関数といいます。この講義では積分の計算をすることはありませんが,特定の確率分布モデルでの積分の値を計算してまとめた数表はよく用います。

「確率変数がある範囲の値に入る確率」 =「確率密度関数のグラフの下の部分のうち,この範囲にあたる部分の面積」(=「確率密度関数のこの範囲での積分」)

という関係は,今後の講義でよく出てきますので,よく理解してください。

確率密度関数は確率変数がとりうる各値の「現れやすさ」を表してはいますが,確率そのものではないことに注意してください。「連続型確率変数がある1つの値をとる確率」は,確率密度関数の値ではありません。「連続型確率変数がある1つの値をとる確率」は,範囲の幅が0ですからその範囲に対応するグラフの下の部分の面積も0で,すなわち0であることに注意しましょう。また,グラフの下の部分全体の面積は,「確率変数の値が,とりうる値の範囲全体のどこかにある確率」ですから 1 (100%)となります。

ところで,現実のデータは,必ず何桁かの数字で表されるわけですから,どんなに細かく表現してても必ず「デジタル」,すなわち「とびとび(離散的)」です。連続型確率分布というのは,あくまで数式で表しやすくするための手段だと考えてください。

正規分布モデル

代表的な連続型確率分布モデルである正規分布モデルは一番応用範囲の広い確率分布モデルで,世の中には正規分布モデルであらわせるような母集団分布がたくさんあります。これは,中心極限定理という定理があるからです。中心極限定理とは,ひとことでいうと「母集団のデータが分布している(ばらついている)原因が,無数の独立な原因によるデータの分布の合計になっているときは,母集団分布は概ね正規分布になる」ということです。

正規分布モデルのパラメータは期待値と分散で,確率変数 Xの確率分布が期待値 µ,分散!2の正規分布であることを,「確率変数 Xは正規分布 N(µ,!2)にしたがう」あるいはさらに短く「X ! N(µ,!2)」と書きます。正規分布の確率密度関数のグラフは図 3のようになります。期待値 µをとる確率密度がいちばん高く,左右対称に広がっています。

浅野 晃/統計学(2013 年度秋学期) 第11回 (2013. 12. 5) http://racco.mikeneko.jp/  2/4ページ

これを表す式のほうが数学は簡単。

階級の区切り方がどんどん細かくなって,見えなくなったと考える

Page 38: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

ヒストグラムを式で表すこんなヒストグラムを,式で書けるだろうか?

度数分布のヒストグラム

たくさんのデータによって描かれている

関数のグラフで表す

いくつかの「パラメータ」を決めれば描ける

図 1: 確率分布モデル

ムの上端をつないだグラフで表される関数』の『ある範囲』での積分」といいます。この「ヒストグラムの上端をつないだグラフで表される関数」を確率密度関数といいます。この講義では積分の計算をすることはありませんが,特定の確率分布モデルでの積分の値を計算してまとめた数表はよく用います。

「確率変数がある範囲の値に入る確率」 =「確率密度関数のグラフの下の部分のうち,この範囲にあたる部分の面積」(=「確率密度関数のこの範囲での積分」)

という関係は,今後の講義でよく出てきますので,よく理解してください。

確率密度関数は確率変数がとりうる各値の「現れやすさ」を表してはいますが,確率そのものではないことに注意してください。「連続型確率変数がある1つの値をとる確率」は,確率密度関数の値ではありません。「連続型確率変数がある1つの値をとる確率」は,範囲の幅が0ですからその範囲に対応するグラフの下の部分の面積も0で,すなわち0であることに注意しましょう。また,グラフの下の部分全体の面積は,「確率変数の値が,とりうる値の範囲全体のどこかにある確率」ですから 1 (100%)となります。

ところで,現実のデータは,必ず何桁かの数字で表されるわけですから,どんなに細かく表現してても必ず「デジタル」,すなわち「とびとび(離散的)」です。連続型確率分布というのは,あくまで数式で表しやすくするための手段だと考えてください。

正規分布モデル

代表的な連続型確率分布モデルである正規分布モデルは一番応用範囲の広い確率分布モデルで,世の中には正規分布モデルであらわせるような母集団分布がたくさんあります。これは,中心極限定理という定理があるからです。中心極限定理とは,ひとことでいうと「母集団のデータが分布している(ばらついている)原因が,無数の独立な原因によるデータの分布の合計になっているときは,母集団分布は概ね正規分布になる」ということです。

正規分布モデルのパラメータは期待値と分散で,確率変数 Xの確率分布が期待値 µ,分散!2の正規分布であることを,「確率変数 Xは正規分布 N(µ,!2)にしたがう」あるいはさらに短く「X ! N(µ,!2)」と書きます。正規分布の確率密度関数のグラフは図 3のようになります。期待値 µをとる確率密度がいちばん高く,左右対称に広がっています。

浅野 晃/統計学(2013 年度秋学期) 第11回 (2013. 12. 5) http://racco.mikeneko.jp/  2/4ページ

度数分布のヒストグラム

たくさんのデータによって描かれている

関数のグラフで表す

いくつかの「パラメータ」を決めれば描ける

図 1: 確率分布モデル

ムの上端をつないだグラフで表される関数』の『ある範囲』での積分」といいます。この「ヒストグラムの上端をつないだグラフで表される関数」を確率密度関数といいます。この講義では積分の計算をすることはありませんが,特定の確率分布モデルでの積分の値を計算してまとめた数表はよく用います。

「確率変数がある範囲の値に入る確率」 =「確率密度関数のグラフの下の部分のうち,この範囲にあたる部分の面積」(=「確率密度関数のこの範囲での積分」)

という関係は,今後の講義でよく出てきますので,よく理解してください。

確率密度関数は確率変数がとりうる各値の「現れやすさ」を表してはいますが,確率そのものではないことに注意してください。「連続型確率変数がある1つの値をとる確率」は,確率密度関数の値ではありません。「連続型確率変数がある1つの値をとる確率」は,範囲の幅が0ですからその範囲に対応するグラフの下の部分の面積も0で,すなわち0であることに注意しましょう。また,グラフの下の部分全体の面積は,「確率変数の値が,とりうる値の範囲全体のどこかにある確率」ですから 1 (100%)となります。

ところで,現実のデータは,必ず何桁かの数字で表されるわけですから,どんなに細かく表現してても必ず「デジタル」,すなわち「とびとび(離散的)」です。連続型確率分布というのは,あくまで数式で表しやすくするための手段だと考えてください。

正規分布モデル

代表的な連続型確率分布モデルである正規分布モデルは一番応用範囲の広い確率分布モデルで,世の中には正規分布モデルであらわせるような母集団分布がたくさんあります。これは,中心極限定理という定理があるからです。中心極限定理とは,ひとことでいうと「母集団のデータが分布している(ばらついている)原因が,無数の独立な原因によるデータの分布の合計になっているときは,母集団分布は概ね正規分布になる」ということです。

正規分布モデルのパラメータは期待値と分散で,確率変数 Xの確率分布が期待値 µ,分散!2の正規分布であることを,「確率変数 Xは正規分布 N(µ,!2)にしたがう」あるいはさらに短く「X ! N(µ,!2)」と書きます。正規分布の確率密度関数のグラフは図 3のようになります。期待値 µをとる確率密度がいちばん高く,左右対称に広がっています。

浅野 晃/統計学(2013 年度秋学期) 第11回 (2013. 12. 5) http://racco.mikeneko.jp/  2/4ページ

これを表す式のほうが数学は簡単。

階級の区切り方がどんどん細かくなって,見えなくなったと考える

[連続型確率分布]

Page 39: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

連続型確率分布ヒストグラム

Page 40: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

連続型確率分布ヒストグラム

ある範囲に入る確率=柱の面積の合計

Page 41: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

連続型確率分布ヒストグラム

ある範囲に入る確率=柱の面積の合計

階級の区切りを細かく

Page 42: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

連続型確率分布ヒストグラム

ある範囲に入る確率=柱の面積の合計

階級の区切りを細かく

Page 43: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

連続型確率分布ヒストグラム

ある範囲に入る確率=柱の面積の合計

階級の区切りを細かく

同じ範囲なら柱の面積の合計は同じ

Page 44: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

連続型確率分布ヒストグラム

ある範囲に入る確率=柱の面積の合計

階級の区切りを細かく

同じ範囲なら柱の面積の合計は同じ

Page 45: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

連続型確率分布ヒストグラム

ある範囲に入る確率=柱の面積の合計

階級の区切りを細かく

同じ範囲なら柱の面積の合計は同じ

Page 46: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

連続型確率分布ヒストグラム

ある範囲に入る確率=柱の面積の合計

階級の区切りを細かく

同じ範囲なら柱の面積の合計は同じ

同じ範囲なら柱の面積の合計は同じ

Page 47: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

連続型確率分布ヒストグラム

ある範囲に入る確率=柱の面積の合計

階級の区切りを細かく

同じ範囲なら柱の面積の合計は同じ

同じ範囲なら柱の面積の合計は同じ

ヒストグラムの上の縁=[確率密度関数]

Page 48: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

確率密度関数

Page 49: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

確率密度関数

ヒストグラムの上の縁=[確率密度関数] 確率ではない

Page 50: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

確率密度関数

この範囲に入る確率=この面積=確率密度関数の積分

ヒストグラムの上の縁=[確率密度関数] 確率ではない

Page 51: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

確率密度関数

連続型確率変数がすべての実数のうちのどれかになる確率=1(100%)

Page 52: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

確率密度関数

連続型確率変数がすべての実数のうちのどれかになる確率=1(100%)

a

連続型確率変数がある特定の値aになる確率=0

Page 53: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

確率密度関数

連続型確率変数がすべての実数のうちのどれかになる確率=1(100%)

a

連続型確率変数がある特定の値aになる確率=0

幅が0だから,面積も0

Page 54: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

確率密度関数

連続型確率変数がすべての実数のうちのどれかになる確率=1(100%)

a

連続型確率変数がある特定の値aになる確率=0

幅が0だから,面積も0 なんかヘン?演習の回答例の付録で

Page 55: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

連続型確率分布は,数学の都合

Page 56: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

連続型確率分布は,数学の都合

こんなのより

Page 57: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

連続型確率分布は,数学の都合

こんなのより

こんなののほうが数式にしやすい

Page 58: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

連続型確率分布は,数学の都合

こんなのより

こんなののほうが数式にしやすい

実際のデータは,有限の桁数の数字で表されている限り,必ず離散的。

Page 59: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

A. A

sano

, Kan

sai U

niv.

Page 60: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

A. A

sano

, Kan

sai U

niv.

正規分布モデル

Page 61: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布モデル世の中には,[正規分布モデル]で表せるような母集団分布がたくさんある長さの測定値の分布センター試験の成績の分布 …

Page 62: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布モデル世の中には,[正規分布モデル]で表せるような母集団分布がたくさんある長さの測定値の分布センター試験の成績の分布 …

[中心極限定理]母集団のばらつきの原因が無数の独立な原因の和のとき,母集団分布は概ね正規分布になる

Page 63: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布の特徴

Page 64: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布の特徴パラメータが平均(期待値)と分散

Page 65: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布の特徴パラメータが平均(期待値)と分散

μ

Page 66: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布の特徴パラメータが平均(期待値)と分散

μ σ2

Page 67: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布の特徴パラメータが平均(期待値)と分散

μ σ2(わかりやすいものを推定すればよい ので都合がいい)

Page 68: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布の特徴パラメータが平均(期待値)と分散

μ σ2

確率変数Xの確率分布が期待値μ,分散σ2 の正規分布であることを

(わかりやすいものを推定すればよい ので都合がいい)

Page 69: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布の特徴パラメータが平均(期待値)と分散

μ σ2

確率変数Xの確率分布が期待値μ,分散σ2 の正規分布であることを

確率変数XがN(μ,σ2 )にしたがう という

(わかりやすいものを推定すればよい ので都合がいい)

Page 70: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布の特徴パラメータが平均(期待値)と分散

μ σ2

Page 71: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布の特徴パラメータが平均(期待値)と分散

μ σ2

確率変数の値がある範囲に入る確率=柱の面積の合計

ある範囲

ある範囲

ある範囲

確率変数の値がある範囲に入る確率=灰色の部分の面積

確率密度関数

階級の区切りを細かく

階級の区切りをもっと細かく

図 2: 連続型確率分布

µµ + !x

f(x)

µ – !

図 3: 正規分布の確率密度関数

正規分布には,次の大変重要な性質があります1。

1.確率変数 Xが期待値 µ,分散!2の正規分布 N(µ,!2)にしたがうとき,確率変数 (X!µ)/!は正規分布 N(0, 1)にしたがいます。

確率変数 (X ! µ)/!とは,確率変数 Xの「すべての可能な値」について,いずれも µをひいて !で割るという操作を行なって,新しい確率変数を作ったものです。元の確率変数 Xの期待値が µ,分散が!2のとき,確率変数 (X ! µ)/!の期待値は 0,分散は 1になることは,第5回の「標準得点」のところで説明した通りです。ここで述べていることは,それだけでなく,元の確率変数 Xが正規分布にしたがうならば,変換後の確率変数もやはり正規分布にしたがう,ということです。この N(0, 1)を,標準正規分布といいます。この性質を,この講義では以後「正規分布の性質1」とよぶことにします。

2.X1, . . . , Xnが独立で,いずれも正規分布 N(µ,!2)にしたがうならば,それらの平均 (X1 +

1くわしくは,私の講義「解析応用」第3部を参照してください。

浅野 晃/統計学(2013 年度秋学期) 第11回 (2013. 12. 5) http://racco.mikeneko.jp/  3/4ページ

確率密度関数はこんな形

Page 72: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布の特徴パラメータが平均(期待値)と分散

μ σ2

確率変数の値がある範囲に入る確率=柱の面積の合計

ある範囲

ある範囲

ある範囲

確率変数の値がある範囲に入る確率=灰色の部分の面積

確率密度関数

階級の区切りを細かく

階級の区切りをもっと細かく

図 2: 連続型確率分布

µµ + !x

f(x)

µ – !

図 3: 正規分布の確率密度関数

正規分布には,次の大変重要な性質があります1。

1.確率変数 Xが期待値 µ,分散!2の正規分布 N(µ,!2)にしたがうとき,確率変数 (X!µ)/!は正規分布 N(0, 1)にしたがいます。

確率変数 (X ! µ)/!とは,確率変数 Xの「すべての可能な値」について,いずれも µをひいて !で割るという操作を行なって,新しい確率変数を作ったものです。元の確率変数 Xの期待値が µ,分散が!2のとき,確率変数 (X ! µ)/!の期待値は 0,分散は 1になることは,第5回の「標準得点」のところで説明した通りです。ここで述べていることは,それだけでなく,元の確率変数 Xが正規分布にしたがうならば,変換後の確率変数もやはり正規分布にしたがう,ということです。この N(0, 1)を,標準正規分布といいます。この性質を,この講義では以後「正規分布の性質1」とよぶことにします。

2.X1, . . . , Xnが独立で,いずれも正規分布 N(µ,!2)にしたがうならば,それらの平均 (X1 +

1くわしくは,私の講義「解析応用」第3部を参照してください。

浅野 晃/統計学(2013 年度秋学期) 第11回 (2013. 12. 5) http://racco.mikeneko.jp/  3/4ページ

確率密度関数はこんな形

左右とも無限に広がっている

Page 73: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布の性質1確率変数XがN(μ,σ2 )にしたがう とき

pLATEX2!: 20131020˙08˙seiki : 2013/10/20(20:22)

6 第 8章 いちばんよく出てくる「型」の分布ー正規分布モデル

!だけ左に移動

!0X

0X – !

広がりを(1 / ")に縮める

X – !"

N(!, "2)

N(0, "2)N(0, 1)

0

図 8.4 正規分布の性質 1

計算すると,標本平均の期待値は母平均と同じで,標本平均の分散は母分散の 1/nになることを説明しました。ここで,母集団分布が正規分布モデルで表されるならば,標本平均も正規分布にしたがうことがいえます。つまり,母集団分布が正規分布N(µ,!2)

で表されるならば,標本平均の分布は正規分布 N(µ,!2/n)で表されます。この性質を,この本では以後「正規分布の性質2」とよぶことにします。

8.4 正規分布の数表の見方次章以降の推定・検定では,さきほど述べた正規分布の2つの性質を用い

た手法を説明します。その準備として,正規分布モデルにしたがう確率変数がある範囲の値になる確率を,数表を使って求める方法を見てみましょう。現在では,こういう計算はパソコンを使って行うのがふつうで,数表を見ながら手計算で行う機会は減っていますが,グラフと数表を見ながら手計算を行う練習をすることで,出てきた数値におかしなところがないかどうかを感じ取る「直感」を働かせるのは,意味のあることです。巻末の「正規分布表」は「標準正規分布にしたがう確率変数 Z がある値 z

以上である確率」P (Z ! z)を計算したものです。P ( )は,「( )内の事象が起きる確率」という意味を表します。標準正規分布の確率密度関数のグラフ

Page 74: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布の性質1確率変数XがN(μ,σ2 )にしたがう とき

pLATEX2!: 20131020˙08˙seiki : 2013/10/20(20:22)

6 第 8章 いちばんよく出てくる「型」の分布ー正規分布モデル

!だけ左に移動

!0X

0X – !

広がりを(1 / ")に縮める

X – !"

N(!, "2)

N(0, "2)N(0, 1)

0

図 8.4 正規分布の性質 1

計算すると,標本平均の期待値は母平均と同じで,標本平均の分散は母分散の 1/nになることを説明しました。ここで,母集団分布が正規分布モデルで表されるならば,標本平均も正規分布にしたがうことがいえます。つまり,母集団分布が正規分布N(µ,!2)

で表されるならば,標本平均の分布は正規分布 N(µ,!2/n)で表されます。この性質を,この本では以後「正規分布の性質2」とよぶことにします。

8.4 正規分布の数表の見方次章以降の推定・検定では,さきほど述べた正規分布の2つの性質を用い

た手法を説明します。その準備として,正規分布モデルにしたがう確率変数がある範囲の値になる確率を,数表を使って求める方法を見てみましょう。現在では,こういう計算はパソコンを使って行うのがふつうで,数表を見ながら手計算で行う機会は減っていますが,グラフと数表を見ながら手計算を行う練習をすることで,出てきた数値におかしなところがないかどうかを感じ取る「直感」を働かせるのは,意味のあることです。巻末の「正規分布表」は「標準正規分布にしたがう確率変数 Z がある値 z

以上である確率」P (Z ! z)を計算したものです。P ( )は,「( )内の事象が起きる確率」という意味を表します。標準正規分布の確率密度関数のグラフ

(X-μ)/σ はN(0, 1 )にしたがう

Page 75: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布の性質1確率変数XがN(μ,σ2 )にしたがう とき(X-μ)/σ はN(0, 1 )にしたがう

Page 76: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布の性質1確率変数XがN(μ,σ2 )にしたがう とき(X-μ)/σ はN(0, 1 )にしたがう

「標準得点」と同じ

Page 77: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布の性質1確率変数XがN(μ,σ2 )にしたがう とき(X-μ)/σ はN(0, 1 )にしたがう

「標準得点」と同じ

Page 78: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布の性質1確率変数XがN(μ,σ2 )にしたがう とき(X-μ)/σ はN(0, 1 )にしたがう

「標準得点」と同じ

変換しても,やはり正規分布になる

Page 79: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布の性質1確率変数XがN(μ,σ2 )にしたがう とき(X-μ)/σ はN(0, 1 )にしたがう

「標準得点」と同じ

変換しても,やはり正規分布になる

N(0,1)を[標準正規分布]という

Page 80: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布の性質2

母集団

母平均μ母分散σ2

X1 X2 … Xn

サイズnの標本1セット 標本平均Xbar

X1 X2 … Xn Xbar

X1 X2 … Xn Xbar

母集団と同じ期待値μ

…分散σ2

期待値μ分散 σ2/n

Page 81: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布の性質2

母集団

母平均μ母分散σ2

X1 X2 … Xn

サイズnの標本1セット 標本平均Xbar

X1 X2 … Xn Xbar

X1 X2 … Xn Xbar

母集団と同じ期待値μ

…分散σ2

期待値μ分散 σ2/n

正規分布なら

Page 82: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布の性質2

母集団

母平均μ母分散σ2

X1 X2 … Xn

サイズnの標本1セット 標本平均Xbar

X1 X2 … Xn Xbar

X1 X2 … Xn Xbar

母集団と同じ期待値μ

…分散σ2

期待値μ分散 σ2/n

正規分布なら こちらも正規分布になる

Page 83: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布の性質2

母集団

母平均μ母分散σ2

X1 X2 … Xn

サイズnの標本1セット 標本平均Xbar

X1 X2 … Xn Xbar

X1 X2 … Xn Xbar

母集団と同じ期待値μ

…分散σ2

期待値μ分散 σ2/n

正規分布なら こちらも正規分布になるN(μ,σ2)

Page 84: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布の性質2

母集団

母平均μ母分散σ2

X1 X2 … Xn

サイズnの標本1セット 標本平均Xbar

X1 X2 … Xn Xbar

X1 X2 … Xn Xbar

母集団と同じ期待値μ

…分散σ2

期待値μ分散 σ2/n

正規分布なら こちらも正規分布になる

N(μ,σ2/n)

N(μ,σ2)

Page 85: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

A. A

sano

, Kan

sai U

niv.

Page 86: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

A. A

sano

, Kan

sai U

niv.

正規分布表の見方

Page 87: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布にもとづく計算正規分布にしたがう確率変数がある範囲に入る確率

z

f(z)

0 z

面積 = P(Z ! z)

図 4: 標準正規分布の確率密度関数のグラフ上で「確率変数 Zが値 z以上である確率」P(Z ! z)

· · · + Xn)/nは N(µ,!2/n)にしたがいます2。

「X1, . . . , Xnが独立で,いずれも正規分布 N(µ,!2)にしたがう」という条件にあてはまるのは,X1, . . . , Xn

が,正規分布 N(µ,!2) にしたがう母集団分布から無作為抽出された標本であるときです。このとき,(X1 + · · · + Xn)/nは標本平均です。第10回の講義で,標本平均の期待値は µ,分散は !2/nであると述べました。ここで述べているのは,それだけでなく,母集団分布が正規分布であるならば,標本平均もやはり正規分布にしたがう,ということです。この性質を,この講義では以後「正規分布の性質2」とよぶことにします。

正規分布の数表の見方

正規分布モデルにしたがう確率変数がある範囲の値になる確率を求めるには,積分の計算をしなければなりません。しかし,実際にはその必要はなく,数表を使って求めることができます。

数表は「標準正規分布にしたがう確率変数 Zがある値 z以上である確率」P(Z ! z)を計算したもので3,確率密度関数のグラフにおいては図 4のグレーの部分の面積になります。標準正規分布の確率密度関数は z = 0に対して左右対称なので,数表は z ! 0についてのみ掲載されています。

さきほどの「正規分布の性質1」を使うと,期待値・分散がどんな値の正規分布でも,それにしたがう確率変数 Xがある値 x以上である確率を,この数表だけで求めることができます。例えば,期待値 50,分散 102である正規分布 N(50, 102)にしたがう確率変数 Xが 60以上である確率,すなわち P(X ! 60)を求めてみましょう。Z = (X ! 50)/10のように変換すると,性質1から確率変数 Zは標準正規分布 N(0, 1)にしたがいます。また,X = 60のとき Z = (60 ! 50)/10 = 1ですから,求める確率は P(Z ! 1)です。数表から,P(Z ! 1) = 0.15866であることがわかります。

今日の演習

確率変数 Xが正規分布 N(50, 102)にしたがうとき,(1) P(X ! 55),(2) P(45 " X " 60),をそれぞれ求めてください。

2これを正規分布の再生性といいます。3P( )は,「( )内の事象が起きる確率」という意味です。

浅野 晃/統計学(2013 年度秋学期) 第11回 (2013. 12. 5) http://racco.mikeneko.jp/  4/4ページ

Page 88: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布にもとづく計算正規分布にしたがう確率変数がある範囲に入る確率

z

f(z)

0 z

面積 = P(Z ! z)

図 4: 標準正規分布の確率密度関数のグラフ上で「確率変数 Zが値 z以上である確率」P(Z ! z)

· · · + Xn)/nは N(µ,!2/n)にしたがいます2。

「X1, . . . , Xnが独立で,いずれも正規分布 N(µ,!2)にしたがう」という条件にあてはまるのは,X1, . . . , Xn

が,正規分布 N(µ,!2) にしたがう母集団分布から無作為抽出された標本であるときです。このとき,(X1 + · · · + Xn)/nは標本平均です。第10回の講義で,標本平均の期待値は µ,分散は !2/nであると述べました。ここで述べているのは,それだけでなく,母集団分布が正規分布であるならば,標本平均もやはり正規分布にしたがう,ということです。この性質を,この講義では以後「正規分布の性質2」とよぶことにします。

正規分布の数表の見方

正規分布モデルにしたがう確率変数がある範囲の値になる確率を求めるには,積分の計算をしなければなりません。しかし,実際にはその必要はなく,数表を使って求めることができます。

数表は「標準正規分布にしたがう確率変数 Zがある値 z以上である確率」P(Z ! z)を計算したもので3,確率密度関数のグラフにおいては図 4のグレーの部分の面積になります。標準正規分布の確率密度関数は z = 0に対して左右対称なので,数表は z ! 0についてのみ掲載されています。

さきほどの「正規分布の性質1」を使うと,期待値・分散がどんな値の正規分布でも,それにしたがう確率変数 Xがある値 x以上である確率を,この数表だけで求めることができます。例えば,期待値 50,分散 102である正規分布 N(50, 102)にしたがう確率変数 Xが 60以上である確率,すなわち P(X ! 60)を求めてみましょう。Z = (X ! 50)/10のように変換すると,性質1から確率変数 Zは標準正規分布 N(0, 1)にしたがいます。また,X = 60のとき Z = (60 ! 50)/10 = 1ですから,求める確率は P(Z ! 1)です。数表から,P(Z ! 1) = 0.15866であることがわかります。

今日の演習

確率変数 Xが正規分布 N(50, 102)にしたがうとき,(1) P(X ! 55),(2) P(45 " X " 60),をそれぞれ求めてください。

2これを正規分布の再生性といいます。3P( )は,「( )内の事象が起きる確率」という意味です。

浅野 晃/統計学(2013 年度秋学期) 第11回 (2013. 12. 5) http://racco.mikeneko.jp/  4/4ページ

数表を使って求める

Page 89: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布にもとづく計算正規分布にしたがう確率変数がある範囲に入る確率

z

f(z)

0 z

面積 = P(Z ! z)

図 4: 標準正規分布の確率密度関数のグラフ上で「確率変数 Zが値 z以上である確率」P(Z ! z)

· · · + Xn)/nは N(µ,!2/n)にしたがいます2。

「X1, . . . , Xnが独立で,いずれも正規分布 N(µ,!2)にしたがう」という条件にあてはまるのは,X1, . . . , Xn

が,正規分布 N(µ,!2) にしたがう母集団分布から無作為抽出された標本であるときです。このとき,(X1 + · · · + Xn)/nは標本平均です。第10回の講義で,標本平均の期待値は µ,分散は !2/nであると述べました。ここで述べているのは,それだけでなく,母集団分布が正規分布であるならば,標本平均もやはり正規分布にしたがう,ということです。この性質を,この講義では以後「正規分布の性質2」とよぶことにします。

正規分布の数表の見方

正規分布モデルにしたがう確率変数がある範囲の値になる確率を求めるには,積分の計算をしなければなりません。しかし,実際にはその必要はなく,数表を使って求めることができます。

数表は「標準正規分布にしたがう確率変数 Zがある値 z以上である確率」P(Z ! z)を計算したもので3,確率密度関数のグラフにおいては図 4のグレーの部分の面積になります。標準正規分布の確率密度関数は z = 0に対して左右対称なので,数表は z ! 0についてのみ掲載されています。

さきほどの「正規分布の性質1」を使うと,期待値・分散がどんな値の正規分布でも,それにしたがう確率変数 Xがある値 x以上である確率を,この数表だけで求めることができます。例えば,期待値 50,分散 102である正規分布 N(50, 102)にしたがう確率変数 Xが 60以上である確率,すなわち P(X ! 60)を求めてみましょう。Z = (X ! 50)/10のように変換すると,性質1から確率変数 Zは標準正規分布 N(0, 1)にしたがいます。また,X = 60のとき Z = (60 ! 50)/10 = 1ですから,求める確率は P(Z ! 1)です。数表から,P(Z ! 1) = 0.15866であることがわかります。

今日の演習

確率変数 Xが正規分布 N(50, 102)にしたがうとき,(1) P(X ! 55),(2) P(45 " X " 60),をそれぞれ求めてください。

2これを正規分布の再生性といいます。3P( )は,「( )内の事象が起きる確率」という意味です。

浅野 晃/統計学(2013 年度秋学期) 第11回 (2013. 12. 5) http://racco.mikeneko.jp/  4/4ページ

数表を使って求める標準正規分布の場合に,いろいろなzの値について,この面積が載っている

Page 90: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布にもとづく計算例)確率変数XがN(50, 102)にしたがうとき,Xが60以上である確率を求めよ。

Zは標準正規分布にしたがう

Page 91: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布にもとづく計算例)確率変数XがN(50, 102)にしたがうとき,Xが60以上である確率を求めよ。

性質1により,Z = (X - 50) / 10 と変換Zは標準正規分布にしたがう

Page 92: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布にもとづく計算例)確率変数XがN(50, 102)にしたがうとき,Xが60以上である確率を求めよ。

性質1により,Z = (X - 50) / 10 と変換

X=60のとき,Z=(60 - 50) / 10 = 1Zは標準正規分布にしたがう

Page 93: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布にもとづく計算例)確率変数XがN(50, 102)にしたがうとき,Xが60以上である確率を求めよ。

性質1により,Z = (X - 50) / 10 と変換

X=60のとき,Z=(60 - 50) / 10 = 1

よって,求めるのは,Zが1以上である確率

z

f(z)

0 z

面積 = P(Z ! z)

図 4: 標準正規分布の確率密度関数のグラフ上で「確率変数 Zが値 z以上である確率」P(Z ! z)

· · · + Xn)/nは N(µ,!2/n)にしたがいます2。

「X1, . . . , Xnが独立で,いずれも正規分布 N(µ,!2)にしたがう」という条件にあてはまるのは,X1, . . . , Xn

が,正規分布 N(µ,!2) にしたがう母集団分布から無作為抽出された標本であるときです。このとき,(X1 + · · · + Xn)/nは標本平均です。第10回の講義で,標本平均の期待値は µ,分散は !2/nであると述べました。ここで述べているのは,それだけでなく,母集団分布が正規分布であるならば,標本平均もやはり正規分布にしたがう,ということです。この性質を,この講義では以後「正規分布の性質2」とよぶことにします。

正規分布の数表の見方

正規分布モデルにしたがう確率変数がある範囲の値になる確率を求めるには,積分の計算をしなければなりません。しかし,実際にはその必要はなく,数表を使って求めることができます。

数表は「標準正規分布にしたがう確率変数 Zがある値 z以上である確率」P(Z ! z)を計算したもので3,確率密度関数のグラフにおいては図 4のグレーの部分の面積になります。標準正規分布の確率密度関数は z = 0に対して左右対称なので,数表は z ! 0についてのみ掲載されています。

さきほどの「正規分布の性質1」を使うと,期待値・分散がどんな値の正規分布でも,それにしたがう確率変数 Xがある値 x以上である確率を,この数表だけで求めることができます。例えば,期待値 50,分散 102である正規分布 N(50, 102)にしたがう確率変数 Xが 60以上である確率,すなわち P(X ! 60)を求めてみましょう。Z = (X ! 50)/10のように変換すると,性質1から確率変数 Zは標準正規分布 N(0, 1)にしたがいます。また,X = 60のとき Z = (60 ! 50)/10 = 1ですから,求める確率は P(Z ! 1)です。数表から,P(Z ! 1) = 0.15866であることがわかります。

今日の演習

確率変数 Xが正規分布 N(50, 102)にしたがうとき,(1) P(X ! 55),(2) P(45 " X " 60),をそれぞれ求めてください。

2これを正規分布の再生性といいます。3P( )は,「( )内の事象が起きる確率」という意味です。

浅野 晃/統計学(2013 年度秋学期) 第11回 (2013. 12. 5) http://racco.mikeneko.jp/  4/4ページ

Zは標準正規分布にしたがう

Page 94: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布にもとづく計算

pLATEX2!: 20131020˙08˙seiki : 2013/10/20(20:22)

8.4 正規分布の数表の見方 7

z

f(z)

0 z

面積 = P(Z ! z)

図 8.5 標準正規分布にしたがう確率変数がある値以上である確率」P (Z ! z)否

0.00 0.01 0.02 0.03 0.04 0.05

0.0 0.50000 0.49601 0.49202 0.48803 0.48405 0.48006

0.1 0.46017 0.45620 0.45224 0.44828 0.44433 0.44038

0.2 0.42074 0.41683 0.41294 0.40905 0.40517 0.40129

0.3 0.38209 0.37828 0.37448 0.37070 0.36693 0.36317

0.4 0.34458 0.34090 0.33724 0.33360 0.32997 0.32636

...

...

図 8.6 正規分布表(一部抜粋)で P (Z ! 0.23)を求める

においては,図 8.5のグレーの部分の面積になります。標準正規分布の確率密度関数は z = 0に対して左右対称なので,数表は z ! 0についてのみ掲載されています。正規分布表では,縦の見出しに z の値の小数第 1位までが,横の見出しに小数第 2位が表示されており,調べたい z の値について縦と横の見出しを見つけて,対応する行と列の交点を探すと,そこに P (Z ! z)の値が書いてあります。例えば,図 のように,P (Z ! 0.23)を求める場合,縦の見出しから 0.2を,横の見出しから 0.03を見つけて,対応する行と列の交点を探すと,そこに書いてある 0.40905が P (Z ! 0.23)の値です。さきほどの「正規分布の性質 1」を使うと,期待値・分散がどんな値の正

規分布でも,それにしたがう確率変数X がある値 x以上である確率を,正規分布表だけで求めることができます。例えば,期待値 50,分散 102 である正規分布N(50, 102)にしたがう確率

を求める

0.00 0.01 0.02 0.03 0.04 0.05

0.0 0.50000 0.49601 0.49202 0.48803 0.48405 0.48006

0.1 0.46017 0.45620 0.45224 0.44828 0.44433 0.44038

0.2 0.42074 0.41683 0.41294 0.40905 0.40517 0.40129

0.3 0.38209 0.37828 0.37448 0.37070 0.36693 0.36317

0.4 0.34458 0.34090 0.33724 0.33360 0.32997 0.32636...

...

1.0 0.15866 0.15625 0.15386 0.15151 0.14917 0.14686 ...

Page 95: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布にもとづく計算zの小数第1位まで

pLATEX2!: 20131020˙08˙seiki : 2013/10/20(20:22)

8.4 正規分布の数表の見方 7

z

f(z)

0 z

面積 = P(Z ! z)

図 8.5 標準正規分布にしたがう確率変数がある値以上である確率」P (Z ! z)否

0.00 0.01 0.02 0.03 0.04 0.05

0.0 0.50000 0.49601 0.49202 0.48803 0.48405 0.48006

0.1 0.46017 0.45620 0.45224 0.44828 0.44433 0.44038

0.2 0.42074 0.41683 0.41294 0.40905 0.40517 0.40129

0.3 0.38209 0.37828 0.37448 0.37070 0.36693 0.36317

0.4 0.34458 0.34090 0.33724 0.33360 0.32997 0.32636

...

...

図 8.6 正規分布表(一部抜粋)で P (Z ! 0.23)を求める

においては,図 8.5のグレーの部分の面積になります。標準正規分布の確率密度関数は z = 0に対して左右対称なので,数表は z ! 0についてのみ掲載されています。正規分布表では,縦の見出しに z の値の小数第 1位までが,横の見出しに小数第 2位が表示されており,調べたい z の値について縦と横の見出しを見つけて,対応する行と列の交点を探すと,そこに P (Z ! z)の値が書いてあります。例えば,図 のように,P (Z ! 0.23)を求める場合,縦の見出しから 0.2を,横の見出しから 0.03を見つけて,対応する行と列の交点を探すと,そこに書いてある 0.40905が P (Z ! 0.23)の値です。さきほどの「正規分布の性質 1」を使うと,期待値・分散がどんな値の正

規分布でも,それにしたがう確率変数X がある値 x以上である確率を,正規分布表だけで求めることができます。例えば,期待値 50,分散 102 である正規分布N(50, 102)にしたがう確率

を求める

0.00 0.01 0.02 0.03 0.04 0.05

0.0 0.50000 0.49601 0.49202 0.48803 0.48405 0.48006

0.1 0.46017 0.45620 0.45224 0.44828 0.44433 0.44038

0.2 0.42074 0.41683 0.41294 0.40905 0.40517 0.40129

0.3 0.38209 0.37828 0.37448 0.37070 0.36693 0.36317

0.4 0.34458 0.34090 0.33724 0.33360 0.32997 0.32636...

...

1.0 0.15866 0.15625 0.15386 0.15151 0.14917 0.14686 ...

Page 96: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布にもとづく計算

zの小数第2位

zの小数第1位まで

pLATEX2!: 20131020˙08˙seiki : 2013/10/20(20:22)

8.4 正規分布の数表の見方 7

z

f(z)

0 z

面積 = P(Z ! z)

図 8.5 標準正規分布にしたがう確率変数がある値以上である確率」P (Z ! z)否

0.00 0.01 0.02 0.03 0.04 0.05

0.0 0.50000 0.49601 0.49202 0.48803 0.48405 0.48006

0.1 0.46017 0.45620 0.45224 0.44828 0.44433 0.44038

0.2 0.42074 0.41683 0.41294 0.40905 0.40517 0.40129

0.3 0.38209 0.37828 0.37448 0.37070 0.36693 0.36317

0.4 0.34458 0.34090 0.33724 0.33360 0.32997 0.32636

...

...

図 8.6 正規分布表(一部抜粋)で P (Z ! 0.23)を求める

においては,図 8.5のグレーの部分の面積になります。標準正規分布の確率密度関数は z = 0に対して左右対称なので,数表は z ! 0についてのみ掲載されています。正規分布表では,縦の見出しに z の値の小数第 1位までが,横の見出しに小数第 2位が表示されており,調べたい z の値について縦と横の見出しを見つけて,対応する行と列の交点を探すと,そこに P (Z ! z)の値が書いてあります。例えば,図 のように,P (Z ! 0.23)を求める場合,縦の見出しから 0.2を,横の見出しから 0.03を見つけて,対応する行と列の交点を探すと,そこに書いてある 0.40905が P (Z ! 0.23)の値です。さきほどの「正規分布の性質 1」を使うと,期待値・分散がどんな値の正

規分布でも,それにしたがう確率変数X がある値 x以上である確率を,正規分布表だけで求めることができます。例えば,期待値 50,分散 102 である正規分布N(50, 102)にしたがう確率

を求める

0.00 0.01 0.02 0.03 0.04 0.05

0.0 0.50000 0.49601 0.49202 0.48803 0.48405 0.48006

0.1 0.46017 0.45620 0.45224 0.44828 0.44433 0.44038

0.2 0.42074 0.41683 0.41294 0.40905 0.40517 0.40129

0.3 0.38209 0.37828 0.37448 0.37070 0.36693 0.36317

0.4 0.34458 0.34090 0.33724 0.33360 0.32997 0.32636...

...

1.0 0.15866 0.15625 0.15386 0.15151 0.14917 0.14686 ...

Page 97: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布にもとづく計算

zの小数第2位

zの小数第1位まで

pLATEX2!: 20131020˙08˙seiki : 2013/10/20(20:22)

8.4 正規分布の数表の見方 7

z

f(z)

0 z

面積 = P(Z ! z)

図 8.5 標準正規分布にしたがう確率変数がある値以上である確率」P (Z ! z)否

0.00 0.01 0.02 0.03 0.04 0.05

0.0 0.50000 0.49601 0.49202 0.48803 0.48405 0.48006

0.1 0.46017 0.45620 0.45224 0.44828 0.44433 0.44038

0.2 0.42074 0.41683 0.41294 0.40905 0.40517 0.40129

0.3 0.38209 0.37828 0.37448 0.37070 0.36693 0.36317

0.4 0.34458 0.34090 0.33724 0.33360 0.32997 0.32636

...

...

図 8.6 正規分布表(一部抜粋)で P (Z ! 0.23)を求める

においては,図 8.5のグレーの部分の面積になります。標準正規分布の確率密度関数は z = 0に対して左右対称なので,数表は z ! 0についてのみ掲載されています。正規分布表では,縦の見出しに z の値の小数第 1位までが,横の見出しに小数第 2位が表示されており,調べたい z の値について縦と横の見出しを見つけて,対応する行と列の交点を探すと,そこに P (Z ! z)の値が書いてあります。例えば,図 のように,P (Z ! 0.23)を求める場合,縦の見出しから 0.2を,横の見出しから 0.03を見つけて,対応する行と列の交点を探すと,そこに書いてある 0.40905が P (Z ! 0.23)の値です。さきほどの「正規分布の性質 1」を使うと,期待値・分散がどんな値の正

規分布でも,それにしたがう確率変数X がある値 x以上である確率を,正規分布表だけで求めることができます。例えば,期待値 50,分散 102 である正規分布N(50, 102)にしたがう確率

を求める

z

f(z)

0 z

面積 = P(Z ! z)

図 4: 標準正規分布の確率密度関数のグラフ上で「確率変数 Zが値 z以上である確率」P(Z ! z)

· · · + Xn)/nは N(µ,!2/n)にしたがいます2。

「X1, . . . , Xnが独立で,いずれも正規分布 N(µ,!2)にしたがう」という条件にあてはまるのは,X1, . . . , Xn

が,正規分布 N(µ,!2) にしたがう母集団分布から無作為抽出された標本であるときです。このとき,(X1 + · · · + Xn)/nは標本平均です。第10回の講義で,標本平均の期待値は µ,分散は !2/nであると述べました。ここで述べているのは,それだけでなく,母集団分布が正規分布であるならば,標本平均もやはり正規分布にしたがう,ということです。この性質を,この講義では以後「正規分布の性質2」とよぶことにします。

正規分布の数表の見方

正規分布モデルにしたがう確率変数がある範囲の値になる確率を求めるには,積分の計算をしなければなりません。しかし,実際にはその必要はなく,数表を使って求めることができます。

数表は「標準正規分布にしたがう確率変数 Zがある値 z以上である確率」P(Z ! z)を計算したもので3,確率密度関数のグラフにおいては図 4のグレーの部分の面積になります。標準正規分布の確率密度関数は z = 0に対して左右対称なので,数表は z ! 0についてのみ掲載されています。

さきほどの「正規分布の性質1」を使うと,期待値・分散がどんな値の正規分布でも,それにしたがう確率変数 Xがある値 x以上である確率を,この数表だけで求めることができます。例えば,期待値 50,分散 102である正規分布 N(50, 102)にしたがう確率変数 Xが 60以上である確率,すなわち P(X ! 60)を求めてみましょう。Z = (X ! 50)/10のように変換すると,性質1から確率変数 Zは標準正規分布 N(0, 1)にしたがいます。また,X = 60のとき Z = (60 ! 50)/10 = 1ですから,求める確率は P(Z ! 1)です。数表から,P(Z ! 1) = 0.15866であることがわかります。

今日の演習

確率変数 Xが正規分布 N(50, 102)にしたがうとき,(1) P(X ! 55),(2) P(45 " X " 60),をそれぞれ求めてください。

2これを正規分布の再生性といいます。3P( )は,「( )内の事象が起きる確率」という意味です。

浅野 晃/統計学(2013 年度秋学期) 第11回 (2013. 12. 5) http://racco.mikeneko.jp/  4/4ページ

0.00 0.01 0.02 0.03 0.04 0.05

0.0 0.50000 0.49601 0.49202 0.48803 0.48405 0.48006

0.1 0.46017 0.45620 0.45224 0.44828 0.44433 0.44038

0.2 0.42074 0.41683 0.41294 0.40905 0.40517 0.40129

0.3 0.38209 0.37828 0.37448 0.37070 0.36693 0.36317

0.4 0.34458 0.34090 0.33724 0.33360 0.32997 0.32636...

...

1.0 0.15866 0.15625 0.15386 0.15151 0.14917 0.14686 ...

Page 98: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布にもとづく計算

zの小数第2位

zの小数第1位まで

pLATEX2!: 20131020˙08˙seiki : 2013/10/20(20:22)

8.4 正規分布の数表の見方 7

z

f(z)

0 z

面積 = P(Z ! z)

図 8.5 標準正規分布にしたがう確率変数がある値以上である確率」P (Z ! z)否

0.00 0.01 0.02 0.03 0.04 0.05

0.0 0.50000 0.49601 0.49202 0.48803 0.48405 0.48006

0.1 0.46017 0.45620 0.45224 0.44828 0.44433 0.44038

0.2 0.42074 0.41683 0.41294 0.40905 0.40517 0.40129

0.3 0.38209 0.37828 0.37448 0.37070 0.36693 0.36317

0.4 0.34458 0.34090 0.33724 0.33360 0.32997 0.32636

...

...

図 8.6 正規分布表(一部抜粋)で P (Z ! 0.23)を求める

においては,図 8.5のグレーの部分の面積になります。標準正規分布の確率密度関数は z = 0に対して左右対称なので,数表は z ! 0についてのみ掲載されています。正規分布表では,縦の見出しに z の値の小数第 1位までが,横の見出しに小数第 2位が表示されており,調べたい z の値について縦と横の見出しを見つけて,対応する行と列の交点を探すと,そこに P (Z ! z)の値が書いてあります。例えば,図 のように,P (Z ! 0.23)を求める場合,縦の見出しから 0.2を,横の見出しから 0.03を見つけて,対応する行と列の交点を探すと,そこに書いてある 0.40905が P (Z ! 0.23)の値です。さきほどの「正規分布の性質 1」を使うと,期待値・分散がどんな値の正

規分布でも,それにしたがう確率変数X がある値 x以上である確率を,正規分布表だけで求めることができます。例えば,期待値 50,分散 102 である正規分布N(50, 102)にしたがう確率

を求める

z

f(z)

0 z

面積 = P(Z ! z)

図 4: 標準正規分布の確率密度関数のグラフ上で「確率変数 Zが値 z以上である確率」P(Z ! z)

· · · + Xn)/nは N(µ,!2/n)にしたがいます2。

「X1, . . . , Xnが独立で,いずれも正規分布 N(µ,!2)にしたがう」という条件にあてはまるのは,X1, . . . , Xn

が,正規分布 N(µ,!2) にしたがう母集団分布から無作為抽出された標本であるときです。このとき,(X1 + · · · + Xn)/nは標本平均です。第10回の講義で,標本平均の期待値は µ,分散は !2/nであると述べました。ここで述べているのは,それだけでなく,母集団分布が正規分布であるならば,標本平均もやはり正規分布にしたがう,ということです。この性質を,この講義では以後「正規分布の性質2」とよぶことにします。

正規分布の数表の見方

正規分布モデルにしたがう確率変数がある範囲の値になる確率を求めるには,積分の計算をしなければなりません。しかし,実際にはその必要はなく,数表を使って求めることができます。

数表は「標準正規分布にしたがう確率変数 Zがある値 z以上である確率」P(Z ! z)を計算したもので3,確率密度関数のグラフにおいては図 4のグレーの部分の面積になります。標準正規分布の確率密度関数は z = 0に対して左右対称なので,数表は z ! 0についてのみ掲載されています。

さきほどの「正規分布の性質1」を使うと,期待値・分散がどんな値の正規分布でも,それにしたがう確率変数 Xがある値 x以上である確率を,この数表だけで求めることができます。例えば,期待値 50,分散 102である正規分布 N(50, 102)にしたがう確率変数 Xが 60以上である確率,すなわち P(X ! 60)を求めてみましょう。Z = (X ! 50)/10のように変換すると,性質1から確率変数 Zは標準正規分布 N(0, 1)にしたがいます。また,X = 60のとき Z = (60 ! 50)/10 = 1ですから,求める確率は P(Z ! 1)です。数表から,P(Z ! 1) = 0.15866であることがわかります。

今日の演習

確率変数 Xが正規分布 N(50, 102)にしたがうとき,(1) P(X ! 55),(2) P(45 " X " 60),をそれぞれ求めてください。

2これを正規分布の再生性といいます。3P( )は,「( )内の事象が起きる確率」という意味です。

浅野 晃/統計学(2013 年度秋学期) 第11回 (2013. 12. 5) http://racco.mikeneko.jp/  4/4ページ

0.00 0.01 0.02 0.03 0.04 0.05

0.0 0.50000 0.49601 0.49202 0.48803 0.48405 0.48006

0.1 0.46017 0.45620 0.45224 0.44828 0.44433 0.44038

0.2 0.42074 0.41683 0.41294 0.40905 0.40517 0.40129

0.3 0.38209 0.37828 0.37448 0.37070 0.36693 0.36317

0.4 0.34458 0.34090 0.33724 0.33360 0.32997 0.32636...

...

1.0 0.15866 0.15625 0.15386 0.15151 0.14917 0.14686 ...

Page 99: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布にもとづく計算

zの小数第2位

zの小数第1位まで

pLATEX2!: 20131020˙08˙seiki : 2013/10/20(20:22)

8.4 正規分布の数表の見方 7

z

f(z)

0 z

面積 = P(Z ! z)

図 8.5 標準正規分布にしたがう確率変数がある値以上である確率」P (Z ! z)否

0.00 0.01 0.02 0.03 0.04 0.05

0.0 0.50000 0.49601 0.49202 0.48803 0.48405 0.48006

0.1 0.46017 0.45620 0.45224 0.44828 0.44433 0.44038

0.2 0.42074 0.41683 0.41294 0.40905 0.40517 0.40129

0.3 0.38209 0.37828 0.37448 0.37070 0.36693 0.36317

0.4 0.34458 0.34090 0.33724 0.33360 0.32997 0.32636

...

...

図 8.6 正規分布表(一部抜粋)で P (Z ! 0.23)を求める

においては,図 8.5のグレーの部分の面積になります。標準正規分布の確率密度関数は z = 0に対して左右対称なので,数表は z ! 0についてのみ掲載されています。正規分布表では,縦の見出しに z の値の小数第 1位までが,横の見出しに小数第 2位が表示されており,調べたい z の値について縦と横の見出しを見つけて,対応する行と列の交点を探すと,そこに P (Z ! z)の値が書いてあります。例えば,図 のように,P (Z ! 0.23)を求める場合,縦の見出しから 0.2を,横の見出しから 0.03を見つけて,対応する行と列の交点を探すと,そこに書いてある 0.40905が P (Z ! 0.23)の値です。さきほどの「正規分布の性質 1」を使うと,期待値・分散がどんな値の正

規分布でも,それにしたがう確率変数X がある値 x以上である確率を,正規分布表だけで求めることができます。例えば,期待値 50,分散 102 である正規分布N(50, 102)にしたがう確率

を求める

z

f(z)

0 z

面積 = P(Z ! z)

図 4: 標準正規分布の確率密度関数のグラフ上で「確率変数 Zが値 z以上である確率」P(Z ! z)

· · · + Xn)/nは N(µ,!2/n)にしたがいます2。

「X1, . . . , Xnが独立で,いずれも正規分布 N(µ,!2)にしたがう」という条件にあてはまるのは,X1, . . . , Xn

が,正規分布 N(µ,!2) にしたがう母集団分布から無作為抽出された標本であるときです。このとき,(X1 + · · · + Xn)/nは標本平均です。第10回の講義で,標本平均の期待値は µ,分散は !2/nであると述べました。ここで述べているのは,それだけでなく,母集団分布が正規分布であるならば,標本平均もやはり正規分布にしたがう,ということです。この性質を,この講義では以後「正規分布の性質2」とよぶことにします。

正規分布の数表の見方

正規分布モデルにしたがう確率変数がある範囲の値になる確率を求めるには,積分の計算をしなければなりません。しかし,実際にはその必要はなく,数表を使って求めることができます。

数表は「標準正規分布にしたがう確率変数 Zがある値 z以上である確率」P(Z ! z)を計算したもので3,確率密度関数のグラフにおいては図 4のグレーの部分の面積になります。標準正規分布の確率密度関数は z = 0に対して左右対称なので,数表は z ! 0についてのみ掲載されています。

さきほどの「正規分布の性質1」を使うと,期待値・分散がどんな値の正規分布でも,それにしたがう確率変数 Xがある値 x以上である確率を,この数表だけで求めることができます。例えば,期待値 50,分散 102である正規分布 N(50, 102)にしたがう確率変数 Xが 60以上である確率,すなわち P(X ! 60)を求めてみましょう。Z = (X ! 50)/10のように変換すると,性質1から確率変数 Zは標準正規分布 N(0, 1)にしたがいます。また,X = 60のとき Z = (60 ! 50)/10 = 1ですから,求める確率は P(Z ! 1)です。数表から,P(Z ! 1) = 0.15866であることがわかります。

今日の演習

確率変数 Xが正規分布 N(50, 102)にしたがうとき,(1) P(X ! 55),(2) P(45 " X " 60),をそれぞれ求めてください。

2これを正規分布の再生性といいます。3P( )は,「( )内の事象が起きる確率」という意味です。

浅野 晃/統計学(2013 年度秋学期) 第11回 (2013. 12. 5) http://racco.mikeneko.jp/  4/4ページ

0.00 0.01 0.02 0.03 0.04 0.05

0.0 0.50000 0.49601 0.49202 0.48803 0.48405 0.48006

0.1 0.46017 0.45620 0.45224 0.44828 0.44433 0.44038

0.2 0.42074 0.41683 0.41294 0.40905 0.40517 0.40129

0.3 0.38209 0.37828 0.37448 0.37070 0.36693 0.36317

0.4 0.34458 0.34090 0.33724 0.33360 0.32997 0.32636...

...

1.0 0.15866 0.15625 0.15386 0.15151 0.14917 0.14686 ...

Page 100: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布にもとづく計算

zの小数第2位

zの小数第1位まで

pLATEX2!: 20131020˙08˙seiki : 2013/10/20(20:22)

8.4 正規分布の数表の見方 7

z

f(z)

0 z

面積 = P(Z ! z)

図 8.5 標準正規分布にしたがう確率変数がある値以上である確率」P (Z ! z)否

0.00 0.01 0.02 0.03 0.04 0.05

0.0 0.50000 0.49601 0.49202 0.48803 0.48405 0.48006

0.1 0.46017 0.45620 0.45224 0.44828 0.44433 0.44038

0.2 0.42074 0.41683 0.41294 0.40905 0.40517 0.40129

0.3 0.38209 0.37828 0.37448 0.37070 0.36693 0.36317

0.4 0.34458 0.34090 0.33724 0.33360 0.32997 0.32636

...

...

図 8.6 正規分布表(一部抜粋)で P (Z ! 0.23)を求める

においては,図 8.5のグレーの部分の面積になります。標準正規分布の確率密度関数は z = 0に対して左右対称なので,数表は z ! 0についてのみ掲載されています。正規分布表では,縦の見出しに z の値の小数第 1位までが,横の見出しに小数第 2位が表示されており,調べたい z の値について縦と横の見出しを見つけて,対応する行と列の交点を探すと,そこに P (Z ! z)の値が書いてあります。例えば,図 のように,P (Z ! 0.23)を求める場合,縦の見出しから 0.2を,横の見出しから 0.03を見つけて,対応する行と列の交点を探すと,そこに書いてある 0.40905が P (Z ! 0.23)の値です。さきほどの「正規分布の性質 1」を使うと,期待値・分散がどんな値の正

規分布でも,それにしたがう確率変数X がある値 x以上である確率を,正規分布表だけで求めることができます。例えば,期待値 50,分散 102 である正規分布N(50, 102)にしたがう確率

を求める

z

f(z)

0 z

面積 = P(Z ! z)

図 4: 標準正規分布の確率密度関数のグラフ上で「確率変数 Zが値 z以上である確率」P(Z ! z)

· · · + Xn)/nは N(µ,!2/n)にしたがいます2。

「X1, . . . , Xnが独立で,いずれも正規分布 N(µ,!2)にしたがう」という条件にあてはまるのは,X1, . . . , Xn

が,正規分布 N(µ,!2) にしたがう母集団分布から無作為抽出された標本であるときです。このとき,(X1 + · · · + Xn)/nは標本平均です。第10回の講義で,標本平均の期待値は µ,分散は !2/nであると述べました。ここで述べているのは,それだけでなく,母集団分布が正規分布であるならば,標本平均もやはり正規分布にしたがう,ということです。この性質を,この講義では以後「正規分布の性質2」とよぶことにします。

正規分布の数表の見方

正規分布モデルにしたがう確率変数がある範囲の値になる確率を求めるには,積分の計算をしなければなりません。しかし,実際にはその必要はなく,数表を使って求めることができます。

数表は「標準正規分布にしたがう確率変数 Zがある値 z以上である確率」P(Z ! z)を計算したもので3,確率密度関数のグラフにおいては図 4のグレーの部分の面積になります。標準正規分布の確率密度関数は z = 0に対して左右対称なので,数表は z ! 0についてのみ掲載されています。

さきほどの「正規分布の性質1」を使うと,期待値・分散がどんな値の正規分布でも,それにしたがう確率変数 Xがある値 x以上である確率を,この数表だけで求めることができます。例えば,期待値 50,分散 102である正規分布 N(50, 102)にしたがう確率変数 Xが 60以上である確率,すなわち P(X ! 60)を求めてみましょう。Z = (X ! 50)/10のように変換すると,性質1から確率変数 Zは標準正規分布 N(0, 1)にしたがいます。また,X = 60のとき Z = (60 ! 50)/10 = 1ですから,求める確率は P(Z ! 1)です。数表から,P(Z ! 1) = 0.15866であることがわかります。

今日の演習

確率変数 Xが正規分布 N(50, 102)にしたがうとき,(1) P(X ! 55),(2) P(45 " X " 60),をそれぞれ求めてください。

2これを正規分布の再生性といいます。3P( )は,「( )内の事象が起きる確率」という意味です。

浅野 晃/統計学(2013 年度秋学期) 第11回 (2013. 12. 5) http://racco.mikeneko.jp/  4/4ページ

0.00 0.01 0.02 0.03 0.04 0.05

0.0 0.50000 0.49601 0.49202 0.48803 0.48405 0.48006

0.1 0.46017 0.45620 0.45224 0.44828 0.44433 0.44038

0.2 0.42074 0.41683 0.41294 0.40905 0.40517 0.40129

0.3 0.38209 0.37828 0.37448 0.37070 0.36693 0.36317

0.4 0.34458 0.34090 0.33724 0.33360 0.32997 0.32636...

...

1.0 0.15866 0.15625 0.15386 0.15151 0.14917 0.14686 ...

Page 101: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布にもとづく計算

zの小数第2位

zの小数第1位まで

pLATEX2!: 20131020˙08˙seiki : 2013/10/20(20:22)

8.4 正規分布の数表の見方 7

z

f(z)

0 z

面積 = P(Z ! z)

図 8.5 標準正規分布にしたがう確率変数がある値以上である確率」P (Z ! z)否

0.00 0.01 0.02 0.03 0.04 0.05

0.0 0.50000 0.49601 0.49202 0.48803 0.48405 0.48006

0.1 0.46017 0.45620 0.45224 0.44828 0.44433 0.44038

0.2 0.42074 0.41683 0.41294 0.40905 0.40517 0.40129

0.3 0.38209 0.37828 0.37448 0.37070 0.36693 0.36317

0.4 0.34458 0.34090 0.33724 0.33360 0.32997 0.32636

...

...

図 8.6 正規分布表(一部抜粋)で P (Z ! 0.23)を求める

においては,図 8.5のグレーの部分の面積になります。標準正規分布の確率密度関数は z = 0に対して左右対称なので,数表は z ! 0についてのみ掲載されています。正規分布表では,縦の見出しに z の値の小数第 1位までが,横の見出しに小数第 2位が表示されており,調べたい z の値について縦と横の見出しを見つけて,対応する行と列の交点を探すと,そこに P (Z ! z)の値が書いてあります。例えば,図 のように,P (Z ! 0.23)を求める場合,縦の見出しから 0.2を,横の見出しから 0.03を見つけて,対応する行と列の交点を探すと,そこに書いてある 0.40905が P (Z ! 0.23)の値です。さきほどの「正規分布の性質 1」を使うと,期待値・分散がどんな値の正

規分布でも,それにしたがう確率変数X がある値 x以上である確率を,正規分布表だけで求めることができます。例えば,期待値 50,分散 102 である正規分布N(50, 102)にしたがう確率

を求める

z

f(z)

0 z

面積 = P(Z ! z)

図 4: 標準正規分布の確率密度関数のグラフ上で「確率変数 Zが値 z以上である確率」P(Z ! z)

· · · + Xn)/nは N(µ,!2/n)にしたがいます2。

「X1, . . . , Xnが独立で,いずれも正規分布 N(µ,!2)にしたがう」という条件にあてはまるのは,X1, . . . , Xn

が,正規分布 N(µ,!2) にしたがう母集団分布から無作為抽出された標本であるときです。このとき,(X1 + · · · + Xn)/nは標本平均です。第10回の講義で,標本平均の期待値は µ,分散は !2/nであると述べました。ここで述べているのは,それだけでなく,母集団分布が正規分布であるならば,標本平均もやはり正規分布にしたがう,ということです。この性質を,この講義では以後「正規分布の性質2」とよぶことにします。

正規分布の数表の見方

正規分布モデルにしたがう確率変数がある範囲の値になる確率を求めるには,積分の計算をしなければなりません。しかし,実際にはその必要はなく,数表を使って求めることができます。

数表は「標準正規分布にしたがう確率変数 Zがある値 z以上である確率」P(Z ! z)を計算したもので3,確率密度関数のグラフにおいては図 4のグレーの部分の面積になります。標準正規分布の確率密度関数は z = 0に対して左右対称なので,数表は z ! 0についてのみ掲載されています。

さきほどの「正規分布の性質1」を使うと,期待値・分散がどんな値の正規分布でも,それにしたがう確率変数 Xがある値 x以上である確率を,この数表だけで求めることができます。例えば,期待値 50,分散 102である正規分布 N(50, 102)にしたがう確率変数 Xが 60以上である確率,すなわち P(X ! 60)を求めてみましょう。Z = (X ! 50)/10のように変換すると,性質1から確率変数 Zは標準正規分布 N(0, 1)にしたがいます。また,X = 60のとき Z = (60 ! 50)/10 = 1ですから,求める確率は P(Z ! 1)です。数表から,P(Z ! 1) = 0.15866であることがわかります。

今日の演習

確率変数 Xが正規分布 N(50, 102)にしたがうとき,(1) P(X ! 55),(2) P(45 " X " 60),をそれぞれ求めてください。

2これを正規分布の再生性といいます。3P( )は,「( )内の事象が起きる確率」という意味です。

浅野 晃/統計学(2013 年度秋学期) 第11回 (2013. 12. 5) http://racco.mikeneko.jp/  4/4ページ

0.00 0.01 0.02 0.03 0.04 0.05

0.0 0.50000 0.49601 0.49202 0.48803 0.48405 0.48006

0.1 0.46017 0.45620 0.45224 0.44828 0.44433 0.44038

0.2 0.42074 0.41683 0.41294 0.40905 0.40517 0.40129

0.3 0.38209 0.37828 0.37448 0.37070 0.36693 0.36317

0.4 0.34458 0.34090 0.33724 0.33360 0.32997 0.32636...

...

1.0 0.15866 0.15625 0.15386 0.15151 0.14917 0.14686 ...

Page 102: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布にもとづく計算

zの小数第2位

zの小数第1位まで

pLATEX2!: 20131020˙08˙seiki : 2013/10/20(20:22)

8.4 正規分布の数表の見方 7

z

f(z)

0 z

面積 = P(Z ! z)

図 8.5 標準正規分布にしたがう確率変数がある値以上である確率」P (Z ! z)否

0.00 0.01 0.02 0.03 0.04 0.05

0.0 0.50000 0.49601 0.49202 0.48803 0.48405 0.48006

0.1 0.46017 0.45620 0.45224 0.44828 0.44433 0.44038

0.2 0.42074 0.41683 0.41294 0.40905 0.40517 0.40129

0.3 0.38209 0.37828 0.37448 0.37070 0.36693 0.36317

0.4 0.34458 0.34090 0.33724 0.33360 0.32997 0.32636

...

...

図 8.6 正規分布表(一部抜粋)で P (Z ! 0.23)を求める

においては,図 8.5のグレーの部分の面積になります。標準正規分布の確率密度関数は z = 0に対して左右対称なので,数表は z ! 0についてのみ掲載されています。正規分布表では,縦の見出しに z の値の小数第 1位までが,横の見出しに小数第 2位が表示されており,調べたい z の値について縦と横の見出しを見つけて,対応する行と列の交点を探すと,そこに P (Z ! z)の値が書いてあります。例えば,図 のように,P (Z ! 0.23)を求める場合,縦の見出しから 0.2を,横の見出しから 0.03を見つけて,対応する行と列の交点を探すと,そこに書いてある 0.40905が P (Z ! 0.23)の値です。さきほどの「正規分布の性質 1」を使うと,期待値・分散がどんな値の正

規分布でも,それにしたがう確率変数X がある値 x以上である確率を,正規分布表だけで求めることができます。例えば,期待値 50,分散 102 である正規分布N(50, 102)にしたがう確率

を求める

z

f(z)

0 z

面積 = P(Z ! z)

図 4: 標準正規分布の確率密度関数のグラフ上で「確率変数 Zが値 z以上である確率」P(Z ! z)

· · · + Xn)/nは N(µ,!2/n)にしたがいます2。

「X1, . . . , Xnが独立で,いずれも正規分布 N(µ,!2)にしたがう」という条件にあてはまるのは,X1, . . . , Xn

が,正規分布 N(µ,!2) にしたがう母集団分布から無作為抽出された標本であるときです。このとき,(X1 + · · · + Xn)/nは標本平均です。第10回の講義で,標本平均の期待値は µ,分散は !2/nであると述べました。ここで述べているのは,それだけでなく,母集団分布が正規分布であるならば,標本平均もやはり正規分布にしたがう,ということです。この性質を,この講義では以後「正規分布の性質2」とよぶことにします。

正規分布の数表の見方

正規分布モデルにしたがう確率変数がある範囲の値になる確率を求めるには,積分の計算をしなければなりません。しかし,実際にはその必要はなく,数表を使って求めることができます。

数表は「標準正規分布にしたがう確率変数 Zがある値 z以上である確率」P(Z ! z)を計算したもので3,確率密度関数のグラフにおいては図 4のグレーの部分の面積になります。標準正規分布の確率密度関数は z = 0に対して左右対称なので,数表は z ! 0についてのみ掲載されています。

さきほどの「正規分布の性質1」を使うと,期待値・分散がどんな値の正規分布でも,それにしたがう確率変数 Xがある値 x以上である確率を,この数表だけで求めることができます。例えば,期待値 50,分散 102である正規分布 N(50, 102)にしたがう確率変数 Xが 60以上である確率,すなわち P(X ! 60)を求めてみましょう。Z = (X ! 50)/10のように変換すると,性質1から確率変数 Zは標準正規分布 N(0, 1)にしたがいます。また,X = 60のとき Z = (60 ! 50)/10 = 1ですから,求める確率は P(Z ! 1)です。数表から,P(Z ! 1) = 0.15866であることがわかります。

今日の演習

確率変数 Xが正規分布 N(50, 102)にしたがうとき,(1) P(X ! 55),(2) P(45 " X " 60),をそれぞれ求めてください。

2これを正規分布の再生性といいます。3P( )は,「( )内の事象が起きる確率」という意味です。

浅野 晃/統計学(2013 年度秋学期) 第11回 (2013. 12. 5) http://racco.mikeneko.jp/  4/4ページ

0.00 0.01 0.02 0.03 0.04 0.05

0.0 0.50000 0.49601 0.49202 0.48803 0.48405 0.48006

0.1 0.46017 0.45620 0.45224 0.44828 0.44433 0.44038

0.2 0.42074 0.41683 0.41294 0.40905 0.40517 0.40129

0.3 0.38209 0.37828 0.37448 0.37070 0.36693 0.36317

0.4 0.34458 0.34090 0.33724 0.33360 0.32997 0.32636...

...

1.0 0.15866 0.15625 0.15386 0.15151 0.14917 0.14686 ...

Page 103: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布にもとづく計算

zの小数第2位

zの小数第1位まで

pLATEX2!: 20131020˙08˙seiki : 2013/10/20(20:22)

8.4 正規分布の数表の見方 7

z

f(z)

0 z

面積 = P(Z ! z)

図 8.5 標準正規分布にしたがう確率変数がある値以上である確率」P (Z ! z)否

0.00 0.01 0.02 0.03 0.04 0.05

0.0 0.50000 0.49601 0.49202 0.48803 0.48405 0.48006

0.1 0.46017 0.45620 0.45224 0.44828 0.44433 0.44038

0.2 0.42074 0.41683 0.41294 0.40905 0.40517 0.40129

0.3 0.38209 0.37828 0.37448 0.37070 0.36693 0.36317

0.4 0.34458 0.34090 0.33724 0.33360 0.32997 0.32636

...

...

図 8.6 正規分布表(一部抜粋)で P (Z ! 0.23)を求める

においては,図 8.5のグレーの部分の面積になります。標準正規分布の確率密度関数は z = 0に対して左右対称なので,数表は z ! 0についてのみ掲載されています。正規分布表では,縦の見出しに z の値の小数第 1位までが,横の見出しに小数第 2位が表示されており,調べたい z の値について縦と横の見出しを見つけて,対応する行と列の交点を探すと,そこに P (Z ! z)の値が書いてあります。例えば,図 のように,P (Z ! 0.23)を求める場合,縦の見出しから 0.2を,横の見出しから 0.03を見つけて,対応する行と列の交点を探すと,そこに書いてある 0.40905が P (Z ! 0.23)の値です。さきほどの「正規分布の性質 1」を使うと,期待値・分散がどんな値の正

規分布でも,それにしたがう確率変数X がある値 x以上である確率を,正規分布表だけで求めることができます。例えば,期待値 50,分散 102 である正規分布N(50, 102)にしたがう確率

を求める

z

f(z)

0 z

面積 = P(Z ! z)

図 4: 標準正規分布の確率密度関数のグラフ上で「確率変数 Zが値 z以上である確率」P(Z ! z)

· · · + Xn)/nは N(µ,!2/n)にしたがいます2。

「X1, . . . , Xnが独立で,いずれも正規分布 N(µ,!2)にしたがう」という条件にあてはまるのは,X1, . . . , Xn

が,正規分布 N(µ,!2) にしたがう母集団分布から無作為抽出された標本であるときです。このとき,(X1 + · · · + Xn)/nは標本平均です。第10回の講義で,標本平均の期待値は µ,分散は !2/nであると述べました。ここで述べているのは,それだけでなく,母集団分布が正規分布であるならば,標本平均もやはり正規分布にしたがう,ということです。この性質を,この講義では以後「正規分布の性質2」とよぶことにします。

正規分布の数表の見方

正規分布モデルにしたがう確率変数がある範囲の値になる確率を求めるには,積分の計算をしなければなりません。しかし,実際にはその必要はなく,数表を使って求めることができます。

数表は「標準正規分布にしたがう確率変数 Zがある値 z以上である確率」P(Z ! z)を計算したもので3,確率密度関数のグラフにおいては図 4のグレーの部分の面積になります。標準正規分布の確率密度関数は z = 0に対して左右対称なので,数表は z ! 0についてのみ掲載されています。

さきほどの「正規分布の性質1」を使うと,期待値・分散がどんな値の正規分布でも,それにしたがう確率変数 Xがある値 x以上である確率を,この数表だけで求めることができます。例えば,期待値 50,分散 102である正規分布 N(50, 102)にしたがう確率変数 Xが 60以上である確率,すなわち P(X ! 60)を求めてみましょう。Z = (X ! 50)/10のように変換すると,性質1から確率変数 Zは標準正規分布 N(0, 1)にしたがいます。また,X = 60のとき Z = (60 ! 50)/10 = 1ですから,求める確率は P(Z ! 1)です。数表から,P(Z ! 1) = 0.15866であることがわかります。

今日の演習

確率変数 Xが正規分布 N(50, 102)にしたがうとき,(1) P(X ! 55),(2) P(45 " X " 60),をそれぞれ求めてください。

2これを正規分布の再生性といいます。3P( )は,「( )内の事象が起きる確率」という意味です。

浅野 晃/統計学(2013 年度秋学期) 第11回 (2013. 12. 5) http://racco.mikeneko.jp/  4/4ページ

0.00 0.01 0.02 0.03 0.04 0.05

0.0 0.50000 0.49601 0.49202 0.48803 0.48405 0.48006

0.1 0.46017 0.45620 0.45224 0.44828 0.44433 0.44038

0.2 0.42074 0.41683 0.41294 0.40905 0.40517 0.40129

0.3 0.38209 0.37828 0.37448 0.37070 0.36693 0.36317

0.4 0.34458 0.34090 0.33724 0.33360 0.32997 0.32636...

...

1.0 0.15866 0.15625 0.15386 0.15151 0.14917 0.14686 ...

Page 104: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布にもとづく計算演習の2

2013年度春学期 統計学 第11回演習の解答例

確率変数 Xが正規分布 N(50, 102)にしたがうとき,Z = (X ! 50)/10のように変換すると,性質1から確率変数 Zは標準正規分布 N(0, 1)にしたがいます.また,

X = 45のとき  Z = (45 ! 50)/10 = !0.5X = 55のとき  Z = (55 ! 50)/10 = 0.5X = 60のとき  Z = (60 ! 50)/10 = 1

です(図 1).

1. 求める確率は P(Z ! 0.5)で,数表から,P(Z ! 0.5) = 0.30854となります.

2. 求める確率は P(!0.5 " Z " 1)です.この値は 1 ! (P(Z " !0.5) + P(Z ! 1))で,数表から P(Z !1) = 0.15866であり,また前問から P(Z ! 0.5) = 0.30854ですから,P(45 " X " 60) = P(!0.5 "Z " 1) = 0.53280となります(図 2).

面積 = P(45 ! X ! 60)

   = P(– 0.5 ! Z ! 1)

X~N(50, 102)

x

f(x)

50 6045µ+1"µ#0.5" µ

Z~N(0, 1)

z

f(z)

0 1– 0.5

Z = (X – 50) / 10

図 1: 任意の正規分布から標準正規分布への変換

0 1– 0.5

=

+

0 1

0

(–

0– 0.5

)

図 2: P(!0.5 " Z " 1)を数表から求めるには

浅野 晃/統計学(2013 年度春学期) 第11回演習の解答例 http://racco.mikeneko.jp/  1/4ページ

Page 105: 2013年度秋学期 統計学 第11回「分布の「型」を考える - 確率分布モデルと正規分布」

2013年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

正規分布にもとづく計算演習の2

2013年度春学期 統計学 第11回演習の解答例

確率変数 Xが正規分布 N(50, 102)にしたがうとき,Z = (X ! 50)/10のように変換すると,性質1から確率変数 Zは標準正規分布 N(0, 1)にしたがいます.また,

X = 45のとき  Z = (45 ! 50)/10 = !0.5X = 55のとき  Z = (55 ! 50)/10 = 0.5X = 60のとき  Z = (60 ! 50)/10 = 1

です(図 1).

1. 求める確率は P(Z ! 0.5)で,数表から,P(Z ! 0.5) = 0.30854となります.

2. 求める確率は P(!0.5 " Z " 1)です.この値は 1 ! (P(Z " !0.5) + P(Z ! 1))で,数表から P(Z !1) = 0.15866であり,また前問から P(Z ! 0.5) = 0.30854ですから,P(45 " X " 60) = P(!0.5 "Z " 1) = 0.53280となります(図 2).

面積 = P(45 ! X ! 60)

   = P(– 0.5 ! Z ! 1)

X~N(50, 102)

x

f(x)

50 6045µ+1"µ#0.5" µ

Z~N(0, 1)

z

f(z)

0 1– 0.5

Z = (X – 50) / 10

図 1: 任意の正規分布から標準正規分布への変換

0 1– 0.5

=

+

0 1

0

(–

0– 0.5

)

図 2: P(!0.5 " Z " 1)を数表から求めるには

浅野 晃/統計学(2013 年度春学期) 第11回演習の解答例 http://racco.mikeneko.jp/  1/4ページ