Upload
kipp
View
55
Download
0
Embed Size (px)
DESCRIPTION
確率と統計. メディア学部 2011 年 2011 年 12 月 22 日(木). この資料は数学的な話が中心です。. 確率分布. 検定を行う際、確率計算が必要になります。 そのためには、分析対象が従うそれぞれの確率値の在り様 ( 確率分布 ) を知り、その 性質・特徴を上手く利用することになります。. 例えば. 1つのサイコロを 500 回投げたとき、偶数の目が100回出る確率 P を求めるとき、 定義では を計算しなければならない。うっそ!. 興味ある人は計算してみてください。. 参考情報. オープンソースのツールを使うことも考えてみよう - PowerPoint PPT Presentation
Citation preview
確率と統計確率と統計確率と統計確率と統計メディア学部メディア学部 20112011 年年
20112011 年年 1212 月月 2222 日(木)日(木)
この資料は数学的な話が中心です。
この資料は数学的な話が中心です。
確率分布• 検定を行う際、確率計算が必要になりま
す。• そのためには、分析対象が従うそれぞれ
の確率値の在り様 ( 確率分布 ) を知り、その性質・特徴を上手く利用することになります。
東京工科大学 確率と統計 2011 P.2
例えば• 1つのサイコロを 500 回投げたとき、
偶数の目が100回出る確率 P を求めるとき、定義では
を計算しなければならない。うっそ!
東京工科大学 確率と統計 2011 P.3
400100
100500 2
1
2
1
CP
興味ある人は計算してみてください。
興味ある人は計算してみてください。
参考情報• オープンソースのツールを使うことも
考えてみよう– 数式計算ソフトウェア Maxima– 数値計算ソフトウェア Scilab– 統計計算ソフトウェア R など
東京工科大学 確率と統計 2011 P.4
いろいろな確率分布1. 2項分布2. 正規分布3. ポアソン分布4. 一様分布5. χ 2分布(カイ自乗分布6. t分布(ティー分布)7. F 分布(エフ分布) などなど
P.5東京工科大学 確率と統計 2011
1. 2項分布• 1回の試行において、事象 A の起こる
確率が p 、起こらない確率が q とする。このとき、n回の反復試行で事象 A がk 回起こる確率は、次のようになる。
この分布を と書く。
教科書 p.97 参照のこと
),,2,1,0()( nkqpCkXP knkkn
),( pnB
P.6東京工科大学 確率と統計 2011
例• 1枚の硬貨をn回投げる。
P.7東京工科大学 確率と統計 2011
2項分布 B(n, p) の平均と分散
• 平均 = np• 分散 = npq
教科書 p.101 式 (2) 参照のこと
有名かつ便利な公式
P.8東京工科大学 確率と統計 2011
公式の利用例• サイコロを 500 回振る。3の倍数の目
が出る回数の平均(期待値)は、公式より
東京工科大学 確率と統計 2011 P.9
回3
500
6
2500
pn
2.正規分布• 測定誤差や身長のデータのヒストグラムを
作ると釣鐘型になる。このときのヒストグラムの形を近似的に表す曲線を正規分布曲線とい、このときの分布を正規分布という。
正規分布曲線は、平均 μ と分散 σ2 できまるので、 N(μ, σ2 ) と書くことがある。
P.10東京工科大学 確率と統計 2011
キーワード• 分布関数• 確率密度関数• 正規分布曲線(定義)• 正規分布の特徴• 標準化 など
P.11東京工科大学 確率と統計 2011
正規分布のグラフ
P.12東京工科大学 確率と統計 2011
正規分布のグラフ
変曲点
左右対称
ほとんどゼロ
教科書 p.102 図 3 参照のこと
P.13東京工科大学 確率と統計 2011
正規分布曲線の式
ex
xf
2)( 2
2
1)( 2
)( x
14東京工科大学 確率と統計 2011
正規分布曲線の式
ex
xf
2
2)(
2
1)( 2
)( x標準偏差
平均
15東京工科大学 確率と統計 2011
重要な性質• 左右対称• X =σ は変曲点(上凸と下凸の変わり
目)• 平均 = 中央値 = モード
P.16東京工科大学 確率と統計 2011
他の重要な性質• (次ページ以降を参照のこと)
P.17東京工科大学 確率と統計 2011
正規分布のグラフ
68%
P.18東京工科大学 確率と統計 2011
正規分布のグラフ
95%
P.19東京工科大学 確率と統計 2011
正規分布のグラフ
99.7%
P.20東京工科大学 確率と統計 2011
ちょっと一言• 図形の面積は定積分によりもとめられ
る。
東京工科大学 確率と統計 2011 P.21
b
adxxfS )(面積
標準化の公式
x
z
N(μ,σ2) N(0,1)P.22東京工科大学 確率と統計 2011
標準化の公式
x
z
N(0,1)N(μ,σ2)
平均ゼロ、分散1
(標準正規分布)
平均 μ 、分散 σ2
(正規分布)
P.23東京工科大学 確率と統計 2011
標準化の公式
x
z
N(0,1)N(μ,σ2)
平均ゼロ、分散1
(標準正規分布)
平均 μ 、分散 σ2
(正規分布)
P.24東京工科大学 確率と統計 2011
これについての情報が標準正規分布表として与えられている。
練習問題• 正しく作られたコインを 100 回投げ
るとき、表が 40 回から 60 回出る確率を求めよ。
P.25東京工科大学 確率と統計 2011
• ヒント:– コイン投げの繰り返しは2項分布 B(n,p) と
なるので、定義に従って計算しても良い。– 繰り返しの回数が多い場合は、平均が np 、
分散が npq の正規分布 N(np,npq) で近似できる。
– この事実を使うと比較的楽に確率が計算できる。
P.26東京工科大学 確率と統計 2011
• 答え:– μ= np = (100)×(1/2) = 50– σ2= npq = (100)×(1/2)×(1-1/2) = 25 = 52
– Z=(X-μ)/σ = (X – 50) / 5 とすると– Z1=(40-50)/5 = -2
– Z2=(60-50)/5 = +2
– 標準正規分布曲線の -2 ~ +2 の部分の面積が求める確率。
– 標準正規分布表 ( 教科書 p.295) より約 0.95 (= 0.4772×2)
P.27東京工科大学 確率と統計 2011
以上のことを別の言い方で表すと..
.
東京工科大学 確率と統計 2011 P.28
dxedze
dxe
C
XP
P
xzm
m
mx
k
kk
k
22
2
2
2
2
60
40
2
)(60
40
60
40
100
100
2
1
2
1
2
1
2
1
2
1
)6040(
)6040100(
回以下出る回以上回中表が確率
図で表すと...• (黒板で説明します)
東京工科大学 確率と統計 2011 P.29
確認問題• 正しく作られたコインを 400 回投げ
るとき、表が 150 回以上 230 回以下出る確率を求めよ。
東京工科大学 確率と統計 2011 P.30
発展問題• 両側検定と片側検定について
以下の問に答えよ。(1)両側検定とは何か。(2)片側検定とは何か。(3)コインを何回か投げた結果に基づいて、コインが正しく作られているかを調べたい。このときは、両側検定を使うべきか、片側検定を使うべきか。
P.31東京工科大学 確率と統計 2011
• 問題のヒント:教科書の p.163~ 167 をよく読むこと。両側検定、片側検定の区別、使い分けは重要なので、何かの機会に一度調べておくことを勧める。
P.32東京工科大学 確率と統計 2011
正規分布の話は今日はここまで
東京工科大学 確率と統計 2011 P.33
今日の挑戦問題• ある人種では4つの血液型が知られてお
り、各血液型を持つ人の割合は 0.16, 0.48, 0.20, 0.16であるという。一方、他の人種の人についても同様の調査をしたところ、それぞれの血液型を持つ人は 180, 360, 130, 100 人
だった。これら人種間で血液型の人数比は同じだろうか?
P.34東京工科大学 確率と統計 2011
挑戦問題問題のヒント• カイ2乗検定を利用する。• 教科書第 10章を参照のこと。• 教科書 p.229 の問題2と同じ。• 自由度の求め方を覚えると良い。• カイ2乗分布の表は教科書 p.298 。• (カイ2乗検定は利用価値が高いです
ので、是非覚えて使ってください。)
P.35東京工科大学 確率と統計 2011
練習問題• ある図書館での本の貸し出しを調べたら以下の
ようになった。「曜日により貸し出し冊数は変わらない」かどうか検定せよ。なお、有意水準を5%とせよ。
月曜 火曜 水曜 木曜 金曜貸し出し冊数
135
108
120
114 146
36東京工科大学 確率と統計 2011
練習問題のヒント
月曜 火曜 水曜 木曜 金曜 合計
観測値 135
108
120
114
146 T
理論値 T / 5 T / 5 T / 5 T/ 5 T / 5
T=135 + 108 + 120 + 114 + 146=623
37東京工科大学 確率と統計 2011
その他• カイ2乗検定の1つに、分割表 ( 教科書
p.225) があります。便利なのでマスターしてください。授業でもやりましたよね!
• カイ2乗検定は、分散分析の特殊な場合となっています。分散分析はさらに強力な手法ですので、是非勉強しましょう。
• 統計は慣れることが大切です。継続的に勉強してください。理論よりまず実践です。
P.38東京工科大学 確率と統計 2011
最後に• 統計を知っている人と知らない人とで
は、今後大きな差になってきます。統計をすべて勉強することは無理です。自分に関係のある分野で、必要なものから順次慣れていってください。
練習あるのみ次回4つ目のレポート課題を提示する予定です。
P.39東京工科大学 確率と統計 2011