Upload
others
View
6
Download
0
Embed Size (px)
Citation preview
2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
田中 宏季
知能コミュニケーション研究室
/ 49
統計的仮説検定について
1
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
ある事柄について、どの程度の確率でそうなのかを主張することができる
偶然にそうなったのではない
幅広い分野で基本的には必須
2
なぜ検定?
よくなった?
10人のスキルの平均
A B
0.0
0.5
1.0
1.5
2.0
2.5
3.0
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
3
データの種類
大分類 小分類 意味 例
量的変数
比較尺度 量が0である点が存在 間隔にも比率にも意味がある
身長 体重 時間
間隔尺度 数値の間隔には意味がある 量が0である点が存在しない
温度 時刻
評価点
質的変数 (カテゴリカル・
データ)
順序尺度 順位には意味がある 間隔には意味がないもの
満足度 年代
名義尺度 順序のないカテゴリの変数 異なる・同じしか示さない
性別 職業
血液型
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
4
1変数の記述統計
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
x={13,14,7,12,10,6,8,15,4,14,9,6,10,12,5,12,8,8,12,15}
ヒストグラム
平均
n: サンプル数
5
データの可視化
Histogram of X
X
Fre
que
ncy
4 6 8 10 12 14 16
01
23
4
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
中央値
データを大きさの順に並べたときに真ん中に位置する値
外れ値がある場合などに有効
先ほどの例では、10
最頻値
もっとも頻繁に観測される値
質的変数で主に使用
先ほどの例では、8
6
平均以外の代表値
x 4 5 6 7 8 9 10 12 13 14 15 1 1 2 1 3 1 2 4 1 2 2
4 5 6 6 7 8 8 8 9 10 10 12 12 12 12 13 14 14 15 15
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
代表値のみならず、ばらつきを見ることも重要
(不偏)分散
平均からの偏差
標準偏差
分散の平方根
論文などではこの値
そのほか、範囲(レンジ)など 7
ばらつき
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
正規化
データ値の変換
Z値
平均0、標準偏差1
範囲[0,1]におさまるように写像する場合もある
8
正規化
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
9
2変数の記述統計
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
正の相関
負の相関
無相関(相関なし)
10
散布図
2 4 6 8 10
12
14
16
18
20
x
y
正の相関例
4 6 8 10
46
81
012
14
c
d
無相関例
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
2変数の関係の強さを反映する指標
変数xとyについて、
共分散が正 -> 正の相関、共分散が負 -> 負の相関
共分散を正規化したものが、相関係数
11
共分散
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
2変量について相関の度合いを示した係数r
12
相関係数
相関係数 評価の目安
-0.2 < r < 0.2 ほとんど相関なし
-0.4 r < -0.2, 0.2 < r < 0.4 弱い相関あり
-0.7 < r -0.4, 0.4 < r < 0.7 中程度の相関あり
-1.0 < r < -0.7, 0.7 < r < 1.0 強い相関あり
岩永雅也, 大塚雄作, and 高橋一男. "社会調査の基礎." 放送大学 教育振興会(1996).
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
質的変数の関係性(連関)
例)数学と統計の好き、嫌い
13
クロス集計
統計
嫌い 好き
数学 嫌い 10 4
好き 2 4
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
14
母集団と標本
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
母集団:対象となる全データの集合
母集団の平均:母平均μ(真の平均)
母集団の分散:母分散σ2(真の分散)
標本集団:サンプリングされたデータの集合
標本集団の平均:標本平均
標本集団の分散:標本分散
15
母集団と標本
既知
未知
推測
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
16
推測統計の分類
推測統計
推定
検定
点推定
区間推定 (信頼区間)
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
点推定(誤差を含む)
母集団から抽出した標本を用いて、母数の点推定を行う
標本平均(推定量)から、母平均を推定
区間推定
標本の統計量から、母集団の平均などを、幅(区間)を持たせて推定
17
点推定と区間推定
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
18
統計的仮説検定
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
標本抽出から母数の推測を行う
確率論に基づいて、主張を行うための方法
19
統計的仮説検定
よくなった?
スキルの平均
A B
0.0
0.5
1.0
1.5
2.0
2.5
3.0
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
20
検定と手順
手順
1 母集団に関する帰無仮説と対立仮説(両側か片側検定)を設定
2 検定統計量を選ぶ
3 有意水準αの値を決める
4 (データを収集し)データから検定統計量の値を求める
5 検定統計量の値が棄却域に入れば帰無仮説を棄却して、対立仮説を採択する。
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
1つの平均値の検定、母分散が既知
実際には、ほとんどない
例:過去のデータの蓄積から「心理学テスト」の得点は平均12、分散
10の正規分布に従う。新しい20人の心理学テスト得点は、この母集
団からの無作為標本と考えてよいか
帰無仮説H0:u = 12(心理学テストの母平均は12である)
対立仮説H1:u 12(心理学テストの母平均は12ではない)
正規分布を分布とする検定
21
Z検定
両側検定
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
有意水準αの決定
5%、α=0.05、両側検定
Zの実現値を求める
Z=-2.8284
Z < -1.95より、棄却域に入る
帰無仮説の棄却
p < 0.05
平均12,分散10からの
サンプリングとは言えない
実際のp値の計算
22
Z検定
-3 -2 -1 0 1 2 3
0.0
0.1
0.2
0.3
0.4
x
dno
rm(x
) 棄却域2.5%
-1.95 1.95
棄却域2.5%
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
1つの平均値の検定、母分散が未知
自由度df = n-1のt分布を使用、データが大きいと正規分布に近づく
23
1群のt検定
-4 -2 0 2 4
0.0
0.1
0.2
0.3
0.4
x
dt(
x, 8)
df=8
df=1
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
母集団では相関がないのに、偶然に相関が出てしまったのでは?
ピアソンの積率相関係数
帰無仮説H0:ρ = 0(母相関は0である)
対立仮説H1:ρ 0(母相関は0ではない)
統計検定量
24
無相関検定
2 4 6 8 10
12
14
16
18
20
x
y
偶然?
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
相関の検定でわかるのは、共変関係があるかということ
因果関係はわからない
相関関係は因果関係の必要条件の1つ
25
統計的因果推論
相関関係 因果関係
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
因果関係ならば相関関係(真)
相関関係でなければ因果関係なし(対偶も真)
因果関係は、相関関係というのに十分(十分条件)
相関関係は、因果関係というのに必要(必要条件)
26
必要条件・十分条件
http://juken-mikata.net/how-to/mathematics/meidai.html
因果関係
相関関係
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
2値データ、カテゴリカルデータの独立性・連関を検定
例)数学の好き・嫌いと、統計の好き・嫌いに連関はない
データ中に10以下の数値がある場合は、イエーツ補正χ2 検定
データ中に4以下の数値がある場合は、フィッシャー直接確率試験
27
χ2 検定
統計
嫌い 好き
数学 嫌い 10 4
好き 2 4
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
28
2つの平均値(2群)の比較
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
無作為標本(独立性)が前提
例1)男女で心理学テストに差があるのか
例2)統計が好き・嫌いで統計テストの平均値に差があるか
帰無仮説H0:u1 = u2(2つの母平均は等しい)
対立仮説H1:u1 u2(2つの母平均は等しくない)
検定統計量(対応なし、等分散)
29
t検定
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
等分散性の検定
データのばらつき・分布に差があるか
30
F検定
-10 -5 0 5 10
0.0
0.1
0.2
0.3
0.4
x
dt(
x,
100
)
等分散性によって、検定法が異なる
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
対応あり
同一被験者が反復測定を行っている場合などは「対応がある」
p値が低く出やすい
例)同一被験者のタスク変更課題、事前事後での血圧
対応なし
例)対象群と、統制群
n数が異なることもありえる
31
対応の有無
対応の有無によって、検定法が異なる
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
帰無仮説が棄却されなかった場合
帰無仮説・対立仮説の両方とも正しいとも正しくないとも言えない
第1種の誤りを犯す確率=p値
32
検定での2種類の誤り
棄却 棄却しない
帰無仮説は正しい 第1種の誤り ○
帰無仮説は正しくない ○
第2種の誤り 1 - 第2種の誤り確率
= 検定力
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
33
3つ以上の平均値(3群以上)の比較
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
3群以上の平均値について比較するための統計的方法
統計検定量としてF分布を利用
分散分析で有意差が出たら、多重比較を行うという流れ
34
分散分析
01
23
45
3群
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
主効果と交互作用を考慮
35
2要因の分散分析
http://kogolab.chillout.jp/elearn/hamburger/chap7/sec3.html
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
多重検定はしてはいけない
第1種の誤りが含まれる可能性が向上するため
多重比較として、Tukey法やBonferroni法など 36
多重比較
http://www.slideshare.net/antiplastics/dna-21259335
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
2群間の比較を行うが、比較する回数で危険率を割る
37
Bonferroni法
http://www.slideshare.net/k-kajiwara/r2015-2
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
38
まとめ
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
2群の比較をしたい場合
対応の有無
正規分布か調べる -> コルモゴロフ-スミルノフ検定、シャピロ・ウィル
ク検定
No: ノンパラメトリック -> ウィルコクソンの順位和検定など
母分散が等分散か調べる -> F検定
3群以上の比較をしたい場合
分散分析、混合モデル
多重比較
39
よく使用する検定法
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
ビッグデータになるとサンプル数が大量
数万〜数十テラバイト
統計的有意差が出やすい
効果量の結果も示すことが重要
もしくはサンプルが少なく、統計的差がない時にも有効
40
ビッグデータ解析と検定
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
論文ではこの数値も出すのが最近の傾向
t検定に対応
Cohen’s d
2群の標本平均の差を,データのバラツキで正規化した量
分散分析に対応
Partial η2
要因の効果を誤差(それ以外の効果)で割ったもの
41
効果量
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
42
ブートストラップ法
標本のデータから重複を許したサンプリングを行い、新たな標本を作製
する、といった作業を何度も繰り返す手法
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
43
ブートストラップを用いた解析の例
ブートストラップでの値を計算し、パーセンタイル値を求めて、下2.5%と
上97.5%の間を95%信頼区間とする
ある標本から取得したサンプルがあるシステムに勝った数が95%以上の
ときに、有意に優れているとする(α=0.05) [Koehn, 2004]
http://ghw.pfizer.co.jp/comedical/evaluation/relation.html
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
R言語; オープンソース
データ取得
統計解析
基本統計量、統計的仮説検定、ブートストラップ
多変量解析;主成分分析、多次元尺度構成法
回帰モデル;重回帰
機械学習;SVM,…
データの可視化
散布図、棒グラフ、円グラフ、レーダーチャート…
44
Rでデータ解析
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
Windows
https://cran.r-project.org/bin/windows/base/
(“Download R 3.3.1 for Windows”より)
Mac
https://cran.r-project.org/bin/macosx/
(“R-3.33.1.pkg”より)
Linux
https://cran.ism.ac.jp/
(“Source Code for all Platforms”より)
45
Rのインストール
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
Rのインストール
x<-c(??)
y<-c(??)
平均、中央値、最小値、分散、標準偏差
mean(x), median(x), min(x), var(x), sd(x)
散布図
plot(x,y)
相関係数、無相関検定
cor(x,y), cor.test(x,y)
46
簡単な演習
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
統計的仮説検定を使用することは重要
統計的仮説検定について注意するべき
対応の有無
サンプルサイズ
多重比較
Rで計算可能
47
留意してほしいこと
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
課題内容:
R言語を用いて,以下のコマンドにより生成される画像と結果を提出
> x<-1:10
> y<-4:13
> summary(x)
> barplot(c(mean(x),mean(y)))
> t.test(x,y)
課題の記載項目:
授業名,課題番号(第一回課題),名前,学籍番号,メールアドレス,
summary(x)の実行結果,barplotで生成した画像、t検定の結果(種類、t値、p値)
ファイル形式:PDF
ファイル名, 件名:BDA-日付-学籍番号-名前
ex) BDA-20161007-1251079-hiroki_tanaka
提出先
[email protected] (締切10/14(金)の授業開始時まで) 48
課題
/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST
統計的仮説検定について
舟尾暢男. The R Tips データ解析環境 R の基本技・グラフィックス活用
集. 株式会社 オーム社, 2009.
http://cse.naro.affrc.go.jp/takezawa/r-tips/r2.html
山田剛史, 杉澤武俊, and 村井潤一郎. R によるやさしい統計学. 株式
会社 オーム社, 2008.
鷲尾泰俊. "実験の計画と解析." 岩波書店 (1988).
田中豊, and 脇本和昌. "多変量統計解析法." (1983).
49
参考資料