49
2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 田中 宏季 知能コミュニケーション研究室 / 49 統計的仮説検定について 1

統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

  • Upload
    others

  • View
    6

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

田中 宏季

知能コミュニケーション研究室

/ 49

統計的仮説検定について

1

Page 2: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

ある事柄について、どの程度の確率でそうなのかを主張することができる

偶然にそうなったのではない

幅広い分野で基本的には必須

2

なぜ検定?

よくなった?

10人のスキルの平均

A B

0.0

0.5

1.0

1.5

2.0

2.5

3.0

Page 3: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

3

データの種類

大分類 小分類 意味 例

量的変数

比較尺度 量が0である点が存在 間隔にも比率にも意味がある

身長 体重 時間

間隔尺度 数値の間隔には意味がある 量が0である点が存在しない

温度 時刻

評価点

質的変数 (カテゴリカル・

データ)

順序尺度 順位には意味がある 間隔には意味がないもの

満足度 年代

名義尺度 順序のないカテゴリの変数 異なる・同じしか示さない

性別 職業

血液型

Page 4: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

4

1変数の記述統計

Page 5: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

x={13,14,7,12,10,6,8,15,4,14,9,6,10,12,5,12,8,8,12,15}

ヒストグラム

平均

n: サンプル数

5

データの可視化

Histogram of X

X

Fre

que

ncy

4 6 8 10 12 14 16

01

23

4

Page 6: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

中央値

データを大きさの順に並べたときに真ん中に位置する値

外れ値がある場合などに有効

先ほどの例では、10

最頻値

もっとも頻繁に観測される値

質的変数で主に使用

先ほどの例では、8

6

平均以外の代表値

x 4 5 6 7 8 9 10 12 13 14 15 1 1 2 1 3 1 2 4 1 2 2

4 5 6 6 7 8 8 8 9 10 10 12 12 12 12 13 14 14 15 15

Page 7: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

代表値のみならず、ばらつきを見ることも重要

(不偏)分散

平均からの偏差

標準偏差

分散の平方根

論文などではこの値

そのほか、範囲(レンジ)など 7

ばらつき

Page 8: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

正規化

データ値の変換

Z値

平均0、標準偏差1

範囲[0,1]におさまるように写像する場合もある

8

正規化

Page 9: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

9

2変数の記述統計

Page 10: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

正の相関

負の相関

無相関(相関なし)

10

散布図

2 4 6 8 10

12

14

16

18

20

x

y

正の相関例

4 6 8 10

46

81

012

14

c

d

無相関例

Page 11: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

2変数の関係の強さを反映する指標

変数xとyについて、

共分散が正 -> 正の相関、共分散が負 -> 負の相関

共分散を正規化したものが、相関係数

11

共分散

Page 12: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

2変量について相関の度合いを示した係数r

12

相関係数

相関係数 評価の目安

-0.2 < r < 0.2 ほとんど相関なし

-0.4 r < -0.2, 0.2 < r < 0.4 弱い相関あり

-0.7 < r -0.4, 0.4 < r < 0.7 中程度の相関あり

-1.0 < r < -0.7, 0.7 < r < 1.0 強い相関あり

岩永雅也, 大塚雄作, and 高橋一男. "社会調査の基礎." 放送大学 教育振興会(1996).

Page 13: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

質的変数の関係性(連関)

例)数学と統計の好き、嫌い

13

クロス集計

統計

嫌い 好き

数学 嫌い 10 4

好き 2 4

Page 14: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

14

母集団と標本

Page 15: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

母集団:対象となる全データの集合

母集団の平均:母平均μ(真の平均)

母集団の分散:母分散σ2(真の分散)

標本集団:サンプリングされたデータの集合

標本集団の平均:標本平均

標本集団の分散:標本分散

15

母集団と標本

既知

未知

推測

Page 16: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

16

推測統計の分類

推測統計

推定

検定

点推定

区間推定 (信頼区間)

Page 17: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

点推定(誤差を含む)

母集団から抽出した標本を用いて、母数の点推定を行う

標本平均(推定量)から、母平均を推定

区間推定

標本の統計量から、母集団の平均などを、幅(区間)を持たせて推定

17

点推定と区間推定

Page 18: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

18

統計的仮説検定

Page 19: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

標本抽出から母数の推測を行う

確率論に基づいて、主張を行うための方法

19

統計的仮説検定

よくなった?

スキルの平均

A B

0.0

0.5

1.0

1.5

2.0

2.5

3.0

Page 20: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

20

検定と手順

手順

1 母集団に関する帰無仮説と対立仮説(両側か片側検定)を設定

2 検定統計量を選ぶ

3 有意水準αの値を決める

4 (データを収集し)データから検定統計量の値を求める

5 検定統計量の値が棄却域に入れば帰無仮説を棄却して、対立仮説を採択する。

Page 21: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

1つの平均値の検定、母分散が既知

実際には、ほとんどない

例:過去のデータの蓄積から「心理学テスト」の得点は平均12、分散

10の正規分布に従う。新しい20人の心理学テスト得点は、この母集

団からの無作為標本と考えてよいか

帰無仮説H0:u = 12(心理学テストの母平均は12である)

対立仮説H1:u 12(心理学テストの母平均は12ではない)

正規分布を分布とする検定

21

Z検定

両側検定

Page 22: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

有意水準αの決定

5%、α=0.05、両側検定

Zの実現値を求める

Z=-2.8284

Z < -1.95より、棄却域に入る

帰無仮説の棄却

p < 0.05

平均12,分散10からの

サンプリングとは言えない

実際のp値の計算

22

Z検定

-3 -2 -1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

x

dno

rm(x

) 棄却域2.5%

-1.95 1.95

棄却域2.5%

Page 23: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

1つの平均値の検定、母分散が未知

自由度df = n-1のt分布を使用、データが大きいと正規分布に近づく

23

1群のt検定

-4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

x

dt(

x, 8)

df=8

df=1

Page 24: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

母集団では相関がないのに、偶然に相関が出てしまったのでは?

ピアソンの積率相関係数

帰無仮説H0:ρ = 0(母相関は0である)

対立仮説H1:ρ 0(母相関は0ではない)

統計検定量

24

無相関検定

2 4 6 8 10

12

14

16

18

20

x

y

偶然?

Page 25: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

相関の検定でわかるのは、共変関係があるかということ

因果関係はわからない

相関関係は因果関係の必要条件の1つ

25

統計的因果推論

相関関係 因果関係

Page 26: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

因果関係ならば相関関係(真)

相関関係でなければ因果関係なし(対偶も真)

因果関係は、相関関係というのに十分(十分条件)

相関関係は、因果関係というのに必要(必要条件)

26

必要条件・十分条件

http://juken-mikata.net/how-to/mathematics/meidai.html

因果関係

相関関係

Page 27: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

2値データ、カテゴリカルデータの独立性・連関を検定

例)数学の好き・嫌いと、統計の好き・嫌いに連関はない

データ中に10以下の数値がある場合は、イエーツ補正χ2 検定

データ中に4以下の数値がある場合は、フィッシャー直接確率試験

27

χ2 検定

統計

嫌い 好き

数学 嫌い 10 4

好き 2 4

Page 28: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

28

2つの平均値(2群)の比較

Page 29: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

無作為標本(独立性)が前提

例1)男女で心理学テストに差があるのか

例2)統計が好き・嫌いで統計テストの平均値に差があるか

帰無仮説H0:u1 = u2(2つの母平均は等しい)

対立仮説H1:u1 u2(2つの母平均は等しくない)

検定統計量(対応なし、等分散)

29

t検定

Page 30: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

等分散性の検定

データのばらつき・分布に差があるか

30

F検定

-10 -5 0 5 10

0.0

0.1

0.2

0.3

0.4

x

dt(

x,

100

)

等分散性によって、検定法が異なる

Page 31: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

対応あり

同一被験者が反復測定を行っている場合などは「対応がある」

p値が低く出やすい

例)同一被験者のタスク変更課題、事前事後での血圧

対応なし

例)対象群と、統制群

n数が異なることもありえる

31

対応の有無

対応の有無によって、検定法が異なる

Page 32: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

帰無仮説が棄却されなかった場合

帰無仮説・対立仮説の両方とも正しいとも正しくないとも言えない

第1種の誤りを犯す確率=p値

32

検定での2種類の誤り

棄却 棄却しない

帰無仮説は正しい 第1種の誤り ○

帰無仮説は正しくない ○

第2種の誤り 1 - 第2種の誤り確率

= 検定力

Page 33: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

33

3つ以上の平均値(3群以上)の比較

Page 34: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

3群以上の平均値について比較するための統計的方法

統計検定量としてF分布を利用

分散分析で有意差が出たら、多重比較を行うという流れ

34

分散分析

01

23

45

3群

Page 35: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

主効果と交互作用を考慮

35

2要因の分散分析

http://kogolab.chillout.jp/elearn/hamburger/chap7/sec3.html

Page 36: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

多重検定はしてはいけない

第1種の誤りが含まれる可能性が向上するため

多重比較として、Tukey法やBonferroni法など 36

多重比較

http://www.slideshare.net/antiplastics/dna-21259335

Page 37: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

2群間の比較を行うが、比較する回数で危険率を割る

37

Bonferroni法

http://www.slideshare.net/k-kajiwara/r2015-2

Page 38: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

38

まとめ

Page 39: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

2群の比較をしたい場合

対応の有無

正規分布か調べる -> コルモゴロフ-スミルノフ検定、シャピロ・ウィル

ク検定

No: ノンパラメトリック -> ウィルコクソンの順位和検定など

母分散が等分散か調べる -> F検定

3群以上の比較をしたい場合

分散分析、混合モデル

多重比較

39

よく使用する検定法

Page 40: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

ビッグデータになるとサンプル数が大量

数万〜数十テラバイト

統計的有意差が出やすい

効果量の結果も示すことが重要

もしくはサンプルが少なく、統計的差がない時にも有効

40

ビッグデータ解析と検定

Page 41: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

論文ではこの数値も出すのが最近の傾向

t検定に対応

Cohen’s d

2群の標本平均の差を,データのバラツキで正規化した量

分散分析に対応

Partial η2

要因の効果を誤差(それ以外の効果)で割ったもの

41

効果量

Page 42: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

42

ブートストラップ法

標本のデータから重複を許したサンプリングを行い、新たな標本を作製

する、といった作業を何度も繰り返す手法

Page 43: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

43

ブートストラップを用いた解析の例

ブートストラップでの値を計算し、パーセンタイル値を求めて、下2.5%と

上97.5%の間を95%信頼区間とする

ある標本から取得したサンプルがあるシステムに勝った数が95%以上の

ときに、有意に優れているとする(α=0.05) [Koehn, 2004]

http://ghw.pfizer.co.jp/comedical/evaluation/relation.html

Page 44: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

R言語; オープンソース

データ取得

統計解析

基本統計量、統計的仮説検定、ブートストラップ

多変量解析;主成分分析、多次元尺度構成法

回帰モデル;重回帰

機械学習;SVM,…

データの可視化

散布図、棒グラフ、円グラフ、レーダーチャート…

44

Rでデータ解析

Page 45: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

Windows

https://cran.r-project.org/bin/windows/base/

(“Download R 3.3.1 for Windows”より)

Mac

https://cran.r-project.org/bin/macosx/

(“R-3.33.1.pkg”より)

Linux

https://cran.ism.ac.jp/

(“Source Code for all Platforms”より)

45

Rのインストール

Page 46: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

Rのインストール

x<-c(??)

y<-c(??)

平均、中央値、最小値、分散、標準偏差

mean(x), median(x), min(x), var(x), sd(x)

散布図

plot(x,y)

相関係数、無相関検定

cor(x,y), cor.test(x,y)

46

簡単な演習

Page 47: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

統計的仮説検定を使用することは重要

統計的仮説検定について注意するべき

対応の有無

サンプルサイズ

多重比較

Rで計算可能

47

留意してほしいこと

Page 48: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

課題内容:

R言語を用いて,以下のコマンドにより生成される画像と結果を提出

> x<-1:10

> y<-4:13

> summary(x)

> barplot(c(mean(x),mean(y)))

> t.test(x,y)

課題の記載項目:

授業名,課題番号(第一回課題),名前,学籍番号,メールアドレス,

summary(x)の実行結果,barplotで生成した画像、t検定の結果(種類、t値、p値)

ファイル形式:PDF

ファイル名, 件名:BDA-日付-学籍番号-名前

ex) BDA-20161007-1251079-hiroki_tanaka

提出先

[email protected] (締切10/14(金)の授業開始時まで) 48

課題

Page 49: 統計的仮説検定について - 奈良先端科学技術大学院大学(NAIST ... · 2016-10-07 · /49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST 統計的仮説検定について

/49 2016@Hiroki Tanaka, AHC-Lab, IS, NAIST

統計的仮説検定について

舟尾暢男. The R Tips データ解析環境 R の基本技・グラフィックス活用

集. 株式会社 オーム社, 2009.

http://cse.naro.affrc.go.jp/takezawa/r-tips/r2.html

山田剛史, 杉澤武俊, and 村井潤一郎. R によるやさしい統計学. 株式

会社 オーム社, 2008.

鷲尾泰俊. "実験の計画と解析." 岩波書店 (1988).

田中豊, and 脇本和昌. "多変量統計解析法." (1983).

49

参考資料