15
1 構造方程式モデリングの基礎 宇佐美慧 (心理学方法論I 2017/05/091 本講義の目的 限られた講義時間の中で,構造方程式モデリ ング(SEM)の仕組みを学び,SEMの概念的理 解を深めることが目標. 同時にSEMの限界点についても批判的に理解 することも目標. 2 内容 構造方程式モデリングとは 式の表現 平均・共分散構造の導出 モデルの評価 分析例とソフトウェア まとめ,注意点 3 構造方程式モデリング(Structural Equation Modeling; SEM, Jöreskog,1969,1970)とは(豊田,1998) 多変量解析と呼ばれる統計手法群の1つ. 柔軟なモデル表現力が最大の魅力.様々な統計 モデルが下位モデルとして存在する. 下位モデルとして, ・因子分析モデル・回帰(t検定・分散分析)モデル, パス解析(シンプレックスモデル,媒介モデルetc)潜在成長モデル, 多母集団モデルetc (後述します) SEMは様々なモデルを包含しており,一貫して同じ 枠組みで解析するための理論的枠組みを与える. 4 「構造方程式モデリング」は「平均構造分析」 と「共分散構造分析」の2つを包含する用語. 構造方程式モデリングは特定のモデルを指 す用語ではなく,「平均構造」および「共分散 構造」というもの(後述)を設定してモデルを 構築・推定・評価していく一連の方法論を指 す. 5 平均ベクトルと分散共分散行列 ID 変数1 変数2 変数3 変数P 1 x11 x12 x13 x1P 2 x21 x22 x23 x2P 3 x31 x32 x33 x3P 4 x41 x42 x43 x4P N xN1 xN2 xN3 xNP サイズN×P(N>P)の多変量データから,平均ベクトル P×1)と分散共分散行列S(P×P)が計算できる. x 6

本講義の目的 構造方程式モデリングの基礎 解を ... - …satoshiusami.com/SEM.pdf1 構造方程式モデリングの基礎 宇佐美慧 (心理学方法論I 2017/05/09)

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

1

構造方程式モデリングの基礎

宇佐美慧

(心理学方法論I  2017/05/09)

1

本講義の目的

• 限られた講義時間の中で,構造方程式モデリング(SEM)の仕組みを学び,SEMの概念的理解を深めることが目標.

• 同時にSEMの限界点についても批判的に理解することも目標.

2

内容

• 構造方程式モデリングとは

• 式の表現

• 平均・共分散構造の導出

• モデルの評価

• 分析例とソフトウェア

• まとめ,注意点

3

構造方程式モデリング(Structural Equation 

Modeling; SEM, Jöreskog,1969,1970)とは(豊田,1998)

• 多変量解析と呼ばれる統計手法群の1つ.

• 柔軟なモデル表現力が最大の魅力.様々な統計モデルが下位モデルとして存在する.

• 下位モデルとして,

・因子分析モデル・回帰(t検定・分散分析)モデル,パス解析(シンプレックスモデル,媒介モデルetc),潜在成長モデル, 多母集団モデルetc (後述します)

SEMは様々なモデルを包含しており,一貫して同じ枠組みで解析するための理論的枠組みを与える.4

• 「構造方程式モデリング」は「平均構造分析」と「共分散構造分析」の2つを包含する用語.

• 構造方程式モデリングは特定のモデルを指す用語ではなく,「平均構造」および「共分散構造」というもの(後述)を設定してモデルを構築・推定・評価していく一連の方法論を指す.

5

平均ベクトルと分散共分散行列

ID 変数1 変数2 変数3 … 変数P

1 x11 x12 x13 … x1P

2 x21 x22 x23 … x2P

3 x31 x32 x33 … x3P

4 x41 x42 x43 … x4P

… … … … … …

N xN1 xN2 xN3 … xNP

サイズN×P(N>P)の多変量データから,平均ベクトル(P×1)と分散共分散行列S(P×P)が計算できる.

x

6

2

ID 国語 数学 理科 社会 英語

1 48 65 55 80 67

2 36 67 76 50 84

3 51 45 56 32 64

4 48 82 67 56 50

5 56 34 53 67 56

6 43 67 34 76 51

x 62.00) 60.17, 56.83, 60.00, 47.00,( t

135.67 , 57.67- 93.83, 6.00,- 41.83,-

267.47 106.31,- 48.67, 2.17,

168.47 50.17, 24.83,-

251.33, 62.00,-

39.33,

S

7

対角要素が分散で非対角要素が共分散

• SEMでは,データの関係性を説明・表現・予測するためのモデルを分析者が自由に構成する.

• 「モデルを構成する」ことは,モデルで説明できる平均構造 と共分散構造 を考えるということ.

• SEMでは観測データの平均ベクトル ,分散共分散行列 をなるべく正確に表現(近似)できるようにモデル内の母数(パラメタ)を推定する.

• つまり となるように母数を推定する.そして,様々なモデルを比較しながら,最適なモデルを探索していく.

xS

Sx ,

8

構造方程式モデリングのイメージデータ

Sx ,

モデル1(飽和モデル)

モデル2(因子分析モデル)

モデル3(シンプレックスモデル)

ID 国語 数学 理科 社会 英語

1 48 65 55 80 67

2 36 67 76 50 84

3 51 45 56 32 64

4 48 82 67 56 50

5 56 34 53 67 56

6 43 67 34 76 51

11,

22 ,

33 ,

比較

比較

比較

どのモデル(1,2,3)が最適( )か?

9

Sx ,

下位モデルとパス図(飽和モデル)

• モデルをグラフィカルに表現した図をパス図と呼ぶ.• 四角(矩形)は観測変数を,そして変数の上の文字は左から順に平均,分散を,また双方向矢印は共分散を表す.

• このパス図で表現されるモデルを飽和モデルと言う.各変数はそれぞれ個別の平均・分散(・共分散)をもつという,(直観的には当然成立する)モデル.

• 広くは,この様にデータに完全に当てはまるモデルを指す. 10

下位モデルとパス図(独立モデル)

• 独立モデルとは,変数間の共分散(つまりは相関)が0である,という(現実的には強い)仮定を表現したモデル.

• 各変数は矢印で結ばれておらず,全く無関係(独立).

11

下位モデルとパス図(重回帰モデル)

• 従属変数(英語)の上の文字β0は回帰式の切片を,単方向矢印はパス係数(偏回帰係数)を表す.

• 他の変数からその値を説明される変数を内生変数といい,反対に独立変数としてのみの役割を持つ変数を外生変数という.(国語・数学・理科・社会は外生変数であり,英語は内生変数).

• 内生変数である英語には残差(平均0,残差分散σ^2)がつく.12

*共分散を表す記号は省略

3

下位モデルとパス図(単回帰モデル)

• 独立変数が1つの場合.

• 内生変数である英語には,残差(平均0,残差分散σ^2)がつく.

13

t検定=回帰分析!

• 「実験群」は0(=統制群),1(=実験群)をあらわすダミー(2値)変数.

• 切片であるβ0が統制群の平均を,回帰係数であるβ1が群間差を表す.したがって, β0 +β1 が実験群の平均を表す.σ^2は各群で共通の(群内)分散.

• (対応のない)t検定を行うことと,ダミー変数を使って回帰分析をしてβ1を調べることは同値.

ID 英語 実験群

1 67 0

2 84 0

3 64 0

4 50 1

5 56 1

6 51 1

14

• ここまで説明してきた下位モデルは(独立モデルを除いて),後述するモデルの適合度(あてはまり)は常に完全.例えば,重回帰モデルは常にあてはまるモデル.

• 構造方程式モデリングでは,一般に分析者の主体的な態度の下,(適合度が完全でない)様々なモデルをデータにあてはめ,適合度を比較しながらモデルを選択する(後述).

15

パス解析(シンプレックスモデル)

*母数を表す記号は省略

• 国語の出来・不出来が数学のそれを説明し,数学の出来・不出来が理科のそれを説明し…という(一般的に仮定の強い)モデル.

• 国語ができなければ,それ以降の科目はできない,という逐次的な影響を仮定.

• 各回帰式で,異なる切片や回帰係数,残差分散を仮定(科目間で予測力や残差の大きさは異なる). 16

パス解析(自己回帰モデル)

• 0歳時の国語{言語的知能}の出来・不出来が1歳時のそれを説明し, 1歳時の国語{言語的知能}の出来・不出来が2歳時のそれを説明し…というモデル.

• 自己回帰モデルという場合,一般に,各時点の回帰式で,同じ回帰係数,残差分散を仮定する.

• このモデルは,特に一次の自己回帰モデルという.

17

パス解析(自己回帰クロスラグモデル)

• 0歳時の国語と数学の出来・不出来が1歳時のそれらを説明し, 1歳時の国語と数学の出来・不出来が2歳時のそれらを説明し…というモデル.

• 一般に,各時点の回帰式で,同じ母数を仮定する.

• 数学ができるから国語ができるのか?それとも逆か?→因果関係に「接近した」検証.(たとえば,数学t→国語(t+1)のパス係数は,「時点tで同じ国語力を持つ子たちの中での数学力の違いが,時点t+1の国語力の個人差をどの程度説明するか」を意味する.) 18

4

パス解析(媒介モデル)

• 国語ができると英語ができる(直接効果)

• 英語の出来・不出来は,国語力から育まれる数学力の個人差によって(も)説明される(媒介・間接効果)

• このモデルは完全にあてはまる(後述).

19

パス解析(縦断的媒介モデル)

20宇佐美・荘島(2015), Preacher (2015).

探索的因子分析モデル(二因子)

• 国語,数学…英語の出来・不出来を2つの因子で説明する(二因子分析モデル・斜交解).

• 単方向矢印(パス係数)は因子負荷を,独自因子からの分散は独自分散を表す.因子の上の文字は因子平均・因子分散を表す(0,1にそれぞれ固定).

*解を一通りに定めるため,いずれかのパスを1に固定する.(因子の回転による識別性の問題) 21

確認的因子分析モデル(二因子)

• 国語,数学…英語の出来・不出来を2つの因子(文系能力・理系能力)で説明する(二因子分析モデル・斜交解).

• 研究仮説に応じて特定の複数の因子負荷を0に固定.

• 因子の回転の問題は生じない.22

因子分析モデル+パスモデル

• 因子分析モデルとパス(自己回帰)モデル.

• ある時点の因子得点(この場合,学力)が将来のそれをどの程度説明できるか?

23

潜在成長モデル

• 因子分析モデルを縦断データの分析に応用したモデル.

• 因子負荷を固定して変化のパタンを表現する代わりに,因子平均・分散を推定する.

• 変化の平均像と共に個人差の大きさを把握する. 24

5

多母集団(multigroup)モデル

(男子) (女子)

・集団別で母数(の一部)が異なることを仮定.

・男子と女子で回帰係数(β1,β2)が異なることを仮定.

・因子分析モデルでもパス解析にも応用可能.25

• 平均構造に着目しない(たとえば,因子分析では相関係数の情報を縮約した因子の抽出に興味があるため因子負荷を主に見る)場合は, となるように母数を推定する.

• 前述のように,このような場合は,とくに共分散構造分析(CSA)と呼ぶ.平均構造にも着目

する場合は,平均・共分散構造分析と呼ぶ.構造方程式モデリング(SEM)はこれらを包含する名称.

S

26

内容

• 構造方程式モデリングとは

• 式の表現

• 平均・共分散構造の導出

• モデルの評価

• 分析例とソフトウェア

• まとめ,注意点

27

構造方程式モデリングの表現(豊田,1998)

• f…潜在変数のベクトル,v…観測変数のベクトル

• Aa,Ad,Ab,Ac…パス係数の情報を含んだ行列.

• d,e…各式の残差変数のベクトル

*潜在変数fから観測変数vを表現するモデルは測定方程式と呼ぶ.それ以外を構造方程式と呼ぶ.

evAfAv

dvAfAf

cb

da

28これまでのモデルは,この2つの式で表現できる!

具体例 (重回帰分析)

• Ac部分のみ関わる(外生変数v1‐v4はそれぞれ異なる平均・分散・共分散を持つ).つまり、

54433221105 )(0

00

evvvvfv

dvff

44332211 ,,, vvvvvvvv 29

具体例 (探索的因子分析)

• Ab部分のみ関わる(外生変数である因子f1,f2については、 )

525215155

424214144

323213133

222212122

121211111

0

0

0

0

0

00

evfafav

evfafav

evfafav

evfafav

evfafav

dvff

2211 , ffff

30

6

具体例 (因子分析モデル+パスモデル)

• Aa,Ab部分のみ関わる(外生変数である因子f1については, )11 ff

5225125252

1221121212

5115115151

1111111111

1222

0

0

0

0

0

evfav

evfav

evfav

evfav

dvff

31

• このように,様々な種類の統計モデルの表現は,さきの一般的な構造方程式モデルの表現の特別な場合として位置付けることができる.

• 構造方程式モデリングにおいて,

を目指すための母数の推定を行うことで,どのような下位モデルにおいても同じ枠組みで推定が実行可能.

・推定法は最小二乗法・最尤法・ベイズ法と様々であるが, を目指す点では変わらない.→各モデルで はどのように表現されているのか?

Sx ,

Sx ,,

32

内容

• 構造方程式モデリングとは

• 式の表現

• 平均・共分散構造の導出

• モデルの評価

• 分析例とソフトウェア

• まとめ,注意点

33

平均・共分散構造

• モデルを構成するということは,暗に各変数についての平均・分散・共分散の値を母数の関数で表現していることを意味する.

• モデルで表現される平均ベクトルは平均構造

,分散・共分散行列は共分散構造 と呼ぶ.

34

例:飽和モデル

2545352515

4524342414

3534232313

2524232212

1514131221

54321

,,,,

,,,,

,,,,

,,,,

,,,,

),,,,(

35

例:単回帰モデル

11

21102

vv

evv

221

21

211

211

21

1101

,

,

),(

36

7

Why?

211

211

21111

2111

2110121

221

21

21

21

211211

21121102

211

110110

2110

21102

11

0

),cov(),cov(

),cov(

),cov(),cov(

0)(

),cov(2)()(

)()()(

)(

0

)()()(

)()(

)(

vv

evvv

evv

evvvv

vV

eveVvV

evVevVvV

vV

eEvEE

evEvE

vE

       

       

       

     

     

    

    

E(・)…期待値

V(・)…分散

cov(・)…共分散

*一般に定数a,変数xに対して,

E(ax)=aE(x)

V(ax)=a^2V(x)

cov(ax,by+cz)

=abcov(x,y)+accov(x,z)

37

例:確認的因子分析モデル

25

25212524152325222125211

12524124

2411241321241224111

523212413223

2323222123211

5222124122322222

222122211

12521141111232111222112

12

11

0504030201

,,,,

,,,,

,,,,

,,,,

,,,,

),,,,(

araaaaaaraa

raaaraaraaaa

aaraaaaaraa

aaraaaaaraa

raaaaraaraaa

bbbbb

38

Why?

411111411141

122211212211

212221

2111222111

22221111

22220211110121

22

22222

22222222222022

21

21111

21111111111011

022222022222022

011111011111011

),cov(),cov(

000),cov(

),cov(),cov(

),cov(),cov(

),cov(

),cov(),cov(

)()()()()(

)()()()()(

)()()()()(

)()()()()(

aaffaavv

raaffaa

eefae

efafafa

efaefa

efabefabvv

aeVfVaefaVefabVvV

aeVfVaefaVefabVvV

beEfaEbEefabEvE

beEfaEbEefabEvE

       

        

       

       

39

母数の推定データ

Sx ,

ID 国語 数学 理科 社会 英語

1 48 65 55 80 67

2 36 67 76 50 84

3 51 45 56 32 64

4 48 82 67 56 50

5 56 34 53 67 56

6 43 67 34 76 51

を目指して母数の推定を行う.

推定の詳細は,豊田(1992,1998),Bollen(1989),Lee(2007;ベイズ法の場合)など参照.

モデル

,

Sx ,

40

内容

• 構造方程式モデリングとは

• 式の表現

• 平均・共分散構造の導出

• モデルの評価

• 分析例とソフトウェア

• まとめ,注意点

41

データ

Sx ,

モデル1(飽和モデル)

モデル2(因子分析モデル)

モデル3(シンプレックスモデル)

ID 国語 数学 理科 社会 英語

1 48 65 55 80 67

2 36 67 76 50 84

3 51 45 56 32 64

4 48 82 67 56 50

5 56 34 53 67 56

6 43 67 34 76 51

11,

22 ,

33 ,

比較

比較

比較

どのモデル(1,2,3)が最適( )か?

42

Sx ,

8

尤度法

• データベクトルXが多変量正規分布に従うと考える.

μ…モデルで説明される平均ベクトル

Σ…モデルで説明される分散共分散行列

Xi…個人iのデータベクトル, exp()…指数関数

P…変数の数,N…サンプルサイズ

は逆行列,|・|は行列式(一般化分散)

N

ii

ti

P xxxf1

12/12/ )]()(5.0exp[||2),|( π

43

1

• を(対数をとって)式変形すると,以下の結果が得られる.

tr(・)はトレースと呼び,行列の対角成分の和を意味する記号.

fMLの最小化(先ほどの の式変形時に

‐1を掛けているため)を目指して( を目指して),母数の推定を行う.

PxxSStrf tML )()(||log)( 111

),|( xf

Sx ,

44

),|( xf

モデル評価( 適合度検定)2

MLfN )1(2

がモデルの自由度df=(P+P(P+1)/2)‐Kの 分布に従うことを利用.自由度は,データの積率(平均・分散・共分散)の数であるP+P(P+1)/2からモデル内の母数の数であるKを引いた数.

• 値はその値の小ささがモデルへの当てはまりの良さを意味する.

• 値が臨界値を超えて統計的に有意になった場合(帰無仮説が棄却された場合),「モデルはデータに当てはまっていない」と評価される(逆でないことに注意).

2

2

45

2

• 統計的検定の問題

適合度検定は検定に依拠した方法論のため,サンプルサイズNが大きくなると,データからわずかなズレがあっただけでモデルのあてはまりが悪いと判断されてしまう.

→実際の(Nがそれなりに大きい)調査では統計的に有意になりやすく,帰無仮説(データがモデルに当てはまっている)は棄却されやすくなるため,モデルの当てはまりの良さを絶対的に評価する方法としては不十分であると経験的に知られている.

46

2

適合度指標による方法(モデルの良さを絶対的に評価する)

• GFI(Goodness of fit index)

*ΣからSをどれだけ予測できているかを,行列の場合の決定係数(分散説明率)で表現したもの.

*trはトレースであり,行列の対角成分の和のこと.*0‐1の値をとり,大きい方がベター.*経験的に,0.9 または0.95以上をよしとする.*観測変数の多いモデルは値が低くなりやすい.*平均構造は考慮していない.

))((

)))(((1

21

21

Str

StrGFI

47

• RMR(root mean squared residual)*定義の一つ.

*SとΣの各要素の間の二乗距離の平均平方.

*値は小さいほうがよい.

*平均構造は考慮していない.

*モデルを複雑にすれば(母数を多くすれば)基本的にRMRは良い値になる.

• SRMR (Standardized RMR)…(共分散ではなく)相関を基準に.

P

i

i

jijijs

PPRMR

1 1

2)()1(

P

i

i

j ji

ijijr

PPSRMR

1 1

2)()1(

2

48

9

構造方程式モデリングにおけるモデルの自由度(df:degree of freedom)

• 積率(平均・分散・共分散)の総数‐母数の数

• が同程度であれば,母数の少ない(=自由度が大きい)モデルの方が望ましい.

49

2

• CFI (comparative fit index)

*設定モデルのデータへのあてはまりの良さの程度が,独立モデルから飽和モデルのそれらのあいだのどのあたりに位置するかをあらわす指標.飽和モデルではχ二乗値も自由度も0.

* CFIは0から1の値をとり,値が大きいほど優れていることを意味する.下添え字の「設定」・「独立」はそれぞれ設定したモデルと独立モデルに関する指標値を意味する.

*0より小さい時は0と,1より大きい時は1と定義する.

*経験的に,0.9 または0.95以上をよしとする.

))1((*1 22

2

MLfNdf

dfCFI

設定

独立独立

設定設定   

50

• RMSEA (root mean squared error of approximation)

• と自由度dfの差を非心度という.

• CFIとは違いサンプルサイズを考慮する.1自由度の1個人あたりの非心度の大きさを意味する.

*RMSEAは0から無限大の値をとり,0に近いほどモデ

ルが優れていることを意味する.RMSEAが負の場合

は0と定義する.RMSEA<.05が一つの目安.

)1(

2

Ndf

dfRMSEA

設定

設定設定

51

2

情報量規準による方法(モデルの良さを相対的に評価する)

• 情報量規準は,モデル選択の目的で広く利用されている方法情報量規準は,適合度指標のように,データへのあてはまり(      )とモデルの複雑さ(母数の数)を直接考慮する.有名なものの1つが赤池情報量規準(Akaike Information Criterion: AIC).

*AICは,その値が小さいモデルほど良いことを意味する.* 値が小さくなるようなあてはまりの良いモデルは,母数が

多い複雑なモデルである傾向にある.したがって, 値が小さい(あてはまりの良い)モデルであっても,母数の数が多い(自由度が小さい)複雑なモデルのAICは大きくなる.

*AICはデータへのあてはまり(χ2値)とモデルの複雑さ(母数の数)のバランスがよいときに値が最も小さくなる.

設定設定 dfAIC 22

52

2

22

• AIC以外によく利用される情報量規準として,

で定義されるベイジアン情報量規準(Bayesian Information Criterion: BIC)がある.

・ logは自然対数.BICは,サンプルサイズの大きさも考慮する指標.値が小さいほどモデルとして良いことを意味する.

• AICとBICは,モデルの良さについてそれぞれ異なった観点から提案されているため,これらをモデル選択のときに併用するのは一貫性がないという考えもある.しかし,「良い」モデルを選ぶという目的は共通していることから,実際はこれら2つの指標など併用しながらモデル選択がおこなわれることが多い.

• 一般に,BIC はAICよりも母数の数が少ないより単純なモデルを選択しやすい傾向にある.逆に,AIC はBICよりも母数の多い複雑なモデルを選択しやすい傾向にある.

設定設定 dfNBIC )log(2

53

モデル選択の研究は奥深い

• 情報量規準Vrieze, S.I. (2012). Model Selection and Psychological Theory: A Discussion of the Differences between the Akaike Information Criterion (AIC) and the Bayesian Information Criterion (BIC). Psychological Methods, 17, 228‐243.

• モデル選択指標Hu L. & Bentler P. (1998). Fit indices in covariance structure modelling: sensitivity to underparametrized model misspecification. Psychological Methods, 3, 424 – 453. 

Lance, C. E., Beck, S. S., Fan, Y., Carter, N. T. (2016). A Taxonomy of Path‐related Goodness‐of‐Fit Indices and Recommended Criterion Values. Psychological Methods, 21, 388‐404.

54

10

内容

• 構造方程式モデリングとは

• 式の表現

• 平均・共分散構造の導出

• モデルの評価

• 分析例とソフトウェア

• まとめ,注意点

55

分析例(国内・国外の研究)

1,宇佐美(2015)…縦断データ

2, Possel & Black (2014)のBeckの抑うつに関する認知モデルについての相関研究

3,Ryff & Keyes (1995)のwell‐beingの尺度構造研究

利用可能なソフトウェア:R(lavaan,OpenMx, semパッケージ),AMOS, Mplus, SASなど.

56

縦断データ

57

潜在成長モデル(線形的な変化を仮定)

58

潜在成長モデル(二次的な変化を仮定)

59

各スキルでのあてはまりの比較

• 線形的な変化を仮定したモデル

• 二次的な変化を仮定したモデル

60

11

分析例(国内・国外の研究)

1,宇佐美(2015)…縦断データ

2, Possel & Black (2014)のBeckの抑うつに関する認知モデルについての相関研究

3,Ryff & Keyes (1995)のwell‐beingの尺度構造研究

利用可能なソフトウェア:R(lavaan,OpenMx, semパッケージ),AMOS, Mplus, SASなど.

61 62

63

dysfunctional attitudes:非機能的態度

Cognitive errors:認知的エラー

Cognitive triads

Automatic thoughts:自動思考

Depressive symptom

(e.g., “People will probably think less of me if I make a mistake”)

(e.g., “There is nothing left in my life to look forward to.”)

(e.g., “You just finished spending three hours cleaning the basement. Your spouse however, doesn’t say anything about it. You think to yourself, ‘S/He must think I did a lousy job.’”)

“negative self-statements” (12 items), “well-being” (5 items), and “self-confidence”

64

65

・CFIの高さやそのほかの統計的整合性(相関や回帰係数が完全に0とは考えにくい?)を重視した選択か。

66直接効果のパスは省略しているか?詳しい議論は本文も参照のこと

12

• ・

67

“all possible”ではないのでは?詳しい議論は本文も参照のこと

分析例(国内・国外の研究)

1,宇佐美(2015)…縦断データ

2, Possel & Black (2014)のBeckの抑うつに関する認知モデルについての相関研究

3,Ryff & Keyes (1995)のwell‐beingの尺度構造研究

利用可能なソフトウェア:R(lavaan,OpenMx, semパッケージ),AMOS, Mplus, SASなど.

68

69 70

71

ソフトウェア(Rのlavaanパッケージ(Rosseel, 2012)を使用)

*例示のため,伊藤・宇佐美(2017,教育心理学研究)から一部のデータを利用。

学級風土質問紙(5件法)

A…学級活動への関与(7項目)(e.g.,行事へ一生懸命取り組む)

B…学級への満足感(5項目)(e.g.,クラスを心から楽しむ)

C…学級内の不和(6項目)(e.g.,クラスでもめ事が少ない)

E…生徒間の親しさ(6項目)(e.g.,友達同士,助け合う)

13

二次(高次)因子分析モデル#下準備(lavaanパッケージの読み込み)install.packages("lavaan") library("lavaan")#下準備(データの読み込み)DATA<‐read.csv("C:/Users/satoshi/Desktop/PUBLIC2/example.data.csv")#モデルの記述bifamodel<‐'fA=~A1+A2+A3+A4+A5+A6+A7fB=~B1+B3+B5+B6+B7fC =~C1+C2+C3+C4+C6+C7fE=~E2+E3+E5+E6+E7f=~fA+fB+fC+fE'#分析と出力fit <‐ cfa(bifamodel, data = DATA)summary(fit, fit.measures = TRUE) 

#私のPCの場合

=~はmanifested byの意味

前後に'  を忘れない。

出力

• lavaan (0.5‐16) converged normally after  34 iterations

• Number of observations                          8961

• Estimator                                         ML

• Minimum Function Test Statistic            10506.631

• Degrees of freedom                               226

• P‐value (Chi‐square)                           0.000

• Model test baseline model:

• Minimum Function Test Statistic           105729.828

• Degrees of freedom                               253

• P‐value                                        0.000

• User model versus baseline model:Comparative Fit Index (CFI)                    0.903Tucker‐Lewis Index (TLI)                       0.891

• Loglikelihood and Information Criteria:Loglikelihood user model (H0)             ‐268732.279Loglikelihood unrestricted model (H1)     ‐263478.964

• Number of free parameters                         50Akaike (AIC)                              537564.559Bayesian (BIC)                            537919.591Sample‐size adjusted Bayesian (BIC)       537760.699

• Root Mean Square Error of Approximation:RMSEA                                          0.07190 Percent Confidence Interval          0.070  0.072P‐value RMSEA <= 0.05                          0.000

• Standardized Root Mean Square Residual:SRMR                                           0.050

情報量規準

適合度指標

対数尤度

適合度指標

• Estimate  Std.err  Z‐value  P(>|z|)

• Latent variables:

• fA =~

• A1                1.000

• A2                0.899    0.018   51.175    0.000

• A3                1.131    0.018   61.350    0.000

• A4                1.204    0.019   62.916    0.000

• A5                1.315    0.019   69.687    0.000

• A6                1.255    0.019   67.619    0.000

• A7                1.058    0.017   62.571    0.000

*途中略*

fE =~

• E2                1.000

• E3                1.109    0.014   78.161    0.000

• E5                0.779    0.012   64.319    0.000

• E6                0.858    0.014   63.020    0.000

• E7                0.884    0.012   71.519    0.000

• f =~

• fA 1.000

• fB 1.505    0.026   58.972    0.000

• fC 1.028    0.024   43.688    0.000

• fE 1.486    0.025   58.706    0.000

Variances:A1                0.471    0.008A2                0.741    0.012A3                0.622    0.010A4                0.634    0.011A5                0.455    0.008A6                0.491    0.009A7                0.502    0.008B1                0.500    0.009B3                0.591    0.010B5                0.401    0.008B6                0.349    0.007B7                0.528    0.008C1                0.800    0.015C2                1.207    0.019C3                1.012    0.018C4                1.107    0.019C6                0.973    0.017C7                1.040    0.018E2                0.516    0.009E3                0.550    0.010E5                0.561    0.009E6                0.727    0.012E7                0.502    0.008fA 0.134    0.004fB 0.069    0.005fC 0.358    0.012fE 0.033    0.005f                 0.322    0.010

パスの推定値標準誤差検定統計量p値

分散成分推定値 参考:潜在成長モデル(線形)

参考:http://lavaan.ugent.be/tutorial/growth.html#下準備(lavaanパッケージの読み込み)

install.packages("lavaan") 

library("lavaan")

#データの読み込み

DATA<‐ read.csv("C:/Users/satoshi/Desktop/PUBLIC2/Transcend/研究/74,岩波本/iwanamimath/第7章データ東大附属2009‐2013.csv")

attach(DATA)

#モデルの記述・潜在成長モデル(線形) #” クォテーション(’) “に注意!

growthmodel<‐'fI=~1*sleeptime1+1*sleeptime2+1*sleeptime3+1*sleeptime4+1*sleeptime5+1*sleeptime6

fS=~0*sleeptime1+1*sleeptime2+2*sleeptime3+3*sleeptime4+4*sleeptime5+5*sleeptime6

'

#分析と出力

fit <‐ growth (growthmodel, DATA,missing = 'fiml' , fixed.x = FALSE)

summary(fit, standardized = T,rsq=T,fit.measures = TRUE) 

14

参考:潜在成長モデル(非線形)参考:http://lavaan.ugent.be/tutorial/growth.html

#データの読み込み

DATA <‐ read.csv("C:/Users/satoshi/Desktop/PUBLIC2/Transcend/研究/74,岩波本/iwanamimath/第7章データJAHEAD.csv") 

attach(DATA)

#モデルの記述

growthmodel<‐‘fI=~1*W60+1*W63+1*W66+1*W69+1*W72+1*W75+1*W78+1*W81+1*W84+1*W87+1*W90

fS=~0*W60+(1‐exp(‐para*1))*W63+(1‐exp(‐para*2))*W66+(1‐exp(‐para*3))*W69+(1‐exp(‐para*4))*W72+(1‐exp(‐para*5))*W75+(1‐exp(‐para*6))*W78+(1‐exp(‐para*7))*W81+(1‐exp(‐para*8))*W84+(1‐exp(‐para*9))*W87+(1‐exp(‐para*10))*W90

#分析と出力

fit <‐ growth (growthmodel, DATA,missing = 'fiml' , fixed.x = FALSE)

summary(fit, standardized = T,rsq=T,fit.measures = TRUE) 

内容

• 構造方程式モデリングとは

• 式の表現

• 平均・共分散構造の導出

• モデルの評価

• 分析例とソフトウェア

• まとめ,注意点

80

まとめ• 構造方程式モデリング(SEM)は,多変量解析のための統計

モデル群の総称であり,多くのモデルを包含する柔軟な表現力が魅力.

• 対応可能な分析手法や気軽に利用できるソフトウェアもだいぶ増えてきている.

• 一部実行に限界があるもの(ソフトによっては相性の悪いもの)

因子の回転(探索的因子分析モデル;単純構造を見出す)時系列解析(高次のものは非常に複雑になる)

項目反応モデルなど非線形モデル(ただし因子分析モデルの枠組みからは利用可能)

階層モデル・マルチレベルモデル(実行可能なソフトもあり)高次元データ

81

注意点:識別条件

モデル内の母数の解が一通りに定まらない状況.

Ex)積率の数(=n+n(n+1)/2)よりも母数の数が多い場合(平均構造を含めるとき).つまり自由度が負値の場合.

Ex)因子分析の実行時に,因子負荷and/or因子平均・因子分散を固定し忘れる(因子や誤差変数などは,必ずパス係数か因子平均/因子分散のどちらかを固定する必要がある).

・ソフトウェアでエラーが出た時は,この可能性も踏まえる.

82

注意点:同値モデル• 見掛け上異なるモデルであるが,同じあてはまり を示すモ

デル群.データからではどれが正しいか推測できないため,科学的知見や研究仮説に基づいた主体的な判断が必要.

• 変数間で逐次的に矢印が引かれているモデルでは,矢印の方向をすべて逆にすれば,そのモデルは同値モデル.また,飽和モデル同士も同値(たとえば下の3つのモデル).

83

2注意点:因果推論

• パス(単方向矢印)は因果効果を意味しているのではない!「影響している」・「規定している」・「引き起こしている」は強い主張.「(数値的に)予測・説明できる」・「(相関的に)関係している」程度としか言えない場合が実際は多い.

• 構造方程式モデリング(SEM)では,あくまでデータの平均・分散共分散を表現するモデルを構成してその当てはまりを調べるだけ.特に,一般に調査・観察データから因果関係を特定するのは非常に難しい.

←同値モデルの存在←実験的に独立変数を操作していない場合,第3の変数などの

影響.(自己回帰クロスラグ・媒介モデルなど特に注意)また、「適合度が高い」≠「モデルが正しいorモデルが有意義。」

• 論文では,構成したモデルの根拠を詳しく書くべきであり,また他の候補となるモデルとの比較も行うべき.モデル構成が先であり,データ収集が後という姿勢が重要. 84

15

SEMの現在

• 日本では,調査・観察研究にSEMが多用される傾向にある.

• モデル構成の理由が不明確な場合や,他のモデルとの比較が不十分である場合が多い.

• (SEM特有の問題ではないが)興味ある現象を説明する上でど

のような構成概念を導入する必要があるかはよく考えるべき(一見,新しい概念のように見えるだけの可能性も).

• SEMでは誤った解釈・拡大解釈も多く,そして仮説が成熟していない段階で,不必要に複雑なモデルを構成しがち.

←SEMに対して否定的な理論・応用研究者もいる.

85

• データ収集デザイン(例えば縦断デザインや共変数の収集)を再検討することが有効な場合も多い。

• SEMは方法論としての揺るぎない魅力がある反面,適切に使

いこなして現象を解釈できているケースはやや限られている.方法論ばかりが成熟して,分析者側の原理的な理解は不十分な場合も多い.←専門家とのコラボレーションも大事にすること.

86

参考資料

平均・共分散構造の計算など,基本から確認したい場合.

南風原朝和(2002). 心理統計学の基礎 有斐閣

SEMの教科書(日本語;難易度順;一部のみ)豊田秀樹・前田忠彦・柳井晴夫 (1992).原因を探る統計学-共分散

構造分析入門- 講談社ブルーバックス豊田秀樹編(1998). 共分散構造分析事例編 北大路書房豊田秀樹(1998). 共分散構造分析入門編 朝倉書店狩野 裕・三浦麻子(2002). AMOS, EQS, CALISによるグラフィカル多変

量解析(増補版) 現代数学社豊田秀樹(1992).SASによる共分散構造分析 東京大学出版会豊田秀樹編(2000). 共分散構造分析応用編 朝倉書店

87

SEMの教科書(英語)Bollen, K. A. (1989). Structural equations with latent variables. New York: 

Wiley.Hoyle, R. H. (Ed.). (2012). Handbook of structural equation modeling. New 

York: Guilford Press.Lee, S.Y. (2007). Structural Equation Modelling: A Bayesian Approach", Wiley

ソフトウェア(R)の基本操作について船尾暢男(2005). The R Tips -データ解析環境R の基本技・グラフィックス活

用集 九天社山田剛史・杉沢武俊・村井潤一郎(2008).Rによるやさしい統計学 オーム社

各種ソフトウェアによるSEMの実行(日本語)豊田秀樹編(2007).共分散構造分析AMOS編 東京図書豊田秀樹編(2014).共分散構造分析R編 東京図書小杉孝司・清水裕士(2014). MplusとRによる構造方程式モデリング入門 北

大路書房

88

Rosseel, Y (2012). lavaan: An R Package for Structural Equation Modeling. Journal of Statistical Software, 48(2), 1‐36. URL http://www.jstatsoft.org/v48/i02/.

各種ソフトウェアによるSEMの実行(英語;一部のみ)Byrne, B. M. (2010). Structural equation modeling with AMOS: Basic 

concepts, applications, and programming (2nd ed.). Mahwah, NJ: Erlbaum

Byrne, B. M. (2012). Structural equation modeling with Mplus: Basic concepts, applications, and programming. Mahwah, NJ: Erlbaum.

本講義資料Jöreskog , K. G. (1969). A general approach to confirmatory maximum 

likelihood factor analysis. Psychometrika, 34, 183‐202.Jöreskog, K. G. (1970). A general method for analysis 

of covariance structures. Biometrika, 57, 239–251.Preacher, K.J. (2015). Advances in mediation analysis: A survey and 

synthesis of new developments. Annual Review of Psychology, 66, 825‐852.

宇佐美慧(2015) 発達心理学のための統計誠信書房

89

Rosseel, Y (2012). lavaan: An R Package for Structural Equation Modeling. Journal of Statistical Software, 48(2), 1‐36. URL http://www.jstatsoft.org/v48/i02/.

*分析例の論文はスライドの記述を参照