60
1 もうすぐにも使える 統計ソフト Stat View の使い方 マニュアル 精神科 医官 小羽 俊士 目次 1. 実験デザインの基本的な考え方 2. StatView の基本的な使い方 3. t検定と分散分析(ANOVA4. ノンパラメトリック検定 5. 分割表分析 6. 生存分析 7. データの信頼性の検定 精神科看護研究に

もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

  • Upload
    ngobao

  • View
    223

  • Download
    3

Embed Size (px)

Citation preview

Page 1: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

1

もうすぐにも使える 統計ソフト Stat Viewの使い方

マニュアル

精神科 医官 小羽 俊士 目次

1. 実験デザインの基本的な考え方 2. StatViewの基本的な使い方 3. t検定と分散分析(ANOVA) 4. ノンパラメトリック検定 5. 分割表分析 6. 生存分析 7. データの信頼性の検定

精神科看護研究に

Page 2: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

2

第1章 実験デザインの基本的な考え方 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

らかの介入をすることが多いでしょう。この「介入」には、薬を与えること、病気につい

ての教育をすること、気持ちを落ち着かせてあげるような言葉かけをすること、何らかの

処置をしてあげること、などいろいろなものがあるでしょう。以下では、これら全てをひ

っくるめて「介入」という言葉で呼ぼうと思います。

おそらく、多くの場合、私たちはこの「介入」を患者のためにと思ってやっています。

しかしふと、「患者のためにと思ってやっている、このことは、本当に患者のためになる

のだろうか?」、「本当に良い方向への効果をもたらしているのだろうか?」という疑問

が生じます。あるいは「もしかしたら、このことのために、かえって患者に不利益を与え

ていないだろうか?」といったことさえ、あるかもしれません。この疑問に応えるために、

「研究」があるわけです。この私たちの側の不安を払拭し、患者により利益を与え、より

不利益を除くために、です。

さて、一般に物事には原因があって、結果があります。そこに「介入」がからむとき、

以下のような具合になっているでしょう:

例えば、躁状態の患者が、怒って怒鳴り散らしながら興奮していたとします。看護婦さ

んが行って、少しの間患者の話を聞いてあげる。そうしながら、患者の言い分の「もっと

も」な点には「その状況で、そう感じるのは、もっともだよね」と言ってあげる、などを

しているうちに落ち着いたとします。この看護婦さんによる「話を聴いてあげる」という

介入が、「前の状態」と「後の状態」の間にあるのです。人は、このようなときに、ここ

!"#$ %"#$

&'()

Page 3: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

3

に因果関係を考えたくなるものです。つまり、今回の例で言うと、この看護婦さんがこの

ような「介入」をしてあげたおかげで、患者の状態が落ち着くという効果が得られた、と

いうようにです。その体験から、この看護婦さんは「そうか、躁病の患者の興奮に対して

は、一方的に注意したり、患者の怒り狂う行動を問題視する前に、その背景にある気持ち

を聴きだし、患者のおかれた状況から考えて「もっともだ」という点は認めてあげること

が効果的だ」という持論を持つかもしれません。しかし、偶然かもしれないし、もう数人

の別の躁病患者に同じようなアプローチを実践してみようと思いました。その結果、どの

患者でも、このように接していると、次第に患者が落ち着いてくることが分かったのです。

ということは、「このような接し方によって、躁状態で興奮した患者を落ち着かせること

ができる」と結論できるでしょうか?この「介入」と「効果」の間に、因果関係を見るこ

とができるでしょうか?

もう1つ別な例をあげましょう。ある看護婦さんは、アルコール依存症の家族と関わっ

ているうちに、かなりの頻度で家庭内の問題があることに気づいてきました。家庭内での

問題は、夫がアルコール依存症の場合、夫の暴力行為などの問題行動だけでなく、妻も子

どもを虐待するなどの問題行動を起こしがちであることに気づいたのです。そこで、就学

前の小さな子どもを抱える母親にアンケート調査を行い、母親に(1)どの程度、現在の

夫婦関係に満足感を持っているか?という質問シート、(2)母親が子どもに虐待行為を

行ってしまったかどうかの質問、をとったところ、以下のような結果が出たとします:

対象者 夫婦関係の満足感(点) 子どもへの虐待行為(%)

夫がアルコール依存(+) 平均 43点 76%

夫がアルコール依存(- ) 平均 82点 11%

この結果から、どんなことが言えるでしょうか?この看護婦さんは、「夫がお酒ばかり

飲んだくれているせいで、夫婦の関係も悪化し、妻の心的なストレスが増えるために、子

どもへの虐待行為が引き起こされる」と考えました。しかし、この因果関係の推論は正し

いでしょうか?

答えは、両方とも、この情報だけでは因果関係があるとは言えません。躁病患者の興奮

Page 4: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

4

状態を扱った1つ目の例では、もし看護婦さんが行って話を聴いてあげなくても、同じ時

間だけ放っておけば、興奮がおさまったかもしれないからです(「正常範囲への回帰」を

参照)。2つ目の例では、もしかすると因果関係は逆であり、妻のもともとの性格が悪い

ため、夫婦関係が悪くなり夫が飲酒行動をするのかもしれません。また妻の性格が悪いた

めに、夫がどんな夫であろうと、妻は生活にストレスを感じ、それを適切に処理できずに、

子どもにあたってしまうのかもしれません(「別の原因による結果の並立」を参照)。つ

まり、2つ目の例では、「夫のアルコール依存」と「夫婦関係の悪さ」と「妻の子どもへ

の虐待行動」の間には相関性がある、ということは言えるのですが、そこに因果関係を言

うことはできないのです。

1. 正常範囲への回帰

人の状態には波があります。ですから、ある時点で「異常」というか、その人の普段の

状態でなかったときは、次の時点では「普段の状態」に下がっていることがあり得ます。

鼻づまりは、いつまでも続くことはありません。放っておけば通るようになるでしょう。

満腹感は、いつまでも続きません。放っておけばお腹が減ってくるでしょう。このため、

一般に、ある時点で「異常値」が出たケースは、その次に測定する時点では、例え何も「治

療的介入」を受けていなくても、「正常値」に戻っていることが多いのです。これを「正

常範囲への回帰 regression to the norm」と呼んでいます。下図を見てください:

このため、「前の状態」と「後の状態」の間で、何らかの介入を行ったために(原因)、

患者の「異常値」が「正常値」に戻った(結果)、とは言えなくなるのです。

ご存じのように、躁病患者は気分のムラがあることで有名ですから、ある時点で「異常

に」高ぶって怒った状態でいても、数分もすると、怒りもすぐにおさまり、上機嫌で落ち

着いた状態に戻ってしまっても不思議ではありません。ですから、この看護婦さんの持論

!"#

$%&'()*%+,-.

$%!/01)234,567

8%!/073+,-.96'3:;)*<

=6$('>=

Page 5: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

5

を証明するためには、「躁状態で興奮している患者に対しては、看護婦が積極的に関わっ

て、話を聴いてあげ、言い分の「もっとも」な点を理解してあげる、という介入を行った

方が、ただ放っておいた場合に比較して、ずっと落ち着くことが多い。」ということを示

さなくてはなりません。このために、「介入した群」と「介入しなかった群」とを比較す

る、「前向き群別比較 prospective controlled study」が必要になってくるのです。

2. 別の原因による結果の並立

因果関係の推論で、もう1つよくある間違いが、別の原因によって、ある結果(結果1)

と、もう1つの結果(結果2)が引き起こされているのに、結果1の方が、結果2よりも

早く起こってしまう場合、「結果1によって、結果2が引き起こされた」と考えてしまう

ことです。下図を見てください:

夫のアルコール依存症と、妻による子どもへの虐待行為の例では、夫によるアルコール

依存症の問題は、結婚後比較的すぐ起こっていることが多いのに対し、妻による子どもへ

の虐待行為はその数年後に起こっていることが多い、ということから、あの看護婦さんは、

ここに因果関係を考えたのです。しかし、前述したように、もしかしたら、「妻の性格が

悪いこと」という別の原因があって、これによって、「結果1」=夫のアルコール乱用と

いう不適応行動が起こされる、「結果2」=妻はストレスを上手く処理できず子どもにあ

たってしまう、という別々の結果が引き起こされた、と考えられなくもないのです。

では、あの看護婦さんの持論を証明するにはどうしたら良いでしょうか?答えは、あの

看護婦さんが行ったような、「後ろ向き調査 retrospective study」や「横断的研究」では、

ダメなのです。彼女の持論を証明するためには、「妻の性格傾向が同じで、夫のアルコー

ル依存症になりやすさも同じ人たちを集めて2群に分け、一方の群にはどうやってもお酒

の飲めない国に行ってもらい、もう片方の群には、同じような生活水準で、同じような文

化的背景がありながら、お酒を飲むことは自由な国に行ってもらう。そしてその家族の様

子を10年程度追跡調査し、夫婦関係の満足度や、妻による子どもへの虐待行為の頻度を

!"

#$% #$& #$' ()*

+#$%,-./012+#$&,3456789+#$%,-

:;2+#$&,3./45<=>:?-@A2BC?D

Page 6: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

6

比較する」という形の、「前向き群別比較 prospective controlled study」が必要なのです。

「前向き群別比較 prospective controlled study」というデザイン

私たちが見ていきたいのは、因果関係です。つまり「この介入が有効である」とか、「こ

の要因が悪影響を与えている(だから、この要因を改善すれば治療的な効果を得られるか

もしれない)」ということを言いたいのです。要するに「これが原因で、こうなった」と

言いたいのです。このため、原因であると思っている「これ」以外は、全ての点で同じ集

団を(1)「これ」が与えられる群、(2)「これ」が与えられない群、に分けて比較す

れば良いことになります。もしこの2つの群の間に違いがあれば、それは「これ」が与え

られたか、与えられなかったか、という違いのせいだ、と言えるからです。

躁病患者との良い関わり合い方、を考えていた、あの看護婦さんの場合、彼女の持論を

証明するためには、「よく話を聴いてあげる」という点以外は、全く同じ条件の患者をた

くさん集め、ランダムに2つの群に分けて、一方の患者群には、患者が怒って興奮したと

きには、ちゃんと看護婦さんが行って、話を聴いてあげるようにして、もう一方の患者群

には、患者が怒って興奮しても、ただ普通に見ているだけで同じ時間を過ごすようにしま

す。そして、その結果の違いを比較するわけです。つまり、この際の注意点は

1. 患者を2つの群に振り分けるのは、全くランダムにすること。

2. 介入を与えるか、与えないか、という違い以外は、条件を全く同じにする。つまり、

患者のもともとの疾患、重症度、性別、主治医の意向や治療方針、などは全く同じ

ようにそろえるようにする。

ということになります。

さて、このように対象をランダムに2群に分けてデータを取っていくわけですが、ここ

でまた問題が発生します。つまり、とろうとするデータは「妥当性」のあるものか?「信

頼性のあるものか?」という問題です。

データの「妥当性」と「信頼性」 躁状態の患者との関わり合いについて興味を持っている、さきほどの看護婦さんは、患

者を2群に分けて、「前向き群別比較」研究をすることにしました。そこで、患者がどの

Page 7: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

7

程度「興奮しているか」ということを、データとして、とらなくてはならなくなったので

すが、これはどうすれば良いでしょうか?

まず思いついたのは、患者さんの脈拍をとることでした。人は怒って興奮すると脈が速

くなりますから、脈拍数をデータとすれば良いんじゃないかと思ったのです。つまり、介

入をする前に、ちょっと脈を取り、介入をして、その後でまた脈を取り、どの程度下がっ

たかを見ることによって、どの程度興奮がおさまったかを評価しようとしました。しかし、

これはどうでしょうか?問題がありませんか?

ここで、「脈拍数」は確かに、患者の興奮の程度を評価する上で、間接的な材料にはな

るでしょう。しかし脈拍数は不安などの心理状態でも上がりますし、身体的な変化でも変

動します。脈拍数が「怒り」や「興奮」を適切に表しているとは、とても言えません。こ

れが「妥当性」という問題です。つまり、そのデータは、注目しようとしている現象を、

適切に表していると言えるのか?ということです。

その次に、患者の様子を看護婦が観察して記録すればいい、と思いました。そのために、

「躁状態の興奮スコア」という評価シートをつくり、簡単な項目をチェックすることで、

興奮の度合いが点数として出るようにしました。それぞれの、担当看護婦さんたちが、「表

情… (1)すごく険しい、 (2)やや険しい、 (3)普通」などの項目を幾つかチェ

ックするようにしたのです。この質問紙は、なかなか良い出来映えでした。さて、では早

速これを使って評価すれば良いでしょうか?

実は少し問題があります。この評価シートの質問は、かなり主観的でファジーなところ

が多いことに注意してください。つまり、同じ患者の、同じ状態を観察しても、ある看護

婦 A子さんは、「表情、すごく険しい」と判断したのに、別の看護婦 B子さんは「表情、

普通」と判断するかもしれません。こうした、評価する人によるばらつきの問題を「信頼

性」と呼んでいます。この評価シートの信頼性を評価するためには、何人かの看護婦さん

たちに、何人かの患者の状態を見てもらい、それぞれに点数をつけてもらい、どの程度一

致するかを見なくてはなりません。どうやって、どの程度一致しているかを判断するか、

という問題には、幾つかの手法がありますが、例えば、点数で出てくる場合には、2人の

評価者の相関係数をとっても良いでしょうし、「はい」「いいえ」というような2通りの

答えしか存在しないような質問の場合には、κ(カッパ)と呼ばれる指数を計算しても良

いでしょう。いずれにしろ、こうして評価シート自体の信頼性をちゃんと検討してからで

Page 8: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

8

ないと、実用的に使うことはできません。これらの計算も統計用ソフト Stat Viewを使え

ば、簡単に計算できます。StatViewを使った、より詳しい計算のしかたは、後でお話しし

ようと思います。

2群の違いをどのように比較検討するか?検定法のいろいろ さて、2つの群のデータが出そろいました。では、どうやって、この2群の間に差があ

るかどうかを検定すればいいのかを、ここで簡単に概観します。統計ソフト StatView を

使った、より詳しい、実際的なやり方は、後で説明します。

(1)群別の平均の違いを検定する(t検定、ANOVA)

実はt検定と ANOVAはほとんど同じものです。というか、群別比較を2群にだけ限っ

た場合の ANOVAがt検定になります。ともに、平均の違いを検定します。但し、ANOVA

あるいはt検定が使えるためには、(1)データがだいたい正規分布をしていること、

(2)各群の分散が大きくは違わないこと、が必要です。つまり、データが正規分布をし

ていない時は使えないですし、群別の分散に大きな違いがある時には(具体的には3倍以

上あるときは使うべきではないと言われています)使えません。

(2)ANOVA が使えない条件のときに、群別の平均を検定する(Mann-Whiteney の U test)

上記の条件に合わないため、ANOVA が使えない時や、データが間隔変数ではなく順位

変数である場合(「間隔変数」と「順位変数」の違いについては、後で説明します)、い

わゆる「ノンパラメトリック検定」と言われる検定を使います。2群を比較するものは、

この中でもMann-WhiteneyのU testと呼ばれる方法です。これは ANOVAのような使用

条件の厳しさがないぶんだけ、やや違いの検出力に劣ると言われています。

(3)分割表分析

結果が「はい」か「いいえ」に別れる場合、そのどちらに、どれだけのケースが該当す

るかを比較する方法です。

例えば、以下の表を見てください:

Page 9: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

9

介入の有無:「はい」 介入の有無:「いいえ」

症状の有無:「はい」 ( )人 ( )人

症状の有無:「いいえ」 ( )人 ( )人

こうした分布に偏りがあるかどうか、を検定するために、χ二乗分析や直接法分析など

があります。

(4)生存分析

ある期間、患者を追跡調査していく中で、「再発する人と、しない人」、「死亡する人

と、生存を続ける人」の発生する仕方の違いを検定する方法です。例えば、以下の図を見

てください:

上の群に比べて、下の群の方が「死亡例」がたくさん発生してしまっていることが分か

ります。この差が、果たして有意なものがどうかを検定するのが、生存分析です。「生存

分析」という名前があるのは、よく予後調査に使用されるからです。精神科では、治療か

らのドロップアウトや、服薬中断などの「打ち切り」の発生頻度を見るのに、よく使用さ

れます。

!"#$%&'(

)*+

,-./01234567898:8;0<

=>?@A9BCDEFG;3

!"#$%&'(

)*+

,-./01234567898:8;0<

=>?@A9BCDEFG;3

Page 10: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

10

第2章 StatViewの基本的な使い方 この章では、統計ソフト StatViewの基本的な使い方について、ご説明します。

1.ソフトを立ち上げる Windows の「スタート」ボタンから、「StatView」を選択し、立ち上げると、以下の

ような画面が出てきます:

「ファイル(F)」から新規データシートを選択するか、あるいは一番左のボタンをク

リックすることによって、新規データシートを立ち上げます。以下のような画面がデータ

シートです:

Page 11: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

11

統計ソフト StatView は、「データシート」と「ビューシート」という2つのウィンド

ウからできています。「データシート」に基本的なデータを入力し、それを解析すること

を「ビューシート」の方でするのです。

「データシート」には、すでに1列だけ「入力列」ができています。これをクリックし

て選択して、それぞれの列に、それぞれのデータを入力していきます。

「入力列」と書かれたセルをクリックして選択した状態を上図に示しています。この状態

で、各列の名前の入力や、データの属性設定ができます。まずは名前を入れてみます:

Page 12: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

12

一番上のセルに、それぞれ「Name ID」、「Group」、「Data」という名前を入れまし

た。その次に、「タイプ」の行にあるセルをクリックします。すると、「実数」、「整数」、

「カテゴリー」、「文字列」などの変数タイプが出てきますので、選択します。それぞれ

は、だいたい以下のような意味で使われます。

●文字列:患者名や ID 番号など、データを管理するためのもの。計算には使用されない

が、表を分かりやすくするために必要かもしれない。

●実数、整数:何かのテストのスコア、何かの注目している事象が起こった回数、などの

整数データや、身長、体重、測定値、などの実数データ。

●カテゴリー:性別(男・女)、群分け(介入する群、介入しない群)、などのように、

後の解析のときに比較するための属性

おそらく、あまりピンとこないでしょうが、これは3章以降で実際の計算をしていく中

で、お分かりになっていくと思います。

さて、データ列の名前と属性を決めたら、データを入力できます。これは直接セルをク

リックして、1つ1つ手入力していっても良いですし、Excel などの表計算ソフトに保存

Page 13: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

13

してあるデータを、カット&ペーストで張り付けることもできます。

データの入力作業が終わったら、解析をします。これは StatView では、驚くほど簡単

にできます。まず、「ファイル(F)」から新規ビューシートを選択するか、あるいは左

から2番目のボタンをクリックすることによって、「ビューシート」を開きます。

以下に「新規ビューシート」を開いた画面を示します。左側に「解析の実行」というボ

タンがあり、その下に、StatViewで扱える統計計算の一覧が出ています。データ列の一番

上に入力した変数名を選択して、どの統計計算を行うかを選択して、「解析の実行」ボタ

ンをクリックしたら、すぐに計算結果が表やグラフで表示されます。

さて、やはりちょっと理解しにくいと思います。しかし、実例にあたって使ってみると、

驚くほど簡単であることに気づくことと思います。3章以降で、実例を使いながら、

StatViewの使い方を見ていくことにします。

!!"#$%#&'()*+,-./0

Page 14: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

14

Page 15: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

15

第3章 t検定とANOVA t検定も ANOVAも各群の平均を比較し、その差が統計学的に有意なものであるかどう

かを検定するものです。一般に ANOVA は対象とする群が3群以上ある場合に用いられ、

t検定は2群だけの時に用いられます。しかし、t検定は、対象とする群が2群だけの時

の、ANOVAの特殊形だと考えた方が良く、実際、計算してみると同じ結果が出てきます。

ここでは、主として最もよく使う2群間の比較の仕方を見ていきます。

命題:アルコール依存症の患者は、その他の精神科患者に比べて、自己価値感が低いので

あろうか?

精神科病棟に勤務する看護婦・翔子27歳は、これまでの経験から、アルコール依存症

の患者は、患者の中でも特に自己価値感が低く、比較的頻繁に抑うつ状態になりやすい傾

向があることに気づいていました。自己価値感が低いから、そんな嫌な気分を紛らわすた

めに(非適応的な方法ですが)アルコールを飲むのか、あるいはアルコール問題でいろい

ろな問題行動を起こすために、周囲から嫌がられ、ネガティブ・フィードバックを受け続

けてきたために、自己価値感が低くなってしまうのかは、分かりませんでしたが。

彼女は、しかし、とりあえず、自分のこの直感を、まずは数字的に確認してみなくては、

その先が進まないと思いました。

そこで、アルコール依存症で入院してくる患者と、その他の理由で入院してくる患者に

対して、急性期の治療が終わった頃に、患者の自覚的な自己価値感を評価して、(1)ア

ルコール依存症患者群と、(2)別の精神科疾患患者群とで、比較してみることにしまし

た。患者の自己価値感の評価には PILスケールという自己記入式の質問紙を患者に書いて

もらうことにしました。

その結果、以下のようなデータが集まりました:

PILスコア

対照群 アルコール群

34 34

30 27

65 16

40 21

Page 16: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

16

38 33

25 35

39 33

46 19

56 41

58 19

36 25

46 27

36 33

48 26

47 30 一見して、アルコール患者群の方が、点数が低そうです。これを統計学的に検定してみ

ましょう。

間隔変数と順位変数

「テストの点数」というものは、一般に、間隔変数と見なすことができます。ここで、

間隔変数と、順位変数の違いをご説明します。簡単に言いますと、間隔変数は「数字の大

きさに比例的な意味がある」ことで、例えば、身長、体重、などがあります。体重 70kg

の人は、体重 35kg の人の2倍の体重があるわけです。ちょうど物差しで測れるように、

数字は等間隔で並んでおり、「4は2の2倍、18は3の6倍」と言えます。それに対し

て、順位変数は「数字の順番にだけ意味がある」ことであり、「2」は「1」よりも大き

く、「3」よりも小さいわけですが、かならずしも、そこに比例的な意味がなく、「2」

は「1」の2倍でなくてもよく、「3」は「1」の3倍でなくても良い場合です。例えば、

「患者の声の大きさ」を「1=小さすぎて聞き取れない、2=小さい、3=普通、4=大

きい、5=うるさすぎ」というように、表現することにしたとします。しかし、「2」は

「1」の2倍声が大きいかというと、そういう訳ではないのです。ただ、「1」と判断す

るよりは大きく、「3」と判断するよりは小さいのです。このように、数字の順番にだけ

意味がある変数を、順位変数と呼びます。

統計計算をするとき、いわゆる「パラメトリック・テスト」と呼ばれる、t検定や ANOVA

を用いることができるのは、変数が間隔変数の時だけです。変数が順位変数であるときに

は、「ノンパラメトリック・テスト」と呼ばれるMann-WhiteneyのU検定や、その他の

Page 17: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

17

方法を使って比較をしていかなければなりません。

さて、今回の問題である「テストの点数」は、一般に間隔変数とみなして統計処理をす

ることが多いようです。(厳密に言えば、例えば、「抑うつ尺度が20点の人は、10点

の人の2倍落ち込んでいる」とは言えないので、変な話ではあるのですが。ただ、どれだ

けのテスト項目に該当したか、という数を数えていると考えますので、「20点の人は、

10点の人の2倍テスト項目に該当事項があった」とは言えるのです。)

このため、もし(1)両方の群とも、まあだいたい正規分布をしており、(2)その分

散が大きく違わない(3倍以内)であれば、t検定や ANOVAの使用条件を満たすことに

なります。

では、さっそく StatViewを立ち上げて、検定を始めてみましょう。

1. StatViewの操作

まずは、「新規データシート」を開き、2章で見てきた要領で、データを入力します:

とりあえず、1列目を「アルコール患者群」、2列目をその他の疾患で入院した「対照

Page 18: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

18

群」としてみました。せっかく入力したデータが消えてしまうと、悲しくなりますから、

早めに「ファイル(F)」から「保存」を選んで保存するようにしましょう。

さて、次に、データの解析にはいます。その前に、「対象群」と「アルコール群」とい

う2つの群を、「群分け」という名義変数でくくり、その後の解析をしやすくします。「変

数一覧」から、この2つの変数を選択し「コンパクト」ボタンをクリックしてください。

上図のような、ボックスが開きますので、群分け変数の名前として「群分け」と入力し

ます。「コンパクト」ボタンをクリックすると、2つの変数が1組になり、以下のように

出てきます:

これで解析に入る準備ができました。StatViewでは、データの解析は「ビューシート」

Page 19: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

19

上で行うようになっていますので、「新規ビューシート」を立ち上げます。第2章で見て

きたように、「ファイル(F)」から「新規ビューシート」を選択するか、左から2番目

のボタンをクリックして、ビューシートを立ち上げた様子を下図に示します:

もし、上図のように、「変数一覧」ウィンドウが開いていなかったら、「表示」から「変

数一覧」にチェックマークを入れて、表示するようにします:

Page 20: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

20

さて、今からやることは、「アルコール患者群」と「対照群」という名前で入れられて

いるデータを、t検定を用いて比較することです。

まず、「変数一覧」から、「群分け」と「カテゴリー」を選択します。

Page 21: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

21

上図のように、「群分け」と「カテゴリー」とをクリックして、上にある「選択」ボタ

ンをクリックすると、選択状態(StatViewでは、「×」というマークがつきます)になり

ます。

次に、左側にある、各種統計計算リストから、「2群の比較(対応なし)」を、ダブル

クリックします。すると、以下のようなウィンドウが開きます:

「平均の差」の中で、「t検定」にチェックがついていること、信頼区間が 95%になっ

Page 22: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

22

ていること、検定が両側検定になっていることを、確認して「OK」ボタンをクリックしま

す。すると、ビューシートの方に以下のような結果が出てきます:

!"#$$$ %& '#'() #$$$!*+,-. /01 2, 3,

456789:;<:6

2=>?4@ABC8 D8 6EF6EFGHD8 IJKL<8 6EFMN*+,-.O8 $

!" '%#P)) !!&#'P" !$#&&Q %#&!!!" %(#P)) "$#%!$ (#$&Q !#&)$

1H *+, ER STU. STV.4569:;<:6

6WX8 D8 6EF6EFGHD8 IJKL<8 6EF

これによれば、p=0.001 であり、十分な統計学的有意差があることが示されました。

つまり、めでたく「両群間にはやっぱり、ちゃんとした違いがあると言えるのだ」となり、

彼女の直感は科学的に証明されたのです。

ちょっと待った!!

ちょっと待ってください。このt検定に入る前に、(1)両方の群ともに、正規分布を

していること、(2)その分散がだいたい同じであること、を確認していませんでした。

実は、本当は、t検定に入る前に、こうした基本的な点は調べておく必要があります。

再び「ビューシート」の画面に戻ります。「変数一覧」から、「カテゴリー」を選択し、

「分割」ボタンをクリックします。そして「群分け」を選択し「選択」ボタンをクリック

します。こうすることで、「カテゴリー」のなかにある群別に、つまり「対照群」か「ア

ルコール群」かで、別々に、ヒストグラムを作ってくれます。

Page 23: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

23

つぎに、左側にある統計計算リストから、「度数分布」の左側にある三角マークをクリ

ックします。すると、その下に、「度数分布表」、「ヒストグラム」などなど、たくさん

の項目が出てきます。今回は分布の形を見たいので、「ヒストグラム」を選択します。上

にある「解析の実行」ボタンをクリックすると、以下のような図が出てきます:

!

"

#

$

%

&

'

(

)

"! #! $! %! &! '! *!

+,-

./0123,45)6789:;< +,-+6=>+

!

"

#

$

%

&

'

(

)

"! #! $! %! &! '! *!

+,-

./0123,45)6789:;< +,-+6?@A;@+

まあ、だいたい正規分布のような分布をしていそうです。(では、あまり正規分布のよ

うな形ではない場合は、どうしたら良いのか?といわれそうですが、実はパラメトリック・

Page 24: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

24

テストの使用条件としての「分布の正規性」は、それほど気にすることはないといわれて

います。あまりに分布が「山形」ではないときには、ノンパラメトリック・テストにすれ

ばいいでしょう。)

次に、2つめの条件である「両方の群で分散がだいたい同じ」かどうかを、調べます。

続いて(つまり、「カテゴリー」で分割して、「群分け」を選択したまま)、統計計算リ

ストから「記述統計」を選択します。「解析の実行」ボタンをクリックすると、以下のよ

うな画面がでてきます:

ここで「全ての統計量」を選択して「OK」ボタンをクリックします。

!"#$!!%%#&%'(#%"'!)

%*#)))*"#)))

)%!+#*!!#!!!$+#)))%)*!#)))$%'%"#)))!!#"*!!%#'%'#*)!#)%$!$#)))%$#)))!!#)))!$#"&!'#)))

$(#+!!%)#&&*(#&%%%"

("#)))*"#)))

)%%&#$+"#("$

$)#)))*$$#)))(+!)&#)))$%#*"&$)#!+"#$)+,#$&%$)#)))%%#'")

-$(#*%"*#)))

('#+!!'#)&*%#&!)%"

%*#)))$%#)))

)")#(%)#("$("#)))$%+#)))%($)'#)))('#)$((*#%)&,#)*),#&*(('#)))%%#)))!!#)))('#&$**#)))

./01230143567897:9;<9=6>[email protected]./KH./LMNMOP9Q>RS=CD7T9%)UVKW./OPXY23

Z>[\VEF Z>[\VY]Z Z>[\V^_`a_Z

bcdF,ef@6>g@6hijklaV Z>[

すると、上図のような結果が表示されます。「分散」を見ると、「アルコール患者群」

では 50.210、「対照群」では 118.495です。なんと2倍くらい違いますが、一般に、分散

の違いが3倍以内であれば良いという話もあるので、これで良いとしましょう。(どうし

ても、気になれば、後述するノンパラメトリック・テストである Mann-Whitney の U テ

Page 25: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

25

ストを使えば良いことになります。)

分散分析(ANOVA)を使ってみる

全く同じことを、ANOVA を使ってやることもできます。データは全く同じですが、以

下のように表にしてあるとします:

ここで1列目は変数属性を「カテゴリー」にして、「アルコール」と「対象」を、群分

け変数として定義しました。さて、このデータシートを使って、計算をします。「ビュー

シート」を立ち上げましょう。

Page 26: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

26

「変数一覧」から「群別」と「PIL スコア」とを選択します。(これは、それぞれ群分

け変数、データに相当します。)そして、左にあるリストから「分散分析」の左にある三

角をクリックして、内容を出します。

Page 27: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

27

「分散分析表」と「基本統計量」を選択して「解析の実行」をクリックしますと、上図の

ような結果が得られます。p=0.001 であり、統計学的な有意差があることが示されまし

た。

おまけ:どれくらいのp値を「有意差あり」と考えるか? p値とは、つまり、全く両群に差がなかった場合に、「両群に差がある」と言ってし

まったことが間違いになる確率のことです。ですから、pは小さければ小さいほど良い

のですが、ふつうは、p<0.05あるいは、p<0.01を「有意差あり」と便宜上

していることが多いです。

Page 28: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

28

第4章 ノンパラメトリック検定 2つの群のデータを比較するには、多くの場合、パラメトリック・テストである「t検

定」や「分散分析 ANOVA」が使えますが、以下のような場合は、ノンパラメトリック・

テストを使わざるを得ません:

(1)データが数段階の順位変数からなっている場合

(2)データの分布が、あまりにも正規分布からかけ離れている場合

(3)分散の比が1:3以上ある場合

です。

この章では、こうした場合のノンパラメトリック・テストとして、2群を比較する

Mann-WhitneyのU検定と呼ばれるものを見ていきます。

命題:入院中に何回も服薬の指導をしてあげることによって、退院時に服薬に対する理解が良くなるであろうか?

精神科病棟に勤務する看護婦・みずほ29歳は、精神科の患者の場合、特に薬物療法に

対する理解をちゃんと持っていくことが重要だろうと考えました。そして、一連の体系的

な薬物療法の教育プログラムをつくり、患者が入院して、急性期の治療が終わった頃に、

教育をすることにしたのです。今回、この効果を調べるために、(1)服薬指導・教育を

行った患者群と、(2)行わない対照群とで、退院時に薬物について話し合いをした担当

看護婦が、患者の理解度を評価するという方法で調査を開始することにしました。具体的

には、退院時指導に当たった看護婦が、患者との話し合いの中で、患者の薬物治療の必要

性の理解度を、以下のように判定することにしたのです:

1:ほとんど理解していない

2:少しは理解している

3:ふつう程度の理解

4:かなりしっかり理解している。

Page 29: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

29

さて、その結果は以下の表のようになりました:

薬剤指導の効果

介入 理解度スコア 介入 理解度スコア

とくになし 1 指導あり 4

とくになし 2 指導あり 3

とくになし 1 指導あり 4

とくになし 1 指導あり 2

とくになし 2 指導あり 3

とくになし 1 指導あり 4

とくになし 2 指導あり 1

とくになし 2 指導あり 4

とくになし 1 指導あり 2

とくになし 3 指導あり 3 さて、この結果から、彼女のやっている「教育プログラム」は薬物療法の必要性の理解

度を高めるために有効であると言えるでしょうか?

今回のデータは、いわゆる「順位変数」です。つまり、理解度2は、理解度1よりは良

く、理解度3よりは悪いのですが、それ以上の意味はありません。別に理解度2の人は、

理解度1の人よりも2倍良く理解している、という意味ではないのです。こういった「順

位変数」を相手にする場合は、ノンパラメトリック・テストを使うべきです。

1. StatView で Mann-Whitney の U検定を行う

まずは、StatViewを立ち上げ、「新規データシート」を開きましょう。そして、下図の

ように、1列目に「群分け」、2列目に「スコア」を入力していくことにします。

1列目の群分けは、カテゴリー変数ですから、変数属性のところは「カテゴリー」を選

択します。すると、以下のようなボックスが現われます:

Page 30: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

30

カテゴリーの内容を定義しなくてはいけないので、「新規」ボタンをクリックします。

すると、以下のようなボックスが現われます:

カテゴリー名は、「カテゴリー 群分け」となっています。そして「群名」を入力する

ことを要求されていますから、「名称未設定群 1」という場所に、「指導あり」と「と

くになし」を入れます。そして「終了」ボタンをクリックして、もとの「データシート」

に戻ります。

次に、下のセルに次々にデータを入力して、以下のようなデータシートを完成させます:

Page 31: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

31

これで、「データシート」は完成です。早速、解析に移るために、「新規ビューシート」

を開きましょう。

検定に入る前に、ビジュアルにグラフを見てみたい気もします。ヒストグラムを作って

みましょう。「変数名一覧」から、「群分け」を選択し「分割」ボタンをクリックします。

そして「スコア」を選択し、「選択」ボタンをクリックします。こうすることで、群分け

で別々の群ごとに分割して、別々にグラフを作ってくれます。

「選択」ボタンをクリックすると、選択された変数には「×」マークが、「分割」ボタ

ンをクリックして、分割された変数には「S」マークがつきます。そして「ヒストグラム」

を「度数分布」の中から選択して、「解析の実行」をクリックします。すると、以下のよ

うなヒストグラムが得られます:

!

"#

$

$"#

%

%"#

&

&"#

'

'"#

(

)

"# $ $"# % %"# & &"# ' '"#*+,

-*./01234)56276589:;

!

$

%

&

'

#

<

(

)

"# $ $"# % %"# & &"# ' '"#*+,

-*./01234)562765=>?@A

Page 32: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

32

薬物療法の教育・指導を受けた患者は、そうでな対照群に比べて、スコアの良い人が多

そうではあります。これを、Mann-WhitneyのU検定を用いて検定します。

「ビューシート」を立ち上げたら、「変数一覧」から「スコア」も「群分け」も「選択」

します。

次に、左側にある統計計算のリストから、「ノンパラメトリック・テスト」を、クリッ

クして選択し、「解析の実行」をクリックします。

すると、上図のようなボックスが出てきますので、「2群の比較(対応なし)」から

「Mann-Whitneyの U検定」を選択し、「OK」をクリックします。すると、以下のよう

な結果が「ビューシート」に表示されるでしょう:

Page 33: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

33

!"#$$$%"#$$$&'#()(#$$%'&'#*)$#$$(!

)

+,+,-./,0,1,23456780,23456781,2349

:;<<&=>?@<AB8+CD- E- FGHIJKL9E- IJK

!$ !)$#$$$ !)#$$$!$ *$#$$$ *#$$$

M9 34NO PQ34RSTUVWXYZ

:;<<&=>?@<AB34[\- E- FGHIJKL9E- IJK

2つめの表を見ると、平均順位は「指導あり」=14.000、「とくになし」=7.000 とな

っています。つまり、「指導あり」の方が、高いスコアをあげていることが分かります。

1つめの表を見ると、「同順位補正後のp値」=0.0061となっており、十分な有意差が

あることが分かりました。つまり、服薬についての教育指導を行うことで、退院時の患者

の理解は良くなっていると、言えそうです。(だからといって、理解が良ければ服薬コン

プライアンスが良くなるとは言えないのですが・・・・。)

2. パラメトリック・テストかノンパラメトリック・テストか

一般に、ノンパラメトリック・テストは、パラメトリック・テストよりも使用条件に制

約がありませんが、その分だけ有意差の検出力が劣ると言われています。ですから、使用

条件が合う場合は、なるべくパラメトリック・テストを用いた方がいいでしょう。

繰り返しになりますが、ノンパラメトリック・テストを使わざるを得ない時というのは、

以下のような場合です:

(1)データが順位変数からなっている、あるいは

(2)データの分布が正規分布から、あまりにかけ離れている、あるいは

(3)分散の比が1:3以上開いている

Page 34: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

34

第5章 分割表分析 特に精神科の領域では、患者の状態を数値で表すよりも、単純に「白」か「黒」か、「あ

る」か「ない」かで表現することが多いです。例えば、以下のようにです:

●幻覚・妄想が:ある、ない

● 自傷行為を:した、しない

● 脱棟を:した、しない

● ある症状や行動が:ある、ない

といった具合です。このようなときに、ある条件の有無によって、ある症状や行動の有

無が影響されていれば、そこに何らかの関連性があると考えられます。ある条件の有無に

よって、ある症状や行動の有無が影響されなかった場合に期待される出現数と、実際に観

測された出現数を比較して、検討する方法がχ二乗検定や直接法などの「分割表分析」で

す。

この章では、この分割表分析のやり方について、見ていきます。

命題:入院患者で、病棟の入り口のドアを「ガチャガチャ」とやる人は、脱棟する危険性が高いと言えるだろうか?

精神科病棟での勤務が長い看護婦・今日子さん(30歳)は、これまでの経験から幾つ

かの「脱棟しやすい患者のサイン」というものに注目していました。その中でも、特に、

病棟の入り口のドアをガチャガチャと開けようとする行動は、その数日後に本当に脱棟し

てしまうことが多いように感じていました。今回、この経験的な印象を数字で示してみよ

うということになりました(というか、病棟で割り当てられた看護研究に出さなくてはい

けなくなったのでした)。そこで、過去数年間のカルテを引っかき回し、(1)任意に選

んだ3ヶ月以内に、患者が脱棟したかどうか、(2)そしてその間に、ドアノブをガチャ

ガチャする行動をしたかどうか、を調べてみました。結果を、いわゆる「分割表」にして

示すと、以下の表のようになりました:

Page 35: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

35

脱棟した 脱棟しなかった

ドアノブ(+) 12 8

ドアノブ(−) 4 39 この表を見ると、いかにも「ドアノブをガチャガチャやった」患者の方が、脱棟が多そ

うですが、それが本当に統計学的に有意なものであるかどうかを検定してみましょう。

これは、StatViewの「分割表分析」を用います。一般に、ケースの数が十分に多いとき

は「χ二乗検定」がそのまま使えますし、少ない場合(具体的には、計算される「期待値」

が5以下のセルが存在してしまう場合)は、何らかの補正を行うか、あるいは「直接法」

と呼ばれる検定方法にしなくてはなりません。が、StatViewでは、全て自動的にやってく

れるので、心配も、余計な労力も、かかりません。

では、実際に操作してみます。まずは、いつものように StatView を立ち上げて、「新

規データシート」を開きます。上の表をそのまま使おうと思いますので、1列目に脱棟し

た患者の数「escape(+)」という名前を付け、2列目に脱棟しなかった患者の数「escape(-)」

という名前を付けてみました。行の方は名前をつける場所がありませんが、上が「ドアノ

ブ(+)」、下が「ドアノブ(- )」と思ってください。変数の属性は、患者の数ですの

で、整数です。以下のようなデータシートが完成します:

Page 36: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

36

データを入力するセルに、それぞれの患者数を書き入れています。これで、もう、完成

です。あとは解析に移るために、「新規ビューシート」を開きます。

「ビューシート」を開いたら、「変数一覧」から「escape(+)」と「escape(-)」を選択し

ます。そして、左側にある計算リストから「分割表分析」と書かれている左にある三角を

クリックして、その下位にある全ての項目を選択します。以下の図のようになります:

次に、「解析の実行」ボタンをクリックしますと、以下のようなボックスが出てきます:

この表は、最初から「分割表」としてつくっていますから、「二元表」を選択し、さら

に、期待値数が少なすぎる場合のことも想定して、「Fisherの直接法」にもチェックをつ

けておきます。(どうせ、ほとんど手間はかからないのですから。)「OK」ボタンをクリ

ックすると、「ビューシート」に計算結果が表示されます:

Page 37: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

37

!"

"#$%"#&$!!!""'$#()&$!!!"$*''$%*+"%$,'#&$!!!"&$!!!"

-./01234567/456789/:67/:6789/;<=;>?0@A54567/BCDEFGHIJ456789/BCDEFGHJKLGMFNOPQR89/

;<=;>STU8 V8 WXY

"+ # +!* ), *)"( *' ()

Y" Y+ ZTW"W+ZT

[.308 V8 WXY

%$!', "*$,+" +!$!!!"!$,+" )+$!', *)$!!!"($!!! *'$!!! ()$!!!

Y" Y+ ZTW"W+ZT

\]/8 V8 WXY

たくさんの表が出てきますが、大事なのは上記のものです。まず、「期待値」の表を見

てみます。これはつまり、行と列の間に(「ドアノブ」の問題と、「脱棟」の問題に)、

何の関係もなかった場合に期待される分布を示しています。行1,列1のセルに「5.079」

という、かなり少ない期待値があることに注意してください。「期待値が5以下の時には、

通常のχ二乗検定ではなく Fisherの直接法を使う」と考えますと、ぎりぎりですが、χ二

乗検定を使っても良さそうです。

いずれにしろ、χ二乗検定の結果 p<0.0001 ですし、Fisher の直接法でも p<0.0001、

ですが。

こうして、看護婦・今日子さんの印象「ドアノブをガチャガチャやる人は、脱棟しやす

い傾向がある」という仮説はかなりの確率で支持されることになったのです。

Page 38: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

38

第6章 生存分析 一般に、治療は現在ある「悪い」状態を治すためだけではなく、今後「悪い」状態にな

らなくなるように、予防するためにも行われます。

例えば、高血圧・高脂血症の患者が将来脳梗塞や心筋梗塞を起こさないようにと、血圧

コントロールをしたり、食事療法をします。しかし、そのことによって、本当に将来脳梗

塞になったり、心筋梗塞になったりするリスクが下がっているのでしょうか?

あるいは、精神科では、再発予防のために、外来でも長いこと、多くは数年以上、一生

近く、薬を飲み続ける患者がいます。しかし、本当に薬を飲み続けることによって、再発

してしまうリスクは小さくできるのでしょうか?

こうした追跡調査のために、「生存分析」という方法があります。この章では、生存分

析の簡単なやり方について、見ていきたいと思います。

命題:アルコール依存症の患者にSSTを行うことは、再発予防のために有効であろうか? 精神科に勤めている、看護婦・千恵25歳は、最近 SSTを学んで、これが結構いろいろ

な精神疾患をもつ患者に対して、有効そうである印象を持つようになっていました。彼女

の勤務する精神科では、非常にアルコール依存症で入院してくる患者が多く、そのうえ、

かなりの率で再発・再入院してくることも経験していました。そこで、彼女は考えました。

もしかすると、SSTはこうした患者にも有効かもしれない。SSTを行うことによって、コ

ミュニケーション技能が改善し、周囲からの「social support」が増える分だけ、あるいは

周囲からのネガティブ・フィードバックが減り、ポジティブ・フィードバックが増える分

だけ、飲酒に耽ることが少なくなり、再入院のリスクを下げることができるかもしれない、

と。そこで、彼女は入院患者を2群に分け、(1)体系的に SSTを行う群(group1)と、

(2)SST を行わず、通常の教育入院だけで終わらせる群(group2)、とをできるだけ追跡

調査し、予後を比較することにしました。退院日から週単位で患者を追跡調査し、再入院

してしまったところで「打ち切り」とし、再入院しないかぎり「治療が生き続けている」

と考え追跡調査を続けることにしたのです。その結果は、以下の表のようになりました:

Page 39: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

39

観察週数 群分け 再発(打ち切り)

48 group1 非打ち切り

34 group1 非打ち切り

31 group1 非打ち切り

18 group1 非打ち切り

5 group2 非打ち切り

45 group1 打ち切り

45 group2 非打ち切り

43 group2 非打ち切り

28 group1 打ち切り

8 group2 非打ち切り

30 group2 非打ち切り

13 group1 非打ち切り

161 group1 打ち切り

23 group1 非打ち切り

33 group2 非打ち切り

23 group2 非打ち切り

13 group1 打ち切り

8 group2 非打ち切り

12 group2 非打ち切り

5 group2 非打ち切り

27 group2 非打ち切り

16 group2 打ち切り

9 group1 非打ち切り 要するに、この表で、「非打ち切り」とされているのが、まだ再発・再入院をすること

なく、「ちゃんとやれている」患者さんのことです。ざっと見ると、group1、つまり、「SST

を行った群」の方が「非打ち切り」が多い、つまり再発・再入院しないで済んでいる人が

多そうではあります。では、このことを生存分析を使って、統計学的に検定してみましょ

う。

いつものように、StatViewを立ち上げたら、「新規データシート」を開きます。

Page 40: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

40

上図のように、まずは変数属性の定義から入力していきます。「群分け」の属性は「カ

テゴリー」であり、そのうちわけは「group1」と「group2」です。「観察週数」は、外来

で何週間患者をフォローしたかという整数ですから「整数」とします。「打ち切り?」は、

観察を打ち切ったかどうか?つまり再発・再入院したかどうか?ですから、変数属性は「カ

テゴリー」であり、そのうちわけは「打ち切り」と「非打ち切り」です。(StatView の

Windows版では、この生存分析を行う場合の「打ち切り変数」は、「打ち切り」か「非打

ち切り」という名前でないと受け付けないようです。ですから、本来であれば「再発」と

「非再発」とか、「死亡」と「存命中」とか、そういう書き方をしたいところですが、ぐ

っとこらえて我慢してください。)

次に、さきほどの表のデータを、次々に入力していきます。(もちろん、Exelなどに記

録してある場合には、そこからカット&ペーストが可能です。)完成したデータシートは

以下のようになるでしょう:

Page 41: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

41

これでもう、データは完成しましたから、あとは解析に移るだけです。いつものように、

「新規ビューシート」を開きます。そして今回はメニューバーの「解析(A)」から「生

存分析」、そこから「Kaplan-Mayer 法」を選択しますと、以下のようなボックスが出て

きます:

Page 42: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

42

このボックスで、右側に変数一覧が表示されますので、これを左側にある適当な場所に

ドラッグ&ドロップで入れていけば良いのです。「時間変数」に「観察週数」を、「打ち

切り変数」に「打ち切り?」を、「群分け変数」に「群分け」を、それぞれ入れます。そ

して「OK」ボタンをクリックすると、計算結果がビューシートに表示されます。

たくさんの結果が表示されますが、大事なのは以下のものです:

!

"#

"$

"%

"&

'

()*+,

! #! $! %! &! '!! '#! '$! '%! '&!-.

/*0123456#7

()*+,123456#7/*0123456'7

()*+,123456'7

896:9;<=>?>3@()*+,ABCDEFGHIJKLGCHIJKMNOPLGCNOP

まず上図が「生存曲線」と呼ばれるものです。「group2」に比べて「group1」の方が累

積生存率が良いこと、つまり「再発・再入院」によって、観察が打ち切りになることが少

ないことが、示されています。次にハザード曲線を見てみます:

!

"#

$

$"#

%

%"#

&'()*+

! %! ,! -! .! $!! $%! $,! $-! $.!/0

&'()*+123456%7&'()*+123456$7

896:9;<=>?>3@&'()*+ABCDEFGHIJKLGCHIJKMNOPLGCNOP

このグラフから、「group2」の方が「group1」に比べ、どの時点でも、常に、累積ハザ

ードが高いことが分かります。どの時点でも、常に、group2の方が上にあることから(つ

Page 43: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

43

まり、グラフ上2曲線が交差することがないことから)、安心して両群の順位比較をする

ことができる、と言えます。そこで、次の表を見てみます:

!"!#$ % "&$'!(")(! % "&#*#("#*( % "&*+((")&* % "&##*!"&%# % "&*(!

,-(. /01 23456789:;<89=>?@A5BCD7>E?5F@G>H89@IJ?K5B59L8759>@I87>M>=5@M>=5@IJ?K5B59N877J96=59@O?>PJ96;7 Q

RSTUVWXYZ[\]^_ZV[\]^`abc_ZVabc

StatViewのWindows版では、放っておいてもこれだけの統計検定を勝手にしてくれま

す。どの検定の結果を採用しても良いようなものですが、例えば Log rank testを採用す

ることにして、すると p=0.0653となっています。

「p<0.05を統計学的な有意差と考える」と思っている方は、この結果を見て「惜しいの

に!!」と地団駄を踏んで悔しがるかもしれません。でもまあ、こんなときは「p<0.1 以

下を有意差と考える」ことにしても、そんなに悪くないでしょうし、あるいは発表すると

きは p=0.065とそのまま記載してしまっても良いでしょう。

あるいは、もっと症例数を集めれば、有意差に至れる可能性はあります。こうして、

「p<0.05を統計学的な有意差あり」と考えると、看護婦・千恵さんの長い間の努力は悔し

涙に終わることになるのかもしれませんが、しかし「生存曲線」を見れば、group1:SST

を行った群、の優位性は、彼女の仕事に希望を与えてくれるでしょう。

Page 44: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

44

第7章 データの信頼性の検定 精神科では特に、観察する人の主観に頼らなくてはいけないような、ファジーなデータ

がたくさんあります。例えば、ある患者を観察して、「興奮している、していない」、「表

情険しい、険しくない」、「病気に対する理解がある、ない」などなどです。

これらを観察する項目とする場合、注意しなくてはならないのは、本当にそれを観察し

評価した人(以下「評価者」と呼びます)の判断は、信頼できるものなのか?という問題

です。まあ、たいていは、それなりに訓練されたプロが判断するのですから、そうでたら

めな評価はしないはずですが、データの信頼性を云々するときには、それを数字によって、

示さなくてはなりません。これには、いくつか方法がありますが、通常、同じ患者の状態

を2名の評価者が、お互いに相談しないで、独立して評価し、その評価の一致する度合い

を指数にして表現します。この章では、この具体的なやり方について、見ていきます。

●データが2値(「はい」「いいえ」の2通りの回答しかない)の場合の検定

第5章で出てきた、看護婦の今日子さんは、実は脱棟のサインの候補として、患者が執

拗に外出や退院希望を訴えてくる、というものにも気づいていました。ですから、彼女は

これもデータとしてとろうと思ったのですが、ここで問題がありました。「ドアをガチャ

ガチャさせる」というのは、誰が見ても、その通りでしょうから、見る人によって判断が

一致しないということは、まずなさそうです。ところが、「執拗な外出・退院要求」につ

いては、どうでしょう?患者が外出・退院要求を訴えてきたとき、ある看護婦さんにとっ

ては「執拗に訴えているなあ!」と考える場合でも、別の看護婦さんだったら「でも、そ

れほど執拗というほどではないな」と判断が違ってしまうこともあるかもしれないと思っ

たのです。そこで、念のため、2人の看護婦さんに協力してもらい、20人の患者の同じ

カルテを見てもらい、そこに記載されている患者の行動を「執拗な外出・退院要求」と見

なすかどうかを、「見なす場合=+」、「見なさない場合=- 」という記号で判定しても

らいました。その結果は、以下の表のようになりました:

患者ID 評価者1 評価者2

01 + +

02 + +

03 + -

Page 45: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

45

04 - -

05 - -

06 + +

07 - -

08 - -

09 - +

10 + +

11 + +

12 + +

13 - -

14 + +

15 - -

16 + -

17 + +

18 + +

19 - -

20 - - これを見ると、一方の評価者が「+」と判断した場合は、もう片方も「+」としており、

一方が「- 」としているときは、もう片方も「- 」としていることが多いことが分かりま

す。では、どの程度一致しているか?ということを数字で示すにはどうしたら良いでしょ

うか?

よく使われるのは、一致率%を使う方法です。しかし、この方法には問題があります。

例えば、「+」に対して「- 」の頻度が著しく低いときは、その場合にほとんど評価者の

間で判断が一致していなくても、一致率%は高く出てしまいます。つまり、単純に一致す

る率を%で記載しても、あまり意味がないのです。

そこで、一般にはκ(カッパ)と呼ばれる指標を使うことが推奨されています。これは

以下のように計算していきます。

まずは、評価者1、評価者2、それぞれの判断を行、列にして、2×2分割表をつくり

ます。すると、その結果は以下のようになります。(これは、より簡単には、StatViewの

データシートに、第1列に評価者1の判定、第2列に評価者2の判定を、それぞれカテゴ

リー・データとして入力し、これを「観測データ」として分割表分析を行えば、そのまま

Page 46: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

46

結果が表として出てきます。もちろん、たいした手間ではないので、手作業で分割表をつ

くっても良いのですが。)

次に、第5章で分割表分析をしたのと同じ方法で、この分割表をそのまま StatView の

セルに入力し、分割表分析の結果を得ます。すると、その結果は以下のようになります:

これをもとに、カッパを計算しますが、まずは、そのために以下の2つを計算します:

PO=(観測値での一致数の合計)/(全合計数)

PC=(期待値での一致数の合計)/(全合計数)

そしてカッパは、以下のような計算式になります:

Kappa=(PO-PC)/(1-PC) 上記のデータを使って計算すると、以下のようになります:

! " ##

# $ !

#% #% "%

& ' ()

&

'

()

*+,-./.01234.0125

!

"

#$%##

$!!"&

""$!"'

$!!!#

$(&(

$&!)

&$*&+

$!!&!

$!!((

,-./

012

3456.

345678.

956.

95678.

:;<:=>/

?@4

3456.ABCDEFGHI

345678.ABCDEFGHI

JKFLEMNOPQ78.

:;<:=RST7U7VWXYZ7VWX5

# * ""

" % #

"! "! *!

[ \ ]S

[

\

]S

^-2/7U7VWXYZ7VWX5

($(!! ($(!! ""$!!!

)$(!! )$(!! #$!!!

"!$!!! "!$!!! *!$!!!

[ \ ]S

_

_

_

`a.7U7VWXYZ7VWX5

Page 47: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

47

つまり、評価者1と評価者2の一致を示すカッパは 0.70と比較的良好な一致を示すこと

が分かりました。(だいたい 0.7 から 0.8 くらいあれば、かなり良い一致ということが言

えるようです。)

● データが順位変数の場合の一致度の評価

では、データが数段階からなる「順位変数」の場合は、どうでしょうか?特に、精神科

では、患者の状態の評価のために、こうした数段階の順位変数をとることは、多いはずで

す。例えば、以下のようなものがあるでしょう:

看護婦・千恵は、SSTの効果の評価のために、以下のような、患者の会話の質を評価する

チェック項目をつくりました。

!

"

#$%##

$!!"&

""$!"'

$!!!#

$(&(

$&!)

&$*&+

$!!&!

$!!((

,-./

012

3456.

345678.

956.

95678.

:;<:=>/

?@4

3456.ABCDEFGHI

345678.ABCDEFGHI

JKFLEMNOPQ78.

:;<:=RST7U7VWXYZ7VWX5

# * ""

" % #

"! "! *!

[ \ ]S

[

\

]S

^-2/7U7VWXYZ7VWX5

($(!! ($(!! ""$!!!

)$(!! )$(!! #$!!!

"!$!!! "!$!!! *!$!!!

[ \ ]S

_

_

_

`a.7U7VWXYZ7VWX5

bcdA^-.efghijkN]SIlAm]SI

77dn#[%ol*!

77d!$%(

bpdA`a.efgqrjkN]SIlAm]SI

77dn($(!![)$(!!ol*!$!!

77d!$(!

sC88Cdnbc\bpoln"\bpo

77dn!$%(\!$(!oln"\!$(!o

77d!$&

Page 48: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

48

会話のスタイル (1)他人と、社会的に適切で上手な会話ができる(話題の選択、視線の良い合わせ

方、他人の話の聴き方、自分の話の仕方、口調、等)。

(2)他人との会話はほぼ良好ではあるが、会話の話題の選択や自分の話の仕方などは、時に不適切。視線や相手との距離のとりかた、声の調子や口調などはいくらか改善が必要である。指摘されれば直せる。

(3)約数分間は相手とそれなりに会話をすることができる。が、しばしば会話の内容、話の仕方、などが不適切であり、指摘されても改善が乏しい。

(4)ごく短時間(1分以内)くらいしか会話を持つことが困難。会話は妄想的な内容や脈絡がなかったりまとまりが悪いために、相手は話についていくのに困難を感じる。

つまり、これは4段階からなる、順位変数です。(1)番よりも(2)番、(2)番よ

りも(3)番の方が、会話技能に問題がありますが、だからといって、(2)番の患者は

(1)番の患者よりも2倍問題があるのではありません。

さて、このくらい、詳しく判断・評価基準が書かれていれば、評価者によって、評価が

ばらつくことは、あまりないように思いますが、それも一応調べてみなくてはならないで

しょう。この場合も、通常2名の独立した評価者が、同じ患者の、同じ状態を見て、別々

に判断・評価をした結果を、照らし合わせて、どの程度一致するかを見ることが多いです。

そして、その際の一致度の指標としては、(1)スピアマンの順位相関をとる、(2)ICC

(Intra Class Correlate)をとる、という方法が、通常使われることが多いです。以下では、

より適切と思われる、ICCの取り方について、見ていきます。

看護婦・千恵さんは、上記の評価スケールの信頼性を確認するために、2名の看護婦さ

んに協力してもらい、20名の患者さんの同じ状態を観察して、どのような採点をするか

を書いてもらいました。その結果を以下の表に示します。

患者ID 評価者1 評価者2

01 4 4

02 1 1

03 2 3

04 1 1

05 4 4

06 4 3

07 1 1

08 2 2

09 3 2

10 3 3

Page 49: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

49

11 4 4

12 1 1

13 1 1

14 4 4

15 2 2

まあまあ、一致している傾向にありそうです。では、この ICCを求めて行きます。まずは、いつものように StatView を立ち上げて、新規データシートを開きます。そして、1列目に「評価者1」によるスコアを、2列目に「評価者2」によるスコアを記入していき

ます。以下のようなデータシートができあがります:

さて、次に解析に入りますが、これには、「反復測定の分散分析 repeated measure ANOVA」によって計算された幾つかの数値を使いますので、ビューシートを使って、これらを計算していきます。 その前に、ANOVA を使うために、「評価者1」、「評価者2」というのを、「評価者

別」という変数にまとめ上げることが必要です。(一般に、ANOVA とは、縦系列の分散と、横系列の分散を比較する計算をしますので、横系列、つまり、「評価者の違い」とい

うものも、「変数」として扱わなくてはならないからです。)このため、「変数一覧」か

ら、「評価者1」と「評価者2」を選択し、「コンパクト」ボタンをクリックします。す

ると、「コンパクト」化するための変数名を聞いてきますので、「評価者別」とでもして

おきます。すると、以下のように変数がまとめ上げられます:

Page 50: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

50

評価者別のスコアが「連続変数 C」になり、評価者別のカテゴリーが「名義変数 N」となっているのが、表示されています。これで ANOVAを行う準備が整いましたので、「新規ビューシート」を開いて ANOVAを開始します。

上図のように、、まず「変数一覧」から「評価者別」と、「カテゴリー 評価者」とを

選択して、「選択」ボタンをクリックします。つぎに、左側にある計算リストから、「分

散分析」の下位項目である「分散分析表」と「基本統計量」を選択し、「解析の実行」ボ

タンをクリックします。すると、以下のようなボックスが開きます:

Page 51: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

51

ここで、今回は repeated measure ANOVAをするのでしたから、「反復測定」にチェックを入れて、「OK」ボタンをクリックします。結果は以下のように出てくるでしょう:

さて、以下の要領で ICCを計算していきます。

まず以下の数値を計算します: MSB=「対象」の「平方平均」=3.133 MSW=(「カテゴリー評価別」の「平方和」+「カテゴリ評価別」*「対象」の「平方和」)/(「カテゴリー評価別」の「自由度」+「カテゴリ評価別*「対象」の「自由度」)

= ( 0.33 + 1.467 ) / (1 + 14 ) = 0.1198 つぎに、ICCはこの2つの数値を使って、以下のように求めます:

!" "#$%&' #$!##

! $(## $(## $#!% $)%!&

!" !$"&' $!()

*+, -./ -0-. 12 32

45

6789:;<=>?

6789:;<=>?;@;45

ABCDEF2;G;HIJK;$L&%M;NIJK;$L#%

OPOQR;K;<=>?

!) S$"&' !$#(S $##&

!) S$"(( !$S"S $#S!

TU -02 VWXY VWZY

<=>[

<=>\

]^_`a;K;<=>?

bcK;6789:;<=>?

Page 52: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

52

ICC=(MSB-MSW) / (MSB+MSW) =(3.133-0.1198) / (3.133+0.1198) =0.93

となります。 ● スピアマンの順位相関を使うやり方 何だか、ものすごく面倒くさかったことと思います。では、同じデータを使って、スピ

アマンの順位相関を求めたらどうなるでしょうか?また新しく StatView のデータシートを開いて、先ほどと同じデータを入力してみます:

つぎに、解析に入りますが、今回は「新規ビューシート」を開いたら、メニューバーの

「解析」から「ノンパラメトリック検定」、さらにそこから「Spearmannの順位相関」を選択します。すると以下のようなボックスが出てきます:

※しかし「相関係数」は評価者1と評価者2との評価の方向性が同じであることを意味するだけであり、絶

対的点数の「一致」を意味するのではないことに注意が必要です。例えば辛口評価の評価者1はケース1,

2,3に対してそれぞれ 5 点、1 点、3 点という評価をしたとします。甘口評価の評価者2は同じケースを

10 点、3 点、7 点と評価したとします。評価の点数は全然違いますが、評価の方向性は同じために「相関係

数」は高く出てしまうのです。このため、評価の厳密な「一致」を見るためには、やはり ICCを使う方が正

しいのです。

Page 53: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

53

右側にある「変数:」から、「評価者1」と「評価者2」の両方を取り出して、左側に

ドラッグ&ドロップします。こうして「OK」ボタンをクリックすれば、計算結果が以下のように出てきます。

ここで、上から2番目のρ(ロー)が相関の度合いを表す指標ですので、これが 0.954 ということは、かなり良い相関である、つまり評価者1と評価者2は同じ方向性でしっかり

評価しているとは言えるのです。

!"#"$$

#%"&

'#"()

#$$$&

#%")

'#""*

#$$$&

&

&

+,-./

01

21

31

4567801

4569:;,21

4569:;,31

456<=>?@AB

456<=>?@AC

D3EFGHFI,56JK>L>?@ABM>?@AC

Page 54: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

54

第8章 Between Subject Design と Within Subject Design の短所・長所

ここまでの章で、StatViewを使う上で最低限覚えておくべき事は、お終いですが、最後

にもう1点だけあります。 ここまでの例題は、全て、いわゆる Between Subject Designの実験でした。これに対

して、Within Subject Designの実験というものもあり、どちらにも短所・長所があります。この章では、この違いについて、少々ご説明しようと思います。 例えば、あるやり方1と別のやり方2を比較するのに、大勢の被験者を使って実験する

場合、実は2通りの方法があります。 1つめ:被験者を2つの群にわけ、一方には「やり方1」を、もう一方には「やり方2」

をやってもらい、その成績を比較する。(Between Subject Design) 2つめ:被験者に2回集まってもらう。1回目は「やり方1」あるいは「やり方2」をや

ってもらい成績を出し、2回目には1回目にやらなかった方の「やり方」をやってもらい

成績を出す。同じ人が、違うやり方でやった場合、成績の違いがでるかどうかを比較する。

(Within Subject Design)

Between Subject Designについては、いままで見てきた通りですが、これに対し、Within Subject Designの利点と欠点は、以下のようなものです: 利点: ● データが特に個人差の大きいものである場合、介入の違いによる差が、個人差の中に埋もれなくて済む(データの差を有効に検出できる)。

● 被験者として協力してくれる人が少ないばあい、「1つぶで、2どおいしい」ので、楽である。

欠点: ● データが、1回の介入によって、その次におこなう2回目のデータに、何らかの影響を与える場合、1回目、2回目の違いが、介入による違いだけでなく、回数の違い(学習

効果)によって説明されてしまう可能性がある。(このため、介入が被験者に永続的な

変化を残す場合は、全く使えないことになりますし、そうでない場合でも、やはり被験

者は2群にわけ、1群は1回目に介入1、2回目に介入2を行う群、2群は1回目に介

入2、2回目に介入1を行う群、とするように、シャッフルしなくてはなりません。) ● 実験はかならず「前向き研究」でないと成り立たない。 あまりピンとこないかもしれません。つまり、Within Subject Designにおいては、注目する介入が、あまり永続的な効果のあるものでは、困るのです。少なくとも1回目と2回

Page 55: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

55

目の間に、効果が消えていないと、2回目の評価がちゃんとはできないのです。こうした

意味で、あまり精神科看護の研究向きではないかもしれません。このため、ちょっと例を

挙げにくいのですが、ちょっと無理矢理例を挙げてみます:

命題:抗うつ薬SSRI の「パキシル」は、男性の早漏を治療できるか?

精神科の看護婦・恵美(25歳)は、最近よく処方される SSRI を服用している患者から、どうもあの薬を飲むと「いきにくくなる」という話を聞くことが度々あることに気づ

きました。本当にそうなのだろうか?だとすれば、それを逆手にとって、早漏傾向のある

男性の「治療」として使えるのではないだろうか?と考えました。 そこで、周囲の男性たちに協力してもらい、いつものパートナーとの性交をしてもらい

ながら、開始から射精までどのくらい時間がかかったかを、(1)「パキシル」を30分

前に飲んだ場合、と(2)「パキシル」を飲まなかった場合、とで比較することにしまし

た。但し、被験者12名のうち、半数の6名には(1)、(2)の順でやってもらい、残

りの半数には(2)、(1)の順でやってもらうことにしました。さらに1回目と2回目

との間には1週間の間隔をあけるようにしてもらいました。(1)、(2)の順番でやっ

た人を group1、(2)、(1)の順番でやった人を group2として、その結果は以下の表のようになりました。

射精までの時間(分)

被験者 群別 薬剤あり 薬剤なし

01 group1 12 8

02 group1 5 2

03 group1 28 22

04 group1 16 12

05 group1 55 35

06 group1 8 4

07 group2 28 35

08 group2 10 15

09 group2 18 25

10 group2 6 8

11 group2 45 50

12 group2 3 3

この表をみると、一般に「射精までの時間」には、かなりの個人差があり、短い人は薬

物の有無に関わらず短く、長い人は薬物の有無に関わらず長い傾向にあることが、分かり

ます。確かに、こういう介入による差に対して、個人の違いによる差が大きいようなデー

タでは、Within Subject Designの方が適している気がします。 では、さっそく「データシート」を作成してみましょう。

Page 56: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

56

こんなふうになるでしょう。さらに、このあと ANOVA をしなくてはいけませんから、「薬剤あり」「薬剤なし」の2変数を1つにまとめ上げ「薬剤の有無」という名義変数に

コンパクト化します。

上図のようになります。 さて、今から行う統計計算は、「薬剤の有無」と「順番(group 分け)」という2つの

要因が絡んでいる可能性のある、繰り返し比較ですから、これは一般に Two-way Repeated Measure ANOVAと呼ばれる方法です。いつものように、「新規ビューシート」を開いたら、「反復測定」をする「分散分析」の計算を、「薬剤の有無」と「group」との要因別に検定するのです。 まず「変数一覧」から、数のように「group」と「薬剤の有無」の両方を選択し「選択」

ボタンをクリックします:

Page 57: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

57

つぎに、「分散分析」の下位項目の全てを選択します。

そして「解析の実行」ボタンをクリックすると、以下のようなボックスが出てきますので、

「反復測定」にチェックを入れます。(repeated measureだからです。)

そして、「OK」ボタンをクリックすると、以下のような結果が表示されてきます。

Page 58: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

58 まず、私たちが見たいのは、「薬物の有無」の影響ですから、「分散分析表」の「カテゴ

! "#$#%& "#$#%& $!'! $%#()

!* &''($%&* &''$(%&

! )$#%& )$#%& $%(( $(*+%

! !+%$*(' !+%$*(' !($+#& $**#'

!* !'"$*+# !'$"*+

,-. /01 /2/0 34 54

67895

:;<=>?@

ABCDEFGHIJK

ABCDEFGHIJKFLF67895

ABCDEFGHIJKFLF:;<=M

NONPQFRFGHIJK

" '*$""% !+$"#* %$"*"

" !#$+## !'$&"! &$!'+

" !+$### !&$++# "$(+(

" ''$""% !%$")( %$''#

ST /24 UVW@ UV?@

67895!XFGHYZ

67895!XFGH[\

67895'XFGHYZ

67895'XFGH[\

]^_`aFRFGHIJKbcRFABCDEFGHIJKFLF67895

*

'$&

&

%$&

!*

!'$&

!&

!%$&

'*

''$&

'&

Nd=I/24

GHYZ GH[\Nd=

67895'

67895!

efghijklFRFGHIJKbcRFABCDEFGHIJKFLF67895

!#

!(

!&

!"

!%

!+

!)

'*

'!

''

'#

Nd=I/24

GHYZ GH[\Nd=

67895'

67895!

efghmnojklFRFGHIJKbcRFABCDEFGHIJKFLF67895

Page 59: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

59

リー 薬物の有無」を見てみます。すると、この p値は 0.40ですから、全然有意差がありません。でも恵美さんは思いました:「おかしい、確かに group1 の人たちだけで見ていたときは、薬剤を与えた方が、時間が長い傾向にあったのに!」と。そして、それは「交

互作用グラフ」を見れば、よく分かります。被験者を group1だけに限れば、「薬剤あり」のほうが「薬剤なし」よりも平均時間が長いのです。そして「交互作用折れ線グラフ」を

見てください。ここで重要なのは、グラフが交差していることです。これは「薬剤の有無」

と「group分け(つまり、実験の順番)」の間に「交互作用がある」ことを示しています。つまり、もし「薬剤の有無」で一見有意差がでても、それは実験の順番による影響を受け

ているため、信用できないことになるのです。 ちなみに、同じデータをつかって、「1回目」と「2回目」を比較することにしてみま

す。但し group1では、1回目に薬物を服用し、group2では2回目に薬物を服用する点が違っています。こうして並べ替えたデータをもとに、「1回目」か「2回目」かというこ

とで、「射精までの時間」という変数が有意に影響を受けているかどうかを、同じ手法

(two-way repeated measure ANOVA)で調べてみると、結果は以下のようになります:

今回見たいのは「順番」が影響を与えているかどうかですから、「分散分析表」の「カ

テゴリー 順番」を見てみます。すると、p=0.032と有意な結果になっています。さらに、「カテゴリー 順番*group」が p=0.4089と有意差なしですので、groupの違い、つまり薬物服用の有無は影響を与えてないことが示唆されます。このことは以下の「相互作用折

れ線グラフ」でも示されています:

! "#$#%& "#$#%& $!'! $%#()

!* &''($%&* &''$(%&

! !+%$*(' !+%$*(' !($+#& $**#'

! )$#%& )$#%& $%(( $(*+%

!* !'"$*+# !'$"*+

,-. /01 /2/0 34 54

67895

:;<=>?@

ABCDEFGH

ABCDEFGHFIF67895

ABCDEFGHFIF:;<=>J

KLKMNFOFGH

Page 60: もうすぐにも使える 統計ソフト Stat Viepsykoba/library9.pdf2 私たちは、普段の臨床の中で、何らかの点で「患者に良くなって欲しい」と考えて、何

60

グラフが交差していないことに注目してください。つまり、射精時間の長短は、「時間

を測るのが1回目か、2回目か」という条件には有意に影響される(1回目の方が時間が

長い)のですが、薬剤服用の有無には影響をうけないことがわかります。1回目の時は、

こんなふうに時間を計りながら性交をするのは、きっと初めてだったでしょうから、もし

かすると、変に意識して緊張してしまったために、時間がかかってしまったのかもしれま

せん。それが2回目になると、慣れてきたのかもしれません。いずれにしろ、特に精神科

領域では、このように、「慣れ」や「学習」効果が出てしまうことは少なからずあるので、

気をつけなくてはなりません。 ところが、です。同じデータを、全て1回目に薬剤を投与して時間を測り、2回目は薬

剤なしで時間を測ってしまったらどうなるでしょう。結果は、薬剤を投与した場合の方が、

時間が長い、という結果が出てしまうのです。これがWithin Subject Designでやりがちな間違いです。 ですから、常に相互作用を見ていかなくてはなりません。常に、Two-way Repeated

Measure ANOVAを使わなくてはならないのです。 こうしてみると、Within Subject Designは、Between Subject Designに比べ、いかに

実験計画の作り方も、その後の統計計算も、大変であるかがお分かりだと思います。この

理由のために、このマニュアルでは、Between Subject Designのやり方を優先したのでした。 注:この例題でつかった、SSRI の話は、部分的に本当です。SSRI には、男性の場合も、女性の場合も、オーガズムに達するまでの時間を延長することが知られており、この影響

は統計学的に確認されています。

!"

!#

!$

!%

!&

!'

!(

)*

)!

))

)"

+,-./01

234 534+,-

6789:)

6789:!

;<=>?@ABCDEFEGHIJFEKLMNOEGHEPE6789: