20
データ解析と SPSS(情報分析演習用・平成 23 年度版) 担当教員用 この資料は1年次生程度の知識を前提に書かれています。自分で資料を読み自分一人で 作業してもわかるように書かれており、特別なケース以外は説明を行いません。文章を一 つひとつ読みながら作業を行ってください。 Excel について一定の知識があれば、統計学や 数学の知識があまりなくとも理解できように書かれています。作業のあたっては周りの人 と相談してもかまいせん。 以下の文章は読みやすいようにブロック化されています。つぎに3種類の文章ブロック があります。図表番号はこのブロック単位で付けられています。 【説明】この部分を読み理解する努力をしてください。読み飛ばしてはいけません。 【作業】一定の作業が含まれていますが、提出する報告書には反映させる必要はありませ ん。準備作業などが含まれています。 【指示】主に「課題」(授業内課題と宿題)が中心です。指示された作業を行い、主な作業 結果を出力し、報告書に貼付しなさい。報告書の中では、作業したプロセスと結果 が分かるように簡単な文章で説明してください。 注)作業結果の貼付方法(他の方法でもかまいせん) ①「PrintScreen」をクリックする。 ②「アクセサリ」の「ペイント」を立ち上げ、「ホーム」「選択」とボタンを押し、 必要な部分を切り取る。 ③報告書に貼り付ける。 【説明】本資料について 以下、この資料には、主に SPSS の使い方、特に回帰分析のしかたに関するやや詳しい 説明が含まれています。今回は、配布されていませんが、この資料には「後編」があり、 回帰分析(続編)と多変量解析に関する説明が含まれています。 【指示】 以下に示すいくつかの授業内課題の作業を行い、今日の時間中に授業内課題として提出 してください(紙と RENANDI で)。 宿題1 授業内課題で残った部分は、「宿題1」となります。授業内課題ですでに提出した分もあ わせて全体の完成版として提出してください(途中からでは内容がわかりにくいので)。ま た今日の時間内に授業内課題が終わって提出してしまった人は、宿題1のところに、「前回 完成し提出済み」と書いてください。 1

データ解析と SPSS 23 Excel - 専修大学ネットワーク …analysis/spss/SPSS_Manual_I_2011.pdfデータ解析とSPSS(情報分析演習用・平成23 年度版) 担当教員用

  • Upload
    dotram

  • View
    221

  • Download
    4

Embed Size (px)

Citation preview

データ解析と SPSS(情報分析演習用・平成 23 年度版) 担当教員用

この資料は1年次生程度の知識を前提に書かれています。自分で資料を読み自分一人で

作業してもわかるように書かれており、特別なケース以外は説明を行いません。文章を一

つひとつ読みながら作業を行ってください。Excel について一定の知識があれば、統計学や

数学の知識があまりなくとも理解できように書かれています。作業のあたっては周りの人

と相談してもかまいせん。 以下の文章は読みやすいようにブロック化されています。つぎに3種類の文章ブロック

があります。図表番号はこのブロック単位で付けられています。 【説明】この部分を読み理解する努力をしてください。読み飛ばしてはいけません。 【作業】一定の作業が含まれていますが、提出する報告書には反映させる必要はありませ

ん。準備作業などが含まれています。 【指示】主に「課題」(授業内課題と宿題)が中心です。指示された作業を行い、主な作業

結果を出力し、報告書に貼付しなさい。報告書の中では、作業したプロセスと結果

が分かるように簡単な文章で説明してください。 注)作業結果の貼付方法(他の方法でもかまいせん) ①「PrintScreen」をクリックする。 ②「アクセサリ」の「ペイント」を立ち上げ、「ホーム」「選択」とボタンを押し、

必要な部分を切り取る。 ③報告書に貼り付ける。

■ 【説明】本資料について 以下、この資料には、主に SPSS の使い方、特に回帰分析のしかたに関するやや詳しい

説明が含まれています。今回は、配布されていませんが、この資料には「後編」があり、

回帰分析(続編)と多変量解析に関する説明が含まれています。 ■

【指示】 以下に示すいくつかの授業内課題の作業を行い、今日の時間中に授業内課題として提出

してください(紙と RENANDI で)。 宿題1 授業内課題で残った部分は、「宿題1」となります。授業内課題ですでに提出した分もあ

わせて全体の完成版として提出してください(途中からでは内容がわかりにくいので)。ま

た今日の時間内に授業内課題が終わって提出してしまった人は、宿題1のところに、「前回

完成し提出済み」と書いてください。

1

宿題2 インターネット上から「回帰分析」に関する資料を集めそれを編集し、3ページ(フル)

のレポートとしてください。引用は自由ですが URL を明示してください。表題は、「回帰

分析とはなにか」としてください。 ■

【説明】回帰分析とはどういう手法か(一部のクラスでは説明済み) まずおおざっぱに回帰分析とはどういうものかを感覚的に説明しておきます。一緒に配

布した Excel データ(SPSS 用データ.xls)をみてください。作業を行う必要はありません

が、25人のデータを、英語を縦軸に、数学を横軸にしてプロットしてみると図表1のよ

うになります。おおざっぱですが、数学の成績と英語の成績には一応の「相関」があり、

数学の成績が上がれば、英語の成績が上がるという関係がわかります。 その関係を、直線によって近似表現してみるとつぎのようになります(図表2)。この直

線は25個のプロット真ん中を通過する直線です。 図表1

2

図表2

この直線のことを「回帰直線」といい、このような直線を求めることを「回帰分析」と

英語=10.21 + 0.879・数学+e

「e」は誤差項を意味しています。(数学、英語)の組み合わせは25個あり、それゆえ e

になります。軸を縦方向にみれば、「英語」

e= 英語 - (10.21 + 0.879・数学) 帰式では、しばしば誤差項を省略して

英語=10.21 + 0.879・数学

書くことがあります。計量経済学の分野ではしばしばそうしますが、その場合、「=」は

な結

います。作業と説明は後になりますが、実際に Excel を用いてこの回帰直線の係数を求

めてみるとつぎのようになります。

も全部で25個あります。ここでは英語、数学、e の添字番号(受験者番号に対応、たとえ

ば、i=1,2,・・・,25)は省略されています。 この式から、逆に e を求めると、つぎのよう

プロット点に対応し、そのあとの(10.21 + 0.879・数学)が直線の位置(同じ縦の位置)

に対応します。25個の誤差 e は、25個の英語プロットと回帰直線が上下方向にどれだ

けずれているかという情報になります。

正しくは「≒」と書くべきですが、この式ではあくまで省略しているに過ぎません。 現時点では、作業をする必要はありませんが、Excel で回帰分析を行うとつぎのよう

3

果が得られます。上記の式の係数はこのなかで○で囲まれた「係数」の文字の下の2つの

数値を転記したものです。係数は、回帰分析では「回帰係数」といいます。

Excel の出力のうち他の部分は、現時点では理解する必要はありません。Excel をどのよ

て、以上で回帰分析のイメージは理解できたものと

うに操作してこの結果を出すか、またこれらのデータはどのような意味を持っているかに

ついては、逐次説明していきます。 とりあえず詳細な理解は棚上げにし

ます。

【説明】用語 1変数による1変数の回帰分析を「単回帰分析」といいます。つまりつぎ

とを単に「単回帰」ということもあります。X は、「説明変数」(「独

す。X、W、Z が

上記のような

のような回帰分析です。英語のかわりに「Y」、数学のかわりに「X」で表しましょう。「a」は「b」回帰係数を表しています。誤差項 e は省略しています。 Y = a + b・X 「単回帰分析」のこ

変数」ともいう)、Y は「被説明変数」(「従属変数」ともいう)。説明変数、被説明変数は、

計量経済学など社会科学の分野で使われます。独立変数、従属変数という言葉はもともと

数学の言葉です。SPSS では独立変数、従属変数が使用されています。 つぎの回帰分析は、重回帰分析といいます。説明変数が複数ある場合で

説明変数です。

4

Y = a + b・X + c・W d・Z

般に、たくさんの説明変数がある場合には、一例としてつぎのように書きます

Y = a + b・X +c・W + 一

nn XaXaXaaY ⋅+⋅⋅⋅+⋅+⋅+= 22110

複数あるいはたくさんの説明変数がある場合は、それらをどのように選ぶかという問題が

■ 生じますが、その考え方と作業は、今回は省略します。

【説明】回帰分析をなぜ SPSS で行うか は Excel で十分です。また重回帰でも数回程度

、また素

クラスが以下の

単回帰のような簡単な回帰分析を行うに

行うならば、Excel で作業できます。また回帰分析を勉強し理解するに Excel で十分です。

しかし複数の説明変数を選びながら多数回の回帰分析を行うのは Excel ではしんどくなり

ます。計量経済分野や計量社会学分野での回帰分析は続けて何百回も行うことがあります。 Excel で大量の作業を行うことが面倒な理由は、Excel の表に、説明変数群を隣り合わせ

並べておく必要がありその作業をいちいち行うのが面倒なことです。つまり、Excel の欠

点は、操作性の悪さにあります。アンケートのデータや、経済データから、説明変数を試

行錯誤で選択しながらよい結果をもたらす回帰分析を行うには、より操作性のよいより高

度なソフトが必要です。回帰分析を効率的に行うソフトは多数知られていますが、たとえ

ば SAS(非常に高価で大規模な統計解析ソフト、情報科学センターでは、学生も無料で借

りられますが、インストールに2時間位かかります)や EViews(計量経済の専門家が使用

します)などソフトが挙げられますが、現時点では気にする必要はありません。 SPSS は Excel と雰囲気が似ており、また Excel とのデータのやりとりが簡単で

でも操作が簡単です。以下では作業を行い、その使い方を経験します。 以下の目的は SPSS の操作を理解することです。時間などの関係で、各

おりに演習を行えない場合もあります。指示に従ってください。

【説明】SPSS と以下の作業について とつであり、専門家の間でも、初心者の間でも、広 SPSS は著名なデータ解析ソフトのひ

く使われています。機能や使い勝手からいえば、Excel と高度な統計解析ソフト SAS の中間

よりやや SAS 側よりに位置します。SPSS は、簡単な分析をするためであればほとんど Excel

と変わらない操作性でさまざまな分析を行うことができます。SPSS は専門家にとっても十

分な解析能力を提供しています。この授業では全く説明しませんが、本学でも心理学分野

の学生がよく使用するパス解析用の Amos(大学の端末の一部には組み込まれています)な

5

ど、SPSS にはいろいろなオプションがありそれらを付加すればより高度な能力を持たせる

ことができますが、通常は「BASE」とよばれる基本機能セットで十分です。SPSS は「BASE」

とはいえ、市販のソフトと異なり、大きな能力を有すると感じられるひとつの理由は、大

規模なデータを処理できることです。SPSS の価格は 10 万円弱と高価です。

比較的低価格な市販のソフトも販売されていますが、低価格の市販のソフトでは、「50 変

ットワーク情報学部の学生

になるには、「SPSS などのソフトの使い方を理解する

作業内容

数の追加

なお、SPSS は 2009 年に IBM により 12 億ドルで買収されました。以前の大学の端末で

数まで処理可能」というような条件がかかることがありますが、SPSS ではそのようなこと

は少なく、かなり大規模なデータを処理できます。それゆえ、統計的手法を使うための

低限の知識を持っていれば、通常必要とされるさまざまなデータ解析(統計解析)には Excel

と組み合わせながら SPSS でほとんど応えることができます。

データ解析はビジネス分野では不可欠の知識であり、特にネ

よっては将来の活動において大きなよりどころとなります。以下の説明は、90 分間1-

2回の授業につくられたものです。このマニュアルではすでに Excel の使い方の基本を学

んでいることを前提としています。

なお、統計解析を自由に行えるよう

と」が重要なのではなく、「データ解析の理論や考え方を理解すること」が重要です。や

さしい入門書などで理屈を少し勉強すれば、ソフトを利用するのには大きな手間は必要あ

りません。

以下の主な

Excel データの用意

SPSS の起動と Excel からのデータの読み込み

基本統計量の計算

合成変数の作成と変

相関係数の計算

回帰分析の計算

グラフ作成

その他

、SPSS が IBM に買収されたことにより「PASW Statistics 18」という名称になってい

ますが、IBM より販売されている 新バージョンでは、もとの SPSS という名前を残し、

「IBM SPSS Statistics 20」(2011 年 10 月現在)という名称になっています。それゆえ、

以下でも単に「SPSS」とよぶことにします。

【作業】Excel データの用意 た Excel データ(SPSS 用データ.xls)を用意しなさい。以まず 初に、一緒に配布され

6

表1 A高校の成績データ 学 社会 理科 クラス 出身中学

、Excel ファイルの拡張子「.xls」は必要に応じて「.xlsx」と読み替えてください。 図

通し番号 氏名 英語 数

1 山田 20 30 75 45 A X

2 西 75 80 45 75 B Y

3 大野 63 60 30 75 C Z

4 岡 80 75 55 62 B Z

5 齋藤 85 88 50 60 A X

6 綿貫 30 45 50 45 C Y

7 三枝 85 96 86 75 B Y

8 日高 86 45 63 55 C Z

9 荒井 99 85 95 88 A X

10 西岡 48 33 24 54 C X

11 仙石 90 78 70 95 B Y

12 伊藤 55 60 85 70 A Z

13 山下 78 85 45 88 A X

14 向井 85 89 91 95 B Z

15 岡本 62 45 100 45 C Y

16 岸岡 85 75 70 80 A X

17 川内 99 88 75 80 B Y

18 河野 52 63 45 62 C Z

19 村田 55 63 86 80 C X

20 本田 45 25 36 30 A Y

21 植木 95 91 85 88 B Z

22 上田 25 36 45 45 A X

23 氷野 50 38 70 70 B Z

24 辻 35 40 35 20 A Y

25 山崎 82 89 75 60 C X

■ 【指示】授業内課題1(今回は省略・飛ばしください) 図表1のデータをもとに、Excel を利用してつぎのような作業と検討を行い、「A高校の

成績データの検討」というテーマのレポートをまとめなさい。計算結果の出力を列挙する

だけでは十分ではありません。分析手順と分析結果を明確に説明してください。

7

①グラフ作成 英語×数学、・・・などのプロット ②成績のソート(英語、数学、社会、理科) ③英語、数学、社会、理科の平均値と標準偏差の計算

④クラス毎の特性比較(特徴を説明) ⑤出身中学毎の特性比較

【指示】授業内課題2 SPSS の起動と Excel からのデータの読み込み

以下の作業を行い SPSS の作業記録をとりなさい。記録としては途中の画面や各出力図

表1 起動直後の SPSS の画面

表の貼り付けとその都度の簡単な文章で十分です。SPSS を起動するには、大学の端末の

Windows の「すべてのプログラム」から、「SPSS」→「PASW Statistics 18」と選択する

と SPSS が起動します。 つぎのような画面がでます。 図

「データを入力」をクリックし「ok」をクリックすれば、下記の図表3のように、デー

タ入力画面(SPSS データエディタ)になります。この図表2の画面は変数とデータを一覧

する画面です。この画面の下のタグに「データビュー」と「変数ビュー」の2つのタグが

8

ありますが、現在は(おそらく)データビューになっています。そうでない場合は切り替

えてください。「変数ビュー」では変数の定義を行います。その説明は後にごく簡単にしま

す。

図表2 データビュー画面(この画面は変数名とデータを表示する画面です)

図表3 変数ビュー(この画面は、変数の名前や型などの定義を行う画面です)

データビュー画面で、つぎのような手順でデータを読み込みます。 ①

します。 「ファイル(F)」→「開く(O)」→「データ(A)」と選択します。

②「ファイル名の種類(T)」を「Excel(*.xls,*.xlsx,*.xlsm)」に選択

9

③ 上部にある「ファイルの場所」を操作し、上記の配付した Excel のデータファイル(作

名」に対象ファイルの名前が読み込まれます。

画面をいっぱいに拡大します。

業用データ 1.xls)のある場所を選びます。 ④対象ファイルをクリックすると「ファイル

「開く」をクリックするとデータが読み込まれます(図表4 データ画面)。自動的に第1

行が変数名として読みこまれるように設定されています。 ⑤必要があれば、見やすいように「SPSS データエディタ」の

「氏名」、「クラス名」、「出身中学」などの列幅が狭い場合は、変数名の部分をドラッグす

れば任意に拡大できます。これで作業に必要なデータが読み込まれました。 図表4 データ画面

画面下の「変数ビュー」のタブをクリックし、その画面を見ると、変数の定義が自動的

S の設定によっては、変数名として、日本語が使えない

なされています。変数の型としては「数値型」と「文字型」があります。小数桁数を調

整すると、データが見やすくなりますが、現時点ではその調整は必要ありません。また「デ

ータビュー」の画面に戻します。 注)SPSS の古いバージョンや SPS場合もありますが、ここでは第1行の日本語変数名が使えるバージョンを前提としていま

す。

10

【指示】 授業内課題3 基本統計量の計算 以下に説明する「基本統計量の計算」を実際に SPSS で行いその作業記録を報告書に残

分析(A)」→「記述統計(E)」→「記述統計(D)」とクリックすると、変数選択画面が表れ

表5 変数選択画面

しなさい。 「

ます。 図

左の箱の中には全変数があります。これらの変数を一つずつクリックし、二つの箱の間

統計量)がつぎのように計算されま

ある矢印をクリックすると、右の箱に移動します。変数の移動にミスがあったときは、

逆の移動も可能です。ここでは「英語」、「数学」、「社会」、「理科」の変数を移動します。

通し番号は移動する必要ありません。右の箱に入った変数が計算の対象となる変数です。

左の箱から右の箱へ移動する際に、CNTL キーを押しながらクリックすると複数の変数を

同時に選択でき、かつ同時に移動可能になります。 ここで「ok」をクリックすると、基本統計量(記述

す。記述統計量とは平均値や標準偏差など、データの基本的特徴を代表する簡単な基本的

指標を意味します。 図表6 基本統計量の計算結果

記述統計量

11

度数 最小値 最大値 平均値 標準偏差

20 99 66.56 23.845英語 25

数学 25 25 96 64.08 22.842

社会 25 24 100 63.44 21.983

理科 25 20 95 65.68 19.937

有効なケースの数 (リストごと) 25

標準偏差は、データのバラツキを表す指標で、その2乗を「分散」といいます。受験に

す。 ■

ける偏差値は標準偏差の概念を使っています。平均値が偏差値50,「平均値-標準偏

差」が偏差値40、「平均値+標準偏差」が偏差値60に対応しています。

このようなデータが計算されれば、対象となる生徒の成績の概況がわかりま

【指示】 授業内課題4 合成変数の作成・変数の追加・クロス集計 以下に示すように、「成績合計」という変数と「頻度」という新しい合成変数を追加して

1)「成績合計」という合成変数の作成 クします。

理科」などをクリックしながら

ックし、「成績合計」の少数桁数を

2)「頻度」という合成変数の作成 タで、後にクロス集計用に使用します。

欄に「頻度」という名前の変数を追加します。

のすべて欄に、「1」を入力します。数値はも

この変数を使ってクロス集計(Excel のピボット計算に相当)をやってみましょう。

ましょう。 (

「変換(T)」→「変数の計算(C)」とクリッ

① 「目標変数名」の箱に「成績合計」と入力します。

② 数式の箱へ「英語」「+」「数学」「+」「社会」「+」「

式を作り、「ok」を押します。「=」は不要です。 ③ データエディタ画面で、「変数ビュー」タブをクリ

「0」にします。この方が無用の小数点以下の数字がなくなり、見やすくなります。 これで合計の成績変数ができました。 (

この変数の値はすべて「1」のデー

変数ビュー画面を開きます。 ② 変数リストの一番下の行の名前

③ 小数桁数は「0」に直しておきます。 ④ 「デービュー画面」にもどり「頻度」

ちろん半角です(データを変更したときは保存しておくのが賢明です)。

①「分析(A)」→「記述統計(E)」→「クロス集計表(C)」とクリックします。

12

②「行」の箱に「クラス」、「列」の箱に「出身中学」、一番下の箱に「頻度」を移動し、

表1 クラス と 出身中学 と 頻度 のクロス表

ok をクリックすると次の結果が得られます。 図

出身中学

頻度 合計 X Y Z

1 クラス A 6 2 1 9

B 0 4 4 8

C 3 2 3 8

9 8 8合計 25

【指示】 授業内課題5 相関係数の計算 今までの Excel の演習では、すで相関係数の計算はやったクラスもあるかもしれません。

分析(A)」→「相関(C)」→「2変数(B)」とクリックし、変数の箱に、「英語」、「数学」、「社

ような相関係数が計算されます。「Peason の相関

ここでは SPSS を用いて相関係数を計算してみましょう。 「

会」、「理科」の4つの変数を移動します。相関係数は「Peason」、有意差検定が「両側」の

他「有意な相関係数に星印をつける」にしておきます(なにもしなければ、このようにな

っています。その意味はここでは考える必要ありませんが、有意確率の意味は出力を見る

とほぼわかります。有意確率が 0.01 以下であれば「**」がついています。有意確率が 0.05以下であれば「*」がついています)。 ここで「ok」をクリックするとつぎの

数」と書いてある4つの行が相関係数の計算結果です。この表は対角線に対して対称と

なっています。有意確率(両側)を理解するには統計学の知識が必要なのでここでは省略

します。

13

図表1 相関係数の計算結果 相関係数

英語 数学 社会 理科

英語 Pearson の相関係数 1 .842(**) .413(*) .719(**)

有意確率 (両側) .000 .040 .000

N 25 25 25 25

**) 1数学 Pearson の相関係数 .842( .401(*) .755(**)

有意確率 (両側) .000 .047 .000

N 25 25 25 25

社会 Pearson の相関係数 .413(*) .401(*) 1 .449(*)

有意確率 (両側) .040 .047 .024

N 25 25 25 25

理科 Pearson の相関係数 .719(**) .755(**) .449(*) 1

有意確率 (両側) .000 .000 .024

N 25 25 25 25

** 相関係数は 1% 水準で有意 (両側) です。

出力画面とデータ画面などの画面切り換えを行うには、画面一番下のΣの記号の入った

* 相関係数は 5% 水準で有意 (両側) です。

ぎのボタンを押します。過去の計算出力も残っています。

■ 【指示】 授業内課題6 回帰分析 いよいよ SPSS で回帰分析を行います。Excel による回帰分析の件は別途、後で行うこと

英語=a +b 数学 + e e は誤差項(e を省略することもあります)

いう単回帰式を作ってみます。英語を被説明変数(従属変数)、数学を説明変数(独立変

にします。相関係数の計算によれば、数学と英語の相関係数が 0.842 とかなり高いことが

わかりました。そこで、前述の

数)とよびました。回帰式が正しく推定できれば(あとで説明する「決定係数が高い」な

どの条件を意味します。いまはほぼそれを満たしています)、英語が数学の成績でほぼ説明

できることを意味します。前述のように、上式は計量経済学などの分野では、

14

英語=a +b 数学

省略書きすることもあります。

形(L)」とクリックした後、従属変数の箱に「英語」、独

「分析(A)」→「回帰 R」→「線

立変数の箱に「数学」を移動します。方法は「強制投入法」のままにしておきます。「ok」をクリックするとつぎのような回帰分析の結果が得られました(小数点のまえの「0」は省

略されています)。 図表1 回帰分析の計算結果

計 モデル集

調整済み 推定値の

モデル R R2 乗 R2 乗 標準誤差

1 .842(a) .710 .697 13.128

a 予測値: (定数)、数学。

分散分析(b)

モデル 平方和 自由度 平均平方 F 値 有意確率

1 回帰 9682.241 1 9682.241 56.180 .000(a)

残差 3963.919 23 172.344

全体 13646.160 24

a 予測値 )、数

係数(a)

: (定数 学。

b 従属変数: 英語

標準化係

非標準化係数 数

モデル t 有意確率B 標準誤差 ベータ

1 (定数) 10.212 7.963 1.282 .212

数学 .879 .117 7.495 .000 .842

a 従属変 語

この結果よりつぎの回帰式が得られました。

数: 英

英語=10.212 +0.879 数学 + e

15

表には推計に関わる各種の情報も載っています。つぎの情報が重要です。

①回帰係数(非標準化係数の B) 「10.212」と「0.879」

②自由度調整済み決定係数(調整済み R2 乗) 「0.697」

③t値(tとのみ表示されている)

「1.282」⇒回帰係数「10.212」の信頼性に関わる情報

「7.495」⇒ 回帰係数「0.879」の信頼性に関わる情報

まずこれらの3つの「言葉」を覚えましょう。 ■

【説明】 回帰分析についての理解を深めます。

今度は、SPSS による計算結果と Excel の回帰分析画面と対応させながら回帰分析に関す

xcel による回帰分析の手順 はありませんが実際に作業を行ってみてください。

① ます)。

つぎのような画

る言葉と概念を理解します。先に示した Excel の画面をもう一度表示します。SPSS の結果

と対比してみてください。 Eレポートには反映させる必要

まず Excel で回帰分析を行えるようにします(分からない場合は担当教員が説明し

リボンの「データ」「データ分析」が表示される場合は必要ありません。 ②「データ」の「データ分析」をクリックし「回帰分析」を選択します。

面が出ます。

16

③入力 Y 範囲(Y)の右の白い□の中をクリックし、Y(英語)に相当するデータ範囲を変

数名を含めてドラッグして指定します。 ④入力 X 範囲(X)の右の白い□の中をクリックし、X(数学)に相当するデータ範囲を変

数名を含めてドラッグして指定します。 ⑤ラベルの□をクリックします。これは1行目の「英語」と「数学」がデータでなく、変

数名であることを指示する命令です。 ⑥ ok を押せば別のシートに回帰分析の結果が出力されます。

17

通常、報告書などには、この情報をつぎのように要約して書きます。誤差項 e は省略す

ることがあります。

以下の内容は、回帰分析を利用する上での回帰式の「検定」に関する重要事項を経験則

して述べています。とりあえずは読み、言葉を頭の片隅に記憶してください。 (1)調整済み R2(自由度調整済み決定係数、あるいは単に決定係数ということもある) 同じ表に R,R2 のことも出力されていますが R は相関係数のことです。R2 はその2乗で「決

定係数」といいます。自由度調整済み決定係数は決定係数を改良した指標で主にこれを使

用します。 これらは先に計算した英語と数学の相関係数と同じ値になっています。R2 は SPSS 側の

都合で正しく表現されていませんが、正しくは2R のことで R×R を意味します。決定係数

とよばれています。また調整済み R2 は「自由度調整済み決定係数」とよばれ、正式には2R

とかかれます。これらの3つの指標の意味はいずれも、「誤差項 e」がいかに小さいかを表

します。逆にいえば等号「=」がいかに正しいかを表します。「R,R2,調整済み R2」などが

完全に1と一致すれば、誤差項はゼロを意味します。分野によって異なりますが、計量経

済学の分野では、回帰式を予測で利用できるためには 0.95 以上は必要であることが分かっ

ています。アンケート調査などでは 0.6 を超えることはまれです。それでも説明変数と被説

明変数の間の情報は有しています。上記の結果は、相関は強いものの「英語の成績を数学

の成績で完全に予測できる」いうほどの強い関係はありません。 (2)t値 「t」とは「t値」のことでその絶対値が「2以上」であればその変数は説明力がある

といわれます(これは単純化した経験則です)。正式にはt値は、それに対応する係数がゼ

ロであるかどうかを検定しています。複数の独立変数が含まれる重回帰分析の時の重要な

評価基準になります。t値は説明変数(独立変数)が2個以上の時に意味を持ちます。そ

のような場合、t値が悪い独立変数は、説明力がないことを意味しますので、回帰式から

除いてやる必要があります。しかし、ここでは回帰分析に関する詳しいことは省略します。

t値の意味をここでは理解する必要はありませんが、名前くらいは覚えていてもよいでし

ょう。

18

■ 【指示】 授業内課題7 グラフ作成 SPSS のグラフは多様かつ高度な能力をもっていますが慣れないと使いにくい面があり

ます。慣れもありますが、普通のグラフ作成ならば SPSS よりは Excel の方がわかりやす

く使いやすいと思います。一方では Excel のグラフ作成機能が万能というわけでもありま

せん。Excel で手に負えないようなグラフは、グラフ専用ソフトを使えばよいと思いますが、

意外とよいソフトは多くはありません。 ここでは簡単なグラフの例を行います。図表1(プロット)と図表3(3-D)だけを作成

してください。 (1)プロット 「グラフ(G)」→「レガシーダイヤログ(L)」→「散布図/ドッと(S)」とクリックし、その

あと、「単純な散布」→「定義」とクリックします。図表 1 のようなグラフができます。 図表 1 プロット例

(2)3次元棒グラフ まず「グラフ(G)」→「レガシーダイヤログ(L)」→「3-D 棒(3)」とクリックます。「X 軸

の表現内容」、「Z 軸の表現内容」に●印がついていますがそのままにして「定義」を押しま

す。X-Z 軸は水平面、Y 軸は垂直面を意味します。ここで X カテゴリ軸(X)に変数「クラ

ス」、Z カテゴリ軸に変数「出身中学」を移動します。 つぎに、図表 2 の一番上の「棒の表現内容」を「合計値」にします。変数(Y)には先

に作成した合成変数「成績合計」を移動します。「OK」を押すと図表 3 のように、「クラス」

「出身中学」の分類ごとの合計値が計算されます。分類ごとの総合実力が計測されます。

19

図表 2 3-D のグラフの定義画面

図表 3 3D棒グラフ

■ 以上

20