16
調査データ分析における ニューラルネットワークモデルの適用 ──社会関係資本に対するメディア効果の探索的検討── 主に調査データに基づいて因果的影響についての議論を行う際,分析実行や 解釈の容易さなどから,重回帰分析をはじめとした線形モデルが利用されるこ とが多い。複数の変数をモデルに投入し,仮説や research question として関心 を持つ要因以外の影響を統制した上での検討を行うことはコンベンショナルに 行われているが,そのような時も多くの場合,線形関係を仮定した統制が行わ れている。 このような手法が持つ大きな利点に対して想定できる重要な課題は,非線形 的関係や,独立変数間の組み合わせによって生じる交互作用の影響を十分に検 討できないことであろう。もちろん理論的,経験的予測の下に事前に想定でき る関係性については,あらかじめ変数変換や多項式などを用いた非線形回帰, また交互作用項などを導入してモデルに組み込むことが当然行われており,ま たサブサンプル間での関連構造の差異を意識した分析手法も開発,適用されて いるところではある。しかし実際の分析においてこのような関係性が事前に十 分に想定できているとは必ずしも言えず,また多変量統制を行いながら複雑な 関係を探索的に検討することにも困難が伴っている。 45

調査データ分析における ニューラルネットワークモデルの適用 · ニューラルネットワークは元来,神経細胞(ニューロン)間におけるシナプ

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 調査データ分析における ニューラルネットワークモデルの適用 · ニューラルネットワークは元来,神経細胞(ニューロン)間におけるシナプ

調査データ分析における

ニューラルネットワークモデルの適用──社会関係資本に対するメディア効果の探索的検討──

柴 内 康 文

問 題

主に調査データに基づいて因果的影響についての議論を行う際,分析実行や

解釈の容易さなどから,重回帰分析をはじめとした線形モデルが利用されるこ

とが多い。複数の変数をモデルに投入し,仮説や research question として関心

を持つ要因以外の影響を統制した上での検討を行うことはコンベンショナルに

行われているが,そのような時も多くの場合,線形関係を仮定した統制が行わ

れている。

このような手法が持つ大きな利点に対して想定できる重要な課題は,非線形

的関係や,独立変数間の組み合わせによって生じる交互作用の影響を十分に検

討できないことであろう。もちろん理論的,経験的予測の下に事前に想定でき

る関係性については,あらかじめ変数変換や多項式などを用いた非線形回帰,

また交互作用項などを導入してモデルに組み込むことが当然行われており,ま

たサブサンプル間での関連構造の差異を意識した分析手法も開発,適用されて

いるところではある。しかし実際の分析においてこのような関係性が事前に十

分に想定できているとは必ずしも言えず,また多変量統制を行いながら複雑な

関係を探索的に検討することにも困難が伴っている。

―45 ―

Page 2: 調査データ分析における ニューラルネットワークモデルの適用 · ニューラルネットワークは元来,神経細胞(ニューロン)間におけるシナプ

入力層 隠れ層 出力層

ニューラルネットワークによる非線形多変量解析

このような問題を背景に,(人工)ニューラルネットワーク((Artificial)Neu-

ral Network)モデルを用いた分析により,単純な線形モデルでは想定しなかっ

た関係性を探索的に検討する手法の試行および評価を行うことが本論文の目的

である。

ニューラルネットワークは元来,神経細胞(ニューロン)間におけるシナプ

スを介した情報伝達を数理的にモデル化し,コンピュータ上で学習やパターン

認識などの脳機能を再現することを目的として研究が行われてきた。その初期

のモデルとして Rosenblatt(1958)が提案したパーセプトロンモデルがある

が,これは線形分離不可能問題に対する限界という決定的な問題を抱えていた

(Minsky & Papert, 1969)。これに対し 1986年にラメルハートらが提案した多

層パーセプトロンモデルとウェイト学習のための誤差後方伝播法により応用可

能性が大きく拡大することとなり(Rumelhart, Hinton, & Williams, 1986),1990

年代以降のデータマイニング技術の急速な発展の中で,その手法の一つとして

の開発・実践も盛んになっていった。

図 1に示すようにニューラルネットワークで用いられる多層パーセプトロン

モデルでは,入力層段階のいわば独立変数が,多くのニューロン,また多段の

図 1 ニューラルネットワーク(多層パーセプトロン)モデル

調査データ分析におけるニューラルネットワークモデルの適用

―46 ―

Page 3: 調査データ分析における ニューラルネットワークモデルの適用 · ニューラルネットワークは元来,神経細胞(ニューロン)間におけるシナプ

ニューロン層からなる隠れ層を介して従属変数となる出力層と,S 字形をなす

シグモイド関数(通常はロジスティック関数)で結びついている。したがっ

て,隠れ層を持たないモデルは多変量解析においてはロジスティック回帰分析

に相当し,これはニューラルネットワークにおいては単層パーセプトロンモデ

ルにあたる。ここで入力層と出力層を多数のニューロンによって構成された隠

れ層が媒介することによって,入出力変数間の関係,また入力値同士の関係に

ついて柔軟で多様なモデル表現が可能となっている(1)。

各ニューロン間の重み付けの初期値はランダムに与えられており,入力に対

する出力の結果も当初はランダムな意味のないものとなる。しかし入力層から

の値の入力によって生じた(正しい結果である「教師データ」との)予測誤差

が後方に向かって順次伝播されることによって重み付けの調整がなされ,この

入力と調整が繰り返されることにより学習が進行する。

ニューラルネットワークモデルの形状とウェイト学習のアルゴリズムがもた

らす性質から考えると,単純な線形モデルよりも予測という点で大きなアドバ

ンテージがあることが当然期待できる。そのような観点から,社会科学領域に

おいても豊田(1996),Garson(1998)などにより,ニューラルネットワーク

のデータ分析への適用可能性についてこれまで検討がなされてきた(2)。

しかしこの領域におけるニューラルネットワークを用いた分析は実際には,

予想されるその有効性に比して積極的に利用されているとは言えない現状にあ

る。統計分析手法の普及に従来大きな影響を及ぼしてきたソフトウェア的な要

因を別とすると,結果解釈をめぐる問題がここにおける大きな課題の一つとし

て挙げられるだろう。重回帰分析においては,偏回帰係数が独立変数と従属変

数の間の関連の強さを示す指標として直接に解釈可能であるが,ニューラルネ

ットワークにおいては,隠れ層のニューロンを挟みニューロン同士が複雑な接

続構造をしているがゆえに,各ニューロン間に与えられた重み付けから独立/

従属変数の関連の仕方を解釈することは(ネットワーク構造にもよるが)多く

の場合困難を伴うこととなる。社会科学研究一般においては正確な予測より

も,現象生起のメカニズム理解に力点が置かれることが通常多いが,ニューラ

調査データ分析におけるニューラルネットワークモデルの適用

―47 ―

Page 4: 調査データ分析における ニューラルネットワークモデルの適用 · ニューラルネットワークは元来,神経細胞(ニューロン)間におけるシナプ

ルネットワークを用いた分析においては予測力が高くとも,第一に検討される

べきこのメカニズムがいわばブラックボックス化してしまい,研究関心や目的

に手法の特性が必ずしもマッチしないという側面がありうる。実際,データマ

イニングにおいてニューラルネットワークモデルが積極的に適用される分野と

して需要予測や与信審査などがあるが,これらの場合大量の要因また観察ケー

スを用いて正確な予測を引き出したいという実践的な目的があるのであって,

各種要因の影響メカニズムや,それを基礎とした結果の制御に必ずしも関心の

中心があるわけではない(その他,ニューラルネットワークが抱える課題とし

て隠れ層およびニューロン数の決定法などの問題もあるが,この点については

後述する)。

しかしニューラルネットワークにおいては,事前のモデルの特定化を必要と

せずにデータの示すパターンの学習から予測を行うので,線形加算的ではな

い,また事前想定外の重要な影響プロセスが存在した場合,それを効果的に発

見,検出できる可能性が大きいことが期待できる。そこで本研究では,牛田・

高井・木暮(2003)に示唆された,ニューラルネットワークの学習結果を決定

木によってトレースしてルール抽出を行う手法を適用し,分析から解釈可能な

知見を得ることを目指す。これは,学習済みニューラルネットワークによる予

測値を基準変数として,ニューラルネットワークで予測力の高かった入力変数

によって決定木による分岐を順次行わせて線形モデルでは表現できない関係性

を析出するという手続きを取る。最終的に,そこで見出された関係をより単純

なモデル形として表現し直し,実質科学的な知見を得ることを目指す。

実質科学的問題:社会関係資本とメディア:

社会関係資本をテーマとした研究で,コミュニケーションメディア,またマ

スメディアの影響を扱うことは少なくないが,多くの結果は複雑な関係を示し

ている。例えば社会関係資本に対するテレビの影響に関しては,Putnam

(1995)によるそのネガティブな影響の主張以来,さまざまな議論,検討が行

われてきた。ただし単純な視聴時間による影響に関しては,否定的な結果を示

調査データ分析におけるニューラルネットワークモデルの適用

―48 ―

Page 5: 調査データ分析における ニューラルネットワークモデルの適用 · ニューラルネットワークは元来,神経細胞(ニューロン)間におけるシナプ

す研究が少なくないように思われる(最近のものでは江利川・川端・山田

(2007)など)。一方で,例えば Putnam(2000)では娯楽としてのテレビ視聴

のネガティブな影響が強調されると共に,ニュース番組の視聴はむしろ社会参

加とプラスの関連を持つとされるようになっている。また Shah(1998)では

番組の選好ジャンルによって社会参加への影響パターンが異なると主張される

など,より詳細で複雑な関係が指摘されてもいる。例えば選好ジャンルなど他

の変数によって影響の向きが大きく異なるのであれば,視聴時間のような変数

の評価において,線形的関係ではカウンターバランスによる打ち消しにより全

体として影響がないという結果となることは当然考えられる。インターネット

等,コミュニケーションメディアの持つ影響についても,当初インターネット

利用が社会参加に対してネガティブな影響を与えるとされた Kraut, Patterson,

Lundmark, Kiesler, Mukophadhyay, & Scherlis(1998)に対して,インターネッ

ト利用が社会参加に対して与える影響は利用者の内向性/外向性のような心理

的傾向性によって異なる方向を取るという指摘(Kraut, Kiesler, Boneva, Cum-

mings, Helgeson, & Crawfor, 2001)や,PC メールと携帯によるメールでは異な

る帰結が想定される(池田,2005)など,変数がさらに細分化され,また他変

数との交互作用によって異なる影響が考えられるなどの主張が多くなされるよ

うになっている。今回はパーソナルネットワークの規模を従属変数とし,さま

ざまな側面のメディア変数をはじめとした独立変数によって,線形関係以外の

知見が析出されるかについての探索的検討を試みる。

方 法

分析データ

国内最大手ポータルサイトユーザを対象としたオンラインパネル(抽出母集

団約 53万人)を対象に,2007年 3月に調査を行った。サンプリングに当たっ

ては,パネルの性別,年代,居住地域に関する事前登録情報に基づき,平成 17

年国勢調査の分布と等しくする形で割り付けを行った。サンプル数 2203に対

調査データ分析におけるニューラルネットワークモデルの適用

―49 ―

Page 6: 調査データ分析における ニューラルネットワークモデルの適用 · ニューラルネットワークは元来,神経細胞(ニューロン)間におけるシナプ

し,有効回収数は 1052(回収率 47.7%)である。回収データの女性比率は

51.8%,年齢平均は 41.68才(SD 11.13)であった。

変数

ここでは従属変数にパーソナルネットワーク規模(「重要なことを話した

り,悩みを相談する人」,0~5人以上の 6段階)を用いた。独立変数としては

メディア関連として,平日テレビ視聴時間[6],娯楽番組選好度[6](3),新聞

接触頻度[5],オンラインニュース接触頻度[5],携帯メール頻度[7],PC

メール頻度[7],デモグラフィック変数として性別,年齢,教育水準[3],フ

ルタイム就業,世帯年収[14],配偶者有無,子供有無,自家所有有無,居住

地について一般市を基準とした,政令指定市,県庁所在市,群町村の 3ダミー

変数の合計 17変数を用いた(2値をとるダミー変数,および連続変数である

年齢以外の変数に付したかっこ内数値が尺度点数である)。

分析方法

ニューラルネットワークおよび決定木モデル生成には,データマイニングに

特化した統合分析環境である Clementine(version 11.1)を使用した(図 2)。

分析は以下の手順で行った。

0)ベンチマークとして全独立変数を用いた重回帰分析を行った。

1)同様に,全独立変数を入力層に,従属変数を出力層に指定してニューラル

ネットワークモデルによる学習を行った。ここで隠れ層のニューロン数,また

隠れ層数の決定においては Clementine に実装された拡張剪定(exhaustive

prune)法を用いた。これは大きなネットワークトポロジーから開始して,学

習の進行に応じて隠れ層および入力層のもっとも弱いユニットを剪定しなが

ら,可能なモデルスペースから最適モデルをくまなく探索する手法である。さ

らに学習データセット比率を 90%とした(学習データセット比率の実際・課

題については後述する)。

2)学習されたモデルによる予測値を出力変数として,CHAID(CHi-squared

調査データ分析におけるニューラルネットワークモデルの適用

―50 ―

Page 7: 調査データ分析における ニューラルネットワークモデルの適用 · ニューラルネットワークは元来,神経細胞(ニューロン)間におけるシナプ

Automatic Interaction Detector,ここでは Clementine に実装された,最適分割を

くまなく探索する手法である exhaustive CHAID)による決定木分析を行った。

3)CHAID により見出されたルールを中心とし,それを重回帰分析にフィード

バックする,またキー変数によるニューラルネットワークモデルの数値シミュ

レーションを行うなどの手法を用いて結果の解釈を行った。

結果・考察

まず先述の従属変数,独立変数を用いた重回帰分析の結果を表 1左列に示

す。10%水準以上の基準で有意であった独立変数が 7つあるが,モデルの説

明力が全体として高いわけではない。

1)この重回帰分析結果をベンチマークとして,ニューラルネットワークによ

るモデル生成を行った。学習プロセスの結果として,入力層として 5つの独立

図 2 Clementine の分析インターフェイス

調査データ分析におけるニューラルネットワークモデルの適用

―51 ―

Page 8: 調査データ分析における ニューラルネットワークモデルの適用 · ニューラルネットワークは元来,神経細胞(ニューロン)間におけるシナプ

変数,第 1隠れ層に 8ニューロン,第 2隠れ層に 2ニューロンを持つモデルが

生成された。入力層に残留した変数,およびその相対重要度(ネットワーク内

においてその入力の持つ重要度のスコアで,0~1の値を取る)については表 1

右列に示す。生成されたニューラルネットワークモデルによる予測値と実測値

の相関係数は .328であり,ベンチマークとした 17変数による重回帰モデルの

重相関係数 .296からの向上を示している(なお,ニューラルネットワークに

よって選択された 5変数のみを独立変数として用いた重回帰分析による重相関

係数は .255であった)。ベースモデルにおいて有意であったいくつかの変数を

取り除いた状態でもこのニューラルネットワークによる予測力が実現されてい

ることに加え,重回帰分析で線形関係が有意とならなかった変数のニューラル

ネットワークにおける残存も見られた。

2)ニューラルネットワークによる予測値を基準変数として用いた CHAID の

表 1 重回帰分析およびニューラルネットワークによる変数選択結果

β NN 残存(相対重要度)

平日テレビ視聴時間娯楽番組選好度新聞接触頻度オンライン N 頻度

.030

.033

.007

.083**

+(.112)

携帯メール頻度PC メール頻度

.176***−.064*

+(.141)+(.067)

性別(女性)年齢教育水準フルタイム就業世帯年収配偶者有無子供有無自家所有居住地(政令市)居住地(県庁所在市)居住地(群町村)

.100**

.033*

.024−.117**.054

−.051.075+

−.023−.047−.010−.038

+(.090)

+(.154)

R 2 .087***

(***p<.001 ; **p<.01 ; *p<.05 ; +p<.1)

調査データ分析におけるニューラルネットワークモデルの適用

―52 ―

Page 9: 調査データ分析における ニューラルネットワークモデルの適用 · ニューラルネットワークは元来,神経細胞(ニューロン)間におけるシナプ

分岐結果概略を説明すると,第一分岐においてはフルタイム就業の有無が寄与

しており,非フルタイム就業者の方がパーソナルネットワーク規模が大きいと

いう結果になっていた。フルタイム就業あり,なしの両分岐に続く第二分岐と

しては,両者ともに携帯メール利用頻度による分岐が起こっており,どちらに

おいても携帯メール頻度が多いほどパーソナルネットワーク規模が大きくなる

という傾向が見られた。携帯メール利用頻度による第二分岐の次に現れた第三

段階の分岐は,両者とも一カ所の例外を除いて娯楽番組選好度によるものであ

った。非フルタイム就業者において娯楽番組選好の影響パターンは解釈の難し

い結果を示していたが,フルタイム就業者においては概ね,携帯メール利用の

多い者においては娯楽番組選好はネットワークサイズの増大に寄与していたも

のの,携帯メール利用の少ない者にとってはそうではないという結果が得られ

た。なお CHAID による分析をニューラルネットワークモデルを介さずに実測

の従属変数に対しても行ったが,類似の構造は再現されず,基本的にはベンチ

マークとした重回帰分析結果において有意な変数に基づく単純な分岐を順次示

しており,変数の組み合わせによる有意味な影響を見出すことができなかっ

た。

3)ここで,携帯メール頻度と娯楽番組選好度の組み合わせが予測値にもたら

す影響パターンが,フルタイム就業の有無によって異なる結果になっているよ

うに解釈されたので,携帯メール頻度と娯楽番組選好度の交互作用項(平均値

中心化)を作成し,ニューラルネットワークにより選択された変数および表 1

の重回帰モデルで有意であった変数を用いて,就業形態別の重回帰分析を行っ

たところ,フルタイム就業者(N=638)において,携帯メール頻度×娯楽番

組選好度の有意な交互作用を得た(β=.092, p<.05)。フルタイム就業者の方

がパーソナルネットワーク規模が小さい傾向があるが,特にその中では携帯メ

ールをより使う層で,娯楽番組の選好がむしろパーソナルネットワークを拡大

させる影響を持ちうるなどの解釈が可能となっている。

この関係についてグラフィカルに表現するために,ニューラルネットワーク

を用いた数値予測シミュレーションを行った。すなわち,携帯メール利用頻度

調査データ分析におけるニューラルネットワークモデルの適用

―53 ―

Page 10: 調査データ分析における ニューラルネットワークモデルの適用 · ニューラルネットワークは元来,神経細胞(ニューロン)間におけるシナプ

パーソナルネットワーク規模予測値

携帯メール利用 娯楽番組選好

と娯楽番組選好度については値を連続的に変化させ,その他の変数については

平均値(および,フルタイム就業のダミー値)を学習済みニューラルネットワ

ークのニューロンに順次入力として与え,出力された予測値と,変化させて与

えた 2変数によるプロットを行った(図 3)。まずフルタイム就業者全体とし

て,携帯メール利用頻度とパーソナルネットワーク規模に正の関係があるとい

う,いわば「主効果」が観察できる。ここで携帯メールを使わない層(右手

前)においては娯楽番組選好のスコアが増大することは,パーソナルネットワ

ークに影響をほぼ与えない(傾きとしては,微少にネットワーク規模が縮小す

る)が,携帯メールを積極的に利用する層(左手奥)においては,娯楽番組選

好はパーソナルネットワーク規模の増大にむしろ寄与するという結果が表現さ

れている。これらの手続きを通じて,それぞれの変数を独立した形で重回帰分

析に投入することによっては見出し得なかった関係性が析出された。

図 3 ニューラルネットワークによるパーソナルネットワーク規模予測シミュレーション

調査データ分析におけるニューラルネットワークモデルの適用

―54 ―

Page 11: 調査データ分析における ニューラルネットワークモデルの適用 · ニューラルネットワークは元来,神経細胞(ニューロン)間におけるシナプ

考 察

実質科学的観点より

本分析では,パーソナルネットワーク規模の小さいフルタイム就業者に限定

してではあるが,従来類似した指摘のある,娯楽番組選好のネガティブな影響

に対して,むしろ(携帯メールを積極的に利用するような)関係形成を志向す

る者に対し,テレビ視聴のポジティブな関連が見出されている。携帯メールを

あまり利用しないような対人関係の指向性の低い者に対しては,娯楽系テレビ

視聴は何の影響も与えない一方で,対人関係の志向性の強いものにとっては,

そのようなジャンルの番組を視聴することが日常的な会話の共有基盤として機

能し,関係の発達維持に寄与するなどのメカニズムが想定されるだろう。実

際,近年発達したインターネット,あるいは多チャンネル放送等を受け手の細

分化をもたらす選択性の強いメディアと捉え,むしろ従来的なテレビ視聴が社

会,政治参加等に持つ積極的意味を論じる論考が登場しつつある。(e.g. Prior,

2007),関係形成におけるテレビ視聴の役割の検討も今後求められよう。

方法論的観点より

本分析では,ニューラルネットワークモデルに決定木分析を組み合わせると

いう手法により,事前に関数形を特定しないモデルをフィットさせて有効な独

立変数を抽出すると共に,それらがどのような実質科学的知見を持ちうるかを

トレースするという方法が一定の成果を持つ可能性が示唆された。ここで,ニ

ューラルネットワークを介さず直接決定木分析を行った場合には,重回帰モデ

ルと類似したような知見が得られているということは,ニューラルネットワー

クがいわばノイズフィルターとして機能し,有効な関連を見出しやすくするこ

とに貢献する可能性を示している可能性がある。また,ベースラインモデルに

おいて一定の影響を持っていたにもかかわらず,ニューラルネットワークモデ

ルにおいて相対的重要度が下がり,また剪定される変数が発生しているが,ニ

調査データ分析におけるニューラルネットワークモデルの適用

―55 ―

Page 12: 調査データ分析における ニューラルネットワークモデルの適用 · ニューラルネットワークは元来,神経細胞(ニューロン)間におけるシナプ

ューラルネットワークモデル内の変数の(単一変数によるものではなく)組み

合わせを通じた媒介メカニズムが生じていることなども想定できるだろう。

もっとも,例に挙げたモデルはベンチマーク,ニューラルネットワークの双

方において十分な予測力を有しておらず,他に重要な規定要因が残されてい

る。このように重回帰分析とニューラルネットワークを併用・比較することに

よって,事前に想定した変数セットによってさらなる説明力の向上が望めるの

か,それとも他の変数を探索するべきなのかといった点について,有効な示唆

も得られると考えられる。

近年計算機環境が向上し,従来負荷が高く収束まで長大な反復計算を必要と

する解析手法もごく短時間で結果を得られるようになっているが,本手法につ

いてはパラメータ設定によってはいまだに長大な時間を必要としている。今回

は最適モデルの発見のために「拡張選定法」によってニューロン数,隠れ層数

を探索的に決定したためとりわけ計算時間を必要とした。具体的には Intel Core

2 Duo プロセッサ 1.60 GHz 搭載のコンピュータにおいて,Clementine に 1 G

バイトのメモリを割り当てて実行したところ,上記報告モデルの推定完了まで

に要した計算機時間は 1時間 50秒であった。分析(ネットワーク学習)に多

大な時間がかかることは,諸パラメータを操作した上での最適モデルを探索的

に検討する作業の困難さを示すものであるが,もっともこの点についてはコン

ピュータ技術の発展により解決する可能性が高い。

ニューラルネットワークを用いた分析においては,モデルを事前に特定する

必要はないが,事前に決定すべきパラメータとして隠れ層の数およびそこに含

まれるニューロン数があり,それをいかに定めるかについては多くの問題が残

されている。基本的にそれらの数を増せば当然モデルの予測力は向上すること

になるが,一方でモデルを複雑にすると学習に用いたデータに(外れ値などの

ノイズを学習するなど)過剰に適合することになり,一般化可能な知見を生み

出せなくなる可能性が高い。この問題は過学習(overtraining)と呼ばれてい

る。今回はニューロン数および隠れ層数の決定に,可能なモデルを広範に探索

するソフトウェア依存の方法を採用してしまっているが,適切なモデル構造の

調査データ分析におけるニューラルネットワークモデルの適用

―56 ―

Page 13: 調査データ分析における ニューラルネットワークモデルの適用 · ニューラルネットワークは元来,神経細胞(ニューロン)間におけるシナプ

決定法に関してはさらなる検討が必要である。

この過学習問題とも関連するが,一般にデータマイニングにおいてはモデル

学習に利用する学習用データセットと,そのモデルの検証用に用いられる「交

差妥当化」用データセットを分割して分析が行われる(4)。学習結果を交差妥当

化用データでチェックすることによってモデルの評価がなされ,それがモデル

改善と学習の打ち切りの判断に用いられる。観測数が十分に大きい場合これら

をランダムに等分すればよいが,今回はサンプルサイズがそれほど大きくなく

十分なモデル学習をさせるためもあり,学習データセットの比率を変化させな

がら最終的な学習結果の評価を行った。その結果を表 2に示すが,学習データ

を 100%とした場合(交差妥当化が行われない),明らかに過剰な学習が生じ

ていることがわかる。ここではそれを除いて重相関係数が最も高く,ネットワ

ーク構造とのバランスのよい 90%の場合を採用したが,調査データのような

限られたサンプル数がもたらす問題もさらなる検討が必要である(5)。

一般的な各種統計解析ソフトウェアにおいても,ニューラルネットワークを

利用しやすい環境が近年整い,分析の中にニューラルネットワークを組み込む

ことが比較的容易になりつつある(6)。またサポートベクターマシンのような次

世代の有力な学習モデルも提案されており,現在も研究開発が積極的に進んで

いる。知見のある程度定まった標準データに対して条件を変化させながらニュ

ーラルネットワークモデルを適用していくことによって,調査データ等の分析

におけるその有効性の検証や実践上の注意点が蓄積されていくことが望まれよ

表 2 学習データセット比率毎の生成モデルの説明力・構造

ニューロン数

学習データ比率(%) 重相関係数 入力層 第 1層 第 2層

5060708090

100

.293

.268

.255

.291

.328

.999

717

375

17

303030

18

29

171620

12

18

調査データ分析におけるニューラルネットワークモデルの適用

―57 ―

Page 14: 調査データ分析における ニューラルネットワークモデルの適用 · ニューラルネットワークは元来,神経細胞(ニューロン)間におけるシナプ

う。

盧 中間層において十分なニューロン数が用意できれば,任意の連続関数を任意の精

度で近似できることが知られている。

盪 近年行われた関連する検討としては,総括的レビューを行った DeTienne ,

DeTienne, & Joshi(2003),また文化間比較というテーマにおけるニューラルネッ

トワークモデルと重回帰分析のパフォーマンス比較については Palocsay & White

(2004)などを参照。

蘯 「よく見る番組」20ジャンルの相互関連付置について検討した分析結果に基い

て,「お笑い番組・演芸」「クイズ・ゲーム番組」「バラエティ番組」「歌番組・音

楽番組」「トーク番組」の MA 選択個数を用いた。

盻 多数のモデルを交差妥当化用データで評価することによる影響もあるため,さら

に検証用データセットを用いて評価することも通常行われる。

眈 さらに,ウェイト等の初期値が収束結果に及ぼす影響も実践においては無視でき

ない。

眇 本研究で用いたデータマイニング専門のソフトウェアではない汎用ソフトウェア

においても,SPSS の neural networks オプション,R の nnet パッケージなどが利

用可能である。

文 献

DeTienne, K. B., DeTienne, D. H., & Joshi, S. A.(2003). Neural networks as statistical

tools for business researchers. Organizational Research Methods , 6, 236−265.

江利川滋・川端美樹・山田一成(2007).ソーシャルネットワークの規定因:テレビ

視聴行動と社会関係資本(2)日本社会心理学会第 48回発表論文集,608−609.

Garson, G. D.(1998). Neural Networks : An Introductory Guide for Social Scientists . Lon-

don : Sage.

池田謙一(編)(2005).インターネット・コミュニティと日常世界 誠信書房

Kraut, R., Patterson, M., Lundmark, V., Kiesler, S., Mukophadhyay, T., & Scherlis, W.

(1998). Internet paradox : A social technology that reduces social involvement and

psychological well-being? American Psychologist, 53, 1017−1031.

Kraut, R., Kiesler, S., K., Boneva, B., Cummings, J., Helgeson, J., & Crawford, A.(2002).

Internet paradox revisited. Journal of Social Issues , 58, 49−74.

Minsky, M. & Papert, S.(1969). Perceptrons . Cambridge, MA : MIT Press.

Palocsay, S. W. & White, M. M.(2004). Neural network modeling in cross-cultural re-

search : A comparison with multiple regression. Organizational Research Methods , 7,

389−399.

調査データ分析におけるニューラルネットワークモデルの適用

―58 ―

Page 15: 調査データ分析における ニューラルネットワークモデルの適用 · ニューラルネットワークは元来,神経細胞(ニューロン)間におけるシナプ

Prior, M.(2007). Post-Broadcast Democracy : How Media Choice Increases Inequality in

Political Involvement and Polarizes Elections . Cambridge, UK : Cambridge University

Press.

Putnam, R. D.(1995). Bowling alone : America’s declining social capital. Journal of De-

mocracy, 6, 65−78.

Putnam, R. D.(2000). Bowling Alone : Collapse and Revilval of American Community .

New York : Simon & Schuster.(柴内康文(訳)(2006).孤独なボウリング:米国

コミュニティの崩壊と再生 柏書房)

Rosenblatt, F.(1958). The perceptron : A probabilistic model for information storage and

organization in the brain. Psychological Review , 65, 386−408.

Rumelhart, D. E., Hinton, G. E., & Williams, R. J.(1986). Learning representations by

backpropagating errors. Nature , 323, 533−536.

Shah , D . V .(1998). Civic engagement , interpersonal trust , and television use : An

individual-level assessment of social capital. Political Psychology, 19, 469−496.

豊田秀樹(1996).非線形多変量解析:ニューラルネットによるアプローチ 朝倉書

牛田一雄・高井勉・木暮大輔(2003).SPSS クレメンタインによるデータマイニング

東京図書

本論文は日本社会心理学会第 49回大会で発表したものに加筆修正したものであ

る。本研究は科研費(17730372)の助成を受けた。

調査データ分析におけるニューラルネットワークモデルの適用

―59 ―

Page 16: 調査データ分析における ニューラルネットワークモデルの適用 · ニューラルネットワークは元来,神経細胞(ニューロン)間におけるシナプ

Application of the Neural Network Model to Survey Data──An Exploratory Analysis of Media Effects on Social Capital──

Yasufumi Shibanai

Survey data are frequently analyzed by using linear models such as multiple re-gression, and as a result, nonlinear and interactive relationships that lie beyond theresearcher’s prior assumptions are often disregarded or overlooked. Artificial neuralnetworks with multilayer perceptrons, which simulate signal transmission betweenneurons, can potentially represent complex relationships and achieve a higher predic-tive accuracy through their flexible learning ability. This article presents a compari-son of the performance between the use of neural networks and a multiple regressionanalysis by using an online sample survey (N=1042) that focuses on media effectson social capital . Neural networks achieve a higher predictive performance withfewer independent variables than the multiple regression model . A decision treeanalysis, which traces the prediction of the neural networks to interpret the underly-ing causal mechanism, suggested an interaction effect of entertainment televisionviewing and cell phone use on the size of personal network. Finally, the paper dis-cusses topics for future research.

Key words:neural networks, nonlinear models, multivariate analysis, social capital,media effects

調査データ分析におけるニューラルネットワークモデルの適用

―60 ―