26
ベベベ ベベベベベベベベ ベベベベベベ ベベベベベ ベベベ ベベ ベ ベベ ベベ ベ :116 植植 植植 ベベベベベベベベベベ / ベベベベベベベベ 24(1), 35-52, 2000

ベイズ・アプローチによる       グラフィカル・テスト理論

  • Upload
    mircea

  • View
    24

  • Download
    1

Embed Size (px)

DESCRIPTION

ベイズ・アプローチによる       グラフィカル・テスト理論. 植野 真臣. 日本教育工学会論文誌 / 日本教育工学雑誌 24(1), 35-52, 2000. 発表者:佐藤 篤 日時:11月6日. 論文の内容. ベイズアプローチによるグラフィカル・テスト理論の定式化 母数推定と構造推定法 予測分布最大化によるテスト情報量( EVTIN) の定式化 従来のテスト理論との理論的比較についての考察. グラフィカル・テスト理論. 教材構造を確率ネットワークとして定式化し、統計的意思決定論の枠組みによりテスト構成を行おうとするもの. はじめに. - PowerPoint PPT Presentation

Citation preview

Page 1: ベイズ・アプローチによる       グラフィカル・テスト理論

ベイズ アプローチによる・      グラフィカル テ・スト理論

発表者:佐藤 篤日時:11月6日

植野 真臣

日本教育工学会論文誌 / 日本教育工学雑誌 24(1), 35-52, 2000

Page 2: ベイズ・アプローチによる       グラフィカル・テスト理論

論文の内容

ベイズアプローチによるグラフィカル・テスト理論の定式化母数推定と構造推定法予測分布最大化によるテスト情報量( EVTIN )の定式化従来のテスト理論との理論的比較についての考察

Page 3: ベイズ・アプローチによる       グラフィカル・テスト理論

グラフィカル テスト理論・

教材構造を確率ネットワークとして定式化し、統計的意思決定論の枠組みによりテスト構成を行おうとするもの

Page 4: ベイズ・アプローチによる       グラフィカル・テスト理論

はじめに

グラフィカル テスト理論はいままで提・案されてきたテスト理論の利点を統合的に有し、統一的な視点から、さまざまなテスト理論モデルに漸近収束、または変化していくモデルである。当初、確率ネットワークと呼ばれる AI分野の比較的新しい技術の応用として定式化されたために、その統計モデルとしての定式化は正確に行われていない。

Page 5: ベイズ・アプローチによる       グラフィカル・テスト理論

グラフィカル テスト理論・   の統計モデル(基本モデル)

N 個の項目の i 番目の項目に対して、その反応に対する確率変数 xi を導入すると、N 項目に対する反応パターンの同時確率は

p(x1,x2,‥ ・ ,xN)=Πp(xi | x1,x2,‥ ・ ,xi-1) =Πp(xi | Πi)と表される。

Page 6: ベイズ・アプローチによる       グラフィカル・テスト理論

グラフィカル テスト理論・   の統計モデル(基本モデル)

この確率モデルは、確率の定義から導かれる定理であり、なんらテストデータ特有のデータ発生メカニズムに対する仮定を置いていない。例外の存在を許容するモデルが提供される。

Page 7: ベイズ・アプローチによる       グラフィカル・テスト理論

グラフィカル テスト理論・ の統計モデル(ベイズ モ・デル)

ξijk を Πi=j のときの条件付き確率パラメータとし、 {ξijk},i=1,‥ ・ ,N,j=0‥ ・ ,qi,k=0,1 とすると、 j は j 番目の親ノードを、 k は変数の取り得る値を示す。よってテストデータは

p(x1, ‥・ ,xN|ξ,S)=ΠΠΠξijk

Page 8: ベイズ・アプローチによる       グラフィカル・テスト理論

グラフィカル テスト理論・ の統計モデル(ベイズ モ・デル)

前ページの式が、n人のランダムに採集されたデータ X ( N *n)を得たとすると論文中(3)式のように表すことができる。

Page 9: ベイズ・アプローチによる       グラフィカル・テスト理論

構造の推定

グラフィカル テスト理論では、データ・から構造を推定することができる。

p(S|X)=p(S)p(X|S) / ∑g∈G p(S)p(X|S) で構造 S に対する事後分布を導き出す。

Page 10: ベイズ・アプローチによる       グラフィカル・テスト理論

構造の推定

( 11 )( 12 )( 13 )( 14 )式による証明により、真のハイパーパラメータが 1/2 でなくても、真の構造を得る保証がある。すなわち、一致性がある。NP-hard 問題の回避には親探しアルゴリズムアーク消去型アルゴリズム遺伝的アルゴリズムによる全数探索の三つが有力である。

Page 11: ベイズ・アプローチによる       グラフィカル・テスト理論

テスト情報量

統計的意思決定論では、期待されるデータの価値 EVSI を( 17 )式のように定式化する。テスト情報量 EVTIN は、未知なる項目への被験者の反応を如何に少ない項目で予測するかを効用としたテスト構成を実現できる。

Page 12: ベイズ・アプローチによる       グラフィカル・テスト理論

テストデータによる       未知項目の予測

EVTIN を最大とするテストを実施した後、未知の項目への反応を各被験者ごとに予測することができる。テスト情報量 ENTIN 最大化によるテスト構成は、この未知項目への予測を最大化するように最適化

Page 13: ベイズ・アプローチによる       グラフィカル・テスト理論

適応型テスト

グラフィカル テスト理論を用いて適応・型テストを開発することができる。項目情報量 EVTIN が最大となるように項目を出題していき、それがある近傍ε 以下になった時にテストを打ち切る。どのノードを理解して、どのノードを理解していないかが推論できる。

Page 14: ベイズ・アプローチによる       グラフィカル・テスト理論

テスト得点の予測

( 22 )式によってテスト得点の予測ができる。少数の項目出題から、全体中どのくらい出来ているかを推測。

Page 15: ベイズ・アプローチによる       グラフィカル・テスト理論

項目応答理論との関係

グラフィカル テスト理論における同時・確率は、項目数 N を大きくすると項目応答理論モデルの同時確率に近づく。すなわちモデルとしては同値になる。( 25 、26式により証明)‥・ Theorem 1一般に、項目応答理論のような潜在変数モデルでは、潜在変数に標準正規分布を仮定するが、 n’ijk が小さくても、z - 分布は正規分布によく近似される。

Page 16: ベイズ・アプローチによる       グラフィカル・テスト理論

項目応答理論との関係

項目数 N を増やすとグラフィカル テ・スト理論は項目応答理論に一致し、局所独立性も成り立つ。精度高く推定されたグラフィカル テス・ト理論におけるパラメータおよび構造を用い、項目応答理論における能力推定値 θsや項目パラメータ ai,biを求めることができる。( 27,28,29式)

Page 17: ベイズ・アプローチによる       グラフィカル・テスト理論

フィッシャー情報量との関係

項目応答理論を用いる場合に、項目の持つ良さの尺度としてフィッシャー情報量が用いられ、ここでは( 30 )式で表される。フィッシャー情報量の逆数は、一般に最尤推定値の漸近分散で示すが、同様にベイズ推定値にも同じことの証明ができる。( 31,32 )式

Page 18: ベイズ・アプローチによる       グラフィカル・テスト理論

フィッシャー情報量との関係

グラフィカル テスト理論における情報・量 EVTIN は( 33 )式によって示され、カルバックライブラー情報量のこれから出そうとしているテスト項目についての期待値を示している。N’ に対してテスト項目 N’ が充分に大きくなるとき、グラフィカル テスト理論・における同時確率は、項目数 N を大きくすると項目応答理論モデルの同時確率に近づく。

Page 19: ベイズ・アプローチによる       グラフィカル・テスト理論

フィッシャー情報量との関係カルバックライブラーのパラメータ近傍の漸近性質により 34,35 式が求められ、前ページ同様、項目数を増やしていくと、グラフィカル テスト理論の情報量・EVTIN は項目応答理論におけるフィッシャー情報量の N’^2/2倍に近づいていき、されに情報量の加法性が成り立っていく。すなわち大量の項目数を持つテストを構成する場合、グラフィカル テス・ト理論におけるテスト構成と項目応答理論におけるテスト構成は同一となる。

Page 20: ベイズ・アプローチによる       グラフィカル・テスト理論

項目関連構造分析との関係

IRS 分析の項目間の順序性係数は( 36)式で定義され、独立性の定義は( 37 ) (、 38)式を満たせばよい。ゆえに IRS 分析における順序性の定義は独立性の定義と同義である。

Page 21: ベイズ・アプローチによる       グラフィカル・テスト理論

項目関連構造分析との関係

IRS 分析によって構成された教材構造について、グラフィカル テスト理論にお・いて、親ノードが互いに独立という制約の下では、ハイパーパラメータ n’ijk を 1/2lognとした時の構造 S の事後分布最大化によって得られた構造を得るのと等しい。ハイパーパラメータを用いた場合、 IRS分析で得られる構造とグラフィカル テ・スト理論における構造は一致する。

Page 22: ベイズ・アプローチによる       グラフィカル・テスト理論

おわりに

本論文 ( 理論 ) でベイズ統計的アプローチを導入する利点は①少数データのサンプリングによって、条件付確率パラメータが0や1などに推定されることを防ぐ。②周辺尤度や周辺事後分布が漸近展開などの近似なく正確にもとめることができる。③ハイパーパラメータをさまざまに変化させることによって、さまざまなテスト理論モデルに漸近収束っさせることができる。

Page 23: ベイズ・アプローチによる       グラフィカル・テスト理論

今後の目標

大規模型教育データバンク(テストデータを中心にして)の開発と Web上での共有グラフィカル テスト理論のユーザーフレ・ンドリーなシステム化大規模型データのための解析ツールの開発(教育用データマインド手法の開発)新しい効用関数の開発とテスト構成の目的分析

Page 24: ベイズ・アプローチによる       グラフィカル・テスト理論

ためになった部分

グラフィカル テスト理論はこれまでのテ・スト理論の利点を総合的に有し、統一的な視点からさまざまなテスト理論に漸近収束、変化するモデルということで、これを自分のシステムに入れることができたらすごいかな‥・論文中に IRSや S-P 、 IRT などの話が出てきたのでいろんな理論の再確認ができた。

Page 25: ベイズ・アプローチによる       グラフィカル・テスト理論

ためになった部分

テストの得点予測などについてはおもしろいと感じた。グラフィカル テスト理論と・ IRS 、 IRTとの関係などが述べられている部分に興味を持てた。

Page 26: ベイズ・アプローチによる       グラフィカル・テスト理論

参考文献

竹谷 誠 「新 テスト理論 ・ 教育情報の構造

分析法」 、早稲田大学出版部