112
統統統統統統統統 ―統統統統統統統統統 統統統 統統統統統― 2013 統 統統 統 81 統統統統統統 統統 統統統統

統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

Embed Size (px)

DESCRIPTION

統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―. 2013 年8月1日 富山国際大学 教授 浜松誠二. Ⅰ . 統計処理を巡る話題 ― 我々の知識には根拠がなかった ―. 1.最強の学問 ― 統計ブーム ―. 「統計学が最強の学問である」     西内啓著 ダイヤモンド社  2013 年. EBM( Evidence-Based Medicine )   科学的根拠に基づく医療. ( 前史 ) イグナッツ・ゼンメルワイスの発見 (1840)   産院での女性の死亡率 12 %⇒ 2 %     手を洗うことの励行で産褥熱感染の回避. EBM宣言. - PowerPoint PPT Presentation

Citation preview

Page 1: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

統計で富山を知る

―情報システムの進化・普及と統計の活用―

2013 年8月1日富山国際大学

教授 浜松誠二

Page 2: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

Ⅰ .統計処理を巡る話題

―我々の知識には根拠がなかった―

Page 3: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

1.最強の学問―統計ブーム―

• 「統計学が最強の学問である」     西内啓著 ダイヤモンド社 2013 年

Page 4: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

EBM( Evidence-Based Medicine )  科学的根拠に基づく医療

( 前史 )• イグナッツ・ゼンメルワイスの発見 (1840)  産院での女性の死亡率    12 %⇒ 2 %    手を洗うことの励行で産褥熱感染

の回避

Page 5: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

EBM宣言ゴードン・ガイヤット、デヴィト・サケット    (1992)

• 治療法の選択は、最高の根拠に基づくべきで、最高の根拠とはできれば統計からくるべきだ。

Page 6: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

「 10 万人の命」宣言• ドン・バーウック  (2004)

• 回避可能な死の防止のために         6つの変化の導入

  肺感染、静脈感染の防止など

治療方法の確認 ⇒ 根拠のある治療

Page 7: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

• 分析が可能に      カルテの電子化と共有      事実の発見

• 海外の様子が見えだす ( 日本 )      共有化、国際化、日本へも情

Page 8: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

日本での医療を巡る話題

• メタボの評価

• サプリメントの評価

• がん検診の評価

Page 9: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

H.G.ウェールズ• 「統計学的思考が読み書きと同じよう

に良き社会人としての必須の能力になる日がくる。」  (1903 年 )

       

Page 10: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

H.ヴァリンGoogle チーフエコノミスト

• 「これから 10 年もっともセクシーな職業は統計家である。 」 (2009 年 )

       

Page 11: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

データサイエンティストの時代• 情報通信白書

   将来的に 25 万人不足

Page 12: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

2.統計処理の変化 ─情報技術の深化の中で─

Page 13: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

(1)  統計学• A. ケトレー  ( 近代統計学の父 )

 社会事象の正規分布

• ナイチンゲール   戦場での死因 ( 統計の有効活用 )

Page 14: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

•   19c末~ 20c初F. ゴールトン 指紋の発見者生物測定研究所  生物学に数学的厳密さを回帰  平均への回帰 親子の身長相関  計測の尺度

K.ピアソン 進化論の追跡 『科学概論』 1880s   決定論的見方に追加すべきものを認識

Page 15: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

フィッシャー実験計画

 ロザムステッド農事試験場のデータ解析

W. ゴセット  ステュデントのt検定

Page 16: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

標本調査と統計学マスコミの隆盛

  新聞社の模擬投票  20c に入って盛んに  世論調査社の設立

アメリカ大統領選挙  ギャッラップの大成功 (1936) と大失敗 (1948)  

センサス局等の活動 標本調査の価値

   → 標本調査の理論

Page 17: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

統計学の実践• 数表活用   ↓• Excelでの計算

• 解析的解法   ↓• シミュレーション等による解法

Page 18: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

(2)  日常的統計処理• データの入手    普段の活動で蓄積    インターネットでの提供

• データの加工    Excelで簡便に    多様な表現

• 成果の発信

Page 19: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

○ 統計体系の再構築 ( 日本 )

• 統計法 改正2007年      全面施行  2009 年

   基幹統計     国民経済計算、国勢調査、・・・

   経済センサス      2009年7月1日実施

Page 20: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

政府統計の総合窓口• 体系的整理

     インターネット経由での入手     データベースシステム

Page 21: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―
Page 22: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―
Page 23: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

○ 世界の統計• 各国の統計システム

• 国際機関の統計    無料化

Page 24: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―
Page 25: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

データの加工

• Excelによる統計表の整理、       検定            χ 2検定             

• Excelによるグラフの作成    散布図で多様なグラフのテンプレート

Page 26: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

(3)  体系的検証勘による対応から根拠のある対応へ

         ( Evidence-Based )

• 年毎の新たなワインの質            (オーリー・アッシェンフェルター )

= 12.145+ 0.00117×冬の降雨+ 0.00614×育成期平均気温- 0.00386×収穫期降雨

Page 27: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

• 貢献出走塁   (ビル・ジェイムズ )

=(ヒット数+四球)   ×総塁数   ÷ (死球以外の打席数+四球数)

Page 28: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

• 自動販売機で新たな需要発見

• GPS等で建設機械の稼働状況を把握

• ツイッター情報から風邪の流行を予測

• リポーターの情報を集約から       ゲリラ雷雨の予測

Page 29: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

(4)  仮説の構築• データの蓄積

• 相関から意味の発見

• ビッグデータ  Volume 大量  Variety  多様  Velocity  高速

Page 30: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

取引情報

Page 31: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

ビッグデータの争奪・インターネットの利用がそのままデータに   位置情報、検索情報、交信情報、・・・

 グーグル  アップル フェースブック アマゾン  ・・・

Page 32: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

(5)  人工知能  (AI Ⅲ )

• 翻訳• チェス• 自動車の自動運転• ・・・・・

Page 33: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

3.知識の根拠は脆弱

• 【知識についての考え方】

Page 34: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

(1) 我々の知識の根拠 ほとんど全てが ・権威 (先生・マスコミ ) からもらったもの ・生活体験からつかんだもの   多くは従っておいてよい

真実を知ろうとしたときは  一歩、抜け出ることが必要

Page 35: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

( 2 ) 正しい知識を持っているか①都合のよい判断

• ベンジャミン・フランクリン• 酸っぱいブドウ

Page 36: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

  B. フランクリンの格言•   理性のある動物、人間とは、まこと

に都合のいいものである。したいと思うことなら、何にだって理由を見つけることも、理窟をつけることもできるのだから。

Page 37: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

 無意識のフィルター• 脳科学の発展

• 多様な実験   権威に従う   先入観で判断する   記憶も歪む

Page 38: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

原子力村• 仲間内で集まってもだめ   公共事業の暴走     下水道、ダム、道路、砂防、・・・

• 審議会も機能せず   誰を委員とするか

• 社外役員の重要性

Page 39: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

②無反省な弁明• 富山の特徴に関する多様な言説があるが

根拠に乏しい。

• 日常的認識での誤りが多い。

Page 40: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

③ヒューリスティクな判断• 「人間は生きていくために物事を適当に判断するようにできている」

• 錯覚は人にとって必要

Page 41: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―
Page 42: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―
Page 43: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

ヒューリスティクな誤りの類型• ベースレートの誤信 乳がん検診陽性でのがんの確率• ギャンブラーの誤信 失敗続きの後は• 利用可能性への過度の依存 私の知人はこうであった• 因果関係の存在への期待 ハリネズミの失敗• アンカリングの習性 先入観の囚われ• 後知恵の追加 自らの正当化のみ• 大量情報処理の恣意的整理 8以上の序列化は無理

このため、正しい判断には工夫が必要

Page 44: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

⇒ 知性は理性的でない

こう考えるといろいろな課題を謙虚に考え真実を得るための努力を意識的に行うことができる

Page 45: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

4. 真実を得るための仕掛け

• 積極的に仕掛けを構築する必要がある

Page 46: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

(1)  調査研究の手法• 統計二次分析• 実験• 調査票調査• インタビュー調査• 参与観察• 踏査• ドキュメント分析• (比較研究 )• (既存研究調査 )

Page 47: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

調査の広がり

Page 48: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

(2) 統計的調査/事例的調査

Page 49: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

 事例的調査

• 網羅的情報収集    一定のやり方で見た情報・聞いた情

報は    全て記録する

• 全ての情報での仮説構築    集まった情報は勝手に破棄しない

Page 50: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

統計的調査

• 確実な統計的手続き

• 仮説の検証   (いつまでも仮説を逃れられない)

• 相関があっても因果関係とはいえない   (因果関係を説明する数学的方法論はない )  

Page 51: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

事例 /定性 統計 /定量 代表性に懸念 サンプリング、回収率調査対象に影響 調査対象への影響を回避直接意識を聴く・触れる Wording等の不確かさ 因果を体験、直に聴く・触れる  豊かな内容

推論の不確実性  限定された情報

回答の信頼性( 信頼できるインフォーマントの獲得 )

検討困難非回答者の偏向

仮説生成が可能 仮説検証が主体 グラウンディド・セオリー厚い記述

数値的解析洗練された理論への昇華

時間的・精神的負担(参与観察が典型 )

金銭的負担

Page 52: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

○ ビッグテータと調査の変化• 多種多様な変数の膨大な標本データが入手できる

ようになった。     ↓• 事例的調査・統計的調査の手順に拘束されなくなっ

た。

• 統計的調査で直接仮説構築が可能になり同時に検証もできるようになった。

• 事例的調査の不確かさが乗り越えられるようになった。

Page 53: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

Ⅱ.統計処理の実践

Page 54: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

○ 表グラフを読む力

• 表・グラフになじむことが大切

Page 55: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

○資料がなかったとは言わない 

―情報システムで容易に入手、分析―

Page 56: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

◎地域を知ろう ―富山の常識・非常識―

【富山の話題】   舞台・産業・生活・郷土

【グラフの技法】

Page 57: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

1.富山の舞台

Page 58: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

○ 富山の自然は豊かか

フリーソフト MAPWIN

地図

Page 59: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―
Page 60: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―
Page 61: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―
Page 62: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

○ 富山県の火災発生率はなぜ低いか

Page 63: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

相関分析

Page 64: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―
Page 65: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

○地球温暖化クリモグラフ

Page 66: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―
Page 67: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

国際データ

Page 68: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

スカイライングラフ  原単位と総量

Page 69: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

○人口横棒グラフの調整

Page 70: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

多重折れ線グラフ

Page 71: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

2.富山の産業

Page 72: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

○産業構造と職業三角グラフ

Page 73: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―
Page 74: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―
Page 75: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

ブロックグラフ

Page 76: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―
Page 77: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

○ 農業県か

Page 78: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―
Page 79: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

スカイライングラフ 特化度

Page 80: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

○景気動向

フローチャート VISIO

Page 81: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

○産業構造の変化

Page 82: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

スカイライングラフ 変化寄与度

Page 83: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

3.富山の生活

Page 84: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

○ 生地での居住・大きな家族

Page 85: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―
Page 86: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―
Page 87: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

○ 富山の家計所得はなぜ高いか

Page 88: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―
Page 89: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

スカイライングラフ 全体との比較

Page 90: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―
Page 91: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―
Page 92: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

○助け合いの気風

Page 93: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―
Page 94: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―
Page 95: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―
Page 96: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

○高齢者は地域資源

Page 97: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

○和を乱さない

Page 98: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

○苦手な新しいコミュニティ形成

Page 99: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―
Page 100: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

4.富山の郷土 (土地・基盤施設 )

Page 101: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

○土地利用制度の柔軟な運用

Page 102: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

地図データ

Page 103: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―
Page 104: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―
Page 105: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

○都市の非形成

Page 106: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―
Page 107: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―
Page 108: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

○充実した基盤施設

Page 109: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

散布図と階層区分

Page 110: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―
Page 111: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―
Page 112: 統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―

御清聴有り難うございました