ビールに関する要因分析
■「夏→ビールの売り上げが伸びる」というイメージ
・具体的にどのような要因があるのか? ・ビールの売り上げ(消費量)はどのようなことに 影響をもたらすのか?(相関関係があるのか?)
以上の点に関して世界の国々のデータを用いて3つの仮説を検証
1.目的
仮説1 「年間平均気温が高い国は、一人当たりの年間 ビール消費量が多い。」
仮説2 「一人当たりの年間ビール消費量が多い国 は、一人当たりの年間たばこ消費量も多い。」
仮説3 「一人当たりの年間ビール消費量が多い国は、 男女平均寿命が短い。」
2.仮説
変数1 国ごとの年間平均気温(平年値)(出所:気象庁「気象統計情報」)
変数2 国ごとの一人当たりの年間たばこ消費量(本数)
(出所:Wikipedia 「国別煙草消費概況」)変数3 国ごとの男女平均寿命
(出所:総務省統計局「男女別平均寿命」)変数4 国ごとの一人当たりの年間ビール消費量( L)
(出所:ビール酒造組合「国別一人当たりビール消費量)
3.データ(各変数)について
4.データ分析(仮説1) -ⅰ
4.データ分析(仮説1) -ⅱ
相関係数
年平均気温
一人当たり年間
ビール消費量
年平均気温 Pearson の相関係数 1 -.164
有意確率 (両側) .386
N 30 30
一人当たり年間ビール消費
量
Pearson の相関係数 -.164 1
有意確率 (両側) .386
N 30 30
4.データ分析(仮説1) -ⅲ
分散分析b
モデル 平方和 (分散成
分) 自由度 平均平方 F 値 有意確率
1 回帰 343.223 1 343.223 .776 .386a
残差 (分散分析) 12385.535 28 442.341
合計 (ピボットテーブル) 12728.759 29
a. 予測値: (定数)、年平均気温。
b. 従属変数 一人当たり年間ビール消費量
・散布図:各データは散在しており、予想していたような正の相関は見受けられない。
・相関係数:弱いが負の相関があることがわかる。
・決定係数: 0.027
・有意確率:有意水準 α=0.05とすると、有意確率> αとなり帰無仮説は棄却されない。
4.データ分析(仮説1) -ⅳ
4.データ分析(仮説2) -ⅰ
4.データ分析(仮説2) -ⅱ
相関係数
一人当たり年間
ビール消費量
一人当たり年間
たばこ消費量
一人当たり年間ビール消費
量
Pearson の相関係数 1 .233
有意確率 (両側) .215
N 30 30
一人当たり年間たばこ消費
量
Pearson の相関係数 .233 1
有意確率 (両側) .215
N 30 30
4.データ分析(仮説2) -ⅲ
分散分析b
モデル 平方和 (分散成
分) 自由度 平均平方 F 値 有意確率
1 回帰 680592.844 1 680592.844 1.607 .215a
残差 (分散分析) 1.185E7 28 423390.376
合計 (ピボットテーブル) 1.254E7 29
a. 予測値: (定数)、一人当たり年間ビール消費量。
b. 従属変数 一人当たり年間たばこ消費量
・散布図:データは散在 (→はっきりとした相関は見受けられない)
・相関係数:弱い正の相関
・決定係数: 0.054
・有意確率:有意確率> α(=0.05) (→帰無仮説は棄却されない)
4.データ分析(仮説2) -ⅳ
4.データ分析(仮説3) -ⅰ
4.データ分析(仮説3) -ⅱ
相関係数
一人当たり年間
ビール消費量 平均寿命
一人当たり年間ビール消費
量
Pearson の相関係数 1 .131
有意確率 (両側) .491
N 30 30
平均寿命 Pearson の相関係数 .131 1
有意確率 (両側) .491
N 30 30
4.データ分析(仮説3) -ⅲ
分散分析b
モデル 平方和 (分散成
分) 自由度 平均平方 F 値 有意確率
1 回帰 17.403 1 17.403 .488 .491a
残差 (分散分析) 998.897 28 35.675
合計 (ピボットテーブル) 1016.300 29
a. 予測値: (定数)、一人当たり年間ビール消費量。
b. 従属変数 平均寿命
・散布図:データは散在 (→相関は見受けられない)
・相関係数:ごくわずかだが正の相関
・決定係数: 0.017
・有意確率:有意確率> α(=0.05) (→帰無仮説は棄却されない)
4.データ分析(仮説3) -ⅳ
予想:気温(高)→消費量(増)
結果:予想とは逆の弱い負の相関
なぜ予想とは逆の結果が出たのか?→独立変数(気温)の取り方?
年平均ではなく夏場の最も暑い時期の 1カ月間のデータを使えば違った分析結果が期待できる
5.まとめ・考察(仮説1)
予想:ビールの消費量(増) →たばこの消費量(増)
結果:弱い正の相関
しかし、データは散在している。 データを2つのグループに分ければ、よりはっきりした相関や地域による特徴・性質等がわかるかもしれない。
5.まとめ・考察(仮説2)
予想:ビールの消費量(増)→平均寿命(低) (→負の相関があると予想) 結果:弱い正の相関
この結果をみるとビールの消費量が平均寿命を説明できるとはいえない。ただ、別のアルコール飲料やアルコール飲料全般の消費量を変数に取ったら違った分析結果が出る可能性もある。
5.まとめ・考察(仮説3)
■より大きな標本を用いての分析
■変数の取り方に工夫が必要ex)気温:年平均→夏場の 1カ月間の平均
■信頼できるデータの使用今回たばこの消費量に関するデータはWikipediaのデータを使用→統計局や省庁、調査機関のデータの使用
5.まとめ・考察(全体)