Upload
others
View
4
Download
0
Embed Size (px)
Citation preview
マルコフ過程による野球の作戦の評価
藤澤幸太郎(東大総合文化)
共同研究者共同研究者当山学
澤山慶博高松賢二柏原賢二山口和紀
打率の推移
スティーヴン・ジェイ・グールド,フラミンゴの微笑みより
日本のプロ野球全選手の打率の推移
研究の動機• 野球は原データが豊富なスポーツである
– 本塁打数、奪三振数、エラー数など
• 二次的なデータも数多く存在する– 打率、防御率、出塁率など
• 作戦に関する定説も数多く存在する– 無死一塁からは送りバント、強打者は敬遠
• こういった定説を数理科学的手法を用いて定量的に評価、検証を行う
全体の流れ
1.目的2.モデルの選定と手法3.盗塁の解析結果4.送りバントの解析結果5.犠牲フライ,スクイズの解析結果6.敬遠の解析結果7.無死一塁,三塁での内野ゴロの処理8.打順の検証9.まとめ
研究の目的
• 数理科学的手法を用いて,野球の作戦,定説を定量的に評価する.
• 野球の最適な打順を考慮する.
• 実際の試合を解析してその作戦の是非を問う.
具体的な作戦の有用性
• 無死一塁の送りバント
• 盗塁の利得
• 無死一三塁からの内野ゴロ
• 最強の打者は何番が妥当か
• 実際の試合の解析
単純なモデル
塁に出る回数と得点には相関があるのは自明という考え方から ・打率モデル 打率=安打数/打数 打率と平均得点で回帰直線を引き得点を予想 ・長打率モデル 長打率 =総塁打数/打数 長打率と平均得点で回帰直線を引き得点を予想 ・出塁率モデル 出塁率=(安打数+四球+死球)/打席数 出塁率と平均得点で回帰直線を引き得点を予想
直感的なモデル
・OPSモデル OPS = 出塁率+長打率 得点とOPSで回帰直線を引き得点を予想 ・TAモデル TA = (総塁打数+四球+死球+盗塁)/アウト数 1試合27アウトとするとTA×27=1試合の予想得点 ・RCモデル RC = (安打数+四球)×総塁打数/(打数+四球) 直に予想得点を算出
分析的なモデル
• 回帰直線による得点予想モデル
o 打率モデル・・・得点との回帰直線 (他:長打率、出塁率、長打率+出塁率・・・etc)
o LSLR・・・各打撃成績と得点との重回帰直線 得点 = (一塁打×W1+二塁打×W2・・・盗塁×W6)/試合数
• 回帰直線によらないモデル
o RCモデル RC = (安打数+四球)×総塁打数/(打数+四球)
分析的なモデル2
• [Lindsey 1959, 1961, 1963]• 試合結果や得点分布を統計的に解析、作戦の評価を行う
• [鳩山 1979] 野球のOR (オペレーションズ・リサーチ)
•Lindseyを元に盗塁やバントを評価
• [J.アルバート,J.ベネット 2004] メジャーリーグの数理科学 • 実際のデータを細かく分析.野球の数理科学の教科書
• [Bukiet et al. 1997]のScoring Indexモデル
• マルコフ過程を用いて最適な打順を検証
• [廣津、宮地 2004] 野球チームのラインナップ選定のための数理的手法-日本代表チーム選定を例として(オペレーションズ・リサーチ)
• 最適な打順を考慮
• [大澤、合田 2005]グリッド環境における野球チームの最適打順決定手法の高速化 (情報処理学会研究報告)
Lindseyのモデル
• バントは相当弱い打者なら効果的
• バントはよくも悪くもない
• 敬遠は悪い
• 1978年セ・リーグ平均のデータを使用
• 盗塁は二死三塁,二三塁,満塁に効果的
• OERA(Offensive Earned Run Average)を用いた野球選手の評価
• 投手の評価
モデルの選定
各モデルの特性
目的を検証可能なモデル
• 盗塁やバント等の作戦を評価するには? → 作戦の有無による変化が分かる必要
= アウト数、走者の位置が分類できるモデル
• 打順を評価するには? → 選手を区別する必要
モデルの選定
各モデルの特性
→SIモデルを採用
SIモデル 〜流れ〜
6つの進塁規則
SIモデル
• 24状態の得点期待値• 得点毎の得点確率 → 勝率 ●打順を考慮した1試合あたりの得点期待値
入力
出力
SIモデルの考え方1
24状態 (塁の状態8つXアウト3つ)
進塁規則[D'Esopo, Lefkowitz 1977]
SIモデルの考え方2
要素qijは状態 i から状態 j に 遷移する確率
打席あたりの確率 PS:一塁打 PD:二塁打 Pr:三塁打 PH:ホームラン Pw:四球 Pout:アウト
SIモデルの考え方3
として
rはその状態から直接得点する期待値 viは各状態における得点期待値
→このVを解くと1イニングの得点期待値が求まる.(24元連立方程式を解く)
SIモデルの特徴
SI値について • 1イニングにおける各状態の得点期待値が求まる
→盗塁やバントといった作戦の評価 • 同じ人間が打席に立ち続ける
→個人の評価
SIL値について • SIをベースに9イニング、異なる9人に拡張[廣津、宮地 2004]• 得点期待値が打順によって変化
→打順の検討• 各得点確率を算出可能
SILモデル
得点確率の求め方
行:イニング中 の獲得点 列:状態
1イニング中の得点期待値 2008年日本プロ野球の全チーム平均進塁率
1イニング中における各状態の得点期待値
SIモデルの検証
• 2008年プロ野球の全試合の得点分布(実線)とSIモデルからもとめた得点分布(破線)
得点毎の確率と勝率 ある選手の打撃結果による得点確率の変化 勝率の変化
盗塁
• 盗塁 o 打者、アウト数は変化せず、走者が進塁する
有利な状態に遷移する 必ず成功する訳ではない
盗塁の成功確率を指標として、盗塁の評価
評価項目:得点期待値、1点以上をあげる確率、勝率
盗塁
.評価法(期待値)
●1回ノーアウト1塁(状態2)を考える。 盗塁が成功した場合:状態2→状態3 盗塁が失敗した場合:状態2→状態9
●得失を計算 成功した場合:1.0634-0.8277=0.22357 失敗した場合:0.2463-0.8277=-0.5813
盗塁
P=0.7115で得失は0になる
●盗塁成功確率(p)を考慮 p×0.22357+(1-p)×(-0.5813)=0.8170p-0.5813
盗塁• 期待値による盗塁評価‐結果
二死一塁では、積極的に盗塁を試みるべき
盗塁• 1点以上あげる確率による盗塁評価‐結果
表:1点以上あげる確率
• 1点以上得点する期待値が0になる盗塁確率• 得点期待値は下がるが確実に1点がとれるようになる.
盗塁• 勝率による盗塁評価‐結果
2つの傾向:走者の数のよる違い
盗塁• 打撃成績の変化と盗塁成功確率
1塁打の増減と得失0点確率の変化
盗塁
.盗塁成功率
平均0.668
・イチロー2008年度 盗塁数43、盗塁刺4、盗塁成功率0.915
盗塁まとめ
• 盗塁は二死一塁の時に行うのが最も効果的.
• 一点が欲しい時に特に有効である.
• 同点の場合,走者が一人の時,後半のイニングになるほど勝利の上昇が大きい.
バント
• 日本の野球は送りバントの数がメジャーリーグよりも多い
日本の野球の特徴
送りバントは本当に有効か
バント
• アウトを増やすかわりに走者を進める作戦
• (100%バントが成功すると仮定) "平均的なチーム"での1イニングの得点期待値
0.828 0.727 得点期待値を上げる効果はない
バント有, 無のときの得点分布
バント
• 得点期待値は下がるが, 1点以上の点数が入る確率は上がる ⇒ 1点を確実に取りたい場合は有効?
• バントの有効性を勝率を用いて評価するo 無死一塁での勝率と一死二塁での
勝率を比べる
バントしたとき, しないときの勝率の差
バントのまとめ
• バントを行うと得点期待値は下がる
• 1点を確実に取りたい時は有効
• 後半のイニングで同点または一点勝っている時には有効.負けている時にはよくない.
スクイズ
• スクイズ o 無死または一死で三塁走者をバントで生還させる作戦
盗塁と同様に成功確率を指標として、スクイズを評価
評価項目:得点期待値、勝率
スクイズ
• 状態遷移 o 成功
三塁走者は得点、打者はアウト
o失敗三塁走者はアウト、打者は一塁へ進塁
・例えば
開始 成功 失敗
+1点
スクイズ• 期待値によるスクイズ評価‐結果
状態12では、積極的にスクイズを試みるべき(全体的に値は低い)
勝率によるスクイズの評価• 勝率の利得が0になる成功確率.
4回の前後で状態12、状態6の評価が逆転
敬遠
• 強打者をわざと四球にして対決を避ける
o 四球で歩かせ次の打者にo強打者と勝負
どちらの方が良い作戦だろうか
全打席敬遠
• SI値が大きい選手ほど敬遠すべき• 王なみに長打が打て打率0.45なら全打席敬遠
すべき
特定の場面での敬遠
• 敬遠は二死二塁,二死三塁が効果的
敬遠による分布の変化
イニングによる違い
敬遠のまとめ
• 強打者ほど有効• 二死二塁,二死三塁の時が最も有効• 1,2点取られる確率を下げ,0点,3点以上の確
率を上げる• 前半より後半,特に7回以降に有効
無死一, 三塁での内野ゴロの処理
• 打者が内野ゴロを放ち三塁走者が本塁へむかった場合
• 1点与える• それ以上の点が入
りにくい
併殺を取る
• 1点入るのを阻止• 走者を2人残す本塁へ送球
状況次の状態野手の選択肢
得点期待値による比較
0.952 0.092+1=1.092 得点期待値だけを見ると本塁へ送球が良い
得点分布の比較
2点以上取られる可能性は「本塁へ送球」のほうが高い
勝率の比較
結論
• 2点以上リードしているときは, 終盤に いくほど「併殺をとる」ほうが有利 • リードが1点以下の時には, 終盤にいくほど 「本塁へ送球」が有利
• 2点リードのときには, 序盤は「本塁へ送球」 のほうが良く, 終盤は「併殺をとる」が良い
SIモデルを用いた打順の検証
• 先行研究[Bukiet97]ではSI値が一番高い打者は2番になるべきと結論o「長打をよく打つがアウト率が高い」
「一塁打をよく打つが長打は打てない」 といった打者のタイプが考慮されていない • SI値, 出塁率, 長打率を用いた観点から最適打順
の傾向を見るo日本のプロ野球12球団で投手を含む打順, 含ま
ない打順を検証
投手を含む打順
• 最適打順におけるSI値1位の打者の打順
• 日米の打者のタイプの違いによる可能性o SI値1位で2番になった2選手は 出塁率1位, 長打率2位以下 ⇒ メジャーではそういう打者が多い?
1542本研究(日本)
0327先行研究(メジャー)
5番4番3番2番
投手を9番に固定した場合
• 打席数を減らして負担を軽減するなどの 理由で投手はほぼ9番に置かれる (最適打順の得点期待値) - (投手9番での最適打順の得点期待値) 最大: 0.021最小: 0 (最適打順も投手9番)平均: 0.007
投手を9番に固定した場合
• 最適打順におけるSI値1位の打者の打順
4番最強説は投手を9番に固定したときには正しい
1911
5番4番3番2番
DH制の場合
• 最適打順におけるSI値1位の打者の打順
投手がいる場合といない場合で各打順の役割は異なる
2343
4番3番2番1番
出塁率, 長打率と打順
• 出塁率1位の打者と長打率1位の打者が異なる場合, 出塁率1位の選手のほうが前の打順になるo直感的には, 「出塁率1位の選手が塁に出て,
長打率1位の選手にチャンスで打席を回す」
実際の試合に関してWBCの主力選手陣を並べ替えてSIL値を求める
順位 名前 SIの値
1 村田 1.004
2 内川 0.934
3 青木 0.865
4 中島 0.852
5 小笠原 0.838
6 福留* 0.536
7 イチロー* 0.530
8 岩村* 0.488
9 城島* 0.289
プロ野球平均0.459 *メジャーリーガー
2009年WBCの決勝(日韓戦)の解析
まとめと今後の課題
• 得点確率分布や勝率から新しい結果と従来の定説の裏付けが得られた
• 従来の研究をつなぎ広い視点からの分析を行った
• 新しい進塁規則の作成• 様々な進塁規則からの評価