オルタナティブ・ブログ > マーケティングメトリックス研究所 ITmedia派出所 >

身近にあるデータ、具体的な事例、簡単な手法、分析をもっと面白く

2016年プロ野球順位予想!監督の選手時代から勝利数は予測できる!?

»

昨年も実施したプロ野球順位予想を、2016年はパリーグも対象に実施したいと思います。

有馬記念を見事当てた当研究所は、果たしてプロ野球でもピタリと当てることができるでしょうか?

※ちなみに順位予想をした結果を元に賭博とかしてませんから!


なぜ野球解説者の順位予想は当たらないのか?

路地裏のオヤジの占いと野球解説者の順位予想ほど、ドンピシャで当たらない内容は世の中にありません。

順位予想が難しいのは、昨年までの戦力が今年も同じく活躍するかどうか分からない点、そして今年入った新戦力が開幕するまで未知数な点が挙げられます。

現在、阪神タイガースの高山選手がオープン戦で大活躍しており、鳥谷以来の新人賞もいけると虎ファンは興奮していますが、2001年にオープン戦でだけ活躍したイバン・クルーズを忘れてしまったのでしょうか?


順位予想は結局のところ、その地域のご機嫌取りの意味合いしか無く、関東地域で巨人の優勝と言っておきながら関西地域では阪神の優勝と言っている野球解説者もいるみたいです。

順位予想には新しい考え方が求められていると考えます。

そこで統計学を駆使した順位予想に挑戦したいと思います。


「リーダーが優秀なら組織も悪くない」論で考える監督力と順位予想

プロ野球は、個人と個人の能力のぶつかり合いに見えて、実は組織と組織のぶつかり合いです。

打者がホームランを打っても投手が2点以上失点すれば負けます。1人が頑張るのは当たり前、全員が頑張って、かつその頑張りを勝利に結び付ける必要があります。

それが「監督」の仕事です。

踊る大捜査線2で青島刑事が「リーダーが優秀なら組織も悪くない」と言いましたが、まさに監督が優秀なら組織は優勝するのです。


そうした「監督力」を何とかして数値化できないでしょうか?


ある日、ふと「監督自身の戦略や戦術は自身が選手だった頃の監督に影響を受けているのではないか」と思いつきました。実際、名将・仰木監督は三原監督、野村監督は鶴岡監督の影響を受けたと証言しています。

もし、選手時代の「チーム力」が実際の「監督力」に置き換えられるなら、「監督力」を考慮した順位予想が可能なはずです。

そこで1990年〜2015年の間に監督業を務めた63人のプロ野球人の選手時代・監督時代の実績を参考に分析してみたいと思います。


「チーム力」から導き出す「監督力」

監督業も務めた63人のプロ野球人が活躍していたのはおよそ1960年代以降なので、1961年〜2015年のデータを対象とします。

本来であればセイバーメトリクスを駆使したいところですが、60年代・70年代となると基礎データも少ないので、新聞などで公開されているデータ(勝敗数、得失点、打数、一二三本塁打、打点、盗塁、完投封、投球回数、防御率、奪三振、失点)を参照しました。

(おそらくデータスタジアムさんならきっと豊富なデータをお持ちでしょう。いつかコラボしたいものです)


チーム力という曖昧な言葉を具体化するため、前述したデータを縮約して表現したいと思います。

データの相関係数を算出して含めなくて良いもの、主成分分析を行い意味を成さないものなどを対象から外して、最終的に完封数、失点、防御率、二塁打、安打、得点の6つのデータを主成分分析して縮約することにしました。

縮約の結果は以下のとおりです。


001.jpg

第2主成分までに全体の約85%が縮約されている点、情報量が1以上なのが第2主成分までという点から、この2つをベースに考えていきます。

主成分得点と因子負荷量の両方をプロットした絵は以下のとおりです。


002.jpg

第1主成分は投手力、第2主成分は打力と考えても良いでしょう。

(回転すると当てはまりがピッタリなのですが、それは因子分析でやることで、主成分分析ではやっちゃダメなのです)

各チーム毎に投手力・打力がわかったので、この2つでチーム力とします。


このチーム力を63人の監督時代の成績単位に集約してみます。


003.jpg

この投手力、打力がどれくらい勝利数を「表現」できるか散布図で見てみます。


004.jpg

打力はキレイに比例していますね。投手力は少しバラツキがあります。

目的変数を勝利数、説明変数を投手力・打力にして回帰分析をしてみましょう。その結果は以下のとおりです。


005.jpg

投手力のP値が0.0534と5%有意水準で考えると少しはみ出ることになりますが、このチーム力で勝利数を説明できることもわかりました。補正R2値も79.12%と思っているより良い値です。


では次に、63人の選手時代の成績単位に集約してみます。この値こそ数字にできない「監督力」というやつです。

選手時代のチーム力と監督時代のチーム力を散布図で表現してみました。


006.jpg

選手時代のチーム力を、監督時代に上回っている人は以外と少なく、緒方、江尻、和田、森脇、野村、栗山、秋山、落合、真中、西村、工藤各氏の計11名でした。

親を超える子供は、いつの時代も少ないものです。

ちなみに投手力・打力ともに親を越えられなかったのは藤田、中村、金田、長嶋、土井、森、野村、藤田、大久保、吉田、須藤、八木沢、土橋、高田、仰木、中畑、伊東、田淵、達川、石毛、堀内、田尾各氏の22名でした。

V9巨人戦士が多いのはそれだけ川上氏が偉大だということでしょう。

それにしても常勝西武時代に活躍した選手もいるわけで、川上>森>大久保、石毛、伊東とか笑えない構図ですね。こうして越えられない壁が生まれる限りスケールは小さくなるばかりです。


さて、ではこの「監督力」なるものを、先ほどの回帰分析に追加してみます。

もし先ほどの決定係数を上回れば「監督力」としての説得力を増します。


007.jpg

微妙な結果...orz

当てはまり度合いはほんの数%だけ上がり、監督時代投手力と選手時代打力のP値が大きく外れています。

このたった数%が「監督力」かと問われると、うーん?って感じもします。


ただ、ここまで作ったので、この結果をもとに2016年の勝利数を予測したいと思います。


*パはソフトバンクか西武、セは広島・ヤクルト・巨人・中日の大混戦*

2016年に新たに就任した監督の場合は就任するチームの前年の成績を、引き続き監督を務める場合は監督時代の成績をベースに、各監督の「監督力」を含めてみます。

予想勝利数のモデルは、監督時代の投手力と選手時代の打力で説明ができないものの、あえて計算してみました。その結果が以下のとおりです。


008.jpg

まずセリーグですが、広島・ヤクルト・巨人・中日で混戦になることが予想されます。DeNAと阪神はCS進出すら厳しいという結果です。

関西では金本阪神は1年目で優勝するかのような雰囲気ですが、果たして当研究所宛に脅迫メールが来ないことを祈ります。

次にパリーグですが、ソフトバンク・西武の二強になることが予想されます。CS進出は日ハムか、大番狂わせでロッテになりそうです。

梨田監督は隠れた名将ですが、やはり前年の成績が悪すぎることが大きく響いていますね。


今回は主成分分析でデータを縮約し、その結果を用いて回帰分析にかけて予測を行うことに挑戦しました。

結果にはあまり納得できていませんが、統計を使えば見えないデータを数値化して予測モデルができることが伝われば幸いです。


以上、お手数ですがよろしくお願いします。


Comment(0)