競馬とAI(ディープラーニング)の可能性について

今回は少しだけ夢のある話をしてみたいと思います。それは競馬とAIの組み合わせの話です。AI(ディープラーニング)の技術によって、将棋や囲碁、画像認識、音声認識など様々な分野で飛躍的な成果が見られています。この技術を競馬にも適用すれば大儲けできるのではないか?そう感じている方もいると思います。ここでは、私なりに競馬を分析していて、感じたことや考えたことをまとめてみたいと思います。

 

AI(人工知能)とは何者か?

人工知能とは、「人間の知能をコンピュータ上などで実現させようとする技術や取り組み」という一つの概念のようなものです。人によって解釈は様々ですが、あくまで人間の知能を再現させるという点が重要です。単純な計算や作業を繰り返すことが人工知能ではありません。人工知能自らが判断し、予測することが1つの特徴だと考えています。

例えば、身長から体重を予測する問題を考えます。1つのやり方としては身長と体重のデータを統計的に処理し、多項式で近似した予測式を算出すれば、身長から体重の予測も可能です。これは単にデータベースから最もらしい結果を取り出してきているだけなので、人工知能とは言えないでしょう。

この例では、人間が身長と体重に相関があることを見つけて、データベースを作成しており、特徴抽出自体は人間自身が行っています。しかし、人工知能の場合は、特徴抽出自体も自分で行うことが特徴だと考えています。

先ほどと同じように体重を予測する問題を考えます。今回は身長のデータはありません。分かっているのは、「年齢」「毎日の起床時間」「学生時代に所属していた部活動」「夕食の食事時間」「両親の名前」とします。

今回はどの特徴が体重にどれだけ影響しているか分かりません。もちろん、先ほどと同じように各要素ごとに体重との関係を調査することも可能です。しかし、これだとやはりデータベースを参照するだけなので、人工知能とは言えません。

人工知能の場合、特徴の抽出や予測式の作成を自動で行ってくれます。例えば、「両親の名前」は体重には関係なさそうなのは直感的に分かると思いますが、こういった特徴の除外も人工知能自身が行います。

ディープラーニング

それでは人工知能はどのようにしたら実現させることができるのでしょうか?

人工知能を実現するための技術として注目されているのがディープラーニング(Deep learning)になります。深層学習と言われることもあります。ここでは、人工知能の実現手段をディープラーニングに限定して説明してきたいと思います。

ディープラーニングの仕組み

ここでは、ディープラーニングの詳細を簡単に説明したいと思います。

学習方法

ディープラーニングはデータから特徴抽出を行うことが可能です。脳の細胞モデルを数式で再現することによって実現しています。ある条件が整うと細胞が活性化するという仕組みを利用し、その細胞をいくつも繋げることによって複雑な条件の特徴を見出し、予測することができます。

教師データ

ディープラーニングが学習するためには、教師データというのものが必要になります。競馬で言うと教師データは「着順」や「走破タイム」に当たるでしょう。

例えば、レース条件は「前走2着」「馬体重450kg」「年齢3歳」「距離1400m」で、教師データは「1着」というような形です。このようなデータを大量に処理し学習させることで、ディープラーニング自ら特徴を探し、1着になる条件を抽出してくれます。

過学習

ディープラーニングの難しい点として、過学習の問題があります。過学習とはその名の通り、学習しすぎることです。つまり、過去のデータを丸暗記するような状態になってしまうことです。私たちが知りたいものは未知のデータに対する予測です。過去のデータは学習には使用しますが、過去のデータに対してだけ正答率が高くても実用的ではありません。

先ほどの例でいうと「前走2着」「馬体重450kg」「年齢3歳」「距離1400m」という条件が揃えば、「1着」になる確率は100%と判断しているようなものです。これでは実際の予測に使うことはできません。

ディープラーニングを競馬に適用する目的

さて、ここからはディープラーニングを競馬に適用させたときにどうなるかを考えてみたいと思います。まずは、ディープラーニングで何を予測するかですが、大きく分けて以下の2つのパターンがあるかと思います。

  1. 1着になる馬をあてる
  2. できるだけ馬券で儲ける

1着になる馬を当てる

まず、1つ目は1着になる馬を当てるという目的でディープラーニングを使用することを考えます。馬券で儲かるかは別として、1着になる馬を予測するケースはディープラーニングで達成できるように思います。ただ、この場合ディープラーニングを使用しなくても、1番人気の馬が1着になる確率が1番高いという事実が既にあるので、ディープラーニング使っても新たな発見はあまりないでしょう。1番人気と2番人気が僅差の場合は、メリットがあるかもしれませんね。

できるだけ馬券で儲ける

どちらかというと、馬券で儲けるためにディープラーニングを適用させる方が、現実的ではないでしょうか?馬券購入する人の大半は1着を当てるよりは、馬券の収支をプラスにしたいと思っているはずです。

この後説明しますが、1着になる馬を当てるという目的では、ディープラーニングは有効活用できると思います。しかし、出来るだけ馬券で儲けることを目的としたディープラーニングは少々ハードルが高いように感じます。

競馬に適用させる難しさ

ここでは馬券で儲かることをも目的とした場合に、ディープラーニングの適用が難しい点を説明したいと思います。

教師データ

儲けることを目的とした場合、まず、教師データを何にするかという問題があります。着順を予測する場合は、「着順」や「走破タイム」が教師データになります。しかし、馬券で儲けることを目的とした場合、レースごとに教師データは存在しないことになります。つまり、馬券ごとの期待値はレース直後でも分からないのです。

極端な話、的中した馬券を教師データとすることもできるのですが、それでは、上位の着順の馬を予測する問題にすり替わってしまうか、あるいは、過学習という的中したデータを丸暗記するようなことが起きてしまいます。

データサンプル数

競馬は年間3000レース以上のレースがあります。10年間のデータを蓄積すれば、30000レース以上のデータを使用することができます。しかし、競馬のレース条件は複雑で、芝やダート、距離、開催場所も様々ですし、騎手や調教師、種牡馬も時代によって変化していきます。また、将棋や囲碁のように何回も対戦させてデータを抽出するということができません。

同一条件で何回もレースをすることができれば良いのですが、たった1レースから得られる情報は少なく、その条件と同一条件のレースは今後二度とあり得ません。ディープラーニングを適用させるためには、データサンプル数は少ないと考えます。

傾向の変化

先ほど少し触れましたが、レース傾向が時間とともに変化するのも難しいところです。騎手の実力も一定ではないし、年齢とともに衰えることもあります。また、種牡馬も移り変わるため、対戦相手の相対的な力関係も絶対的なものではありません。その他に、コースの改修なども行われるなど、数年で傾向が変わるものが多いように感じます。

控除率の問題

馬券で儲けるためには控除率の問題があります、単勝の場合、回収率平均は80%になるのですが、ディープラーニングによって回収率90%を達成することは十分に可能だと思います。

しかし、馬券で儲けるとなると回収率100%を超えなければなりません。ディープラーニングを適用できることと回収率100%を超えることは別物です。ディープラーニングといっても何でも達成できるわけではありません。

例えば、ディープラーニングで宝くじで儲けることはできるでしょうか?宝くじの場合、期待値は45%くらいであるのに加えて、ほぼ同一条件で抽選が行われているので、技術介入の余地が少ないです。

宝くじの例は極端ですが、競馬でも儲けるためには控除率の壁が存在しています。

過学習

控除率の問題でも説明しましたが、儲けるとなれば回収率100%を目標に設定しなければなりません。そうすると、どうしても過学習をせざるを得ない状況になります。少なくとも過去のデータで回収率100%を超えるように学習しなければならないという制約があると、過学習しやすい状況になります。回収率100%を目標にして、かつ、過学習しないというもハードルが高いです。

ジャンケンAIは存在するか?

もし仮にディープラーニングによって、馬券で儲かることができたとしても運用していくうえで徐々に儲からなくなる可能性もあります。それは、時間が経つにつれて儲かる条件に多くの人が気づくようになり、その条件は儲からない条件に変化していくことが予測されるからです。

例えば、必ずジャンケンで勝つAIは存在するでしょうか?統計的にジャンケンでグーを出す人が多いということをディープラーニングが学習した場合、このAIはパーを出すようになるでしょう。それを学習した人が今度はチョキを出すようになり、いたちごっこが続きます。

株やFXでも同様のことが言えそうです。相手の戦法によって、こちらの戦法も変えていかないといけないので、継続して運用するのにもハードルは高いでしょう。

競馬のAIに替わるもの

ディープラーニングを競馬に適用することが難しいことを説明しました。しかし、私自身はデータ分析によって競馬で儲けることは可能と思っています。あくまで、ディープラーニングをそのまま使うことが難しいと判断しているだけで、独自の解析方法ならば勝機はあると考えています。

競馬の傾向は移り変わっていきますが、何年経っても変わりづらい傾向や心理というものはあるでしょう。昔は、将棋や囲碁はコンピュータより人間が強い時代がありました。競馬はどうでしょうか?データ分析を人間がしっかり行っていることが前提になりますが、現状はコンピュータの予想(人工知能)よりも、人間の予測精度の方が高いのではと考えています。

実際に競馬で儲けて納税で問題になっている例もありますから、儲かっている人がいるというのは事実だと思います。今後もデータ分析をして回収率を上げるための工夫を続けていきます。

回収率を上げるための記事を以下に書きましたのでよろしければ、参考にして頂ければと思います。

回収率90%を超える方法!データ分析のすすめ

>データ分析で競馬は楽しくなる「Jpot競馬」

データ分析で競馬は楽しくなる「Jpot競馬」

自作で競馬解析ソフトを作成し、時間があるときは競馬の研究を行っています!競馬で儲けるためにはどうすれば良いかを常に意識し、徹底したデータ解析を心がけています!皆様にも本当に役立つ情報を配信していきます!!