自作AI予想システムの紹介② 騎手の扱い

こんにちは、鹿児島弁で「がんばる・兄さん」ことハメッケ・アイアンです。

 

当ブログをご覧いただきありがとうございます。

さて、当ブログで稼働しているAI予想システムの紹介をしていくシリーズの2回目になります。

1回目はこちら ⇒ GET WIN5 で稼働しているAI予想システムの紹介① 馬名を使う?

前回は「実は馬名はつかっていません」という内容でした。

今回2回目です。

騎手データをどのように扱っているか紹介したいと思います。

 

1.騎手の違いと予想課題

騎手といっても一括りにはできないですよね、大まかにいっても、、、、

中央競馬所属騎手
地方競馬所属騎手(交流戦では必要になります)
外国人騎手
短期免許騎手
ベテラン騎手
新人騎手
長期休養明け騎手

の属性があるかと思います。

しかし、これらについても「馬名」と同じ感じになりますが、当ブログの予想AIで上記のような属性データは学習しておりません。ある一つの要素を除いて、単純に過去レースを学習させているだけです。

それでは、その一つの要素について説明したいと思います。

①短期免許騎手

短期免許だけは扱いが難しいデータ要素です。

その理由は「短期免許騎手の成績は強いにも関わらず、他の騎手より圧倒的に出走回数が少ない」からです。

例えば2017~19年の騎乗数を挙げてみます。

1 位 和田竜二   2789 回
9 位 ルメール   2238 回
20 位 M.デム   1893 回
22 位 武豊     1834 回
29 位 川田将雅   1752 回
30 位 池添謙一   1739 回
105 位 ミナリク   314 回
106 位 シュタル   301 回
107 位 C.デム   298 回
114 位 モレイラ   270 回
116 位 マーフィ   246 回
128 位 ムーア    188 回
135 位 アヴドゥ   173 回
136 位 シュミノ   169 回
142 位 フォーリ   133 回
144 位 レーン    126 回
149 位 ビュイッ   119 回
152 位 バルジュ   113 回
156 位 スミヨン   94 回
157 位 ボウマン   80 回
159 位 ホワイト   70 回
162 位 ブロンデ   63 回
165 位 ティータ   54 回
168 位 オドノヒ   49 回

比較のため騎乗数上位の順位を記載いたしました。代表的な通年免許騎手が出ていますね(和田騎手が1位というのは意外でした)。

そして、2020年のリーディングから短期免許騎手を抜き出してみました。

17位 レーン
18位 マーフィー
28位 ヒューイットソン
51位 シュタルケ
56位 ミナリク
75位 フォーリー

当ブログのAIはデータを3年分で学習しているので、各データをトータル3年で処理します。

すると、例えばレーンは過去3年で126回の騎乗で今年2020年のリーディングは17位。

同様にマーフィは過去3年で246回騎乗となります。そして、今年のリーディングは18位。

これが、どんな意味を持つかと言うと、、、、

短期免許騎手は騎乗数と強さのバランスが合っていない!

強い騎手なら騎乗数も上位に来ないと当ブログのAIではうまく処理できないのです!

AIとは統計計算機であるので、他データとバランスが合わせる必要があります。

2.短期免許騎手データをAIで計算できるようにする

この課題に対応できる方法を考えました。

このデータをAIで計算できるように、架空の騎手を定義しました。

それがタンキ1、タンキ2、タンキ3です。

強さのイメージとしては、以下のような感じです。

タンキ1:上位級(騎乗数は1800回くらいを想定)
タンキ2:中堅級(騎乗数は1200回くらいを想定)
タンキ3:新人級(騎乗数は500回くらいを想定)

以下のようにレースデータを加工して作成しています。

①レースデータを2017年、2018年、2019年として1年ごとのデータに分割
②短期免許騎手を対象にして、各年から3着以内回数をカウントする
③そのカウント回数を多い順にならべて、3個のグループを作る。
④3個のグループを強い順にタンキ1、タンキ2、タンキ3とする

この架空の騎手を以下のように当てはめています。

マーフィ、レーン:タンキ1(強い)に置き換える

ミナリク、フォーリ:タンキ2(ほどほど)に置き換える

ヒューイットソンはタンキ1で計算していましたが、これは正直微妙でした。タンキ2でよかったかもしれません。

 

②新人騎手

例えば、岩田望来騎手を例にします。騎乗回数の順位は以下の通りです。

91 位  岩田望来  522 回(2017~19年の騎乗数)

同騎手はWIN5対象レースでたまに上位人気馬に乗ってるのですが、新人騎手も騎乗回数が少ないので当ブログAIでは計算(予想)結果に出てきません。

例:2020/5/17の新潟競馬 11R 八海山Sで1番人気 エルモンストロで「1着」

当ブログAIは新人騎手が強い馬に乗ったときに上手く計算できない

そこで当ブログでは人気馬に乗っている新人騎手は「タンキ2」もしくは「タンキ3」で予想計算する事にしています(ちなみに上記レースをタンキ2で予想計算するとキッチリAIは計算で出力してきます)。

 

3.まとめ

結果、当ブログAIは騎手を起点に予想計算で運用しております。

①過去3年の騎手の成績をAI学習する

②短期免許外国人は架空の騎手「タンキ1」「タンキ2」「タンキ3」として扱う

③強い馬に乗った新人騎手も上記同様、架空の騎手とする。「タンキ2」「タンキ3」として扱う

4.次回

次回は血統の扱いについてご説明したいと思います。

 

 

毎日入るの少額配当。ちょっと嬉しい。

税金計算は面倒ですよね