こんにちは、鹿児島弁で「がんばる・兄さん」ことハメッケ・アイアンです。
当ブログをご覧いただきありがとうございます。
さて、当ブログで稼働しているAI予想システムの紹介をしていくシリーズの2回目になります。
1回目はこちら ⇒ GET WIN5 で稼働しているAI予想システムの紹介① 馬名を使う?
前回は「実は馬名はつかっていません」という内容でした。
今回2回目です。
騎手データをどのように扱っているか紹介したいと思います。
1.騎手の違いと予想課題
騎手といっても一括りにはできないですよね、大まかにいっても、、、、
中央競馬所属騎手
地方競馬所属騎手(交流戦では必要になります)
外国人騎手
短期免許騎手
ベテラン騎手
新人騎手
長期休養明け騎手
の属性があるかと思います。
しかし、これらについても「馬名」と同じ感じになりますが、当ブログの予想AIで上記のような属性データは学習しておりません。ある一つの要素を除いて、単純に過去レースを学習させているだけです。
それでは、その一つの要素について説明したいと思います。
①短期免許騎手
短期免許だけは扱いが難しいデータ要素です。
その理由は「短期免許騎手の成績は強いにも関わらず、他の騎手より圧倒的に出走回数が少ない」からです。
例えば2017~19年の騎乗数を挙げてみます。
1 位 和田竜二 2789 回
9 位 ルメール 2238 回
20 位 M.デム 1893 回
22 位 武豊 1834 回
29 位 川田将雅 1752 回
30 位 池添謙一 1739 回
105 位 ミナリク 314 回
106 位 シュタル 301 回
107 位 C.デム 298 回
114 位 モレイラ 270 回
116 位 マーフィ 246 回
128 位 ムーア 188 回
135 位 アヴドゥ 173 回
136 位 シュミノ 169 回
142 位 フォーリ 133 回
144 位 レーン 126 回
149 位 ビュイッ 119 回
152 位 バルジュ 113 回
156 位 スミヨン 94 回
157 位 ボウマン 80 回
159 位 ホワイト 70 回
162 位 ブロンデ 63 回
165 位 ティータ 54 回
168 位 オドノヒ 49 回
比較のため騎乗数上位の順位を記載いたしました。代表的な通年免許騎手が出ていますね(和田騎手が1位というのは意外でした)。
そして、2020年のリーディングから短期免許騎手を抜き出してみました。
17位 レーン
18位 マーフィー
28位 ヒューイットソン
51位 シュタルケ
56位 ミナリク
75位 フォーリー
当ブログのAIはデータを3年分で学習しているので、各データをトータル3年で処理します。
すると、例えばレーンは過去3年で126回の騎乗で今年2020年のリーディングは17位。
同様にマーフィは過去3年で246回騎乗となります。そして、今年のリーディングは18位。
これが、どんな意味を持つかと言うと、、、、
短期免許騎手は騎乗数と強さのバランスが合っていない!
強い騎手なら騎乗数も上位に来ないと当ブログのAIではうまく処理できないのです!
AIとは統計計算機であるので、他データとバランスが合わせる必要があります。
2.短期免許騎手データをAIで計算できるようにする
この課題に対応できる方法を考えました。
このデータをAIで計算できるように、架空の騎手を定義しました。
それがタンキ1、タンキ2、タンキ3です。
強さのイメージとしては、以下のような感じです。
タンキ1:上位級(騎乗数は1800回くらいを想定)
タンキ2:中堅級(騎乗数は1200回くらいを想定)
タンキ3:新人級(騎乗数は500回くらいを想定)
以下のようにレースデータを加工して作成しています。
①レースデータを2017年、2018年、2019年として1年ごとのデータに分割
②短期免許騎手を対象にして、各年から3着以内回数をカウントする
③そのカウント回数を多い順にならべて、3個のグループを作る。
④3個のグループを強い順にタンキ1、タンキ2、タンキ3とする
この架空の騎手を以下のように当てはめています。
マーフィ、レーン:タンキ1(強い)に置き換える
ミナリク、フォーリ:タンキ2(ほどほど)に置き換える
ヒューイットソンはタンキ1で計算していましたが、これは正直微妙でした。タンキ2でよかったかもしれません。
②新人騎手
例えば、岩田望来騎手を例にします。騎乗回数の順位は以下の通りです。
91 位 岩田望来 522 回(2017~19年の騎乗数)
同騎手はWIN5対象レースでたまに上位人気馬に乗ってるのですが、新人騎手も騎乗回数が少ないので当ブログAIでは計算(予想)結果に出てきません。
例:2020/5/17の新潟競馬 11R 八海山Sで1番人気 エルモンストロで「1着」
当ブログAIは新人騎手が強い馬に乗ったときに上手く計算できない
そこで当ブログでは人気馬に乗っている新人騎手は「タンキ2」もしくは「タンキ3」で予想計算する事にしています(ちなみに上記レースをタンキ2で予想計算するとキッチリAIは計算で出力してきます)。
3.まとめ
結果、当ブログAIは騎手を起点に予想計算で運用しております。
①過去3年の騎手の成績をAI学習する
②短期免許外国人は架空の騎手「タンキ1」「タンキ2」「タンキ3」として扱う
③強い馬に乗った新人騎手も上記同様、架空の騎手とする。「タンキ2」「タンキ3」として扱う
4.次回
次回は血統の扱いについてご説明したいと思います。
コメントを残す