こんにちは、鹿児島弁で「がんばる・兄さん」ことハメッケ・アイアンです。
2021年バージョンのAI開発に向けてデータを探しております。そのシリーズ最終回です。
これまでの記事で書いたことは、以下の①②についてでした。
- 母親の年齢⇒完了
- 母親の成績⇒完了
- 父親の年齢⇒今回の記事
今回は③父親の年齢について調べてみます。
結論から言うと「父親の年齢」による勝馬構成は普通に一定でした。父親の年齢によって特異的な傾向が出ることを期待しましたが(例えば父親10歳の子供は走るぞ!など)、そうはなりませんでした。
しかしそれなりに一定の傾向はありますので、AI学習要素に入れることにしました。
以下、内訳を説明していきます。
1.データ構成
今回使うデータです。
- 今現在で2~20歳の競走馬データ(約15万件)
- 2000年~2019年のJRAレース結果データ(約99万件)
まずは99万件のレース結果データから勝馬(1着馬)だけを抜き出します。その勝馬を15万件の競走馬データから抜き出します。
15万件の競走馬データは、競走馬の母親、父親の年齢データを持っています。その競走馬が生まれたときの年齢です。
この結果を集計します。そして全着馬のデータでも同じことを行います。
2.データ分析
①結果
以下のようになりました。
父親は4歳~30歳の間でした。大体6~7%の勝率で推移しています。一定の比率ですからAIのデータに採用することに決めました。
特に「この年代の父親の子供は買いだ!」とならなかったのは残念ですが、今回のデータ分析はこれで完了です!
(B列) 出走した馬数 | (C列) 勝数 | 勝率 | |
4 | 159 | 4 | 2.5% |
5 | 15,045 | 1,183 | 7.9% |
6 | 44,120 | 3,578 | 8.1% |
7 | 67,540 | 5,241 | 7.8% |
8 | 81,676 | 5,667 | 6.9% |
9 | 82,379 | 5,608 | 6.8% |
10 | 83,270 | 5,532 | 6.6% |
11 | 72,819 | 5,099 | 7.0% |
12 | 71,529 | 4,886 | 6.8% |
13 | 60,691 | 4,215 | 6.9% |
14 | 55,695 | 3,798 | 6.8% |
15 | 47,571 | 3,460 | 7.3% |
16 | 39,883 | 2,720 | 6.8% |
17 | 31,557 | 2,134 | 6.8% |
18 | 22,978 | 1,435 | 6.2% |
19 | 17,375 | 1,203 | 6.9% |
20 | 12,164 | 847 | 7.0% |
21 | 8,555 | 545 | 6.4% |
22 | 5,026 | 354 | 7.0% |
23 | 3,505 | 244 | 7.0% |
24 | 1,912 | 132 | 6.9% |
25 | 1,398 | 97 | 6.9% |
26 | 1,081 | 77 | 7.1% |
27 | 353 | 16 | 4.5% |
28 | 234 | 20 | 8.5% |
29 | 12 | 1 | 8.3% |
30 | 16 | 2 | 12.5% |
合計 | 828,543 | 58,098 | |
2000年~2019年のJRAレース結果を基準にしています。 | |||
B列 ⇒ この期間のレースに出走した競走馬の数 | |||
C列 ⇒ B列数で出した「出走した競走馬」から勝馬を抽出した。その勝馬の父親を年齢ごとに分布した(種牡馬の重複あり)。 | |||
注意:15万件の競走馬データには名前の決まっていない馬がいます。(例:レディインディの18等)
そのため、99万件のレース結果と合わないデータがあります。結果、B列とC列は本来の数より1割ほど減ってます。 |
上記のデータ構成は父親の個別年代の統計に限定されておりますので、「各年代が一緒に走った場合の優劣」はわかりません。しかし、この深堀りの分析はAIにやらせれば優劣が分かるのではないかと期待して開発したいと思います。
②余談
しかし、興味を引く点もありますね。
父親が28,29、30歳の時の子供の勝率は高いです。特に30歳の父親の子供の勝率が12.5%というのは興味深かったので、どんな父親がいるか調べてみました。
馬名 | 父名 | 誕生時の父年齢 |
アドマイヤレオン | Mr. Prospector | 30 |
ラストリゾート | ノーザンテースト | 29 |
エーシンハーバー | Cozzene | 28 |
ゴテツ | ブライアンズタイム | 28 |
スマートシャレード | ブライアンズタイム | 28 |
ダンジグマスター | Danzig | 28 |
ダンツプリウス | ブライアンズタイム | 28 |
ブリリアントタイム | ブライアンズタイム | 28 |
マイネルビクトリー | ブライアンズタイム | 28 |
ジェイケイライアン | ブライアンズタイム | 27 |
フクノグローリア | ブライアンズタイム | 27 |
マイネルサクセサー | ブライアンズタイム | 27 |
ラディカル | ブライアンズタイム | 27 |
ラブローレル | ブライアンズタイム | 27 |
ララオムドゥクー | ブライアンズタイム | 27 |
ちょっと参考にならないですね( 一一)
全て歴史的種牡馬でございました。
③さらに余談
これも予想に使えないデータですが、リーディング種牡馬クラスの勝率を調べてみました。
誕生時父年齢 | 種牡馬の勝数 | ディープ勝数 | ディープ勝数の比率 | ステゴ勝数 | ステゴ勝数の比率 | キンカメ勝数 | キンカメ勝数の比率 | ハーツ勝数 | ハーツ勝数の比率 | ゴールドアリュール勝数 | ゴールドアリュール勝数の比率 |
4 | 4 | ||||||||||
5 | 1,183 | 205 | 17.3% | ||||||||
6 | 3,578 | 241 | 6.7% | 243 | 6.8% | 72 | 2.0% | ||||
7 | 5,241 | 276 | 5.3% | 213 | 4.1% | 128 | 2.4% | 98 | 1.9% | ||
8 | 5,667 | 207 | 3.7% | 184 | 3.2% | 91 | 1.6% | 49 | 0.9% | ||
9 | 5,608 | 223 | 4.0% | 83 | 1.5% | 129 | 2.3% | 114 | 2.0% | 59 | 1.1% |
10 | 5,532 | 206 | 3.7% | 55 | 1.0% | 245 | 4.4% | 117 | 2.1% | 105 | 1.9% |
11 | 5,099 | 230 | 4.5% | 35 | 0.7% | 225 | 4.4% | 142 | 2.8% | 83 | 1.6% |
12 | 4,886 | 216 | 4.4% | 56 | 1.1% | 179 | 3.7% | 74 | 1.5% | 109 | 2.2% |
13 | 4,215 | 236 | 5.6% | 47 | 1.1% | 99 | 2.3% | 137 | 3.3% | 76 | 1.8% |
14 | 3,798 | 94 | 2.5% | 110 | 2.9% | 84 | 2.2% | 133 | 3.5% | 94 | 2.5% |
15 | 3,460 | 46 | 1.3% | 47 | 1.4% | 49 | 1.4% | 81 | 2.3% | 82 | 2.4% |
16 | 2,720 | 75 | 2.8% | 17 | 0.6% | 22 | 0.8% | 59 | 2.2% | ||
17 | 2,134 | 124 | 5.8% | 69 | 61 | 2.9% | |||||
18 | 1,435 | 121 | 8.4% | 12 | 0.8% | ||||||
19 | 1,203 | 141 | 11.7% | ||||||||
20 | 847 | 132 | 15.6% | ||||||||
21 | 545 | 69 | 12.7% | ||||||||
22 | 354 | ||||||||||
23 | 244 | ||||||||||
24 | 132 | ||||||||||
25 | 97 | ||||||||||
26 | 77 | ||||||||||
27 | 16 | ||||||||||
28 | 20 | ||||||||||
29 | 1 | ||||||||||
30 | 2 | ||||||||||
合計 | 58,098 | 1,975 | 3.4% | 1,095 | 1.9% | 1,941 | 3.3% | 1,039 | 1.8% | 959 | 1.7% |
ディープ、ステゴ、キンカメ、ハーツクライは説明不要ですね。ゴールドアリュールはダート馬代表として抜き出してみました。
ステゴの供用晩年の勝率はすごいですね!19歳以降は勝利10%超えですよ!
キンカメも生涯勝利はディープに肉薄していますね。これもすごいです。
、、、、このデータを見て思ったことがあります。
トップクラスの種牡馬は期間が短いですね。
ディープ10年。ステゴ13年。キンカメ13年、、、
ハーツは来年で11年目ですが、セーブすると思われるので(種付け料はプライベート価格)、もう少し上記3頭よりは長く供用できそうかと、、、
今回は当初の目的と違って、競馬界の現実を見た気がしたデータ分析になりました。
まあ、いずれにしても来年のAIに使うデータ要素は大体決まりましたので、年末年始は開発と検証を行っていきたいと思います。
ではまた!
コメントを残す