こんにちは、鹿児島弁で「がんばる・兄さん」ことハメッケ・アイアンです。
2020年の競馬が佳境にはいってきました。JCでは夢の対決が実現して激アツな週末になりますね!
さて当ブログではそろそろ来年のAI開発に向けて有効なデータ項目を探しております。競走馬の母親の年齢をAI(統計)に分析させたいと思っております。
このような文献もあるので調べている人は多いかと思います。
本ブログを読んでいただいている貴方も調べてことがあるかもしれません。なんとなく競走馬は生まれた時の親の年齢が関係があるような気がしますよね。
そこで以下の項目を年末までに調べてみようと思います。
①母親の年齢
②母親の成績
③父親の年齢
父親の成績は調べる必要はないと判断しておりますので、上記3項目に絞ります(父親は優秀な成績だったからそ種牡馬になったわけですから)。
今回は上記、①競走馬の母親年齢を調べてみます。
結果を先に言いますと、「相関がありそうなので来年のハメッケAIに組み込む」ことにしました。あとは②と③は別途しらべてみます。結果がでたらまたアップします。
では行ってみましょう。
1.データ構成
①0歳~20歳の競走馬をターゲットJVで抜き出します → 152,009頭いました
②その152,009頭の母親の年齢をグラフにします → 以下で説明していきます
①出産数をグラフ化
子(競走馬)の年齢が0~18までありますが、これは彼らが生きていればの年齢になります。
どちらかというと彼らの年齢というよりは生産年で理解していください。
対比は以下の通りです。
0歳 → 2020年生まれ
1歳 → 2019年生まれ
2歳 → 2018年生まれ
3歳 → 2017年生まれ
4歳 → 2016年生まれ
5歳 → 2015年生まれ
6歳 → 2014年生まれ
7歳 → 2013年生まれ
8歳 → 2012年生まれ
9歳 → 2011年生まれ
10歳 → 2010年生まれ
11歳 → 2009年生まれ
12歳 → 2008年生まれ
13歳 → 2007年生まれ
14歳 → 2006年生まれ
15歳 → 2005年生まれ
16歳 → 2004年生まれ
17歳 → 2003年生まれ
18歳 → 2001年生まれ
19歳 → 2000年生まれ
20歳 → 1999年生まれ

出産数が600頭を超えている、母親年齢の範囲:6歳~13歳
このグラフの形。予想通りでした(60度の三角定規の形ですね)
上記グラフから勝馬を抽出していきます。その抽出したグラフが「60度三角定規」の形を維持していれば、AIに使えるデータになりそうです(特異点の多いデータはAIと相性が悪いです)
②重賞勝ち馬の母親の年齢帯

まあ、60度三角定規の形ですね。
③重賞未満レース勝ち馬の母親の年齢帯
重賞勝ち馬は限られた馬ですから、AI(統計)に使うには数がすくないですから重賞をのぞいてみました。

出産数グラフに対して、ちょっと頂点を中心に形が鋭角的になりましたね。7歳~9歳の子の勝が多くなるという傾向になっています。しかしAIデータには使えそうです。
④1勝(500万)~3勝(1600万)クラスレース勝馬の母親の年齢帯
上記③のグラフから新馬戦と未勝利戦、オープン戦を除外いたしました。

こちらも形は③のグラフとほぼ同じですね。
2.結論
母親の年齢帯ごとの出産数はAIに使えるか?という観点でデータを見てみました。結果として「使える」と判断いたします。
ハメッケAI2021には組み込む予定といたします。
あと「母親の成績」、「父親の年齢」について調べてみようと思います。その結果は年内中にアップいたします。
ではまた!
コメントを残す