明けましておめでとうございます。 今年は久方振りに帰省してたくさんパワーを貰いました。改修された護衛艦かがも見て大満足。 競馬AIは昨年後半から地方競馬の自動購入調整でかなりの手ごたえを得たので今年は中央競馬も躍進させたいと思います。 呉駅前
ゆま牧場さん絡みの締切オッズの低下がかなり酷いことになっているので3分前購入等を検討するための予備調査。 オッズ低下が顕著な昨日のレースから2Rをピ…
自作の競馬予想AIのレース予測を公開しています。 直前情報ははるかさんのTwitter@haruka_umajouからどうぞ。 小倉10R
自作の競馬予想AIのレース予測を公開しています。 前半あまりにも張らないので少し基準金額算出時に使っている基準バンクロール金額を下げた。これでもう少し金額を張るようになるので様子見だ。 はるかさんのTwitter
今週は開催・券種別の金額配分を色々と調整してみた結果・・・複利運用の神髄というか真理っぽいのが段々と見えてきた気がする。 結局のところ、期待値が取れる(=傾斜配分で金額を大きく張る)レースにぶち当たるまで如何に種銭を減らさないようにするか(或いは少しでも増やすか)がこのゲームの鍵だ。 これは、どんなギャンブルに於いても或いは金融の世界でも本質的には全く同じだ…
本日から実際の購入馬券も複利で運用する試験を開始したので初日の結果を記録しておく。初めての複利運用なのでなるべく大量に張らないように、ベースとなる基本バンクロール金額は50万円で、開始バンクロールは37万円としてみた。というわけで本日開始時のバンクロールレートは0.74ほど。なお開催券種別に設定しているベース金額は基本バンクロール100万円を想定してセッティングしてい…
自作の競馬予想AIのレース予測を公開しています。 11月1日以降の短期で複利運用のシミュレーションをおこなった結果、概ね目標月利は達成できているので、本日から実馬券購入スクリプト側もバンクロール+複利対応をおこないデバッグに入っている。 まだ少し怖いので初期バンクロール50万の現在バンクロール35万くらいにしておいて、1日の投資回転数を0.5回…
自作の競馬予想AIのレース予測を公開しています。 とりあえず購入シミュレータにバンクロールと複利運用の対応を組み込み完了。複利になった途端、券種配分の調整がかなり難しい。的中率の高い券種でハマリを耐えて三連複三連単で回収というスタイルになっているようでたとえ回収率が悪い券種でも的中率が高い場合は、切ったり極端に減らすことができない。…
ちょっと本日まで保守と調査作業で忙しいので、バンクロール対応の予備調査までにしておく。多分実装自体は半日も掛からないと思うので明日以降実装する予定。 購入馬券リストへの馬券データセット部分単勝の例bet = { 'kumi':str(int(axis['horse_num_cd'])), 'kumi_code':int(axis['horse_num_cd']), 'buy_rate':buyRate, 'buy_count':boostBu…
試験運用向けの馬券フィルター微調整がほぼ完了した。 今回の調整の主眼点と方向性�@成績が悪くなった11月以降のフォワードテスト結果
馬券フィルター調整後の中央競馬初節は2日ともプラスで終了。 今日は終日、地方�@の馬単三連単をオフにしていたし昨日のプラス分もあるので、バンクロール1回転には少し足りなかったが馬券1点あたりの的中率は1.7% 回収率は115%で終了。中央の下げ局面がかなり厳しかったが、中山9Rで三連単も含めて大きい馬券を当てて何とかプラスになった感じだ。 現在の…
自作の競馬予想AIのレース予測を公開しています。 今日は軸2-3着が多くハマリも結構きついが馬券フィルターもうまく機能しているので割と気楽に観戦。今日の予測はギリギリで採取してみた。 はるかさんのTwitter
DBメンテナンスをおこない馬券フィルターを11月以降のフォワードテスト結果で再調整した。再調整後の中央競馬初日なので自動購入の試験運用結果を記録しておく…
自作の競馬予想AIのレース予測を公開しています。今日は馬券フィルターを11月1日以降分の結果を元に調整したので1日かけて調整しながら候補と買い目のデバッグ。 多分この時間だとまだ最終的な候補が拾えていない。直前レースの候補馬や予測値を見たい方ははるかさんのTwitter…
馬券フィルターの自動生成について、関連しそうなところを調査して資料メモを作成した。 イメージとして一番近いのは、カーネル密度推定。ここのfprop関数を見ると
DBメンテをおこなって初日の結果。 ファンダ君回収型 model count order1 order2 order3 order4 pay_…
朝5時くらいから開始して、ようやくDBメンテナンス作業完了。なんと去年の4月にメンテして以来だった(汗 差分データをダウンロードして、メンテナンススクリプト実行。2021年以降のタイム集計データもすべて作りなおし用SQLを実行。 これで、問題なく過去履歴の着順が表示され、特徴量の過去走で使っているタイム関連の統計データも正しくとれるようになる。 …
どうも今月の成績が思わしくないので調査した。 中央競馬のLamdaRankランク1位馬と2位馬の単勝的中率/回収率を検索2021年8月 ランク1位 的中率22.92% 回収率96.32% ランク2位 的中率18.66% 回収率108.59%2021年9月 ランク1位 的中率18.88% 回収率96.09% ランク2位 的中率18.80% 回収率122.86%
自作の競馬予想AIのレース予測を公開しています。 出走5分前で候補が変わる場合があるので、はるかさんの直前Tweetをご確認ください。 直前レースの候補馬や予測値を見たい方ははるかさんのTwitter
三連複の傾斜配分のみ、均等買いよりも回収率が悪くなっていたので、三連複のみ旧式版の傾斜配分アルゴリズムに戻した。 購入シミュレーション結果※三連複のみ抽出モデル平均点数対象レース的中レース
自作の競馬予想AIのレース予測を公開しています。 フィルター調整をおこなったおかげで今のところ下振れ耐性付いてうまく耐えている感じだ。ただしあまり三連単を買わなくなったので取りこぼしてるケースも多いようだ。三連単の制限は、様子をみつつ徐々に解除していきたい。 直前レースの候補馬や予測値を見たい方ははるかさ…
三連休1日目の自動購入自体は特に問題は出ていないが、三連複三連単を多く買うレースが連続して外れるとキツい。試験運用中はもう少し控えて下げ耐性を強化するよう調整した。この三連休はまだ自動購入のデバッグ中なのでバンクロール予算はあまり入れてないが、中央競馬の目標回転数は1日2開催でバンクロール1周。 ●中央競馬10R以降の候補(軸相手)フィルターの調整
自作の競馬予想AIのレース予測を公開しています。 分析結果を鑑みて、本日から暫くは、中央競馬では10R以降の候補を絞ることにした。 中央競馬の自動購入は特に問題なさそうだが、穴狙いにドバっと賭けてしまうのでもう少し調整したいところではある。 直前レースの候補馬や予測値を見たい方ははるかさんのTwitt…
三連休三開催を見据えて、候補馬(軸相手)フィルター・馬券フィルターを調整したので、開発資料に残しておく。購入シミュレーションと馬券フィルターの調整は、ものすごく時間がかかる作業なので、何とか自動的に馬券フィルターが作成されるほうが望ましい。せめてバブルチャート表示でもあれば楽なので、これ用の中間集計テーブルを設計する予定である。多分この中間集計テーブルを使うと自動馬券フ…
自作の競馬予想AIのレース予測を公開しています。 中央競馬の自動購入デバッグ中。特に問題なく淡々と自動購入されているのは良いものの、現時点でボロ負け(汗三連単の点数調整したつもりがスルーになっていて特に三連単買いすぎているようなので少しまた調整しなくちゃいけない。後半頑張ってほしい。 直前レースの候補馬や予測値を見た…
正月期間の自動購入デバッグは完了したので、改めて選択馬・馬券フィルターを再調整しなおしてから地方競馬に関しては試験運用を開始した。※中央競馬は1月5日の金杯日に最終デバッグをおこなう。 朝イチ1Rから自動購入をセットして終日完全に放置プレイしてみた。 なお現時点の開催・券種別のベース金額は適当に設定した固定値で、どの馬券も単なる回収率スケーリング(もちろん高オッ…
JRA-即PATについても、1月3日の地方競馬即PATによる自動購入デバッグ及び修正対応で特に問題はなくなったので、最後の投票完了処理について記載する。 �@投票実行部修正中央・地方はここで判定しisLocalIpatで渡すよう修正。1回の投票最大点数(中央255点/地方50件)は予めブロックに分割されていて次のブ…
SPAT投票スクリプトが完成し、自動購入デバッグも問題なかったので、最後の投票完了処理について記載する。競馬AIが購入する馬券は、結合馬券はなく常に1枚につき1点なので突合処理は省いた。単に購入できた馬券のみをMongoDB側へ保存してから、指定ユーザの購入金額や購入点数を加減算すればよい。 �@Spat4Mgr.js最終版
レース更新バッチから自動購入スクリプトを呼び出す部分を組み込んで園田4Rから自動馬券購入を開始した。稼働開始の祝杯をあげつつログと購入履歴を眺めていたのだが、ここで問題発生。 SPAT4を使う場合は1度に馬券が120件を超えている場合に、馬券を分割して購入するのだが色々おかしい。 初回目は、SPAT4マネージャが保持している投票完了リストをクリアするのを忘れていて120件超過…
本年も競馬AI開発に邁進していく所存なり。 1年の計は元旦にあるというので、元旦早起きして競馬システム側のMongoDB(5.05)移行作業をおこなった。 まずは、MavenのPOMの依存環境でMongoDB Java Driverを最新のものにする。最新ドライバではcoreとdriverとに分かれているようだ。<dependency> <groupId>org.mongodb<…
「ブログリーダー」を活用して、平場長さんをフォローしませんか?
明けましておめでとうございます。 今年は久方振りに帰省してたくさんパワーを貰いました。改修された護衛艦かがも見て大満足。 競馬AIは昨年後半から地方競馬の自動購入調整でかなりの手ごたえを得たので今年は中央競馬も躍進させたいと思います。 呉駅前
新年、明けましておめでとうございます。 年末まで仕事に時間を奪われて結局、競馬AIの開発進捗は進まず。12月の中山・阪神・中京開催とも中央の成績は良かったが地方競馬でかなり負けているので、この元旦休みのうちにシーズン2の準備を進めておきたい。 �@新規AI環境の構築 特徴量テーブルの改修とグループ分け 着率算出のために、出走馬2値分類…
世の中、競馬AIの開発ブログ記事は沢山あるわけで、中には自称回収率100%超えたというものもあるが、ほとんどの記事は実戦では全く役に立たないので、良く散見される間違いであろう点を簡単にまとめてみた。 �@特徴量のリーク ・最終オッズや最終人気を当該レースの特徴量としてしまっている。 →最終オッズや最終人気は投票締切以前には分からないので当該レース…
相当今更なんだが、LamdaRankで予測した結果値はデフォルト設定ではラベル毎に指数関数的なゲインが付いていることを知った(汗 ランキングxに対してのデフォルトゲインは2^x-1(0,1,3,7,15,31,63...) 道理で数値そのものの相関が低いはずだ。label_gainパラメータで設定できるので、恣意的にするこ…
ここ2週間ほど、開催別の購入数・配分の最適化に血道を上げているのであるが、ここに至ってようやくほぼ完全に理解した。 過去のシミュレーションにおいてフィルターやAIを駆使することで回収率を上げたり、何らかのルールを用いてレースを絞ることで回収率を上げたりする行為は、単に結果が分かっている事象の確率の下振れを避けて、上振れだけを掬い取っているだけという事。 未来の実戦では、下…
昨シーズンでは、購入シミュレーションの結果による推定期待値を重視して実戦に励んだ結果シミュレーション通りに行く開催もあれば、まったく達しない開催もあり(達しない方が多い)この矛盾に終始悩まされ続けたわけである。 色々理由はあると思うがそもそも期待値というのは 推定勝率×実オッズ なわけで、しょせんどちらも打率…
過去1年分予測結果の分析を終え、次期バージョンの開発方針がまとまってきたのでメモしておく。単なるメモだが重要な事柄が含まれているので競馬AI開発資料カテゴリにしておく。 シーズン1総括Lamdarankの予測順そのものと結果(目的変数)は相関性が高い。Lamdarankの予測値の大小そのものと結果(目的変数)は少し相関性が低い。
今週から中央競馬は秋競馬で、中山・中京開催が始まる。去年はバックテスト以外の裏付けも持たず、この2開催で爆死してしまったので、今年はリベンジしたいところだ。 1年分のフォワードテスト結果を使った購入シミュレーションで中山・中京でも回収率100%を超えるように、馬券フィルターを調整した。今週は三連単無しの設定で、ある程度回収率を維持できるように調整していく予定。
8月末日をもって競馬AI開発のシーズン1は終了。9月からシーズン2に入ることにする。 去年の8月1日から特徴量追加や学習パラメータ調整等で予測モデルをアップデートしたくなるのをずっと我慢して、完全同一モデルでのフォワードテストデータ1年分が蓄積できた。このフォワードテストデータを使った購入シミュレーションで、モデル・競馬場・券種等の分析をおこない、購入馬券フィルター…
長らく無料のデータ取得アプリを使ってきたのだが、速報系の更新が途絶えたりそもそも更新が始まらなかったり、レース結果が反映されなかったりで、一度おかしくなると、PCを再起動しない限りは正常動作しないなどの大きな不具合が目に余るようになってきた。 メモリ関係でいろいろ問題を抱えているにもかかわらず、作者さんは更新する気もなさそうなので、思い切って別のデータ取得アプリにリプレースすること…
7月末日、競馬AI業界に激震が走った。 なんとゆま牧場さんが8月末で予測公開を終了するとの事。→
今週は、若手に環境構築方法を細かく教えながら新サーバの構築を予定通り完了した。 Postgres12PHP7.4Python3.9OpenJDK11/17Tomcat9Apache2.4Maven3Gitbucket GitbucketはPostgreSQLを使うよう設定してもらった。長らく社内のバージョン管理システムはSVNだったので時代遅れだったが、今後は…
誰も使わなくなったデスクトップPCが社内に転がっていたので、主DBサーバにして現行の環境を移行することにした。 5-6年前のPCなのでスペックは古いが社内サーバ用途には充分であろう。 CPUIntel(R) Core(TM) i7-4790 CPU @ 3.60GHzGPUGeForce GTX 1060 6GBメモリ32GB 1TBのHDDを買ってきて、Ubuntu 20.04.1 LTSを…
新しい投資配分方式を導入したのだが、期待配当をバンクロール×N%で適当な決め打ちで算出しているのと、回収率から算出する金額もベース金額を100円としているので単利モードの1Rあたりの平均投資金額がバンクロールの0.5%~1%程度となっていて少ない気がする。 複利における最適な投資金額の割合はケリー基準か…
某掲示板の情報に触発されて、新しい投資配分方式を2日間掛けて実装&シミュレーションしてみた。 これまでの自動購入では回収率による傾斜配分のみだったが、バンクロール×N%を期待配当として均等配当配分の要素を取り入れてみた。期待配当は候補馬のパターンによってもレート変動させるが基本は均等配当配分計算の流れ。この新ルーチンの算出した投資金額と、これまで…
レース予測・投資運用結果の記事については 2022年3月26日から『競馬AI育成ブログ』にて配信します。
競馬AI育成ブログはこちら
自作の競馬予想AIのレース予測を公開しています。 先日の地震の影響によるシステムトラブルでこっちにお鉢が回ってきそう(汗特別割り増し料金取るぜよ。 10分前予測情報ははるかさんのTwitter
自作の競馬予想AIのレース予測を公開しています。 10分前予測情報ははるかさんのTwitter@haruka_umajouからどうぞ。
自作の競馬予想AIのレース予測を公開しています。 今週は主に南関東競馬のAIを回収型から的中型へ変更する作業をおこなった。※明らかに的中型と回収型とでランキング1-2位馬の成績に差異が出てきたので変更することにした。 残りの開発案件は本番デプロイを完了しあとはドキュメント整備を残すのみ。これで来週から競馬のほうに専念できるはず…
新年、明けましておめでとうございます。 年末まで仕事に時間を奪われて結局、競馬AIの開発進捗は進まず。12月の中山・阪神・中京開催とも中央の成績は良かったが地方競馬でかなり負けているので、この元旦休みのうちにシーズン2の準備を進めておきたい。 �@新規AI環境の構築 特徴量テーブルの改修とグループ分け 着率算出のために、出走馬2値分類…
世の中、競馬AIの開発ブログ記事は沢山あるわけで、中には自称回収率100%超えたというものもあるが、ほとんどの記事は実戦では全く役に立たないので、良く散見される間違いであろう点を簡単にまとめてみた。 �@特徴量のリーク ・最終オッズや最終人気を当該レースの特徴量としてしまっている。 →最終オッズや最終人気は投票締切以前には分からないので当該レース…
相当今更なんだが、LamdaRankで予測した結果値はデフォルト設定ではラベル毎に指数関数的なゲインが付いていることを知った(汗 ランキングxに対してのデフォルトゲインは2^x-1(0,1,3,7,15,31,63...) 道理で数値そのものの相関が低いはずだ。label_gainパラメータで設定できるので、恣意的にするこ…