論文の概要: ChessMimic: Per-Rating Transformer Models for Human Move, Clock, and Outcome Prediction in Online Blitz Chess
- arxiv url: http://arxiv.org/abs/2606.04473v1
- Date: Wed, 03 Jun 2026 05:42:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.569292
- Title: ChessMimic: Per-Rating Transformer Models for Human Move, Clock, and Outcome Prediction in Online Blitz Chess
- Title(参考訳): ChessMimic:オンラインBlitz Chessにおける人体移動・クロック・アウトカム予測のためのレートトランスフォーマーモデル
- Authors: Thomas Johnson,
- Abstract要約: ChessMimicは、移動、思考時間、結果予測のための3つのエンコーダのみのトランスフォーマーのシステムである。
Lichess Rated Blitzのゲームでは、ChessMimicの人間の動き予測精度はEloの各バンドでMaia-2を上回っている。
公開デモは1e4.aiで、コード、バンド単位の重み付け、C++データフィルタパイプラインコードをGitHubでリリースしています。
- 参考スコア(独自算出の注目度): 0.08460698440162888
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We present ChessMimic, a system of three small encoder-only transformers - for move, thinking-time, and outcome prediction - conditioned on the position, recent move history, player rating, and clock state. We fit a separate instance of each model per 100-Elo rating band, trading parameter efficiency for sharper per-skill calibration. On a held-out month-wide slice of Lichess Rated Blitz games ChessMimic's human move prediction accuracy outperforms Maia-2 in every Elo band. Compared to Maia-3, our 9M parameter model's accuracy sits between Maia-3-5M and Maia-3-23M without the additional complexity of Geometric Attention Bias. In addition to the move matching model, we also train a game outcome model that conditions not only on the position, but also player ratings, time control, and remaining clock times. The outcome model achieves an AUC of 0.78 out of sample, beating Maia-2 as well as logistic regressions based on material, ratings, and clock time. Finally, we train a clock model that predicts human thinking times. The clock model provides a usable but non-SOTA per-ply think-time signal under ALLIE-style filters (Pearson r = 0.41, Spearman rho = 0.50, MAE 4.10 s, against ALLIE's reported r = 0.70), with the residual gap concentrated in per-position bucket sharpness rather than bucket-marginal calibration. A public demo is at 1e4.ai and we release code, per-band weights, and the C++ data-filter pipeline code in GitHub.
- Abstract(参考訳): 本稿では,3つの小さなエンコーダのみのトランスフォーマ – 移動,思考時間,結果予測 – のシステムであるChessMimicについて,その位置,最近の移動履歴,プレーヤ評価,クロック状態について検討する。
我々は100-Eloのレーティングバンドごとにそれぞれのモデルのインスタンスに適合し、よりシャープなスキル単位のキャリブレーションのためのパラメーター効率を取引する。
Lichess Rated Blitzのゲームでは、ChessMimicの人間の動き予測精度はEloの各バンドでMaia-2を上回っている。
Maia-3と比較して、我々の9Mパラメータモデルの精度はMaia-3-5MとMaia-3-23Mの間にある。
また,移動マッチングモデルに加えて,位置だけでなく,プレイヤーの視聴率,時間制御,残時計時間にも配慮したゲーム結果モデルも訓練する。
結果モデルはサンプルから0.78のAUCを達成し、材料、レーティング、時計時間に基づくロジスティック回帰とマイア-2を上回ります。
最後に、人間の思考時間を予測する時計モデルを訓練する。
クロックモデルは、ALIEスタイルのフィルタ(Pearson r = 0.41, Spearman rho = 0.50, MAE 4.10 s, ALLIEの報告したr = 0.70)の下で使用可能なが、非SOTAのシンクタイム信号を提供する。
公開デモは1e4.aiで、コード、バンド単位の重み付け、C++データフィルタパイプラインコードをGitHubでリリースしています。
関連論文リスト
- Chess-World-Model: A 10M-Game Benchmark for Exact State Tracking from Chess Move Sequences [2.7214777196418645]
我々は1000万の実際のチェスゲームから構築された大規模ステートトラッキングベンチマークであるChess-World-Modelを紹介した。
我々は、負の固有値を持つ因果変換器、ブロック対角SLiCE、Mamba-3、Gated DeltaNetをベンチマークする。
リアルゲームのパフォーマンスは1800万以上のパラメータで飽和するが、ランダムな一様分割は最大4000万まで差別的であり、それ以外はスケールによって隠された失敗を露呈する。
論文 参考訳(メタデータ) (2026-05-28T15:43:31Z) - MolmoAct2: Action Reasoning Models for Real-world Deployment [67.6315757474802]
MolmoAct2は、実用的なデプロイメントのために構築された、完全にオープンなアクション推論モデルである。
空間的および具体的推論に特化した VLM バックボーンである MolmoER を紹介する。
低コストプラットフォームにまたがる3つの新しいデータセットをリリースする。
論文 参考訳(メタデータ) (2026-05-04T17:51:21Z) - Tracking vs. Deciding: The Dual-Capability Bottleneck in Searchless Chess Transformers [3.692740024498697]
人間のようなチェスエンジンは、遊びの強さを最大化するのではなく、強い人間のプレーヤーのスタイル、エラー、一貫性を真似るべきである。
移動順序のみからのトレーニングは、ボードを移動履歴から再構築する状態トラッキングと、その再構築された状態から良い動きを選択する決定品質という2つの能力の学習をモデルに強いることを示す。
このテンションを二重能力ボトルネック P = min(T,Q) として定式化し、全体的な性能はより弱い能力によって制限される。
論文 参考訳(メタデータ) (2026-03-31T14:01:39Z) - Moirai 2.0: When Less Is More for Time Series Forecasting [91.36760228926214]
Moirai 2.0は、36Mシリーズの新しいコーパスで訓練されたデコーダのみの基礎モデルである。
これは、精度、速度、モデルサイズの間の強いトレードオフを達成しつつ、事前訓練された上位モデルの1つにランク付けします。
効率性とモデルサイズに関しては、Moirai 2.0は前バージョンであるMoirai 1.0-Largeの2倍の速度と30倍の小型である。
論文 参考訳(メタデータ) (2025-11-12T12:15:35Z) - Chess Rating Estimation from Moves and Clock Times Using a CNN-LSTM [11.340099493701029]
本稿では,ゲームの動きや時計時間から直接プレイヤーの格付けを推定する手法を提案する。
我々のモデルアーキテクチャは、位置特徴を学習するためのCNNで構成されており、時計時間データと統合された双方向LSTMである。
このモデルは、手作りの機能を使わずにチェスのレーティングを推定し、各移動後にレーティング予測を出力した最初のモデルである。
論文 参考訳(メタデータ) (2024-09-17T19:19:16Z) - Efficient Offline Policy Optimization with a Learned Model [83.64779942889916]
MuZero Unpluggedはログデータからオフラインポリシー学習に有望なアプローチを提供する。
MCTS(Monte-Carlo Tree Search)を学習モデルで実行し、Reanalyzeアルゴリズムを利用してオフラインデータから純粋に学習する。
本稿では,オフライン設定下では MuZero Unplugged がうまく動作しないという仮説について検討する。
論文 参考訳(メタデータ) (2022-10-12T07:41:04Z) - Probing Model Signal-Awareness via Prediction-Preserving Input
Minimization [67.62847721118142]
モデルが正しい脆弱性信号を捕捉して予測する能力を評価する。
SAR(Signal-Aware Recall)と呼ばれる新しい指標を用いて,モデルの信号認識を計測する。
その結果,90年代以降のリコールから60年代以降のリコールは,新たな指標で大幅に減少した。
論文 参考訳(メタデータ) (2020-11-25T20:05:23Z) - Learning Zero-Sum Simultaneous-Move Markov Games Using Function
Approximation and Correlated Equilibrium [116.56359444619441]
両プレイヤーのゼロサム有限ホライゾンマルコフゲームに対する効率の良い強化学習アルゴリズムを開発した。
オフライン環境では、両プレイヤーを制御し、双対性ギャップを最小化してナッシュ平衡を求める。
オンライン環境では、任意の相手と対戦する1人のプレイヤーを制御し、後悔を最小限に抑える。
論文 参考訳(メタデータ) (2020-02-17T17:04:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。