論文の概要: Learning to Imitate with Less: Efficient Individual Behavior Modeling in Chess
- arxiv url: http://arxiv.org/abs/2507.21488v1
- Date: Tue, 29 Jul 2025 04:09:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-30 17:08:55.655159
- Title: Learning to Imitate with Less: Efficient Individual Behavior Modeling in Chess
- Title(参考訳): 省エネを学べる:チェスにおける効率的な個人行動モデリング
- Authors: Zhenwei Tang, Difan Jiao, Eric Xue, Reid McIlroy-Young, Jon Kleinberg, Siddhartha Sen, Ashton Anderson,
- Abstract要約: Maia4Allは、個々の意思決定スタイルを効率的に学習し、適応するように設計されたフレームワークである。
Maia4Allはチェスの個人的行動モデリングを20ゲームで達成している。
- 参考スコア(独自算出の注目度): 10.090379544417432
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As humans seek to collaborate with, learn from, and better understand artificial intelligence systems, developing AIs that can accurately emulate individual decision-making becomes increasingly important. Chess, a long-standing AI benchmark with precise skill measurement, offers an ideal testbed for human-AI alignment. However, existing approaches to modeling human behavior require prohibitively large amounts of data from each individual, making them impractical for new or sparsely represented users. In this work, we introduce Maia4All, a framework designed to learn and adapt to individual decision-making styles efficiently, even with limited data. Maia4All achieves this through a two-stage optimization process: (1) an enrichment step, which bridges population and individual-level human behavior modeling with a prototype-enriched model, and (2) a democratization step, which leverages ability levels or user prototypes to initialize and refine individual embeddings with minimal data. Our experimental results show that Maia4All can accurately predict individual moves and profile behavioral patterns with high fidelity, establishing a new standard for personalized human-like AI behavior modeling in chess. Maia4All achieves individual human behavior modeling in chess with only 20 games, compared to the 5,000 games required previously, representing a significant improvement in data efficiency. Our work provides an example of how population AI systems can flexibly adapt to individual users using a prototype-enriched model as a bridge. This approach extends beyond chess, as shown in our case study on idiosyncratic LLMs, highlighting its potential for broader applications in personalized AI adaptation.
- Abstract(参考訳): 人間が人工知能システムと連携し、学び、より理解しようとすると、個々の意思決定を正確にエミュレートできるAIの開発がますます重要になる。
Chessは、正確なスキル測定を備えた長年のAIベンチマークであり、人間とAIのアライメントに理想的なテストベッドを提供する。
しかしながら、人間の振る舞いをモデル化する既存のアプローチでは、個々の個人からの大量のデータを必要とするため、新規ユーザや疎結合ユーザに対しては実用的ではない。
本研究では,限られたデータであっても,個々の意思決定スタイルを効率的に学習し,適応するためのフレームワークであるMaia4Allを紹介する。
Maia4Allは、(1)人口と個人レベルの人間行動モデリングをプロトタイプでブリッジする豊か化ステップ、(2)個人埋め込みを最小限のデータで初期化・洗練するために能力レベルやユーザプロトタイプを活用する民主化ステップという2段階の最適化プロセスによってこれを達成している。
実験結果から,Maia4Allは個々の動きや行動パターンを高い忠実度で正確に予測し,チェスにおけるパーソナライズされた人間ライクなAI行動モデリングのための新しい標準を確立した。
Maia4Allは、以前必要としていた5000のゲームと比較して、チェスの個々の人間の振る舞いモデリングをわずか20ゲームで達成し、データ効率が大幅に向上した。
私たちの研究は、プロトタイプに富んだモデルをブリッジとして使用することで、人口AIシステムが個々のユーザに対して柔軟に適応する方法の例を提供します。
このアプローチはチェス以外にも拡張されており、このケーススタディで示されているように、パーソナライズされたAI適応における幅広い応用の可能性を強調している。
関連論文リスト
- Is Diversity All You Need for Scalable Robotic Manipulation? [50.747150672933316]
ロボット学習におけるデータ多様性の役割について,従来の「より多様な方がよい」という直観に固執する3つの重要な次元(タスク),実施形態(ロボットの使用方法),専門家(専門家)を用いて検討する。
タスクの多様性は、タスクごとのデモンストレーション量よりも重要であり、多様な事前学習タスクから新しい下流シナリオへの移行に有効であることを示す。
本稿では,速度のあいまいさを緩和する分散デバイアス法を提案する。GO-1-Proは,2.5倍の事前学習データを用いて,15%の性能向上を実現している。
論文 参考訳(メタデータ) (2025-07-08T17:52:44Z) - Maia-2: A Unified Model for Human-AI Alignment in Chess [10.577896749797485]
チェスにおける人間-AIアライメントのための統一モデリング手法を提案する。
プレイヤーの強みをエンコードしたチェス位置と動的に統合する,スキルアウェアアテンション機構を導入する。
我々の結果は、人間の意思決定とAIによる指導ツールに関する深い洞察を得るための道を開いた。
論文 参考訳(メタデータ) (2024-09-30T17:54:23Z) - Transferring Foundation Models for Generalizable Robotic Manipulation [82.12754319808197]
インターネット規模の基盤モデルによって生成された言語推論セグメンテーションマスクを効果的に活用する新しいパラダイムを提案する。
提案手法は,オブジェクトのポーズを効果的かつ堅牢に知覚し,サンプル効率のよい一般化学習を可能にする。
デモは提出されたビデオで見ることができ、より包括的なデモはlink1またはlink2で見ることができます。
論文 参考訳(メタデータ) (2023-06-09T07:22:12Z) - Detecting Individual Decision-Making Style: Exploring Behavioral
Stylometry in Chess [4.793072503820555]
チェスの文脈における行動スタイメトリーに対するトランスフォーマーに基づくアプローチを提案する。
本手法は,数発の分類フレームワークで動作し,数千人の候補選手の中から選手を正確に識別することができる。
我々は、チェスにおける人間のスタイルと潜在的な倫理的意味について、結果の埋め込みが明らかにするものをより広く検討する。
論文 参考訳(メタデータ) (2022-08-02T11:18:16Z) - Skill Preferences: Learning to Extract and Execute Robotic Skills from
Human Feedback [82.96694147237113]
Skill Preferencesは、人間の好みよりもモデルを学習し、オフラインデータから人間に沿ったスキルを抽出するアルゴリズムである。
SkiPは複雑なマルチステップ操作タスクをシミュレートしたキッチンロボットで実現できることを示す。
論文 参考訳(メタデータ) (2021-08-11T18:04:08Z) - Learning Models of Individual Behavior in Chess [4.793072503820555]
チェスにおける個人行動の高精度な予測モデルを構築した。
私たちの研究は、AIシステムを個人の行動とよりよく一致させる方法を示しています。
論文 参考訳(メタデータ) (2020-08-23T18:24:21Z) - Aligning Superhuman AI with Human Behavior: Chess as a Model System [5.236087378443016]
我々は、人間のチェスゲームで訓練されたAlpha-Zeroのカスタマイズ版であるMaiaを開発し、既存のエンジンよりもはるかに高い精度で人間の動きを予測する。
人間が次の動きで大きな間違いを犯すかどうかを予測する2つのタスクに対して、我々は、競争ベースラインを大幅に上回るディープニューラルネットワークを開発する。
論文 参考訳(メタデータ) (2020-06-02T18:12:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。