論文の概要: Learning Models of Individual Behavior in Chess
- arxiv url: http://arxiv.org/abs/2008.10086v3
- Date: Wed, 15 Jun 2022 21:44:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-26 02:55:26.139280
- Title: Learning Models of Individual Behavior in Chess
- Title(参考訳): チェスにおける個人行動の学習モデル
- Authors: Reid McIlroy-Young, Russell Wang, Siddhartha Sen, Jon Kleinberg,
Ashton Anderson
- Abstract要約: チェスにおける個人行動の高精度な予測モデルを構築した。
私たちの研究は、AIシステムを個人の行動とよりよく一致させる方法を示しています。
- 参考スコア(独自算出の注目度): 4.793072503820555
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: AI systems that can capture human-like behavior are becoming increasingly
useful in situations where humans may want to learn from these systems,
collaborate with them, or engage with them as partners for an extended
duration. In order to develop human-oriented AI systems, the problem of
predicting human actions -- as opposed to predicting optimal actions -- has
received considerable attention. Existing work has focused on capturing human
behavior in an aggregate sense, which potentially limits the benefit any
particular individual could gain from interaction with these systems. We extend
this line of work by developing highly accurate predictive models of individual
human behavior in chess. Chess is a rich domain for exploring human-AI
interaction because it combines a unique set of properties: AI systems achieved
superhuman performance many years ago, and yet humans still interact with them
closely, both as opponents and as preparation tools, and there is an enormous
corpus of recorded data on individual player games. Starting with Maia, an
open-source version of AlphaZero trained on a population of human players, we
demonstrate that we can significantly improve prediction accuracy of a
particular player's moves by applying a series of fine-tuning methods.
Furthermore, our personalized models can be used to perform stylometry --
predicting who made a given set of moves -- indicating that they capture human
decision-making at an individual level. Our work demonstrates a way to bring AI
systems into better alignment with the behavior of individual people, which
could lead to large improvements in human-AI interaction.
- Abstract(参考訳): 人間の振る舞いを捉えるaiシステムは、人間がこれらのシステムから学び、協力し、長期にわたってパートナーとして関与したいという状況で、ますます有用になりつつある。
人間指向AIシステムを開発するために、最適な行動を予測するのとは対照的に、人間の行動を予測するという問題が注目されている。
既存の研究は、人間の行動を総合的に捉えることに焦点を当てており、特定の個人がシステムとのインタラクションから得られる利益を制限する可能性がある。
チェスにおける個々の人間の行動の高精度な予測モデルを開発することにより,この作業ラインを拡大する。
AIシステムは何年も前に超人的パフォーマンスを達成したが、それでも人間は対戦相手と準備ツールの両方として、密接な相互作用をしており、個々のプレイヤーゲームに記録された膨大なコーパスがある。
人間のプレイヤーを訓練したAlphaZeroのオープンソース版であるMaiaを皮切りに、一連の微調整手法を適用して、特定のプレイヤーの動きの予測精度を大幅に向上できることを示した。
さらに、私たちのパーソナライズされたモデルは、スタイメトリー(与えられた動きのセットを予測した人)を実行するために使用できます。
我々の研究は、AIシステムを個人の行動により良い整合性を持たせる方法を示しており、それによって人間とAIのインタラクションが大幅に改善される可能性がある。
関連論文リスト
- Maia-2: A Unified Model for Human-AI Alignment in Chess [10.577896749797485]
チェスにおける人間-AIアライメントのための統一モデリング手法を提案する。
プレイヤーの強みをエンコードしたチェス位置と動的に統合する,スキルアウェアアテンション機構を導入する。
我々の結果は、人間の意思決定とAIによる指導ツールに関する深い洞察を得るための道を開いた。
論文 参考訳(メタデータ) (2024-09-30T17:54:23Z) - Explainable Human-AI Interaction: A Planning Perspective [32.477369282996385]
AIシステムは、ループ内の人間に説明可能である必要がある。
我々は、AIエージェントがメンタルモデルを使用して人間の期待に沿うか、あるいは説明的コミュニケーションを通じて期待を変更する方法について論じる。
本書の主な焦点は、協調的なシナリオであるが、同じ精神モデルが難読化や偽造にどのように使用できるかを指摘したい。
論文 参考訳(メタデータ) (2024-05-19T22:22:21Z) - SACSoN: Scalable Autonomous Control for Social Navigation [62.59274275261392]
我々は、社会的に邪魔にならないナビゲーションのための政策の訓練方法を開発した。
この反事実的摂動を最小化することにより、共有空間における人間の自然な振る舞いを変えない方法でロボットに行動を促すことができる。
屋内移動ロボットが人間の傍観者と対話する大規模なデータセットを収集する。
論文 参考訳(メタデータ) (2023-06-02T19:07:52Z) - Learning to Influence Human Behavior with Offline Reinforcement Learning [70.7884839812069]
人間の準最適性を捉える必要があるような環境での影響に焦点を当てる。
人間によるオンライン実験は安全ではない可能性があり、環境の高忠実度シミュレータを作成することは現実的ではないことが多い。
オフライン強化学習は、観察された人間・人間の行動の要素を拡張し、組み合わせることで、人間に効果的に影響を及ぼすことができることを示す。
論文 参考訳(メタデータ) (2023-03-03T23:41:55Z) - HERD: Continuous Human-to-Robot Evolution for Learning from Human
Demonstration [57.045140028275036]
本研究では,マイクロ進化的強化学習を用いて,操作スキルを人間からロボットに伝達可能であることを示す。
本稿では,ロボットの進化経路とポリシーを協調的に最適化する多次元進化経路探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-08T15:56:13Z) - Detecting Individual Decision-Making Style: Exploring Behavioral
Stylometry in Chess [4.793072503820555]
チェスの文脈における行動スタイメトリーに対するトランスフォーマーに基づくアプローチを提案する。
本手法は,数発の分類フレームワークで動作し,数千人の候補選手の中から選手を正確に識別することができる。
我々は、チェスにおける人間のスタイルと潜在的な倫理的意味について、結果の埋め込みが明らかにするものをより広く検討する。
論文 参考訳(メタデータ) (2022-08-02T11:18:16Z) - Role of Human-AI Interaction in Selective Prediction [20.11364033416315]
我々は、AIシステムの遅延決定について、異なる種類の情報を人間に伝達する影響について研究する。
我々は,AIの予測は明らかにせず,遅延する決定を人間に伝えることで,人間のパフォーマンスを大幅に向上させることが可能であることを示す。
論文 参考訳(メタデータ) (2021-12-13T16:03:13Z) - Aligning Superhuman AI with Human Behavior: Chess as a Model System [5.236087378443016]
我々は、人間のチェスゲームで訓練されたAlpha-Zeroのカスタマイズ版であるMaiaを開発し、既存のエンジンよりもはるかに高い精度で人間の動きを予測する。
人間が次の動きで大きな間違いを犯すかどうかを予測する2つのタスクに対して、我々は、競争ベースラインを大幅に上回るディープニューラルネットワークを開発する。
論文 参考訳(メタデータ) (2020-06-02T18:12:52Z) - Learning to Complement Humans [67.38348247794949]
オープンワールドにおけるAIに対するビジョンの高まりは、知覚、診断、推論タスクのために人間を補完できるシステムの開発に焦点を当てている。
我々は,人間-機械チームの複合的なパフォーマンスを最適化するために,エンド・ツー・エンドの学習戦略をどのように活用できるかを実証する。
論文 参考訳(メタデータ) (2020-05-01T20:00:23Z) - Is the Most Accurate AI the Best Teammate? Optimizing AI for Teamwork [54.309495231017344]
AIシステムは人間中心の方法でトレーニングされ、チームのパフォーマンスに直接最適化されるべきである、と私たちは主張する。
我々は,AIレコメンデーションを受け入れるか,あるいはタスク自体を解決するかを選択する,特定のタイプのAIチームを提案する。
実世界の高精度データセット上での線形モデルと非線形モデルによる実験は、AIが最も正確であることは、最高のチームパフォーマンスに繋がらないことを示している。
論文 参考訳(メタデータ) (2020-04-27T19:06:28Z) - Joint Inference of States, Robot Knowledge, and Human (False-)Beliefs [90.20235972293801]
本稿では,人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)の認知能力が,ロボットとの相互作用にどのように影響するかを理解するために,対象状態,ロボット知識,人間(時間的)の認知能力の表現にグラフィカルモデルを採用することを提案する。
推論アルゴリズムは、複数のビューにまたがる全てのロボットから個別のpgを融合し、単一のビューから発生したエラーを克服するより効果的な推論能力を得る。
論文 参考訳(メタデータ) (2020-04-25T23:02:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。