論文の概要: Aligning Superhuman AI with Human Behavior: Chess as a Model System
- arxiv url: http://arxiv.org/abs/2006.01855v3
- Date: Tue, 14 Jul 2020 17:57:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-25 23:43:39.402560
- Title: Aligning Superhuman AI with Human Behavior: Chess as a Model System
- Title(参考訳): 人間行動を持つ超人的AI:モデルシステムとしてのチェス
- Authors: Reid McIlroy-Young and Siddhartha Sen and Jon Kleinberg and Ashton
Anderson
- Abstract要約: 我々は、人間のチェスゲームで訓練されたAlpha-Zeroのカスタマイズ版であるMaiaを開発し、既存のエンジンよりもはるかに高い精度で人間の動きを予測する。
人間が次の動きで大きな間違いを犯すかどうかを予測する2つのタスクに対して、我々は、競争ベースラインを大幅に上回るディープニューラルネットワークを開発する。
- 参考スコア(独自算出の注目度): 5.236087378443016
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As artificial intelligence becomes increasingly intelligent---in some cases,
achieving superhuman performance---there is growing potential for humans to
learn from and collaborate with algorithms. However, the ways in which AI
systems approach problems are often different from the ways people do, and thus
may be uninterpretable and hard to learn from. A crucial step in bridging this
gap between human and artificial intelligence is modeling the granular actions
that constitute human behavior, rather than simply matching aggregate human
performance.
We pursue this goal in a model system with a long history in artificial
intelligence: chess. The aggregate performance of a chess player unfolds as
they make decisions over the course of a game. The hundreds of millions of
games played online by players at every skill level form a rich source of data
in which these decisions, and their exact context, are recorded in minute
detail. Applying existing chess engines to this data, including an open-source
implementation of AlphaZero, we find that they do not predict human moves well.
We develop and introduce Maia, a customized version of Alpha-Zero trained on
human chess games, that predicts human moves at a much higher accuracy than
existing engines, and can achieve maximum accuracy when predicting decisions
made by players at a specific skill level in a tuneable way. For a dual task of
predicting whether a human will make a large mistake on the next move, we
develop a deep neural network that significantly outperforms competitive
baselines. Taken together, our results suggest that there is substantial
promise in designing artificial intelligence systems with human collaboration
in mind by first accurately modeling granular human decision-making.
- Abstract(参考訳): 人工知能がますます知性が高まる中、スーパーヒューマンのパフォーマンスを達成することは、人間がアルゴリズムから学び、協力する可能性を高めている。
しかし、AIシステムが問題にアプローチする方法は、人々が行う方法としばしば異なるため、解釈不能であり、そこから学ぶのが困難である。
人間と人工知能の間のこのギャップを埋める上で重要なステップは、人間の行動を構成する粒度の大きいアクションをモデリングすることだ。
我々は、人工知能の長い歴史を持つモデルシステム、チェスでこの目標を追求する。
チェス選手の総合的なパフォーマンスは、ゲーム中に決定をするときに展開します。
あらゆるスキルレベルでプレイヤーがオンラインでプレイする数億のゲームは、これらの決定とその正確な文脈が詳細に記録される豊富なデータソースを形成する。
AlphaZeroのオープンソース実装を含む既存のチェスエンジンをこのデータに適用すると、人間の動きをうまく予測できないことが分かる。
人間のチェスゲームで訓練されたAlpha-Zeroのカスタマイズ版であるMaiaを開発し,既存のエンジンよりもはるかに高い精度で人間の動きを予測し,特定のスキルレベルでのプレイヤーによる決定を調整可能な方法で予測する際の最大精度を実現する。
人間が次の動きで大きな間違いを犯すかどうかを予測する2つのタスクに対して、我々は、競争ベースラインを大幅に上回るディープニューラルネットワークを開発する。
その結果,まず人間の意思決定を正確にモデル化することで,人間のコラボレーションを念頭に置いて人工知能システムを設計することができる可能性が示唆された。
関連論文リスト
- Human-aligned Chess with a Bit of Search [35.16633353273246]
チェスは長年、AIが人間の知性と一致しようとする試みの場だった。
本稿では,この古典的なゲームにおいて,人工知能と人間の知能のギャップを埋めるために設計されたチェスをプレイするAIであるAllieを紹介する。
論文 参考訳(メタデータ) (2024-10-04T19:51:03Z) - Maia-2: A Unified Model for Human-AI Alignment in Chess [10.577896749797485]
チェスにおける人間-AIアライメントのための統一モデリング手法を提案する。
プレイヤーの強みをエンコードしたチェス位置と動的に統合する,スキルアウェアアテンション機構を導入する。
我々の結果は、人間の意思決定とAIによる指導ツールに関する深い洞察を得るための道を開いた。
論文 参考訳(メタデータ) (2024-09-30T17:54:23Z) - HumanoidBench: Simulated Humanoid Benchmark for Whole-Body Locomotion and Manipulation [50.616995671367704]
そこで本研究では,人型ロボットが器用な手を備えた,高次元シミュレーション型ロボット学習ベンチマークHumanoidBenchを提案する。
その結果,現在最先端の強化学習アルゴリズムがほとんどのタスクに支障をきたすのに対して,階層的学習アプローチはロバストな低レベルポリシーに支えられた場合,優れた性能を達成できることがわかった。
論文 参考訳(メタデータ) (2024-03-15T17:45:44Z) - AI for Mathematics: A Cognitive Science Perspective [86.02346372284292]
数学は人間によって開発された最も強力な概念体系の1つである。
AIの急速な進歩、特に大規模言語モデル(LLM)の進歩による推進により、そのようなシステム構築に対する新たな、広範な関心が生まれている。
論文 参考訳(メタデータ) (2023-10-19T02:00:31Z) - RoboPianist: Dexterous Piano Playing with Deep Reinforcement Learning [61.10744686260994]
本稿では,150曲のピアノ作品の大規模なレパートリーをシミュレートして学習するシステムであるRoboPianistを紹介する。
また,オープンソース環境,タスクのベンチマーク,解釈可能な評価指標,今後の研究課題についても紹介する。
論文 参考訳(メタデータ) (2023-04-09T03:53:05Z) - Superhuman Artificial Intelligence Can Improve Human Decision Making by
Increasing Novelty [8.120494737877799]
我々は過去71年間のプロの囲碁選手による580万件以上の移動決定を分析した。
超人的AIの出現により、超人的人間ははるかに優れた決定を下し始めた。
論文 参考訳(メタデータ) (2023-03-13T20:49:13Z) - Detecting Individual Decision-Making Style: Exploring Behavioral
Stylometry in Chess [4.793072503820555]
チェスの文脈における行動スタイメトリーに対するトランスフォーマーに基づくアプローチを提案する。
本手法は,数発の分類フレームワークで動作し,数千人の候補選手の中から選手を正確に識別することができる。
我々は、チェスにおける人間のスタイルと潜在的な倫理的意味について、結果の埋め込みが明らかにするものをより広く検討する。
論文 参考訳(メタデータ) (2022-08-02T11:18:16Z) - Skill Preferences: Learning to Extract and Execute Robotic Skills from
Human Feedback [82.96694147237113]
Skill Preferencesは、人間の好みよりもモデルを学習し、オフラインデータから人間に沿ったスキルを抽出するアルゴリズムである。
SkiPは複雑なマルチステップ操作タスクをシミュレートしたキッチンロボットで実現できることを示す。
論文 参考訳(メタデータ) (2021-08-11T18:04:08Z) - Teach me to play, gamer! Imitative learning in computer games via
linguistic description of complex phenomena and decision tree [55.41644538483948]
本稿では,複雑な現象の言語記述に基づく模倣による新しい機械学習モデルを提案する。
この手法は,ゲーム開発における知的エージェントの動作を設計し,実装するための優れた代替手段となる。
論文 参考訳(メタデータ) (2021-01-06T21:14:10Z) - Learning Models of Individual Behavior in Chess [4.793072503820555]
チェスにおける個人行動の高精度な予測モデルを構築した。
私たちの研究は、AIシステムを個人の行動とよりよく一致させる方法を示しています。
論文 参考訳(メタデータ) (2020-08-23T18:24:21Z) - Is the Most Accurate AI the Best Teammate? Optimizing AI for Teamwork [54.309495231017344]
AIシステムは人間中心の方法でトレーニングされ、チームのパフォーマンスに直接最適化されるべきである、と私たちは主張する。
我々は,AIレコメンデーションを受け入れるか,あるいはタスク自体を解決するかを選択する,特定のタイプのAIチームを提案する。
実世界の高精度データセット上での線形モデルと非線形モデルによる実験は、AIが最も正確であることは、最高のチームパフォーマンスに繋がらないことを示している。
論文 参考訳(メタデータ) (2020-04-27T19:06:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。