論文の概要: Neural Amortized Inference for Nested Multi-agent Reasoning
- arxiv url: http://arxiv.org/abs/2308.11071v1
- Date: Mon, 21 Aug 2023 22:40:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-23 19:50:16.909353
- Title: Neural Amortized Inference for Nested Multi-agent Reasoning
- Title(参考訳): Nested Multi-Adnt Reasoningのためのニューラルアモータライズ推論
- Authors: Kunal Jha, Tuan Anh Le, Chuanyang Jin, Yen-Ling Kuo, Joshua B.
Tenenbaum, Tianmin Shu
- Abstract要約: 本研究では,人間のような推論能力と計算限界のギャップを埋める新しい手法を提案する。
提案手法を2つの挑戦的マルチエージェント相互作用領域で評価する。
- 参考スコア(独自算出の注目度): 54.39127942041582
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-agent interactions, such as communication, teaching, and bluffing,
often rely on higher-order social inference, i.e., understanding how others
infer oneself. Such intricate reasoning can be effectively modeled through
nested multi-agent reasoning. Nonetheless, the computational complexity
escalates exponentially with each level of reasoning, posing a significant
challenge. However, humans effortlessly perform complex social inferences as
part of their daily lives. To bridge the gap between human-like inference
capabilities and computational limitations, we propose a novel approach:
leveraging neural networks to amortize high-order social inference, thereby
expediting nested multi-agent reasoning. We evaluate our method in two
challenging multi-agent interaction domains. The experimental results
demonstrate that our method is computationally efficient while exhibiting
minimal degradation in accuracy.
- Abstract(参考訳): コミュニケーション、指導、ブラッフィングなどのマルチエージェントインタラクションは、しばしば高階の社会的推論、すなわち他人がどのように自分自身を推論するかを理解することに依存する。
このような複雑な推論は、ネストしたマルチエージェント推論によって効果的にモデル化できる。
それでも計算の複雑さは、各レベルの推論によって指数関数的にエスカレートし、大きな課題となる。
しかし、人間は日々の生活の一部として複雑な社会的推論を行う。
人型推論能力と計算限界のギャップを埋めるため,ニューラルネットワークを利用して高次社会的推論を記憶し,ネストしたマルチエージェント推論を高速化する手法を提案する。
提案手法を2つの挑戦的マルチエージェント相互作用領域で評価する。
実験の結果,精度の低下を最小限に抑えながら,計算効率がよいことがわかった。
関連論文リスト
- Scaling Large-Language-Model-based Multi-Agent Collaboration [75.5241464256688]
大規模言語モデルによるエージェントのパイオニア化は、マルチエージェントコラボレーションの設計パターンを暗示している。
神経スケーリング法則に触発された本研究では,マルチエージェント協調におけるエージェントの増加に類似の原理が適用されるかを検討する。
論文 参考訳(メタデータ) (2024-06-11T11:02:04Z) - Multi-Agent Dynamic Relational Reasoning for Social Robot Navigation [50.01551945190676]
社会ロボットナビゲーションは、日常生活の様々な状況において有用であるが、安全な人間とロボットの相互作用と効率的な軌道計画が必要である。
本稿では, 動的に進化する関係構造を明示的に推論した系統的関係推論手法を提案する。
マルチエージェント軌道予測とソーシャルロボットナビゲーションの有効性を実証する。
論文 参考訳(メタデータ) (2024-01-22T18:58:22Z) - Sim-to-Real Causal Transfer: A Metric Learning Approach to
Causally-Aware Interaction Representations [62.48505112245388]
エージェント相互作用の現代的表現の因果認識を詳細に検討する。
近年の表現は、非因果剤の摂動に対して部分的に耐性があることが示されている。
因果アノテーションを用いた潜在表現を正規化するための計量学習手法を提案する。
論文 参考訳(メタデータ) (2023-12-07T18:57:03Z) - Responsible Emergent Multi-Agent Behavior [2.9370710299422607]
Responsible AIの最先端技術は、人間の問題はマルチエージェントの問題である、という重要なポイントを無視した。
交通の運転から経済政策の交渉まで、人間の問題解決には複数の個人の行動と動機の相互作用と相互作用が伴う。
この論文は、責任ある創発的マルチエージェント行動の研究を発展させる。
論文 参考訳(メタデータ) (2023-11-02T21:37:32Z) - On the Complexity of Multi-Agent Decision Making: From Learning in Games
to Partial Monitoring [105.13668993076801]
マルチエージェント強化学習(MARL)理論における中心的な問題は、構造条件やアルゴリズムの原理がサンプル効率の学習保証につながるかを理解することである。
本稿では,複数のエージェントを用いた対話型意思決定のための一般的な枠組みとして,この問題について考察する。
マルチエージェント意思決定における統計的複雑性を特徴付けることは、単一エージェント決定の統計的複雑性を特徴付けることと等価であることを示す。
論文 参考訳(メタデータ) (2023-05-01T06:46:22Z) - Conveying Autonomous Robot Capabilities through Contrasting Behaviour
Summaries [8.413049356622201]
比較行動要約を効率的に生成する適応探索法を提案する。
この結果から,適応探索により,人間がより優れたエージェントを正確に選択できる情報コントラストのシナリオを効果的に特定できることが示唆された。
論文 参考訳(メタデータ) (2023-04-01T18:20:59Z) - Learning and Blending Robot Hugging Behaviors in Time and Space [10.014074169023058]
複数の相互作用の重畳を含む複雑な相互作用において、適切なロボット応答を予測できる模倣学習に基づく物理ロボットインタラクションアルゴリズムを提案する。
このアルゴリズムは先行研究の一般化であり、元の定式化は単一相互作用の特定のケースに還元されることを示す。
提案アルゴリズムは,既存の最先端手法と比較して,精度,応答性,タイミングに関して,定量的な予測誤差と,より良好な参加者応答が得られる。
論文 参考訳(メタデータ) (2022-12-03T02:00:53Z) - Multiagent Deep Reinforcement Learning: Challenges and Directions
Towards Human-Like Approaches [0.0]
本稿では,最も一般的なマルチエージェント問題表現とその主な課題について述べる。
これらの課題に対処する5つの研究領域を特定します。
我々は,マルチエージェント強化学習が成功するためには,これらの課題を学際的アプローチで解決することを提案する。
論文 参考訳(メタデータ) (2021-06-29T19:53:15Z) - Tesseract: Tensorised Actors for Multi-Agent Reinforcement Learning [92.05556163518999]
MARLは、コミュニケーションと可観測性に様々な制約を課すことによって、問題を悪化させる。
値ベースの手法では、最適な値関数を正確に表現することが課題となる。
政策勾配法では、批判者の訓練を困難にし、遅れる批判者の問題を悪化させる。
学習理論の観点からは、関連するアクション値関数を正確に表現することで、両方の問題に対処できることが示される。
論文 参考訳(メタデータ) (2021-05-31T23:08:05Z) - Learning Human Rewards by Inferring Their Latent Intelligence Levels in
Multi-Agent Games: A Theory-of-Mind Approach with Application to Driving Data [18.750834997334664]
我々は、人間は有理論的であり、他人の意思決定過程を推論する際に異なる知能レベルを持っていると論じる。
学習中の人間の潜在知能レベルを推論する,新しいマルチエージェント逆強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-07T07:48:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。