論文の概要: Who Needs to Know? Minimal Knowledge for Optimal Coordination
- arxiv url: http://arxiv.org/abs/2306.09309v1
- Date: Thu, 15 Jun 2023 17:43:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-16 13:25:53.107510
- Title: Who Needs to Know? Minimal Knowledge for Optimal Coordination
- Title(参考訳): 誰が知る必要がある?
最適協調のための最小限の知識
- Authors: Niklas Lauffer, Ameesh Shah, Micah Carroll, Michael Dennis, Stuart
Russell
- Abstract要約: 戦略的に関連性のある情報と無関係な情報の間には明確な二分法が存在することを示す。
本稿では,この二分法を用いて,Overcooked環境の標準および部分的に観測可能な両方のタスクの戦略的関連情報を解析する。
- 参考スコア(独自算出の注目度): 9.987130158432755
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To optimally coordinate with others in cooperative games, it is often crucial
to have information about one's collaborators: successful driving requires
understanding which side of the road to drive on. However, not every feature of
collaborators is strategically relevant: the fine-grained acceleration of
drivers may be ignored while maintaining optimal coordination. We show that
there is a well-defined dichotomy between strategically relevant and irrelevant
information. Moreover, we show that, in dynamic games, this dichotomy has a
compact representation that can be efficiently computed via a Bellman backup
operator. We apply this algorithm to analyze the strategically relevant
information for tasks in both a standard and a partially observable version of
the Overcooked environment. Theoretical and empirical results show that our
algorithms are significantly more efficient than baselines. Videos are
available at https://minknowledge.github.io.
- Abstract(参考訳): 協調ゲームにおいて他者と最適にコーディネートするためには、自分自身の協力者に関する情報を持つことが不可欠である。
しかし、コラボレータの全ての特徴は戦略的に関係があるわけではない: ドライバーのきめ細かい加速度は最適調整を維持しながら無視される。
戦略的に関連性のある情報と無関係な情報との間に明確な二分法が存在することを示す。
さらに、動的ゲームでは、この二分法がベルマンバックアップ演算子を介して効率的に計算できるコンパクト表現を持つことを示す。
本アルゴリズムを用いて,Overcooked環境の標準および部分的に観測可能な両方のタスクの戦略的関連情報を解析する。
理論的および実証的な結果は、我々のアルゴリズムがベースラインよりもはるかに効率的であることを示している。
ビデオはhttps://minknowledge.github.ioで閲覧できる。
関連論文リスト
- Communication Learning in Multi-Agent Systems from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
本稿では,各エージェントに対して時間的ゲーティング機構を導入し,ある時間に共有情報を受信するかどうかの動的決定を可能にする。
論文 参考訳(メタデータ) (2024-11-01T05:56:51Z) - Learning to Coordinate without Communication under Incomplete Information [39.106914895158035]
自律的なエージェントが、パートナーの行動を解釈することで、どのように協力するかを示す。
Gnomes at Nightというテストベッドの実験結果から、学習したコミュニケーションの協調戦略が成功率を著しく向上させることが示された。
論文 参考訳(メタデータ) (2024-09-19T01:41:41Z) - Communication- and Computation-Efficient Distributed Decision-Making in Multi-Robot Networks [2.8936428431504164]
複数のロボット間のスケーラブルでほぼ最適な関節運動計画を可能にする分散協調パラダイムを提供する。
我々のアルゴリズムは、競合する準最適アルゴリズムよりも2桁高速である。
最大45台のロボットによる監視タスクのシミュレーションでは、1Hzのオーダーでリアルタイム計画が可能で、カバー性能も優れている。
論文 参考訳(メタデータ) (2024-07-15T01:25:39Z) - Learning Multi-Agent Communication from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
提案手法であるCommFormerは,通信グラフを効率よく最適化し,勾配降下によるアーキテクチャパラメータをエンドツーエンドで並列に洗練する。
論文 参考訳(メタデータ) (2024-05-14T12:40:25Z) - What Makes Good Collaborative Views? Contrastive Mutual Information Maximization for Multi-Agent Perception [52.41695608928129]
マルチエージェント認識(MAP)は、複数のソースからのデータを解釈することで、自律システムが複雑な環境を理解することを可能にする。
本稿では,MAPにおける協調的視点の「良い」特性を探求することに焦点を当てた中間的協調について検討する。
中間コラボレーションのための新しいフレームワークCMiMCを提案する。
論文 参考訳(メタデータ) (2024-03-15T07:18:55Z) - Cooperative Open-ended Learning Framework for Zero-shot Coordination [35.330951448600594]
本研究では,2人のプレーヤーによる協調ゲームにおいて,オープンエンドの目標を構築するための枠組みを提案する。
また,ゲーム理論やグラフ理論からの知識を活用する実用的なアルゴリズムを提案する。
本手法は,異なるレベルのパートナーとコーディネートする場合に,最先端の手法よりも優れる。
論文 参考訳(メタデータ) (2023-02-09T18:37:04Z) - Online V2X Scheduling for Raw-Level Cooperative Perception [21.099819062731463]
視界が単独の知性を制限すると、コネクテッドカーの協調的な認識が救助にやってくる。
本稿では,センサ共有スケジューリングのエネルギー最小化問題を定式化して生レベルの協調認識モデルを提案する。
本稿では,対数的性能損失を伴うオンライン学習に基づくアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-02-12T15:16:45Z) - The Information Geometry of Unsupervised Reinforcement Learning [133.20816939521941]
教師なしスキル発見(英語: Unsupervised skill discovery)とは、報酬関数にアクセスせずに一連のポリシーを学ぶアルゴリズムのクラスである。
教師なしのスキル発見アルゴリズムは、あらゆる報酬関数に最適なスキルを学習しないことを示す。
論文 参考訳(メタデータ) (2021-10-06T13:08:36Z) - Coordinated Reinforcement Learning for Optimizing Mobile Networks [6.924083445159127]
数百の協調エージェントを含む複雑なアプリケーションにおいて、協調グラフと強化学習の使い方を示す。
協調強化学習が他の手法より優れていることを実証的に示す。
論文 参考訳(メタデータ) (2021-09-30T14:46:18Z) - Learning to Match Jobs with Resumes from Sparse Interaction Data using
Multi-View Co-Teaching Network [83.64416937454801]
ジョブ列のインタラクションデータは疎結合でノイズが多く、ジョブ列のマッチングアルゴリズムのパフォーマンスに影響する。
求人情報マッチングのための疎相互作用データから,新しいマルチビュー協調学習ネットワークを提案する。
我々のモデルは求人マッチングの最先端手法より優れている。
論文 参考訳(メタデータ) (2020-09-25T03:09:54Z) - Faster Algorithms for Optimal Ex-Ante Coordinated Collusive Strategies
in Extensive-Form Zero-Sum Games [123.76716667704625]
我々は,不完全情報ゼロサム拡張形式ゲームにおいて,対戦相手と対決する2人の選手のチームにとって最適な戦略を見つけることの課題に焦点をあてる。
この設定では、チームができる最善のことは、ゲーム開始時の関節(つまり相関した)確率分布から潜在的にランダム化された戦略(プレイヤー1人)のプロファイルをサンプリングすることである。
各プロファイルにランダム化されるのはチームメンバーの1人だけであるプロファイルのみを用いることで、そのような最適な分布を計算するアルゴリズムを提供する。
論文 参考訳(メタデータ) (2020-09-21T17:51:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。