論文の概要: Expected Value of Communication for Planning in Ad Hoc Teamwork
- arxiv url: http://arxiv.org/abs/2103.01171v1
- Date: Mon, 1 Mar 2021 18:09:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-04 23:41:18.962708
- Title: Expected Value of Communication for Planning in Ad Hoc Teamwork
- Title(参考訳): アドホックチームワークにおける計画立案のためのコミュニケーションの価値
- Authors: William Macke, Reuth Mirsky and Peter Stone
- Abstract要約: 自律エージェントの望ましい目標は、未知のチームメイトとオンザフライで調整できるようにすることだ。
アドホックなチームワークの中心的な課題の1つは、他のエージェントの現在の計画を迅速に認識し、それに応じて計画することです。
アドホックなチームワークのための新しい計画アルゴリズムを提示し、どのクエリに問い合わせるかを決定し、それに応じて計画する。
- 参考スコア(独自算出の注目度): 44.262891197318034
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A desirable goal for autonomous agents is to be able to coordinate on the fly
with previously unknown teammates. Known as "ad hoc teamwork", enabling such a
capability has been receiving increasing attention in the research community.
One of the central challenges in ad hoc teamwork is quickly recognizing the
current plans of other agents and planning accordingly. In this paper, we focus
on the scenario in which teammates can communicate with one another, but only
at a cost. Thus, they must carefully balance plan recognition based on
observations vs. that based on communication. This paper proposes a new metric
for evaluating how similar are two policies that a teammate may be following -
the Expected Divergence Point (EDP). We then present a novel planning algorithm
for ad hoc teamwork, determining which query to ask and planning accordingly.
We demonstrate the effectiveness of this algorithm in a range of increasingly
general communication in ad hoc teamwork problems.
- Abstract(参考訳): 自律エージェントの望ましい目標は、未知のチームメイトとオンザフライで調整できるようにすることだ。
このような能力を実現する「アドホックなチームワーク」は、研究コミュニティで注目を集めています。
アドホックなチームワークの中心的な課題の1つは、他のエージェントの現在の計画を迅速に認識し、それに応じて計画することです。
この論文では、チームメイトが互いにコミュニケーションできるシナリオに焦点を当てていますが、コストがかかります。
したがって、観察に基づく計画認識とコミュニケーションに基づく計画認識を慎重にバランスさせなければならない。
本稿では、チームメイトが従うべき2つのポリシーがいかに類似しているかを評価するための新しい指標を提案する。
次に、アドホックなチームワークのための新しい計画アルゴリズムを提案し、それに従ってどのクエリを問うかを決定する。
本稿では,このアルゴリズムの有効性を,アドホックなチームワーク問題における汎用的なコミュニケーション範囲で実証する。
関連論文リスト
- GOMA: Proactive Embodied Cooperative Communication via Goal-Oriented Mental Alignment [72.96949760114575]
我々は、ゴール指向メンタルアライメント(GOMA)という新しい協調コミュニケーションフレームワークを提案する。
GOMAは、目標に関連のあるエージェントの精神状態のミスアライメントを最小限に抑える計画問題として、言語コミュニケーションを定式化している。
我々は,Overcooked(マルチプレイヤーゲーム)とVirtualHome(家庭用シミュレータ)の2つの挑戦環境において,強いベースラインに対するアプローチを評価する。
論文 参考訳(メタデータ) (2024-03-17T03:52:52Z) - Cooperation on the Fly: Exploring Language Agents for Ad Hoc Teamwork in
the Avalon Game [25.823665278297057]
本研究は,自然言語によって駆動される環境下でエージェントが動作する,アドホックなチームワークの問題に焦点を当てる。
チームコラボレーションにおけるLLMエージェントの可能性を明らかにするとともに,コミュニケーションにおける幻覚に関連する課題を明らかにする。
この問題に対処するため,LLMに拡張メモリとコード駆動推論を備えた汎用エージェントであるCodeActを開発した。
論文 参考訳(メタデータ) (2023-12-29T08:26:54Z) - Adaptation and Communication in Human-Robot Teaming to Handle
Discrepancies in Agents' Beliefs about Plans [13.637799815698559]
我々はモンテカルロ木探索に基づくオンライン実行アルゴリズムを提案し,その動作を計画する。
私たちのエージェントは、共有されたメンタルモデルを保証することなく、チームで作業するための装備がより優れていることを示しています。
論文 参考訳(メタデータ) (2023-07-07T03:05:34Z) - Inferring the Goals of Communicating Agents from Actions and
Instructions [47.5816320484482]
本稿では,あるエージェント,プリンシパルが,その共有計画に関する自然言語指示を他のエージェント,アシスタントに伝達できるような協力チームのモデルを提案する。
3人目のオブザーバが、アクションや指示からマルチモーダルな逆計画を通じて、チームの目標を推測する方法を示します。
我々は,マルチエージェントグリッドワールドにおける人間の目標推定と比較し,モデルの推定が人間の判断と密接に相関していることを見出した。
論文 参考訳(メタデータ) (2023-06-28T13:43:46Z) - Cooperative Actor-Critic via TD Error Aggregation [12.211031907519827]
本稿では、プライバシー問題に違反しないTDエラーアグリゲーションを備えた分散型アクター批判アルゴリズムを提案する。
我々は,各エージェントが平均目標関数を最大化するために,ステップサイズを小さくして収束解析を行う。
論文 参考訳(メタデータ) (2022-07-25T21:10:39Z) - A Survey of Ad Hoc Teamwork: Definitions, Methods, and Open Problems [38.995115886327696]
アドホックなチームワークは、事前調整なしに新しいチームメイトとコラボレーションできるエージェントを設計する上で、十分に確立された研究課題である。
この調査は2倍の貢献をしている。まず、アドホックなチームワーク問題の異なる側面について構造化された説明を提供する。
第二に、これまでこの分野で行われてきた進歩について論じ、アドホックなチームワークの分野で対処する必要がある、即時かつ長期的なオープンな問題を特定します。
論文 参考訳(メタデータ) (2022-02-16T18:16:27Z) - Assisting Unknown Teammates in Unknown Tasks: Ad Hoc Teamwork under
Partial Observability [15.995282665634097]
部分観測可能性(ATPO)の下でのアドホックチームワークの課題設定のための新しいオンライン予測アルゴリズムを提案する。
ATPOは、エージェントの観察を使用して、チームメイトが実行しているタスクを特定することで、部分的な可観測性を実現する。
以上の結果から,ATPOはタスクの膨大なライブラリからチームメイトのタスクを識別し,ほぼ最適時間で解決し,より大きな問題サイズに適応するスケーラブルなスケーラビリティを実現する上で,有効かつ堅牢であることが示された。
論文 参考訳(メタデータ) (2022-01-10T18:53:34Z) - Interpretation of Emergent Communication in Heterogeneous Collaborative
Embodied Agents [83.52684405389445]
本稿では,コラボレーティブな多目的ナビゲーションタスクCoMONを紹介する。
この課題において、オラクルエージェントは、地図の形式で詳細な環境情報を有する。
視覚的に環境を知覚するナビゲーターエージェントと通信し、目標のシーケンスを見つけるのが任務である。
創発的コミュニケーションはエージェントの観察と3次元環境の空間構造に基礎を置くことができることを示す。
論文 参考訳(メタデータ) (2021-10-12T06:56:11Z) - Quasi-Equivalence Discovery for Zero-Shot Emergent Communication [63.175848843466845]
ゼロショットコーディネーション(ZSC)を実現するための新しい問題設定と準等価探索アルゴリズムを提案する。
これらの2つの要因が参照ゲームにおいて一意に最適なZSCポリシーをもたらすことを示す。
QEDはこの設定における対称性を反復的に発見することができ、最適なZSCポリシーに収束する。
論文 参考訳(メタデータ) (2021-03-14T23:42:37Z) - Model-based Reinforcement Learning for Decentralized Multiagent
Rendezvous [66.6895109554163]
目標を他のエージェントと整合させる人間の能力の下にあるのは、他人の意図を予測し、自分たちの計画を積極的に更新する能力である。
分散型マルチエージェントレンデブーのためのモデルに基づく強化学習手法である階層型予測計画(HPP)を提案する。
論文 参考訳(メタデータ) (2020-03-15T19:49:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。