論文の概要: Interpretation of Emergent Communication in Heterogeneous Collaborative
Embodied Agents
- arxiv url: http://arxiv.org/abs/2110.05769v1
- Date: Tue, 12 Oct 2021 06:56:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-13 23:56:50.782690
- Title: Interpretation of Emergent Communication in Heterogeneous Collaborative
Embodied Agents
- Title(参考訳): 不均質体型エージェントにおける創発的コミュニケーションの解釈
- Authors: Shivansh Patel, Saim Wani, Unnat Jain, Alexander Schwing, Svetlana
Lazebnik, Manolis Savva, Angel X. Chang
- Abstract要約: 本稿では,コラボレーティブな多目的ナビゲーションタスクCoMONを紹介する。
この課題において、オラクルエージェントは、地図の形式で詳細な環境情報を有する。
視覚的に環境を知覚するナビゲーターエージェントと通信し、目標のシーケンスを見つけるのが任務である。
創発的コミュニケーションはエージェントの観察と3次元環境の空間構造に基礎を置くことができることを示す。
- 参考スコア(独自算出の注目度): 83.52684405389445
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Communication between embodied AI agents has received increasing attention in
recent years. Despite its use, it is still unclear whether the learned
communication is interpretable and grounded in perception. To study the
grounding of emergent forms of communication, we first introduce the
collaborative multi-object navigation task CoMON. In this task, an oracle agent
has detailed environment information in the form of a map. It communicates with
a navigator agent that perceives the environment visually and is tasked to find
a sequence of goals. To succeed at the task, effective communication is
essential. CoMON hence serves as a basis to study different communication
mechanisms between heterogeneous agents, that is, agents with different
capabilities and roles. We study two common communication mechanisms and
analyze their communication patterns through an egocentric and spatial lens. We
show that the emergent communication can be grounded to the agent observations
and the spatial structure of the 3D environment. Video summary:
https://youtu.be/kLv2rxO9t0g
- Abstract(参考訳): エンボディドAIエージェント間のコミュニケーションは近年注目を集めている。
その使用にもかかわらず、学習されたコミュニケーションが解釈可能で、知覚に基礎があるかどうかはまだ不明である。
まず,創発的なコミュニケーション形態の接地を研究するため,協調型多目的ナビゲーションタスクcomonを導入する。
この課題において、オラクルエージェントは、地図の形式で詳細な環境情報を有する。
視覚的に環境を知覚するナビゲーターエージェントと通信し、目標のシーケンスを見つけるのが任務である。
タスクを成功させるためには、効果的なコミュニケーションが不可欠である。
したがって、コモンは異種エージェント、すなわち異なる機能と役割を持つエージェント間の異なるコミュニケーション機構を研究する基礎となる。
2つの共通通信機構を調査し,エゴセントリックレンズと空間レンズを用いて通信パターンを分析した。
創発的コミュニケーションはエージェントの観察と3次元環境の空間構造に基礎を置くことができることを示す。
ビデオ要約: https://youtu.be/kLv2rxO9t0g
関連論文リスト
- Bidirectional Emergent Language in Situated Environments [4.950411915351642]
マルチエージェントポンとコレクターの2つの新しい協調環境を紹介した。
最適なパフォーマンスには通信プロトコルの出現が必要ですが、適度な成功はそれなしで達成できます。
エージェントは意味のあるメッセージのみを生成し、調整なしでは成功できない状態の受信メッセージに作用する。
論文 参考訳(メタデータ) (2024-08-26T21:25:44Z) - GOMA: Proactive Embodied Cooperative Communication via Goal-Oriented Mental Alignment [72.96949760114575]
我々は、ゴール指向メンタルアライメント(GOMA)という新しい協調コミュニケーションフレームワークを提案する。
GOMAは、目標に関連のあるエージェントの精神状態のミスアライメントを最小限に抑える計画問題として、言語コミュニケーションを定式化している。
我々は,Overcooked(マルチプレイヤーゲーム)とVirtualHome(家庭用シミュレータ)の2つの挑戦環境において,強いベースラインに対するアプローチを評価する。
論文 参考訳(メタデータ) (2024-03-17T03:52:52Z) - Building Cooperative Embodied Agents Modularly with Large Language
Models [104.57849816689559]
本研究では, 分散制御, 生の知覚観察, コストのかかるコミュニケーション, 様々な実施環境下でインスタンス化された多目的タスクといった課題に対処する。
我々は,LLMの常識知識,推論能力,言語理解,テキスト生成能力を活用し,認知に触発されたモジュラーフレームワークにシームレスに組み込む。
C-WAH と TDW-MAT を用いた実験により, GPT-4 で駆動される CoELA が, 強い計画に基づく手法を超越し, 創発的な効果的なコミュニケーションを示すことを示した。
論文 参考訳(メタデータ) (2023-07-05T17:59:27Z) - Over-communicate no more: Situated RL agents learn concise communication
protocols [78.28898217947467]
互いに効果的に効率的にコミュニケーションできる人工エージェントをいかに設計するかは、不明である。
強化学習(RL)を用いたコミュニケーションの出現に関する研究
エージェントがコミュニケーションを行うための環境行為を強制しなければならない多段階タスクにおける位置的コミュニケーションについて検討する。
テストされたすべてのプレッシャーは過剰なコミュニケーションを阻害する可能性があるが、位置通信は最も効果的であり、努力のコストとは異なり、発生に悪影響を及ぼさない。
論文 参考訳(メタデータ) (2022-11-02T21:08:14Z) - Few-shot Language Coordination by Modeling Theory of Mind [95.54446989205117]
我々は、数ショット$textit language coordinate$のタスクについて研究する。
リードエージェントは、言語能力の異なるエージェントの$textitpopulation$と調整する必要があります。
これは、人間のコミュニケーションの重要な構成要素であるパートナーの信念をモデル化する能力を必要とする。
論文 参考訳(メタデータ) (2021-07-12T19:26:11Z) - Learning to Draw: Emergent Communication through Sketching [0.0]
タスクを協調的に解決するために,エージェントがコミュニケーションを学ぶ方法を示す。
既存の研究は言語に重点を置いており、エージェント間で個別のトークンのシーケンスを学習された通信チャネルで送信している。
我々のエージェントはディープニューラルネットワークによってパラメータ化されており、描画手順は微分可能であり、エンドツーエンドのトレーニングを可能にします。
参照型コミュニケーションゲームの枠組みでは,エージェントが図面によるコミュニケーションをうまく学べるだけでなく,適切な帰納的バイアスを伴って,人間が解釈できる方法で行うことができることを示す。
論文 参考訳(メタデータ) (2021-06-03T18:17:55Z) - The Emergence of Adversarial Communication in Multi-Agent Reinforcement
Learning [6.18778092044887]
多くの現実世界の問題は、複数の自律エージェントの調整を必要とする。
最近の研究は、複雑なマルチエージェント協調を可能にする明示的なコミュニケーション戦略を学ぶためのグラフニューラルネットワーク(GNN)の約束を示している。
一つの利己的なエージェントが高度に操作的なコミュニケーション戦略を学習し、協調的なエージェントチームを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2020-08-06T12:48:08Z) - Networked Multi-Agent Reinforcement Learning with Emergent Communication [18.47483427884452]
MARL(Multi-Agent Reinforcement Learning)法は,他の学習エージェントの存在下で活動するエージェントに対して最適なポリシーを求める。
コーディネートするひとつの方法は、相互通信を学ぶことです。
エージェントは共通のタスクを実行するために学習しながら言語を開発することができるか?
論文 参考訳(メタデータ) (2020-04-06T16:13:23Z) - Learning to cooperate: Emergent communication in multi-agent navigation [49.11609702016523]
本稿では,協調ナビゲーションタスクを行うエージェントが,解釈可能な通信プロトコルを学ぶことを示す。
エージェントのポリシーの分析により、創発的信号が状態空間を空間的にクラスタリングすることが明らかになった。
エージェントの集団を用いて,創発的プロトコルは基本構成構造を持つことを示す。
論文 参考訳(メタデータ) (2020-04-02T16:03:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。