Fugu-MT 論文翻訳(概要): Inference-Based Deterministic Messaging For Multi-Agent Communication

論文の概要: Inference-Based Deterministic Messaging For Multi-Agent Communication

arxiv url: http://arxiv.org/abs/2103.02150v1
Date: Wed, 3 Mar 2021 03:09:22 GMT
ステータス: 翻訳完了
システム内更新日: 2021-03-04 14:53:33.131175
Title: Inference-Based Deterministic Messaging For Multi-Agent Communication
Title（参考訳）: 推論に基づくマルチエージェント通信のための決定論的メッセージング
Authors: Varun Bhatt, Michael Buro
Abstract要約: 行列に基づくシグナリングゲームにおける学習について検討し,分散化手法がサブオプティマティリティポリシに収束できることを示した。次に、送信者が送信者の観察を推測するのを助ける最良のメッセージを決定的に選択するメッセージポリシーの修正を提案します。
参考スコア（独自算出の注目度）: 1.8275108630751844
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Communication is essential for coordination among humans and animals. Therefore, with the introduction of intelligent agents into the world, agent-to-agent and agent-to-human communication becomes necessary. In this paper, we first study learning in matrix-based signaling games to empirically show that decentralized methods can converge to a suboptimal policy. We then propose a modification to the messaging policy, in which the sender deterministically chooses the best message that helps the receiver to infer the sender's observation. Using this modification, we see, empirically, that the agents converge to the optimal policy in nearly all the runs. We then apply this method to a partially observable gridworld environment which requires cooperation between two agents and show that, with appropriate approximation methods, the proposed sender modification can enhance existing decentralized training methods for more complex domains as well.
Abstract（参考訳）: コミュニケーションは人間と動物の協調に不可欠である。そのため、インテリジェントエージェントが世界に導入されると、エージェント対エージェントとエージェント対ヒューマンコミュニケーションが必要となる。本稿では,行列に基づくシグナリングゲームにおける学習を初めて研究し,分散手法が最適以下の方針に収束できることを実証的に示す。次に、送信者が送信者の観察を推測するのを助ける最良のメッセージを決定的に選択するメッセージポリシーの修正を提案します。この修正を用いることで、経験上、エージェントがほぼすべての実行で最適なポリシーに収束することがわかる。次に,この手法を2つのエージェントの協調を必要とする部分観測可能なグリッドワールド環境に適用し,提案する送信者修正により,より複雑な領域に対する既存の分散トレーニング手法も強化できることを示す。

関連論文リスト

In-Context Reinforcement Learning via Communicative World Models [49.00028802135605]
この研究は、2エージェントの緊急通信問題としてICRLを定式化する。これは、転送可能な通信コンテキストを学ぶフレームワークであるCORALを紹介している。実験により,本手法により,CAが試料効率を大幅に向上できることが実証された。
論文参考訳（メタデータ） (2025-08-08T19:23:23Z)
AnyMAC: Cascading Flexible Multi-Agent Collaboration via Next-Agent Prediction [70.60422261117816]
本稿では,グラフ構造ではなくシーケンシャル構造を用いて,マルチエージェント協調を再考するフレームワークを提案する。提案手法は,(1)各ステップで最も適したエージェントロールを選択するNext-Agent Predictionと,(2)各エージェントが前ステップから関連する情報にアクセスできるようにするNext-Context Selectionの2つの重要な方向に焦点を当てる。
論文参考訳（メタデータ） (2025-06-21T18:34:43Z)
Decentralized Collective World Model for Emergent Communication and Coordination [6.27726754138289]
本稿では,コミュニケーションのためのシンボルの出現と協調行動の両方を可能にする,完全に分散化されたマルチエージェント世界モデルを提案する。提案手法は,世界モデルと通信チャネルを統合し,エージェントが環境動態を予測し,部分的な観測結果から状態を推定し,重要な情報を共有できるようにする。
論文参考訳（メタデータ） (2025-04-04T11:17:52Z)
Communication Learning in Multi-Agent Systems from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。本稿では,各エージェントに対して時間的ゲーティング機構を導入し,ある時間に共有情報を受信するかどうかの動的決定を可能にする。
論文参考訳（メタデータ） (2024-11-01T05:56:51Z)
DCMAC: Demand-aware Customized Multi-Agent Communication via Upper Bound Training [9.068971933560416]
本稿では,アッパーバウンドトレーニングを用いて理想的なポリシを得る,要求対応のカスタマイズ型マルチエージェント通信プロトコルを提案する。実験結果から,DCMACは,制約のない,通信制約のないシナリオにおいて,ベースラインアルゴリズムを著しく上回ることがわかった。
論文参考訳（メタデータ） (2024-09-11T09:23:27Z)
Networked Communication for Mean-Field Games with Function Approximation and Empirical Mean-Field Estimation [59.01527054553122]
分散エージェントは、経験的システムの非絶対的実行から平均フィールドゲームにおいて平衡を学ぶことができる。既存の設定に関数近似を導入し,Munchausen Online Mirror Descent 方式で描画する。ポリシー情報の交換は,ネットワーク化されたエージェントが,機能近似設定において,独立エージェントと集中エージェントの両方より優れていることを示す。
論文参考訳（メタデータ） (2024-08-21T13:32:46Z)
Learning Multi-Agent Communication from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。提案手法であるCommFormerは,通信グラフを効率よく最適化し,勾配降下によるアーキテクチャパラメータをエンドツーエンドで並列に洗練する。
論文参考訳（メタデータ） (2024-05-14T12:40:25Z)
Pragmatic Communication in Multi-Agent Collaborative Perception [80.14322755297788]
協調的な知覚は、知覚能力とコミュニケーションコストのトレードオフをもたらす。 PragCommは2つの重要なコンポーネントを持つマルチエージェント協調認識システムである。 PragCommは、32.7K以上の通信量で従来手法より一貫して優れていた。
論文参考訳（メタデータ） (2024-01-23T11:58:08Z)
Enhancing Multi-Agent Coordination through Common Operating Picture Integration [14.927199437011044]
各エージェントは、その観察、行動、メッセージの履歴を共通のオペレーティング・ピクチャー(COP)に組み込むことができる。本研究は, COP統合の有効性を実証し, 従来のマルチエージェント強化学習(MARL)法と比較して, COPをベースとしたトレーニングが, アウト・オブ・ディストリビューション初期状態に直面した場合に, 堅牢なポリシーをもたらすことを示す。
論文参考訳（メタデータ） (2023-11-08T15:08:55Z)
Research on Multi-Agent Communication and Collaborative Decision-Making Based on Deep Reinforcement Learning [0.0]
本論文は,マルチエージェント・プロキシ・ポリシー最適化アルゴリズムに基づくマルチエージェントの協調的意思決定について考察する。異なるエージェントは、エージェント間の情報交換を通じて局所的な観測によって引き起こされる非定常性を緩和することができる。実験結果から,マルチエージェント環境の非定常性を改善する効果が得られた。
論文参考訳（メタデータ） (2023-05-23T14:20:14Z)
Coordinating Policies Among Multiple Agents via an Intelligent Communication Channel [81.39444892747512]
MARL(Multi-Agent Reinforcement Learning)では、エージェントが直接通信できる特別なチャンネルがしばしば導入される。本稿では,エージェントの集団的性能を向上させるために,エージェントが提供した信号の伝達と解釈を学習する,インテリジェントなファシリテータを通じてエージェントがコミュニケーションする手法を提案する。
論文参考訳（メタデータ） (2022-05-21T14:11:33Z)
Depthwise Convolution for Multi-Agent Communication with Enhanced Mean-Field Approximation [9.854975702211165]
本稿では,MARL(Multi-agent RL)課題に取り組むための,局所的なコミュニケーション学習に基づく新しい手法を提案する。まず,局所的な関係を効率的に抽出する深層的畳み込み機能を利用する新しい通信プロトコルを設計する。第2に,エージェント相互作用の規模を減らすために,平均場近似を導入する。
論文参考訳（メタデータ） (2022-03-06T07:42:43Z)
Explaining Reinforcement Learning Policies through Counterfactual Trajectories [147.7246109100945]
人間の開発者は、RLエージェントがテスト時にうまく機能することを検証しなければならない。本手法では, エージェントの挙動をより広い軌道分布で示すことにより, エージェントの挙動を分布変化下で表現する。本研究では,2つのエージェント検証タスクのうちの1つに対して,ベースライン法よりも優れたスコアを得られることを示す。
論文参考訳（メタデータ） (2022-01-29T00:52:37Z)
Distributed Adaptive Learning Under Communication Constraints [54.22472738551687]
本研究では,コミュニケーション制約下での運用を目的とした適応型分散学習戦略について検討する。我々は,ストリーミングデータの連続的な観察から,オンライン最適化問題を解決しなければならないエージェントのネットワークを考える。
論文参考訳（メタデータ） (2021-12-03T19:23:48Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。