論文の概要: M2I2: Learning Efficient Multi-Agent Communication via Masked State Modeling and Intention Inference
- arxiv url: http://arxiv.org/abs/2501.00312v1
- Date: Tue, 31 Dec 2024 07:07:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-05 17:12:49.013762
- Title: M2I2: Learning Efficient Multi-Agent Communication via Masked State Modeling and Intention Inference
- Title(参考訳): M2I2:masked状態モデリングと意図推論によるマルチエージェントコミュニケーションの学習
- Authors: Chuxiong Sun, Peng He, Qirui Ji, Zehua Zang, Jiangmeng Li, Rui Wang, Wei Wang,
- Abstract要約: M2I2は、受信した情報を効果的に同化して活用するエージェントの能力を高めるために設計された新しいフレームワークである。
M2I2は、マスク状態モデリングと共同動作予測のための高度な能力を持つエージェントを装備する。
各種マルチエージェントタスクにおけるM2I2の評価を行い,その性能,効率,能力について検討した。
- 参考スコア(独自算出の注目度): 10.7436449414166
- License:
- Abstract: Communication is essential in coordinating the behaviors of multiple agents. However, existing methods primarily emphasize content, timing, and partners for information sharing, often neglecting the critical aspect of integrating shared information. This gap can significantly impact agents' ability to understand and respond to complex, uncertain interactions, thus affecting overall communication efficiency. To address this issue, we introduce M2I2, a novel framework designed to enhance the agents' capabilities to assimilate and utilize received information effectively. M2I2 equips agents with advanced capabilities for masked state modeling and joint-action prediction, enriching their perception of environmental uncertainties and facilitating the anticipation of teammates' intentions. This approach ensures that agents are furnished with both comprehensive and relevant information, bolstering more informed and synergistic behaviors. Moreover, we propose a Dimensional Rational Network, innovatively trained via a meta-learning paradigm, to identify the importance of dimensional pieces of information, evaluating their contributions to decision-making and auxiliary tasks. Then, we implement an importance-based heuristic for selective information masking and sharing. This strategy optimizes the efficiency of masked state modeling and the rationale behind information sharing. We evaluate M2I2 across diverse multi-agent tasks, the results demonstrate its superior performance, efficiency, and generalization capabilities, over existing state-of-the-art methods in various complex scenarios.
- Abstract(参考訳): コミュニケーションは、複数のエージェントの振舞いを調整するのに不可欠である。
しかし、既存の手法は主に情報共有のためのコンテンツ、タイミング、パートナーを強調しており、共有情報の統合における重要な側面を無視することが多い。
このギャップは、複雑で不確実な相互作用を理解し、反応するエージェントの能力に大きな影響を与え、それによって全体のコミュニケーション効率に影響を及ぼす。
この問題に対処するために,エージェントの機能を増強し,受信情報を効果的に利用するためのフレームワークであるM2I2を紹介する。
M2I2は、マスクされた状態モデリングと共同行動予測のための高度な能力を持つエージェントを装備し、環境の不確実性に対する認識を高め、チームメイトの意図の予測を促進する。
このアプローチにより、エージェントには包括的な情報と関連する情報の両方が備わっており、より情報的でシナジスティックな振る舞いが促進される。
さらに,メタラーニングパラダイムを用いて革新的に訓練された次元レーショナルネットワークを提案し,情報の重要性を特定し,意思決定や補助的なタスクへの貢献を評価する。
そこで我々は,情報マスキングと共有のための重要度に基づくヒューリスティックを実装した。
この戦略は、マスキング状態モデリングの効率と情報共有の背後にある理論的根拠を最適化する。
我々は,M2I2を多様なマルチエージェントタスクで評価し,様々な複雑なシナリオにおける既存の最先端手法よりも優れた性能,効率,一般化能力を示す。
関連論文リスト
- Interactive Agents to Overcome Ambiguity in Software Engineering [61.40183840499932]
AIエージェントは、あいまいで不明確なユーザー指示に基づいて、タスクを自動化するためにますますデプロイされている。
不安定な仮定をし、明確な質問をしないことは、最適以下の結果につながる可能性がある。
対話型コード生成設定において,LLMエージェントが不明瞭な命令を処理する能力について,プロプライエタリモデルとオープンウェイトモデルを評価して検討する。
論文 参考訳(メタデータ) (2025-02-18T17:12:26Z) - Contextual Knowledge Sharing in Multi-Agent Reinforcement Learning with Decentralized Communication and Coordination [0.9776703963093367]
マルチエージェント強化学習(Dec-MARL)は、動的環境における複雑なタスクに対処するための重要なアプローチとして登場した。
本稿では,エージェントの知識共有プロセスに目標認識とタイムアウェアネスを取り入れ,ピアツーピアコミュニケーションとコーディネーションを統合した新しいDec-MARLフレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-26T22:49:50Z) - Tacit Learning with Adaptive Information Selection for Cooperative Multi-Agent Reinforcement Learning [13.918498667158119]
本稿では,情報選択と暗黙学習に基づく新しい協調型MARLフレームワークを提案する。
我々はゲーティングと選択機構を統合し、エージェントが環境変化に基づいて情報を適応的にフィルタリングできるようにする。
人気のあるMARLベンチマークの実験により、我々のフレームワークは最先端のアルゴリズムとシームレスに統合できることが示された。
論文 参考訳(メタデータ) (2024-12-20T07:55:59Z) - Communication Learning in Multi-Agent Systems from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
本稿では,各エージェントに対して時間的ゲーティング機構を導入し,ある時間に共有情報を受信するかどうかの動的決定を可能にする。
論文 参考訳(メタデータ) (2024-11-01T05:56:51Z) - Learning Multi-Agent Communication from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
提案手法であるCommFormerは,通信グラフを効率よく最適化し,勾配降下によるアーキテクチャパラメータをエンドツーエンドで並列に洗練する。
論文 参考訳(メタデータ) (2024-05-14T12:40:25Z) - T2MAC: Targeted and Trusted Multi-Agent Communication through Selective
Engagement and Evidence-Driven Integration [15.91335141803629]
我々は、エージェントが選択的なエンゲージメントとエビデンス駆動の統合を学ぶのを助けるために、T2MAC(Targeted and Trusted Multi-Agent Communication)を提案する。
T2MACは、エージェントが個別化されたメッセージを作成し、理想的なコミュニケーションウィンドウをピンポイントし、信頼できるパートナーと対話することを可能にする。
本手法は,様々な課題を伴って,多様な協調型マルチエージェントタスクに対して評価を行う。
論文 参考訳(メタデータ) (2024-01-19T18:00:33Z) - AntEval: Evaluation of Social Interaction Competencies in LLM-Driven
Agents [65.16893197330589]
大規模言語モデル(LLM)は、幅広いシナリオで人間の振る舞いを再現する能力を示した。
しかし、複雑なマルチ文字のソーシャルインタラクションを扱う能力については、まだ完全には研究されていない。
本稿では,新しいインタラクションフレームワークと評価手法を含むマルチエージェントインタラクション評価フレームワーク(AntEval)を紹介する。
論文 参考訳(メタデータ) (2024-01-12T11:18:00Z) - Collaborative Information Dissemination with Graph-based Multi-Agent
Reinforcement Learning [2.9904113489777826]
本稿では,効率的な情報伝達のためのマルチエージェント強化学習(MARL)手法を提案する。
本稿では,各エージェントが個別にメッセージ転送を決定するための情報発信のための部分観測可能なゲーム(POSG)を提案する。
実験の結果,既存の手法よりも訓練済みの方針が優れていることがわかった。
論文 参考訳(メタデータ) (2023-08-25T21:30:16Z) - Re-mine, Learn and Reason: Exploring the Cross-modal Semantic
Correlations for Language-guided HOI detection [57.13665112065285]
ヒューマンオブジェクトインタラクション(HOI)検出は、コンピュータビジョンの課題である。
本稿では,構造化テキスト知識を組み込んだHOI検出フレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-25T14:20:52Z) - Cross-modal Consensus Network for Weakly Supervised Temporal Action
Localization [74.34699679568818]
時間的行動局所化 (WS-TAL) は、ビデオレベルの分類的監督によって、ビデオ内のアクションインスタンスをローカライズすることを目的とした課題である。
この問題に対処するためのクロスモーダルコンセンサスネットワーク(CO2-Net)を提案する。
論文 参考訳(メタデータ) (2021-07-27T04:21:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。