論文の概要: CommCP: Efficient Multi-Agent Coordination via LLM-Based Communication with Conformal Prediction
- arxiv url: http://arxiv.org/abs/2602.06038v1
- Date: Thu, 05 Feb 2026 18:59:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:09.156768
- Title: CommCP: Efficient Multi-Agent Coordination via LLM-Based Communication with Conformal Prediction
- Title(参考訳): CommCP: コンフォーマル予測を用いたLLM通信による効率的なマルチエージェントコーディネート
- Authors: Xiaopan Zhang, Zejin Wang, Zhixu Li, Jianpeng Yao, Jiachen Li,
- Abstract要約: EQA(Embodied Question Answering, MM-EQA)は、標準EQA(Embodied Question Answering)の新たな拡張である。
MM-EQA用に設計された新しい分散通信フレームワークであるCommCPを提案する。
我々のフレームワークは、コンフォメーション予測を用いて、生成されたメッセージの校正を行い、受信者の気晴らしを最小限にする。
- 参考スコア(独自算出の注目度): 23.27599901280979
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To complete assignments provided by humans in natural language, robots must interpret commands, generate and answer relevant questions for scene understanding, and manipulate target objects. Real-world deployments often require multiple heterogeneous robots with different manipulation capabilities to handle different assignments cooperatively. Beyond the need for specialized manipulation skills, effective information gathering is important in completing these assignments. To address this component of the problem, we formalize the information-gathering process in a fully cooperative setting as an underexplored multi-agent multi-task Embodied Question Answering (MM-EQA) problem, which is a novel extension of canonical Embodied Question Answering (EQA), where effective communication is crucial for coordinating efforts without redundancy. To address this problem, we propose CommCP, a novel LLM-based decentralized communication framework designed for MM-EQA. Our framework employs conformal prediction to calibrate the generated messages, thereby minimizing receiver distractions and enhancing communication reliability. To evaluate our framework, we introduce an MM-EQA benchmark featuring diverse, photo-realistic household scenarios with embodied questions. Experimental results demonstrate that CommCP significantly enhances the task success rate and exploration efficiency over baselines. The experiment videos, code, and dataset are available on our project website: https://comm-cp.github.io.
- Abstract(参考訳): 自然言語で人間によって提供される課題を完了させるためには、ロボットは命令を解釈し、シーン理解のための関連する質問を生成し、答え、ターゲットオブジェクトを操作する必要がある。
実世界の展開には、異なる操作能力を持つ複数の異種ロボットが協力して作業を行う必要があることが多い。
専門的な操作スキルの必要以上に、これらの課題を完了させる上で効果的な情報収集が重要である。
この課題に対処するため,本研究では,多目的多目的質問回答(MM-EQA)問題として,多目的質問回答(MM-EQA)問題として,多目的質問回答(MM-EQA)問題として,完全協調環境での情報収集プロセスを定式化し,冗長性のない作業のコーディネートに効果的なコミュニケーションが不可欠である。
この問題に対処するために,MM-EQA 用に設計された新しい LLM ベースの分散通信フレームワーク CommCP を提案する。
本フレームワークでは, 受信者の気晴らしを最小限に抑え, 通信信頼性を向上させるために, コンフォメーション予測を用いて生成したメッセージを校正する。
本フレームワークの評価には,多種多様で写真リアリスティックな家庭シナリオを具体化したMM-EQAベンチマークを導入する。
実験結果から,ComCPはタスク成功率と探索効率を大幅に向上させることが示された。
実験ビデオ、コード、データセットはプロジェクトのWebサイトで公開されています。
関連論文リスト
- ComAgent: Multi-LLM based Agentic AI Empowered Intelligent Wireless Networks [62.031889234230725]
6Gネットワークは複雑な層間最適化に依存している。
数学の定式化に高レベルの意図を手動で翻訳することは、まだボトルネックである。
我々はマルチLLMエージェントAIフレームワークであるComAgentを紹介する。
論文 参考訳(メタデータ) (2026-01-27T13:43:59Z) - Learning to Interact in World Latent for Team Coordination [53.51290193631586]
本研究は,多エージェント強化学習(MARL)におけるチーム協調を支援するために,対話型ワールドラテント(IWoL)という新しい表現学習フレームワークを提案する。
コミュニケーションプロトコルを直接モデル化することにより,エージェント間関係とタスク固有の世界情報とを協調的にキャプチャする学習可能な表現空間を構築する。
私たちの表現は、各エージェントの暗黙のラテントとしてだけでなく、コミュニケーションのための明示的なメッセージとしても使用できます。
論文 参考訳(メタデータ) (2025-09-29T22:13:39Z) - Communicating Plans, Not Percepts: Scalable Multi-Agent Coordination with Embodied World Models [0.0]
MARL(Multi-Agent Reinforcement Learning)の中心的な疑問は、通信プロトコルを設計するか、エンドツーエンドで学習するかである。
本稿では,協調的なタスク割り当て問題に対する2つのコミュニケーション戦略を提案し,比較する。
我々の実験によると、創発的コミュニケーションは単純な設定で実現可能であるが、設計された世界モデルベースのアプローチは、複雑さが増大するにつれて、優れたパフォーマンス、サンプル効率、スケーラビリティを示す。
論文 参考訳(メタデータ) (2025-08-04T21:29:07Z) - AgentMaster: A Multi-Agent Conversational Framework Using A2A and MCP Protocols for Multimodal Information Retrieval and Analysis [0.0]
本稿では,A2AとMPPを自己実装した新しいモジュール型マルチプロトコールMASフレームワークであるAgentMasterの試験的検討を行う。
このシステムは、先行技術知識のない自然言語インタラクションをサポートし、情報検索、質問応答、画像解析を含むタスクに対するマルチモーダルクエリに応答する。
全体として、提案するフレームワークは、MASを利用したドメイン固有、協調的、スケーラブルな対話型AIの可能性に寄与する。
論文 参考訳(メタデータ) (2025-07-08T03:34:26Z) - Cross-Task Experiential Learning on LLM-based Multi-Agent Collaboration [63.90193684394165]
マルチエージェント・クロスタスク体験学習(MAEL)は,LSM駆動型エージェントに明示的なクロスタスク学習と経験蓄積を付与する新しいフレームワークである。
経験的学習フェーズでは、タスク解決ワークフローの各ステップの品質を定量化し、その結果の報酬を記憶する。
推論中、エージェントは、各推論ステップの有効性を高めるために、いくつかの例として、高頻度のタスク関連体験を検索する。
論文 参考訳(メタデータ) (2025-05-29T07:24:37Z) - Cooperative and Asynchronous Transformer-based Mission Planning for Heterogeneous Teams of Mobile Robots [1.1049608786515839]
エージェント間の分散意思決定を協調するための協調型非同期トランスフォーマーベースミッションプランニング(CATMiP)フレームワークを提案する。
我々は,CATMiPを2次元グリッドワールドシミュレーション環境で評価し,その性能を計画に基づく探索法と比較した。
論文 参考訳(メタデータ) (2024-10-08T21:14:09Z) - Cooperation, Competition, and Maliciousness: LLM-Stakeholders Interactive Negotiation [52.930183136111864]
我々は,大言語モデル(LLM)を評価するためにスコーラブルネゴシエーション(scorable negotiations)を提案する。
合意に達するには、エージェントは強力な算術、推論、探索、計画能力を持つ必要がある。
我々は、新しいゲームを作成し、進化するベンチマークを持つことの難しさを増大させる手順を提供する。
論文 参考訳(メタデータ) (2023-09-29T13:33:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。