論文の概要: Learning to Communicate: Toward End-to-End Optimization of Multi-Agent Language Systems
- arxiv url: http://arxiv.org/abs/2604.21794v1
- Date: Thu, 23 Apr 2026 15:53:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-24 14:40:06.701264
- Title: Learning to Communicate: Toward End-to-End Optimization of Multi-Agent Language Systems
- Title(参考訳): コミュニケーションを学ぶ:マルチエージェント言語システムのエンドツーエンド最適化を目指して
- Authors: Ye Yu, Heming Liu, Haibo Jin, Xiaopeng Yuan, Peng Kuang, Haohan Wang,
- Abstract要約: 本稿では,マルチエージェントシステムの学習可能なコンポーネントとして,潜時通信を扱うトレーニングフレームワークDiffMASを提案する。
実験により,DiffMASは単一エージェント推論,テキストベースマルチエージェントシステム,先行潜時通信方式に対して,推論精度と復号安定性を一貫して向上することが示された。
- 参考スコア(独自算出の注目度): 30.327850022896286
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-agent systems built on large language models have shown strong performance on complex reasoning tasks, yet most work focuses on agent roles and orchestration while treating inter-agent communication as a fixed interface. Latent communication through internal representations such as key-value caches offers a promising alternative to text-based protocols, but existing approaches do not jointly optimize communication with multi-agent reasoning. Therefore we propose DiffMAS, a training framework that treats latent communication as a learnable component of multi-agent systems. DiffMAS performs parameter-efficient supervised training over multi-agent latent trajectories, enabling agents to jointly learn how information should be encoded and interpreted across interactions. Experiments on mathematical reasoning, scientific QA, code generation, and commonsense benchmarks show that DiffMAS consistently improves reasoning accuracy and decoding stability over single-agent inference, text-based multi-agent systems, and prior latent communication methods, achieving 26.7% on AIME24, 20.2% on GPQA-Diamond, and consistent gains across reasoning benchmarks.
- Abstract(参考訳): 大規模言語モデル上に構築されたマルチエージェントシステムは複雑な推論タスクにおいて高い性能を示してきたが、ほとんどの研究はエージェントの役割とオーケストレーションに焦点を当て、エージェント間通信を固定インターフェースとして扱う。
キーバリューキャッシュのような内部表現による遅延通信は、テキストベースのプロトコルに代わる有望な代替手段を提供するが、既存のアプローチはマルチエージェント推論による通信を共同で最適化しない。
そこで本稿では,マルチエージェントシステムの学習可能なコンポーネントとして遅延通信を扱うトレーニングフレームワークであるDiffMASを提案する。
DiffMASはマルチエージェントの潜在軌道上でパラメータ効率の高い教師あり訓練を行い、エージェントは対話間でどのように情報をエンコードし解釈するかを共同で学ぶことができる。
数学的推論、科学的なQA、コード生成、コモンセンスベンチマークの実験では、DiffMASは単エージェント推論、テキストベースのマルチエージェントシステム、およびそれ以前の遅延通信方式よりも推論精度と復号安定性を一貫して改善し、AIME24では26.7%、GPQA-ダイアモンドでは20.2%、推論ベンチマークでは一貫して向上している。
関連論文リスト
- Agent Q-Mix: Selecting the Right Action for LLM Multi-Agent Systems through Reinforcement Learning [68.85408801740228]
協調型マルチエージェント強化学習問題としてトポロジ選択を再構成する強化学習フレームワークである textbfAgent Q-Mix を提案する。
提案手法は,Qmix値分解を用いて分散化された通信決定を学習し,各エージェントがラウンドワイド通信グラフを共同生成する一連の通信行動から選択する。
エージェントQ-Mixは,エージェント故障に対して優れたトークン効率とロバスト性を示しながら,既存手法と比較して高い平均精度を達成する。
論文 参考訳(メタデータ) (2026-04-01T00:38:24Z) - MARTI-MARS$^2$: Scaling Multi-Agent Self-Search via Reinforcement Learning for Code Generation [64.2621682259008]
セルフサーチスケーリングによるマルチエージェント強化トレーニングと推論フレームワーク(MARTI-MARS2)
本稿では,MARTI-MARS2を用いたマルチエージェント強化学習・推論フレームワークを提案する。
我々は、MARTI-MARS2が77.7%を獲得し、GPT-5.1のような強力なベースラインを、挑戦的なコード生成ベンチマークで上回っていることを示す。
論文 参考訳(メタデータ) (2026-02-08T07:28:44Z) - AgentRouter: A Knowledge-Graph-Guided LLM Router for Collaborative Multi-Agent Question Answering [51.07491603393163]
tAgentは知識グラフ誘導ルーティング問題としてマルチエージェントQAを定式化するフレームワークである。
エージェントアウトプットのソフトな監督と重み付けされた集約を活用することで、エージェントは多様なエージェントの相補的な強みを捉える、原則化された協調スキームを学ぶ。
論文 参考訳(メタデータ) (2025-10-06T23:20:49Z) - MCP-Orchestrated Multi-Agent System for Automated Disinformation Detection [84.75972919995398]
本稿では,関係抽出を用いてニュース記事の偽情報を検出するマルチエージェントシステムを提案する。
提案したエージェントAIシステムは、(i)機械学習エージェント(ロジスティック回帰)、(ii)Wikipedia知識チェックエージェント、(iv)Webスクラッドデータアナライザの4つのエージェントを組み合わせる。
その結果、マルチエージェントアンサンブルはF1スコア0.964で95.3%の精度を達成し、個々のエージェントや従来のアプローチよりも大幅に優れていた。
論文 参考訳(メタデータ) (2025-08-13T19:14:48Z) - AgentMaster: A Multi-Agent Conversational Framework Using A2A and MCP Protocols for Multimodal Information Retrieval and Analysis [0.0]
本稿では,A2AとMPPを自己実装した新しいモジュール型マルチプロトコールMASフレームワークであるAgentMasterの試験的検討を行う。
このシステムは、先行技術知識のない自然言語インタラクションをサポートし、情報検索、質問応答、画像解析を含むタスクに対するマルチモーダルクエリに応答する。
全体として、提案するフレームワークは、MASを利用したドメイン固有、協調的、スケーラブルな対話型AIの可能性に寄与する。
論文 参考訳(メタデータ) (2025-07-08T03:34:26Z) - AnyMAC: Cascading Flexible Multi-Agent Collaboration via Next-Agent Prediction [77.62279834617475]
本稿では,グラフ構造ではなくシーケンシャル構造を用いて,マルチエージェント協調を再考するフレームワークを提案する。
提案手法は,(1)各ステップで最も適したエージェントロールを選択するNext-Agent Predictionと,(2)各エージェントが前ステップから関連する情報にアクセスできるようにするNext-Context Selectionの2つの重要な方向に焦点を当てる。
論文 参考訳(メタデータ) (2025-06-21T18:34:43Z) - Research on Multi-Agent Communication and Collaborative Decision-Making
Based on Deep Reinforcement Learning [0.0]
本論文は,マルチエージェント・プロキシ・ポリシー最適化アルゴリズムに基づくマルチエージェントの協調的意思決定について考察する。
異なるエージェントは、エージェント間の情報交換を通じて局所的な観測によって引き起こされる非定常性を緩和することができる。
実験結果から,マルチエージェント環境の非定常性を改善する効果が得られた。
論文 参考訳(メタデータ) (2023-05-23T14:20:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。