論文の概要: Active Learning for Communication Structure Optimization in LLM-Based Multi-Agent Systems
- arxiv url: http://arxiv.org/abs/2605.05703v2
- Date: Fri, 08 May 2026 07:16:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 16:31:23.022828
- Title: Active Learning for Communication Structure Optimization in LLM-Based Multi-Agent Systems
- Title(参考訳): LLMに基づくマルチエージェントシステムにおける通信構造最適化のためのアクティブラーニング
- Authors: Huchen Yang, Xinghao Dong, Dan Negrut, Jin-Long Wu,
- Abstract要約: コミュニケーション構造最適化のためのアンサンブルに基づく情報理論タスク選択フレームワークを提案する。
提案手法は,候補タスクがグラフパラメータ上の分布をどの程度変化させるかによって,タスクのインフォメーション性を推定する。
本手法をエージェント攻撃による良質な設定と設定の両方で検証し、制約された計算予算下での通信構造最適化の有効性を実証する。
- 参考スコア(独自算出の注目度): 1.8605423959642353
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Optimizing the communication structure of large language model based multi-agent systems (LLM-MAS) has been shown to improve downstream performance and reduce token usage. Existing methods typically rely on randomly sampled training tasks. However, tasks may differ substantially in difficulty and domain, and thus they are not equally informative for updating communication structure, making optimization under limited training budgets often unstable and highly sensitive to the particular training set. To actively identify the most valuable tasks for communication-structure optimization, we propose an ensemble-based information-theoretic task selection framework. The proposed method estimates task informativeness by how much a candidate task changes the distribution over graph parameters, using ensemble Kalman inversion as an efficient and derivative-free approximation of the corresponding Bayesian update. The resulting estimator is especially suitable for black-box and noisy multi-agent systems. To enhance scalability, we construct a compact candidate pool through embedding-based representative selection and combine the informative selection with surrogate modeling and batch Thompson sampling. We validate our method in both benign settings and settings with agent attacks, demonstrating its effectiveness for communication-structure optimization under constrained computational budgets.
- Abstract(参考訳): 大規模言語モデルに基づくマルチエージェントシステム(LLM-MAS)の通信構造を最適化することにより、ダウンストリーム性能を改善し、トークンの使用量を削減することが示されている。
既存の方法は、通常ランダムにサンプリングされたトレーニングタスクに依存する。
しかし、タスクは難易度や領域によって大きく異なり、コミュニケーション構造を更新するのに等しく有益ではないため、限られた訓練予算の下での最適化はしばしば不安定であり、特定の訓練セットに非常に敏感である。
コミュニケーション構造最適化において最も有用なタスクを積極的に識別するために,アンサンブルに基づく情報理論タスク選択フレームワークを提案する。
提案手法は,候補タスクがグラフパラメータ上の分布をどの程度変化させるかによって,タスク情報度を推定する。
得られた推定器はブラックボックスとノイズの多いマルチエージェントシステムに特に適している。
拡張性を高めるため,埋め込み型代表選択によりコンパクトな候補プールを構築し,情報的選択と代理モデルとバッチトンプソンサンプリングを組み合わせる。
本手法をエージェント攻撃による良質な設定と設定の両方で検証し、制約された計算予算下での通信構造最適化の有効性を実証する。
関連論文リスト
- Joint Semantic Token Selection and Prompt Optimization for Interpretable Prompt Learning [57.91658393667469]
Interpretable Prompt Learningは、個別の意味トークンの選択と連続的なプロンプト最適化を交互に行うハイブリッドフレームワークである。
我々のフレームワークはプラグイン・アンド・プレイであり、既存の即興学習手法とシームレスに統合できる。
論文 参考訳(メタデータ) (2026-05-06T02:38:59Z) - A Unified Multi-Task Learning Framework for Generative Auto-Bidding with Validation-Aligned Optimization [51.27959658504722]
マルチタスク学習は、これらのタスクを共有表現を通じて共同でトレーニングするための、原則化されたフレームワークを提供する。
既存のマルチタスク最適化戦略は、主にトレーニングダイナミクスによって導かれ、不安定な入札環境ではよく一般化される。
本稿では,タスク毎のトレーニング勾配と保留有効度勾配のアライメントに基づいてタスク重みを適応的に割り当てる,バリデーション適応型マルチタスク最適化(VAMO)を提案する。
論文 参考訳(メタデータ) (2025-10-09T03:59:51Z) - Agentic Predictor: Performance Prediction for Agentic Workflows via Multi-View Encoding [56.565200973244146]
Agentic Predictorは、効率的なエージェントワークフロー評価のための軽量な予測器である。
Agentic Predictorはタスク成功率の近似を学ぶことで、最適なエージェントワークフロー構成の迅速かつ正確な選択を可能にする。
論文 参考訳(メタデータ) (2025-05-26T09:46:50Z) - Optima: Optimizing Effectiveness and Efficiency for LLM-Based Multi-Agent System [75.25394449773052]
大規模言語モデル (LLM) に基づくマルチエージェントシステム (MAS) は協調的問題解決において顕著な可能性を示している。
通信効率の低下、スケーラビリティの低下、効果的なパラメータ更新方法の欠如などです。
本稿では,コミュニケーション効率とタスク効率を両立させ,これらの課題に対処する新しいフレームワークOptimaを提案する。
論文 参考訳(メタデータ) (2024-10-10T17:00:06Z) - In-context Demonstration Matters: On Prompt Optimization for Pseudo-Supervision Refinement [71.60563181678323]
大規模言語モデル(LLM)は様々なタスクで大きな成功を収めており、生成品質をさらに向上させるためには微調整が必要である場合もある。
これらの課題に対処する直接的な解決策は、教師なしの下流タスクから高信頼のデータを生成することである。
本稿では,プロンプトと全体的な擬似スーパービジョンを両立させる新しい手法,擬似教師付きデモアライメント・アライメント・アライメント・プロンプト・最適化(PAPO)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-04T03:39:28Z) - CMAT: A Multi-Agent Collaboration Tuning Framework for Enhancing Small Language Models [8.793510432881803]
厳密にキュレートされた高品質データセットに基づいてトレーニングされたTinyAgentモデルを紹介する。
また,言語エージェントの能力向上を目的とした革新的システムであるCMAT(Collaborative Multi-Agent Tuning)フレームワークを提案する。
本研究では,マルチエージェントシステムと環境フィードバック機構を統合した新しいコミュニケーションエージェントフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-02T06:07:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。