論文の概要: Experience as a Compass: Multi-agent RAG with Evolving Orchestration and Agent Prompts
- arxiv url: http://arxiv.org/abs/2604.00901v2
- Date: Thu, 02 Apr 2026 21:22:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 12:42:34.256992
- Title: Experience as a Compass: Multi-agent RAG with Evolving Orchestration and Agent Prompts
- Title(参考訳): コンパスとしての体験 : オーケストレーションとエージェントプロンプットを併用したマルチエージェントRAG
- Authors: Sha Li, Naren Ramakrishnan,
- Abstract要約: HERAは階層的なフレームワークで、マルチエージェントオーケストレーションとロール固有のエージェントプロンプトを共同で進化させる。
HERAは最近のベースラインよりも平均38.69%改善している。
トポロジカル分析により、スパース探索がコンパクトで高ユーティリティなマルチエージェントネットワークを生み出す創発的な自己組織化が明らかになった。
- 参考スコア(独自算出の注目度): 22.323342919724492
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Multi-agent Retrieval-Augmented Generation (RAG), wherein each agent takes on a specific role, supports hard queries that require multiple steps and sources, or complex reasoning. Existing approaches, however, rely on static agent behaviors and fixed orchestration strategies, leading to brittle performance on diverse, multi-hop tasks. We identify two key limitations: the lack of continuously adaptive orchestration mechanisms and the absence of behavior-level learning for individual agents. To this end, we propose HERA, a hierarchical framework that jointly evolves multi-agent orchestration and role-specific agent prompts. At the global level, HERA optimizes query-specific agent topologies through reward-guided sampling and experience accumulation. At the local level, Role-Aware Prompt Evolution refines agent behaviors via credit assignment and dual-axes adaptation along operational and behavioral principles, enabling targeted, role-conditioned improvements. On six knowledge-intensive benchmarks, HERA achieves an average improvement of 38.69\% over recent baselines while maintaining robust generalization and token efficiency. Topological analyses reveal emergent self-organization, where sparse exploration yields compact, high-utility multi-agent networks, demonstrating both efficient coordination and robust reasoning.
- Abstract(参考訳): エージェントが特定の役割を担うマルチエージェント検索拡張生成(RAG)は、複数のステップとソースを必要とするハードクエリ、複雑な推論をサポートする。
しかし、既存のアプローチは静的エージェントの動作と固定されたオーケストレーション戦略に依存しており、多様なマルチホップタスクのパフォーマンスが不安定になる。
継続的適応的なオーケストレーション機構の欠如と,個々のエージェントに対する行動レベルの学習の欠如という,2つの重要な制限を識別する。
この目的のために,マルチエージェントオーケストレーションとロール固有のエージェントプロンプトを共同で進化させる階層型フレームワークHERAを提案する。
世界レベルでは、HERAは報酬誘導サンプリングと経験蓄積を通じてクエリ固有のエージェントトポロジを最適化する。
ローカルレベルでは、ロール・アウェア・プロンプト・エボリューション(Role-Aware Prompt Evolution)は、エージェントの振る舞いを信用代入や、運用原則と行動原則に沿った二重軸適応を通じて洗練し、ターゲットとなるロール条件の改善を可能にする。
6つの知識集約型ベンチマークでは、HERAは、堅牢な一般化とトークン効率を維持しながら、最近のベースラインよりも38.69\%の平均的な改善を実現している。
トポロジカル分析により、スパース探索がコンパクトで高ユーティリティなマルチエージェントネットワークを生み出し、効率的なコーディネーションとロバストな推論の両方を実証する創発的な自己組織化が明らかになった。
関連論文リスト
- MARTI-MARS$^2$: Scaling Multi-Agent Self-Search via Reinforcement Learning for Code Generation [64.2621682259008]
セルフサーチスケーリングによるマルチエージェント強化トレーニングと推論フレームワーク(MARTI-MARS2)
本稿では,MARTI-MARS2を用いたマルチエージェント強化学習・推論フレームワークを提案する。
我々は、MARTI-MARS2が77.7%を獲得し、GPT-5.1のような強力なベースラインを、挑戦的なコード生成ベンチマークで上回っていることを示す。
論文 参考訳(メタデータ) (2026-02-08T07:28:44Z) - InfiAgent: Self-Evolving Pyramid Agent Framework for Infinite Scenarios [28.65914611521654]
InfiAgentはピラミッドのようなDAGベースのMulti-Agent Frameworkで、textbfinfiniteのシナリオに適用できる。
InfiAgentはADAS(類似の自動生成エージェントフレームワーク)と比較して9.9%高いパフォーマンスを実現している
論文 参考訳(メタデータ) (2025-09-26T15:44:09Z) - AgentOrchestra: Orchestrating Hierarchical Multi-Agent Intelligence with the Tool-Environment-Agent(TEA) Protocol [22.406849007798858]
本稿では,環境,エージェント,ツールを統一システムに統合するツール-環境-エージェントプロトコルを提案する。
本稿では,複雑な目的を分解し,特殊エージェントをコーディネートする中央計画エージェントを備えた階層型マルチエージェントフレームワークであるAgensOrchestraを紹介する。
論文 参考訳(メタデータ) (2025-06-14T13:45:37Z) - Multi-Agent Collaboration via Evolving Orchestration [55.574417128944226]
大規模言語モデル(LLM)は、様々な下流タスクで顕著な成果を上げているが、そのモノリシックな性質は複雑な問題解決におけるスケーラビリティと効率を制限している。
LLMに基づくマルチエージェントコラボレーションのためのパウチスタイルのパラダイムを提案し,タスク状態の進化に応じて,中央集権的なオーケストレータ("puppeteer")がエージェント("puppets")を動的に指示する。
クローズドドメインおよびオープンドメインシナリオの実験により,この手法は計算コストを低減し,優れた性能が得られることが示された。
論文 参考訳(メタデータ) (2025-05-26T07:02:17Z) - MorphAgent: Empowering Agents through Self-Evolving Profiles and Decentralized Collaboration [11.01813164951313]
本稿では,新しい自律型・自己組織化型・適応型多エージェントシステムであるMorphAgentを紹介する。
このアプローチでは,3つの主要な指標を通じて最適化された自己進化エージェントプロファイルを採用し,エージェントが個々の専門知識を磨き直す。
実験の結果,MorphAgentはタスク性能や要求の変化に対する適応性という点で,既存のフレームワークよりも優れていた。
論文 参考訳(メタデータ) (2024-10-19T09:10:49Z) - Watch Every Step! LLM Agent Learning via Iterative Step-Level Process Refinement [50.481380478458945]
反復的なステップレベルプロセスリファインメント(IPR)フレームワークは、エージェントトレーニングを強化するためのステップバイステップのガイダンスを提供する。
3つの複雑なエージェントタスクに関する我々の実験は、我々のフレームワークが様々な強力なベースラインより優れていることを示した。
論文 参考訳(メタデータ) (2024-06-17T03:29:13Z) - DCIR: Dynamic Consistency Intrinsic Reward for Multi-Agent Reinforcement
Learning [84.22561239481901]
本稿では,エージェントの行動が他のエージェントの行動と一致しているかどうかを学習するための新しいアプローチを提案する。
マルチエージェント粒子, Google Research Football および StarCraft II Micromanagement を含む複数の環境における DCIR の評価を行った。
論文 参考訳(メタデータ) (2023-12-10T06:03:57Z) - Policy Diagnosis via Measuring Role Diversity in Cooperative Multi-agent
RL [107.58821842920393]
我々はエージェントの行動差を定量化し、bfロールの多様性を通して政策パフォーマンスとの関係を構築する
MARLの誤差は, 役割多様性と強い関係を持つ3つの部分に分けられる。
分解された要因は3つの一般的な方向における政策最適化に大きな影響を及ぼす可能性がある。
論文 参考訳(メタデータ) (2022-06-01T04:58:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。