論文の概要: JADE: Bridging the Strategic-Operational Gap in Dynamic Agentic RAG
- arxiv url: http://arxiv.org/abs/2601.21916v1
- Date: Thu, 29 Jan 2026 16:06:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-30 16:22:49.973672
- Title: JADE: Bridging the Strategic-Operational Gap in Dynamic Agentic RAG
- Title(参考訳): JADE:動的エージェントRAGにおける戦略的操作ギャップのブリッジ
- Authors: Yiqun Chen, Erhan Zhang, Tianyi Hu, Shijie Wang, Zixuan Yang, Meizhi Zhong, Xiaochi Wei, Yan Gao, Yi Wu, Yao Hu, Jiaxin Mao,
- Abstract要約: RAGは、静的な検索パイプラインから、中央プランナーがマルチターン推論をオーケストレーションする動的エージェントへと移行した。
既存のパラダイムは、厳密な固定グラフアーキテクチャ内でモジュールを共同で最適化するか、あるいは動的計画を強化するか、エグゼキュータを凍結したブラックボックスツールとして扱います。
動的マルチターン内における計画と実行の協調最適化のための統合フレームワークである textbfJADE を提案する。
- 参考スコア(独自算出の注目度): 34.97756524623194
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The evolution of Retrieval-Augmented Generation (RAG) has shifted from static retrieval pipelines to dynamic, agentic workflows where a central planner orchestrates multi-turn reasoning. However, existing paradigms face a critical dichotomy: they either optimize modules jointly within rigid, fixed-graph architectures, or empower dynamic planning while treating executors as frozen, black-box tools. We identify that this \textit{decoupled optimization} creates a ``strategic-operational mismatch,'' where sophisticated planning strategies fail to materialize due to unadapted local executors, often leading to negative performance gains despite increased system complexity. In this paper, we propose \textbf{JADE} (\textbf{J}oint \textbf{A}gentic \textbf{D}ynamic \textbf{E}xecution), a unified framework for the joint optimization of planning and execution within dynamic, multi-turn workflows. By modeling the system as a cooperative multi-agent team unified under a single shared backbone, JADE enables end-to-end learning driven by outcome-based rewards. This approach facilitates \textit{co-adaptation}: the planner learns to operate within the capability boundaries of the executors, while the executors evolve to align with high-level strategic intent. Empirical results demonstrate that JADE transforms disjoint modules into a synergistic system, yielding remarkable performance improvements via joint optimization and enabling a flexible balance between efficiency and effectiveness through dynamic workflow orchestration.
- Abstract(参考訳): Retrieval-Augmented Generation (RAG)の進化は、静的検索パイプラインから、中央プランナーがマルチターン推論をオーケストレーションする動的エージェントワークフローへと移行した。
しかし、既存のパラダイムは、厳密な固定グラフアーキテクチャ内でモジュールを共同で最適化するか、あるいは動的計画を強化するか、実行者を凍結したブラックボックスツールとして扱います。
この‘textit{decoupled optimization} が '`strategic-operational mismatch'' を生成すると、未適応のローカルエグゼキュータが原因で高度な計画戦略が実現できず、システムの複雑さが増してもパフォーマンスがマイナスになることが多い。
本稿では,動的マルチターンワークフロー内での計画と実行を協調的に最適化するための統合フレームワークである \textbf{JADE} (\textbf{J}oint \textbf{A}gentic \textbf{D}ynamic \textbf{E}xecution) を提案する。
システムを単一の共有バックボーンの下に統一された協調型マルチエージェントチームとしてモデル化することで、JADEは結果ベースの報酬によって駆動されるエンドツーエンドの学習を可能にする。
プランナーはエグゼキュータの機能境界内で操作することを学び、エグゼキュータは高レベルの戦略的意図と整合するように進化する。
実証的な結果から、JADEは解離モジュールを相乗的システムに変換し、共同最適化による顕著なパフォーマンス向上を実現し、動的ワークフローオーケストレーションによる効率性と効率性の柔軟なバランスを可能にする。
関連論文リスト
- MAESTRO: Meta-learning Adaptive Estimation of Scalarization Trade-offs for Reward Optimization [56.074760766965085]
大規模言語モデル(LLM)の整合性のための効率的なパラダイムとしてグループ相対政策最適化が登場している。
我々は,報酬スカラー化を動的潜在ポリシーとして扱い,モデルの終端隠蔽状態を意味的ボトルネックとして活用するMAESTROを提案する。
本稿では,軽量コンダクタネットワークがメタリワード信号としてグループ相対的優位性を生かしてポリシと共進化する,双方向最適化フレームワークにおけるコンテキスト的帯域幅問題としてこれを定式化する。
論文 参考訳(メタデータ) (2026-01-12T05:02:48Z) - CoDA: A Context-Decoupled Hierarchical Agent with Reinforcement Learning [12.710191300398924]
我々は,低レベルの実行から高レベルの計画を切り離す強化学習フレームワークであるCoDAを紹介する。
CoDAは、複雑なマルチホップ質問応答ベンチマークにおける最先端のベースラインよりも、大幅なパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2025-12-14T14:41:29Z) - Dynamic Generation of Multi-LLM Agents Communication Topologies with Graph Diffusion Models [99.85131798240808]
我々はtextitGuided Topology Diffusion (GTD) と呼ばれる新しい生成フレームワークを導入する。
条件付き離散グラフ拡散モデルにインスパイアされたGTD式は、反復的な構成過程としてトポロジー合成を行う。
各ステップで生成は、多目的報酬を予測する軽量プロキシモデルによって制御される。
実験により、GTDは高いタスク適応性、スパース、効率的な通信トポロジを生成できることが示されている。
論文 参考訳(メタデータ) (2025-10-09T05:28:28Z) - Parallelism Meets Adaptiveness: Scalable Documents Understanding in Multi-Agent LLM Systems [0.8437187555622164]
大規模言語モデル(LLM)エージェントは、協調的なタスク補完の約束が増していることを示している。
既存のマルチエージェントフレームワークは、静的で固定されたロールと限定的なエージェント間通信に依存していることが多い。
本稿では,3つのコア機構による適応性を実現するための協調フレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-22T22:42:51Z) - Multi-Agent Collaboration via Evolving Orchestration [55.574417128944226]
大規模言語モデル(LLM)は、様々な下流タスクで顕著な成果を上げているが、そのモノリシックな性質は複雑な問題解決におけるスケーラビリティと効率を制限している。
LLMに基づくマルチエージェントコラボレーションのためのパウチスタイルのパラダイムを提案し,タスク状態の進化に応じて,中央集権的なオーケストレータ("puppeteer")がエージェント("puppets")を動的に指示する。
クローズドドメインおよびオープンドメインシナリオの実験により,この手法は計算コストを低減し,優れた性能が得られることが示された。
論文 参考訳(メタデータ) (2025-05-26T07:02:17Z) - Flow: Modularized Agentic Workflow Automation [53.073598156915615]
大規模言語モデル(LLM)を利用したマルチエージェントフレームワークは、自動計画とタスク実行において大きな成功を収めている。
しかし, 実行中のエージェントの効果的な調整は十分に研究されていない。
本稿では,エージェントによる継続的なワークフロー改善を可能にするアクティビティ・オン・頂点(AOV)グラフを定義する。
提案するマルチエージェントフレームワークは,サブタスクの効率的な同時実行,効果的なゴール達成,エラー耐性の向上を実現している。
論文 参考訳(メタデータ) (2025-01-14T04:35:37Z) - A Local Information Aggregation based Multi-Agent Reinforcement Learning for Robot Swarm Dynamic Task Allocation [4.144893164317513]
分散化された部分観測可能なマルコフ決定プロセス(Dec_POMDP)を用いた新しいフレームワークを提案する。
我々の方法論の核心は、局所情報集約多元決定政策勾配(LIA_MADDPG)アルゴリズムである。
実験により,LIAモジュールは様々なCTDEベースのMARL法にシームレスに統合可能であることが示された。
論文 参考訳(メタデータ) (2024-11-29T07:53:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。