論文の概要: EvoRoute: Experience-Driven Self-Routing LLM Agent Systems
- arxiv url: http://arxiv.org/abs/2601.02695v1
- Date: Tue, 06 Jan 2026 04:06:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-07 17:02:12.794161
- Title: EvoRoute: Experience-Driven Self-Routing LLM Agent Systems
- Title(参考訳): EvoRoute: 経験駆動型自走式LDMエージェントシステム
- Authors: Guibin Zhang, Haiyang Yu, Kaiming Yang, Bingli Wu, Fei Huang, Yongbin Li, Shuicheng Yan,
- Abstract要約: EvoRouteは、静的で事前定義されたモデルの割り当てを超越する、自己進化型のモデルルーティングパラダイムである。
挑戦的なエージェントベンチマークの実験によると、既製のエージェントシステムに統合されたEvoRouteは、システムのパフォーマンスを維持または向上するだけでなく、実行コストを最大80%削減し、レイテンシを70%以上削減する。
- 参考スコア(独自算出の注目度): 100.64399490164959
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Complex agentic AI systems, powered by a coordinated ensemble of Large Language Models (LLMs), tool and memory modules, have demonstrated remarkable capabilities on intricate, multi-turn tasks. However, this success is shadowed by prohibitive economic costs and severe latency, exposing a critical, yet underexplored, trade-off. We formalize this challenge as the \textbf{Agent System Trilemma}: the inherent tension among achieving state-of-the-art performance, minimizing monetary cost, and ensuring rapid task completion. To dismantle this trilemma, we introduce EvoRoute, a self-evolving model routing paradigm that transcends static, pre-defined model assignments. Leveraging an ever-expanding knowledge base of prior experience, EvoRoute dynamically selects Pareto-optimal LLM backbones at each step, balancing accuracy, efficiency, and resource use, while continually refining its own selection policy through environment feedback. Experiments on challenging agentic benchmarks such as GAIA and BrowseComp+ demonstrate that EvoRoute, when integrated into off-the-shelf agentic systems, not only sustains or enhances system performance but also reduces execution cost by up to $80\%$ and latency by over $70\%$.
- Abstract(参考訳): 複雑なエージェントAIシステムは、LLM(Large Language Models)、ツール、メモリモジュールの協調アンサンブルによって駆動される。
しかし、この成功は禁止的な経済コストと厳しい遅延によって影を落とし、重要で過度に調査されていないトレードオフを露呈している。
我々は、この課題を『textbf{Agent System Trilemma} 』として定式化している。
このトリレンマを分解するために、静的で事前定義されたモデルの割り当てを超越する自己進化型モデルルーティングパラダイムであるEvoRouteを紹介します。
EvoRouteは、これまで経験してきた知識ベースを活用して、各ステップでPareto-Optimal LLMバックボーンを動的に選択し、正確性、効率、リソース使用のバランスをとりながら、環境フィードバックを通じて独自の選択ポリシーを継続的に修正する。
GAIAやBrowseComp+のような挑戦的なエージェントベンチマークの実験では、既製のエージェントシステムに統合されたEvoRouteは、システムのパフォーマンスを維持または向上するだけでなく、実行コストを最大80\%、レイテンシを70\%以上削減する。
関連論文リスト
- Towards Resource-Efficient Multimodal Intelligence: Learned Routing among Specialized Expert Models [0.0]
大規模言語モデル(LLM)は、視覚、音声、文書理解の力を強めている。
小さなオープンソースモデルはコスト上の利点を提供するが、複雑なクエリやマルチモーダルクエリに苦労する。
私たちは、各クエリを最も適したエキスパートモデルにインテリジェントにルーティングする、統一されたモジュール化されたフレームワークを導入します。
論文 参考訳(メタデータ) (2025-11-09T16:14:56Z) - Don't Just Fine-tune the Agent, Tune the Environment [25.7349297100143]
合成データの微調整の監督は、過度な適合につながる。
標準的な強化学習は、重要なコールドスタート問題とトレーニング不安定性に苦慮している。
本研究は,静的軌道の教師付き微調整から動的環境探索へのパラダイムシフトを示す。
論文 参考訳(メタデータ) (2025-10-11T12:35:15Z) - xRouter: Training Cost-Aware LLMs Orchestration System via Reinforcement Learning [104.63494870852894]
我々は,学習したルータが直接応答するか,あるいは1つ以上の外部モデルを呼び出すことができるツールコールベースのルーティングシステム x を提案する。
当社の実装には、報酬とコスト会計を含む、完全な強化学習フレームワークが含まれています。
さまざまなベンチマークで、xはコストパフォーマンスのトレードオフを強く達成します。
論文 参考訳(メタデータ) (2025-10-09T16:52:01Z) - SATER: A Self-Aware and Token-Efficient Approach to Routing and Cascading [39.20076289493037]
本稿では,最短応答の選好最適化と信頼度を考慮した拒絶機構を通じて細管モデルをモデル化する二重モード互換手法SATERを紹介する。
SATERは、前世代のルーティングの性能とカスケードルーティングの効率の両方を改善しながら、冗長な出力と応答時間を著しく削減する。
論文 参考訳(メタデータ) (2025-10-04T19:55:36Z) - MAS$^2$: Self-Generative, Self-Configuring, Self-Rectifying Multi-Agent Systems [40.44248136759827]
マルチエージェントシステムを自律的に設計するマルチエージェントシステムであるMAS$2$を紹介する。
MAS$2$は、最先端のMASに対して最大19.6%のパフォーマンス向上を達成する。
論文 参考訳(メタデータ) (2025-09-29T06:20:10Z) - Dynamic Speculative Agent Planning [57.630218933994534]
大規模な言語モデルベースのエージェントは、遅延の禁止と推論コストのために、重要なデプロイメント課題に直面している。
本稿では,オンライン強化学習フレームワークである動的投機計画(Dynamic Speculative Planning, DSP)を紹介する。
2つの標準エージェントベンチマークの実験では、DSPは高速加速法に匹敵する効率を達成し、総コストを30%削減し、不要コストを60%まで削減している。
論文 参考訳(メタデータ) (2025-09-02T03:34:36Z) - MixLLM: Dynamic Routing in Mixed Large Language Models [57.309520357563215]
大規模言語モデル(LLM)は、最近、人工知能の可能性を秘めている。
問合せ-LLM代入のための動的コンテキスト帯域ベースのルーティングシステムであるMixLLMを開発した。
論文 参考訳(メタデータ) (2025-02-09T02:26:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。