論文の概要: Agent-as-a-Router: Agentic Model Routing for Coding Tasks
- arxiv url: http://arxiv.org/abs/2606.22902v1
- Date: Mon, 22 Jun 2026 06:37:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 03:48:13.749463
- Title: Agent-as-a-Router: Agentic Model Routing for Coding Tasks
- Title(参考訳): Agent-as-a-Router: 符号化タスクのためのエージェントモデルルーティング
- Authors: Pengfei Zhou, Zhiwei Tang, Yixing Ma, Jiasheng Tang, Yizeng Han, Zhenglin Wan, Fanqing Meng, Wei Wang, Bohan Zhuang, Wangbo Zhao, Yang You,
- Abstract要約: Agent-as-a-router (AC)はC-A-Fループとしてルーティングを形式化する(Context->Action->FeedbackContext)
ACは、分配タスクに対する最小の累積後悔を達成し、配布外エージェントプログラミングタスクに一般化する。
- 参考スコア(独自算出の注目度): 54.00153674547733
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Real-world users typically have access to multiple Large Language Models (LLMs) from different providers, and these LLMs often excel at distinct domains, yet none dominate all. Consequently, routing each task to the most suitable model becomes critical for both performance and cost. Existing routers treat this as a static, one-off classification problem. However, we identify the performance bottleneck for these routers as information deficit: simply augmenting a vanilla LLM router with performance statistics at the task-dimension level yields a 15.3% relative gain, surpassing a heuristic router built on the same dimension-level priors. Motivated by this finding, we propose Agent-as-a-Router, a framework that formalizes routing as a C-A-F loop (Context->Action->Feedback->Context). It closes the information gap by accumulating execution-grounded experience during deployment. We instantiate this framework as ACRouter, composed of an Orchestrator, a Verifier, a Memory module, and introduce CodeRouterBench, an evaluation environment comprising ~10K task instances with verified scores from 8 frontier LLMs, enabling regret-based router comparison on streaming tasks. Experiments show that ACRouter achieves the lowest cumulative regret on in-distribution tasks and generalizes to out-of-distribution agentic-programming tasks, demonstrating that our routing framework actively closes the information gap. Codes and benchmarks are released at https://github.com/LanceZPF/agent-as-a-router.
- Abstract(参考訳): 現実世界のユーザは、通常、異なるプロバイダから複数のLarge Language Model(LLM)にアクセスでき、これらのLLMは、しばしば異なるドメインで優れているが、全てを支配していない。
その結果、各タスクを最も適切なモデルにルーティングすることは、パフォーマンスとコストの両方において重要となる。
既存のルータは、これを静的なワンオフ分類問題として扱う。
しかし、これらのルータの性能ボトルネックを情報不足とみなす: タスク次元レベルでの性能統計を付加したバニラLLMルータを単に拡張するだけで、同じ次元レベルで構築されたヒューリスティックルータよりも15.3%の利得が得られる。
本稿では,C-A-Fループ(Context->Action->Feedback->Context)としてルーティングを形式化するフレームワークであるAgent-as-a-Routerを提案する。
デプロイ中に実行時のエクスペリエンスを蓄積することで、情報ギャップを埋める。
このフレームワークをACRouterとしてインスタンス化し,Orchestrator,Verifier,Memoryモジュールで構成されたCodeRouterBenchを紹介した。
実験の結果,ACRouterは分散処理タスクにおいて最小の累積後悔を達成し,分散処理以外のエージェントプログラミングタスクに一般化し,ルーティングフレームワークが情報ギャップを積極的に埋めることを示す。
コードとベンチマークはhttps://github.com/LanceZPF/agent-as-a-router.comで公開されている。
関連論文リスト
- The Routing Plateau: Understanding and Breaking the Accuracy Limits of LLM Routers [19.847272668359707]
LLMルーティングは、各クエリのモデルを動的に選択することで、LLMサービスのコスト品質トレードオフを改善するための一般的なアプローチである。
最近の研究では、クラスタリングベースのルータ、学習された分類器、ペアワイズランキング、信頼に基づくアプローチなど、幅広いルーティング方法が検討されている。
kNNを含む多くの手法は、非常によく似た精度を達成し、オラクルルータよりはるかに低い狭い性能範囲に収束する。
論文 参考訳(メタデータ) (2026-05-27T19:29:01Z) - Learning Agent Routing From Early Experience [55.88886987958933]
バウンダリ(Boundary)は、初期の行動経験とルーリック誘導推論を使用して、クエリに直接推論で答えるか、エージェントにエスカレートするかを決定する、トレーニング不要なルーティングフレームワークである。
また, 直接LLM推定よりも28.6%性能が向上し, 予測時間を60.6%短縮することを示した。
論文 参考訳(メタデータ) (2026-05-08T03:18:40Z) - LLMRouterBench: A Massive Benchmark and Unified Framework for LLM Routing [44.046399484829635]
大規模言語モデル(LLM)ルーティングは、各クエリをアンサンブルから最も適切なモデルに割り当てる。
LLMルーティングのための大規模ベンチマークおよび統合フレームワークであるLLMBenchを紹介する。
21のデータセットと33のモデルから400K以上のインスタンスで構成されている。
論文 参考訳(メタデータ) (2026-01-12T05:01:15Z) - AgentRouter: A Knowledge-Graph-Guided LLM Router for Collaborative Multi-Agent Question Answering [51.07491603393163]
tAgentは知識グラフ誘導ルーティング問題としてマルチエージェントQAを定式化するフレームワークである。
エージェントアウトプットのソフトな監督と重み付けされた集約を活用することで、エージェントは多様なエージェントの相補的な強みを捉える、原則化された協調スキームを学ぶ。
論文 参考訳(メタデータ) (2025-10-06T23:20:49Z) - RCR-Router: Efficient Role-Aware Context Routing for Multi-Agent LLM Systems with Structured Memory [57.449129198822476]
RCRは、マルチエージェント大言語モデル(LLM)システムのためのロールアウェアコンテキストルーティングフレームワークである。
役割とタスクステージに基づいて、各エージェントに対して意味的に関連するメモリサブセットを動的に選択する。
軽量スコアリングポリシは、メモリ選択をガイドし、エージェント出力を共有メモリストアに統合する。
論文 参考訳(メタデータ) (2025-08-06T21:59:34Z) - RAGRouter: Learning to Route Queries to Multiple Retrieval-Augmented Language Models [45.58601993849455]
Retrieval-Augmented Generation (RAG) は、知識集約タスクにおけるLarge Language Models (LLM) の性能を大幅に向上させる。
既存のルーティング手法はRAGシナリオで最適以下の性能を示すのに対し,外部文書はLLMのクエリ応答能力に動的に影響を及ぼす。
本稿では、文書埋め込みとRAG機能埋め込みを利用して知識表現シフトを捉えるパラメトリックなRAG対応ルーティング設計であるRAGを提案する。
論文 参考訳(メタデータ) (2025-05-29T03:44:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。