論文の概要: FlyRoute: Self-Evolving Agent Profiling via Data Flywheel for Adaptive Task Routing
- arxiv url: http://arxiv.org/abs/2605.22057v1
- Date: Thu, 21 May 2026 06:46:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.12121
- Title: FlyRoute: Self-Evolving Agent Profiling via Data Flywheel for Adaptive Task Routing
- Title(参考訳): FlyRoute: 適応タスクルーティングのためのデータフライホイールによるセルフ進化エージェントプロファイリング
- Authors: Rongjun Li, Ziyu Zhou, Yihang Wu,
- Abstract要約: FlyRouteはプロファイリングフレームワークで、実際のトラフィックから能力証拠を成長させる。
定期的に証拠を学習能力記述に蒸留し、BM25で回収された成功と共にこれらの記述を注入する。
FlyRouteは、同じバックボーンのゼロショットLLMルータを72.57%から78.04%に改善した。
- 参考スコア(独自算出の注目度): 10.454059327405163
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Enterprise routers assign queries to expert agents, yet deployed profiles stay static while agents evolve (prompts, tools, models), and developers rarely keep descriptions or exemplars current. We present FlyRoute, a self-evolving profiling framework that grows capability evidence from real traffic: dispatch candidates, quality-gate successful pairs into each agent's success store, periodically distill evidence into learned capability descriptions, and inject those descriptions together with BM25-retrieved successes into an LLM router. To make this flywheel data-efficient, FlyRoute introduces a targeted exploration policy that combines profile uncertainty, BM25 relevance, and lexical novelty, prioritizing under-profiled agents only for plausible queries and avoiding redundant evidence collection. In experiments on our proprietary enterprise developer-support dataset of real routed queries, FlyRoute improves a same-backbone zero-shot LLM router from 72.57% to 78.04% with only five seed queries per agent, showing that profile retrieval already strengthens cold-start routing. After streaming 7,211 labeled training queries through the flywheel, accuracy rises to 89.83% (+17.26pp over zero-shot; +11.79pp over cold start), with consistent gains across four expert domains under standard routing accuracy on single-gold test queries.
- Abstract(参考訳): エンタープライズルータは、専門家のエージェントにクエリを割り当てるが、エージェントが進化している間は、デプロイされたプロファイルは静的のままである(プロンプト、ツール、モデル)。
提案する自己進化型プロファイリングフレームワークであるFlyRouteは、実際のトラフィックから能力証明を増大させる。ディスパッチ候補、各エージェントの成功ストアへの品質ゲート成功ペア、定期的に証拠を抽出して学習能力記述に注入し、BM25で取得した成功と合わせてLSMルータにそれらの記述を注入する。
このフライホイールデータを効率よくするために、FlyRouteはプロファイルの不確実性、BM25の妥当性、語彙的ノベルティを組み合わせた探索ポリシーを導入している。
当社のプロプライエタリな開発者による実際のルーティングクエリデータセットの実験では、FlyRouteは、同じバックボーンのゼロショットLLMルータを72.57%から78.04%に改善した。
フライホイールを通じて7,211ラベルのトレーニングクエリをストリーミングした後、精度は89.83%(ゼロショットで+17.26pp、コールドスタートで+11.79pp)に上昇し、シングルゴールドテストクエリで標準的なルーティング精度の下で4つの専門家ドメインで一貫して向上した。
関連論文リスト
- Route Before Retrieve: Activating Latent Routing Abilities of LLMs for RAG vs. Long-Context Selection [57.3886742625188]
Pre-Routeは、応答前に構造化推論を実行するプロアクティブなルーティングフレームワークである。
本研究は, (i) LLMは, ガイドラインを確実に適用可能な遅延ルーティング能力を有すること, (ii) 線形プローブにより, 表現空間における最適ルーティングの分離性を高めること, (iii) 蒸留により, この推論構造を, 軽量展開のためのより小さなモデルに伝達すること,の3つの重要な知見を示す。
論文 参考訳(メタデータ) (2026-05-11T09:10:55Z) - Learning Agent Routing From Early Experience [55.88886987958933]
バウンダリ(Boundary)は、初期の行動経験とルーリック誘導推論を使用して、クエリに直接推論で答えるか、エージェントにエスカレートするかを決定する、トレーニング不要なルーティングフレームワークである。
また, 直接LLM推定よりも28.6%性能が向上し, 予測時間を60.6%短縮することを示した。
論文 参考訳(メタデータ) (2026-05-08T03:18:40Z) - EvolveRouter: Co-Evolving Routing and Prompt for Multi-Agent Question Answering [39.31752433999864]
エージェントの品質と協調構造を協調的に改善し,制約に対処する訓練可能なフレームワークを提案する。
Evolveは、F1と正確な一致の両方において、SOTAルーティングベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2026-04-06T20:24:54Z) - SkillRouter: Skill Routing for LLM Agents at Scale [18.540967600258607]
ユーザタスクが与えられたら、システムは、下流の計画や実行の前に、関連するスキルを特定する必要がある。
既存のエージェントスタックはプログレッシブな開示に依存しており、完全な実装ボディを隠蔽しながら、スキル名と記述のみを公開する。
1.2Bのコンパクトなフルテキスト検索/参照パイプラインであるSkillを提示する。
論文 参考訳(メタデータ) (2026-03-23T18:23:59Z) - RealRoute: Dynamic Query Routing System via Retrieve-then-Verify Paradigm [19.239852494559212]
予測ルーティングからロバストなRetrieve-then-VerifyメカニズムへパラダイムをシフトするフレームワークであるRealRouteを紹介する。
実験により、RealRouteはマルチホップRag推論タスクにおいて予測ベースラインを大幅に上回ることがわかった。
論文 参考訳(メタデータ) (2026-03-02T17:57:46Z) - Routing with Generated Data: Annotation-Free LLM Skill Estimation and Expert Selection [70.73201284835498]
RGDは、ルータが生成されたクエリと回答のみに基づいてトレーニングされる、困難な設定である。
クエリ・アンサー・ルータ(クエリとラベルの両方を用いて)とクエリのみのルータを4つのベンチマークと12のモデルで評価する。
コンセンサス投票によってモデルの正しさを推定し,階層クラスタリングによるモデル固有のスキルニッチを識別する新しいクエリ専用ルータであるCASCALを提案する。
論文 参考訳(メタデータ) (2026-01-14T18:43:32Z) - Dr.LLM: Dynamic Layer Routing in LLMs [55.11953638340419]
Dr.LLMは、事前訓練されたモデルに軽量な層ごとのルータを装備し、ブロックをスキップ、実行、繰り返すように決定する、適合性のあるフレームワークである。
ARC(logic)とDART(math)では、Dr.LLMは平均で5つのレイヤを保存しながら、最大3.4%の精度向上を実現している。
論文 参考訳(メタデータ) (2025-10-14T17:51:26Z) - AgentRouter: A Knowledge-Graph-Guided LLM Router for Collaborative Multi-Agent Question Answering [51.07491603393163]
tAgentは知識グラフ誘導ルーティング問題としてマルチエージェントQAを定式化するフレームワークである。
エージェントアウトプットのソフトな監督と重み付けされた集約を活用することで、エージェントは多様なエージェントの相補的な強みを捉える、原則化された協調スキームを学ぶ。
論文 参考訳(メタデータ) (2025-10-06T23:20:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。