Fugu-MT 論文翻訳(概要): SkillRouter: Retrieve-and-Rerank Skill Selection for LLM Agents at Scale

論文の概要: SkillRouter: Retrieve-and-Rerank Skill Selection for LLM Agents at Scale

arxiv url: http://arxiv.org/abs/2603.22455v1
Date: Mon, 23 Mar 2026 18:23:59 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-25 19:53:37.141138
Title: SkillRouter: Retrieve-and-Rerank Skill Selection for LLM Agents at Scale
Title（参考訳）: SkillRouter: LLMエージェントを大規模に検索・実行可能なスキル選択
Authors: YanZhao Zheng, ZhenTao Zhang, Chao Ma, YuanQiang Yu, JiHuan Zhu, Baohua Dong, Hangcheng Zhu,
Abstract要約: ユーザタスクが与えられた大きなプールから,最も関連性の高いスキルを取得するためには,スキルルーティングが必要である。その実用的重要性にもかかわらず、スキル・ルーティングは未探索のままである。 Skillは2段階のレシーブ・アンド・リロードパイプラインで、合計1.2Bのパラメータしか持たない。
参考スコア（独自算出の注目度）: 5.512890692955285
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: As LLM agent ecosystems grow, the number of available skills (tools, plugins) has reached tens of thousands, making it infeasible to inject all skills into an agent's context. This creates a need for skill routing -- retrieving the most relevant skills from a large pool given a user task. The problem is compounded by pervasive functional overlap in community skill repositories, where many skills share similar names and purposes yet differ in implementation details. Despite its practical importance, skill routing remains under-explored. Current agent architectures adopt a progressive disclosure design -- exposing only skill names and descriptions to the agent while keeping the full implementation body hidden -- implicitly treating metadata as sufficient for selection. We challenge this assumption through a systematic empirical study on a benchmark of ~$80K skills and 75 expert-verified queries. Our key finding is that the skill body (full implementation text) is the decisive signal: removing it causes 29--44 percentage point degradation across all retrieval methods, and cross-encoder attention analysis reveals 91.7% of attention concentrating on the body field. Motivated by this finding, we propose SkillRouter, a two-stage retrieve-and-rerank pipeline totaling only 1.2B parameters (0.6B encoder + 0.6B reranker). SkillRouter achieves 74.0% top-1 routing accuracy and delivers the strongest average result among the compact and zero-shot baselines we evaluate, while remaining deployable on consumer hardware.
Abstract（参考訳）: LLMエージェントのエコシステムが成長するにつれて、利用可能なスキル(ツール、プラグイン)の数は数万に達し、エージェントのコンテキストにすべてのスキルを注入することができない。これにより、ユーザタスクが与えられた大きなプールから最も関連性の高いスキルを取り出す、スキルルーティングの必要性が生まれます。この問題は、多くのスキルが同様の名前と目的を共有しながら実装の詳細が異なるコミュニティスキルレポジトリにおいて、多岐にわたる機能オーバーラップによって複雑化されている。その実用的重要性にもかかわらず、スキル・ルーティングは未探索のままである。現在のエージェントアーキテクチャでは、プログレッシブな公開設計が採用されています -- 完全な実装ボディを隠蔽しながら、スキル名と記述のみをエージェントに公開することで、メタデータを選択に十分なものとして暗黙的に扱います。約80Kのスキルと75のエキスパート検証クエリのベンチマークに関する体系的な実証的研究を通じて、この仮定に挑戦する。我々のキーとなる発見は、スキルボディ(フル実装テキスト)が決定的な信号であり、すべての検索方法において29～44パーセントのポイント劣化を引き起こし、クロスエンコーダのアテンション分析により、ボディフィールドに集中している注意の91.7%が明らかになる。この発見によって動機づけられたSkillRouterは、1.2Bパラメータ(0.6B encoder + 0.6B reranker)の合計で2段階のレシーブ・アンド・リロードパイプラインである。 SkillRouterは74.0%のトップ1ルーティング精度を達成し、評価したコンパクトでゼロショットのベースラインの中で最も高い平均結果を提供する。

関連論文リスト

SWE-Skills-Bench: Do Agent Skills Actually Help in Real-World Software Engineering? [27.583012125198568]
SWE-Skills-Benchは、現実のソフトウェア工学におけるエージェントスキルの限界効用を分離する最初の要件駆動ベンチマークである。 49の公開SWEスキルと、特定のコミットにピン留めされた本物のGitHubリポジトリと、明確な受け入れ基準を持つ要件ドキュメントをペアリングする。以上の結果から,スキルインジェクションのメリットは,迅速な採用よりもはるかに限定的であることが示唆された。
論文参考訳（メタデータ） (2026-03-16T15:16:31Z)
OSExpert: Computer-Use Agents Learning Professional Skills via Exploration [55.660669638732024]
汎用コンピュータ利用エージェントは、人間の専門家ほど役に立たない。本研究では,環境の単位関数を探索し,検証するための深度優先探索アルゴリズムを提案する。エージェントは、合成タスクのカリキュラムを自己構築するために、ユニットスキル間の構成性を利用する。
論文参考訳（メタデータ） (2026-03-09T05:27:56Z)
EvoSkill: Automated Skill Discovery for Multi-Agent Systems [6.319876096746374]
エージェントスキルを自動的に発見・洗練する自己進化型フレームワークである textbfEvoSkill を紹介する。 EvoSkillは実行障害を分析し、新しいスキルや既存のスキルへの編集を提案し、それらを構造化された再利用可能なスキルフォルダに実体化する。われわれはEvoSkillを米国財務データの根拠となる推論ベンチマークであるOfficeQAと、ノイズの多い検索ベンチマークであるSealQAの2つのベンチマークで評価した。
論文参考訳（メタデータ） (2026-03-03T09:07:22Z)
Organizing, Orchestrating, and Benchmarking Agent Skills at Ecosystem Scale [28.43462779191672]
AgentSkillOSは、スキル選択、オーケストレーション、エコシステムレベルの管理のための原則化されたフレームワークである。 AgentSkillOSには2つのステージがある。 (i) スキルを機能ツリーに整理する管理スキル。 (ii) DAGベースのパイプラインを通じて複数のスキルを検索し、オーケストレーションし、実行するタスクの解決。
論文参考訳（メタデータ） (2026-03-02T18:46:47Z)
SkillNet: Create, Evaluate, and Connect AI Skills [159.47504178122156]
SkillNetは、大規模にAIスキルを作成し、評価し、組織化するように設計されたオープンインフラストラクチャである。私たちのインフラストラクチャは、20万を超えるスキルのリポジトリ、インタラクティブなプラットフォーム、多目的Pythonツールキットを統合しています。
論文参考訳（メタデータ） (2026-02-26T14:24:02Z)
SoK: Agentic Skills -- Beyond Tool Use in LLM Agents [6.356997609995175]
エージェントシステムは、より確実にロングホライゾンを実行するために、再利用可能な手続き能力、すなわちエージェントスキルに依存している。本論文は,全ライフサイクルのスキルレイヤ(発見,実践,蒸留,貯蔵,構成,評価,更新)をマッピングする。我々は、スキルベースのエージェントのセキュリティとガバナンスの影響を分析し、サプライチェーンのリスク、スキルペイロードによるインジェクションの促進、信頼度の高い実行をカバーします。
論文参考訳（メタデータ） (2026-02-24T13:11:38Z)
SkillRL: Evolving Agents via Recursive Skill-Augmented Reinforcement Learning [83.98129545309277]
生経験と政策改善のギャップを埋めるフレームワークであるSkillRLを提案する。本手法では,階層型スキルライブラリであるSkillBankを構築するために,経験に基づく蒸留機構を導入する。 ALF、WebShop、および7つの検索強化タスクの実験結果は、SkillRLが最先端のパフォーマンスを達成することを示す。
論文参考訳（メタデータ） (2026-02-09T03:17:17Z)
WebSailor-V2: Bridging the Chasm to Proprietary Agents via Synthetic Data and Scalable Reinforcement Learning [73.91893534088798]
WebSailorは、この重要な機能を組み込むように設計された、完全なポストトレーニング方法論である。我々のアプローチは、構造化サンプリングと情報難読化によって、新しい、不確実なタスクを生成することである。 WebSailorは複雑な情報検索タスクにおいて、すべてのオープンソースエージェントを著しく上回る。
論文参考訳（メタデータ） (2025-09-16T17:57:03Z)
Design of Negative Sampling Strategies for Distantly Supervised Skill Extraction [19.43668931500507]
本稿では,リテラルマッチングによる遠隔監視に基づく,スキル抽出のためのエンドツーエンドシステムを提案する。 ESCO分類を用いて、関連するスキルからネガティブな例を選択することで、最大の改善が得られます。我々は,タスクのさらなる研究を促進するために,研究目的のベンチマークデータセットをリリースする。
論文参考訳（メタデータ） (2022-09-13T13:37:06Z)
Hierarchical Skills for Efficient Exploration [70.62309286348057]
強化学習において、事前訓練された低レベルスキルは、探索を大幅に促進する可能性がある。下流タスクの以前の知識は、スキルデザインにおける一般性(きめ細かい制御)と特異性(より高速な学習)の適切なバランスをとるために必要である。教師なしの方法で様々な複雑さのスキルを習得する階層的スキル学習フレームワークを提案する。
論文参考訳（メタデータ） (2021-10-20T22:29:32Z)
Knowledge Integration Networks for Action Recognition [58.548331848942865]
我々は,アクション認識のためのメインブランチと,人間のパースとシーン認識のための2つの補助ブランチからなる3分岐アーキテクチャを設計する。補助知識を中程度の畳み込み特徴に符号化するクロスブランチ統合(CBI)モジュールと、高レベルの文脈情報を効果的に融合するアクション知識グラフ(AKG)を含む2段階の知識符号化機構を提案する。 KINetは、大規模アクション認識ベンチマークKinetics-400の最先端性能を77.8%で達成している。
論文参考訳（メタデータ） (2020-02-18T10:20:30Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。