論文の概要: Graph of Skills: Dependency-Aware Structural Retrieval for Massive Agent Skills
- arxiv url: http://arxiv.org/abs/2604.05333v2
- Date: Wed, 08 Apr 2026 19:04:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 14:10:47.872074
- Title: Graph of Skills: Dependency-Aware Structural Retrieval for Massive Agent Skills
- Title(参考訳): スキルのグラフ: 大規模エージェントスキルのための依存性を考慮した構造検索
- Authors: Dawei Liu, Zongxia Li, Hongyang Du, Xiyang Wu, Shihang Gui, Yongbei Kuang, Lichao Sun,
- Abstract要約: Graph of Skills (GoS)は、大規模スキルライブラリのための推論時構造検索層である。
GoSはバニラのフルスキルローディングベースラインに対して平均報酬を43.6%改善した。
GoSは、バニラスキルローディングと単純なベクトル検索の両方を一貫して上回る。
- 参考スコア(独自算出の注目度): 27.93279540484981
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Skill usage has become a core component of modern agent systems and can substantially improve agents' ability to complete complex tasks. In real-world settings, where agents must monitor and interact with numerous personal applications, web browsers, and other environment interfaces, skill libraries can scale to thousands of reusable skills. Scaling to larger skill sets introduces two key challenges. First, loading the full skill set saturates the context window, driving up token costs, hallucination, and latency. In this paper, we present Graph of Skills (GoS), an inference-time structural retrieval layer for large skill libraries. GoS constructs an executable skill graph offline from skill packages, then at inference time retrieves a bounded, dependency-aware skill bundle through hybrid semantic-lexical seeding, reverse-weighted Personalized PageRank, and context-budgeted hydration. On SkillsBench and ALFWorld, GoS improves average reward by 43.6% over the vanilla full skill-loading baseline while reducing input tokens by 37.8%, and generalizes across three model families: Claude Sonnet, GPT-5.2 Codex, and MiniMax. Additional ablation studies across skill libraries ranging from 200 to 2,000 skills further demonstrate that GoS consistently outperforms both vanilla skills loading and simple vector retrieval in balancing reward, token efficiency, and runtime.
- Abstract(参考訳): スキルの使用は現代のエージェントシステムの中核的なコンポーネントとなり、複雑なタスクを完了させるエージェントの能力を大幅に改善することができる。
エージェントが多数のパーソナルアプリケーションやWebブラウザ、その他の環境インターフェースを監視し、操作しなければならない現実世界では、スキルライブラリは数千の再利用可能なスキルにスケールできる。
より大きなスキルセットへのスケーリングには、2つの大きな課題が伴う。
まず、フルスキルセットを読み込むと、コンテキストウィンドウが飽和し、トークンコスト、幻覚、レイテンシが上昇する。
本稿では,大規模技術ライブラリを対象とした推論時構造検索層であるGraph of Skills(GoS)を提案する。
GoSは、スキルパッケージからオフラインで実行可能なスキルグラフを構築し、推論時に、ハイブリッドセマンティックレキシカルシード、リバースウェイトされたパーソナライズされたPersonalized PageRank、コンテキスト予算の水和を通じて、バウンダリ対応のスキルバンドルを取得する。
SkillsBenchとALFWorldでは、バニラのフルスキルローディングベースラインに対して平均報酬を43.6%改善し、入力トークンを37.8%削減し、Claude Sonnet、GPT-5.2 Codex、MiniMaxの3つのモデルファミリを一般化している。
200から2000のスキルを持つスキルライブラリを対象としたさらなるアブレーション調査は、GoSがバニラスキルのロードと単純なベクトル検索の両方で、報酬のバランス、トークン効率、ランタイムを一貫して上回っていることを証明している。
関連論文リスト
- SkillX: Automatically Constructing Skill Knowledge Bases for Agents [27.56549031749266]
SkillXは、プラグアンドプレイのスキル知識ベースを構築するための、完全に自動化されたフレームワークである。
3つのシナジスティックなイノベーションに基づいて構築された、完全に自動化されたパイプラインを通じて運用される。
実験の結果、SkillKBは、より弱いベースエージェントにプラグインされた場合、タスクの成功と実行効率を一貫して改善している。
論文 参考訳(メタデータ) (2026-04-06T16:09:33Z) - SkVM: Compiling Skills for Efficient Execution Everywhere [8.617039060377483]
SkVMは、ポータブルで効率的なスキル実行用に設計されたコンパイルおよびランタイムシステムである。
118,000のスキルを分析し、従来のコンパイラ設計からインスピレーションを得ます。
結果は、SkVMがさまざまなモデルや環境におけるタスク完了率を大幅に改善していることを示しています。
論文 参考訳(メタデータ) (2026-04-03T15:11:45Z) - SKILL0: In-Context Agentic Reinforcement Learning for Skill Internalization [61.37478254738943]
推論時のスキル向上は基本的に制限されている。
SKILL0は,スキル内部化のためのコンテキスト内強化学習フレームワークである。
SKILL0は標準のRLベースラインよりも大幅に改善されている。
論文 参考訳(メタデータ) (2026-04-02T17:03:05Z) - EvoSkills: Self-Evolving Agent Skills via Co-Evolutionary Verification [85.3692584167951]
Anthropicは、LLMエージェントが多段階のプロフェッショナルタスクに取り組むためのスキルの概念を提案する。
ツールは単一の自己完結型関数であり、スキルは相互依存型多ファイルアーティファクトの構造化バンドルである。
EvoSkillsは、エージェントが複雑なマルチファイルスキルパッケージを自律的に構築できる自己進化型スキルフレームワークである。
論文 参考訳(メタデータ) (2026-04-02T06:43:20Z) - SkillRouter: Skill Routing for LLM Agents at Scale [18.540967600258607]
ユーザタスクが与えられたら、システムは、下流の計画や実行の前に、関連するスキルを特定する必要がある。
既存のエージェントスタックはプログレッシブな開示に依存しており、完全な実装ボディを隠蔽しながら、スキル名と記述のみを公開する。
1.2Bのコンパクトなフルテキスト検索/参照パイプラインであるSkillを提示する。
論文 参考訳(メタデータ) (2026-03-23T18:23:59Z) - SkillCraft: Can LLM Agents Learn to Use Tools Skillfully? [67.69996753743129]
SkillCraftは、高レベルのツールコンポジションの生成と再利用を可能にする、明示的にストレステストエージェントのベンチマークである。
SkillCraftは、定量次元と構造次元の両方に沿ってスケールする困難を伴う、現実的で、構成性の高いツール使用シナリオを特徴としている。
本稿では,エージェントがアトミックツールを実行可能なスキルに自動生成し,タスク内およびタスク間のキャッシュと再利用を可能にする軽量な評価プロトコルを提案する。
論文 参考訳(メタデータ) (2026-02-28T15:44:31Z) - SkillNet: Create, Evaluate, and Connect AI Skills [159.47504178122156]
SkillNetは、大規模にAIスキルを作成し、評価し、組織化するように設計されたオープンインフラストラクチャである。
私たちのインフラストラクチャは、20万を超えるスキルのリポジトリ、インタラクティブなプラットフォーム、多目的Pythonツールキットを統合しています。
論文 参考訳(メタデータ) (2026-02-26T14:24:02Z) - SoK: Agentic Skills -- Beyond Tool Use in LLM Agents [6.356997609995175]
エージェントシステムは、より確実にロングホライゾンを実行するために、再利用可能な手続き能力、すなわちエージェントスキルに依存している。
本論文は,全ライフサイクルのスキルレイヤ(発見,実践,蒸留,貯蔵,構成,評価,更新)をマッピングする。
我々は、スキルベースのエージェントのセキュリティとガバナンスの影響を分析し、サプライチェーンのリスク、スキルペイロードによるインジェクションの促進、信頼度の高い実行をカバーします。
論文 参考訳(メタデータ) (2026-02-24T13:11:38Z) - SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks [61.89812116484928]
エージェントスキルは、LLMエージェントを推論時に増強する手続き的知識の構造化パッケージである。
SkillsBenchは、11のドメインにわたる86のタスクのベンチマークであり、キュレートされたスキルと決定論的検証との組み合わせを示す。
キュレートされたスキルは平均パスレートを16.2ポイント(pp)上昇させるが、効果は領域によって大きく異なる。
自己生成スキルは平均的に何の利益も与えず、モデルが消費から得られる手続き的な知識を確実に説明できないことを示している。
論文 参考訳(メタデータ) (2026-02-13T07:06:06Z) - SkillMimic: Learning Basketball Interaction Skills from Demonstrations [85.23012579911378]
我々は、エージェントがインタラクションスキルを学習する方法を根本的に変える統合データ駆動フレームワークであるSkillMimicを紹介した。
私たちの重要な洞察は、統合されたHOI模倣報酬は、HOIデータセットから多様な相互作用パターンの本質を効果的に捉えることができるということです。
評価のために,約35分間のバスケットボールスキルを含む2つのバスケットボールデータセットを収集,導入した。
論文 参考訳(メタデータ) (2024-08-12T15:19:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。