論文の概要: SkillSmith: Compiling Agent Skills into Boundary-Guided Runtime Interfaces
- arxiv url: http://arxiv.org/abs/2605.15215v1
- Date: Tue, 12 May 2026 09:25:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-18 21:22:26.006475
- Title: SkillSmith: Compiling Agent Skills into Boundary-Guided Runtime Interfaces
- Title(参考訳): SkillSmith: エージェントスキルを境界ガイドのランタイムインターフェースにコンパイルする
- Authors: Duling Xu, Zheng Chen, Zaifeng Pan, Jiawei Guan, Dong Dong, Jialin Li, Bangzheng Pu,
- Abstract要約: 既存のフレームワークでは、一度ランタイムタスクにマッチしたコンテキストガイダンスとして、通常、スキルがエージェント推論ループに注入されます。
この実行パラダイムは、無関係なコンテキスト注入と、スキル固有の推論と計画の2つの主要な冗長性源を導入している。
我々は,スキルパッケージをオフラインで最小限の実行可能なインターフェースにコンパイルする,境界優先のコンパイラランタイムフレームワークであるSkillSmithを提案する。
- 参考スコア(独自算出の注目度): 6.384302247811717
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, skills have been widely adopted in large language model (LLM)-based agent systems across various domains. In existing frameworks, skills are typically injected into the agent reasoning loop as contextual guidance once matched to a runtime task, enabling specialized task-solving capabilities. We find that this execution paradigm introduces two major sources of redundancy: irrelevant context injection and repeated skill-specific reasoning and planning. To this end, we propose SkillSmith, a boundary-first compiler-runtime framework that compiles skill packages offline into minimal executable interfaces. By extracting fine-grained operational boundaries from skills, SkillSmith enables agents to dynamically access and execute only the relevant components at runtime, thereby minimizing unnecessary context injection and redundant reasoning overhead. In the evaluation on SkillsBench benchmark, SkillSmith reduces solve-stage token usage by 57.44%, thinking iterations by 42.99%, solve time by 50.57% (2.02x faster), and token-proportional monetary cost by 57.44% compared with using raw-skills. Moreover, compiled artifacts produced by a stronger model can be reused by a smaller or more efficient runtime model, improving task accuracy in cases where raw skill interpretation fails. The source code and data are available at https://github.com/AetherHeart-AI/Aeloon.
- Abstract(参考訳): 近年,多分野にわたる大規模言語モデル(LLM)に基づくエージェントシステムにおいて,スキルが広く採用されている。
既存のフレームワークでは、一度実行時のタスクにマッチしたコンテキストガイダンスとして、通常はエージェント推論ループにスキルが注入される。
この実行パラダイムは、無関係なコンテキスト注入と、スキル固有の推論と計画の2つの主要な冗長性源を導入している。
この目的のために,スキルパッケージをオフラインで最小限の実行可能なインターフェースにコンパイルする境界ファーストコンパイラランタイムフレームワークであるSkillSmithを提案する。
SkillSmithは、スキルからきめ細かい操作境界を抽出することによって、エージェントが実行時に関連するコンポーネントのみに動的にアクセスし、実行することを可能にするため、不要なコンテキストインジェクションと冗長な推論オーバーヘッドを最小限にすることができる。
SkillsBenchベンチマークの評価では、SkillSmithは、解決段階のトークンの使用を57.44%削減し、反復を42.99%、解決期間を50.57%(2.02倍高速)、トークン比通貨コストを57.44%削減した。
さらに、より強力なモデルによって生成されたコンパイルされたアーティファクトを、より小さく、より効率的な実行モデルで再利用することができ、生のスキル解釈が失敗する場合のタスク精度を向上させることができる。
ソースコードとデータはhttps://github.com/AetherHeart-AI/Aeloon.comで入手できる。
関連論文リスト
- SkillGraph: Skill-Augmented Reinforcement Learning for Agents via Evolving Skill Graphs [70.1970574147839]
有向グラフのノードとして再利用可能なスキルを表現するフレームワークであるSKILLGRAPHを提案する。
SKILLGRAPHは個々のスキルだけでなく、多段階意思決定をガイドできる順序付きスキルサブグラフも取得する。
実験により,SKILLGRAPHはメモリ拡張RL法に対して最先端の性能を実現することが示された。
論文 参考訳(メタデータ) (2026-05-12T12:21:49Z) - From Context to Skills: Can Language Models Learn from Context Skillfully? [56.5857437218136]
Ctx2Skillは、コンテキスト固有のスキルを自律的に発見、洗練、選択する自己進化フレームワークである。
より良い文脈学習能力を得るために、どんな言語モデルにもプラグインできる。
論文 参考訳(メタデータ) (2026-04-30T09:53:15Z) - WebXSkill: Skill Learning for Autonomous Web Agents [104.76374637691212]
WebXSkillは、コードベースのスキルと自然言語ガイダンスのギャップを埋めるフレームワークである。
WebArenaとWebVoyagerでは、WebXSkillはタスク成功率をベースラインで最大9.8と12.9ポイント改善する。
論文 参考訳(メタデータ) (2026-04-14T21:48:15Z) - Graph of Skills: Dependency-Aware Structural Retrieval for Massive Agent Skills [27.93279540484981]
Graph of Skills (GoS)は、大規模スキルライブラリのための推論時構造検索層である。
GoSはバニラのフルスキルローディングベースラインに対して平均報酬を43.6%改善した。
GoSは、バニラスキルローディングと単純なベクトル検索の両方を一貫して上回る。
論文 参考訳(メタデータ) (2026-04-07T02:09:11Z) - SKILL0: In-Context Agentic Reinforcement Learning for Skill Internalization [61.37478254738943]
推論時のスキル向上は基本的に制限されている。
SKILL0は,スキル内部化のためのコンテキスト内強化学習フレームワークである。
SKILL0は標準のRLベースラインよりも大幅に改善されている。
論文 参考訳(メタデータ) (2026-04-02T17:03:05Z) - Trace2Skill: Distill Trajectory-Local Lessons into Transferable Agent Skills [21.971456179996093]
Trace2Skillは、人間の専門家がいかにスキルを作成できるかを反映するフレームワークです。
個々のトラジェクトリにシーケンシャルに反応する代わりに、Trace2Skillは並列なサブエージェント群を派遣して、さまざまな実行プールを分析する。
トラジェクトリ固有のレッスンを抽出し、階層的にそれらをインダクティブ推論を通じて統合され、コンフリクトフリーなスキルディレクトリに集約する。
論文 参考訳(メタデータ) (2026-03-26T08:26:38Z) - SkillCraft: Can LLM Agents Learn to Use Tools Skillfully? [67.69996753743129]
SkillCraftは、高レベルのツールコンポジションの生成と再利用を可能にする、明示的にストレステストエージェントのベンチマークである。
SkillCraftは、定量次元と構造次元の両方に沿ってスケールする困難を伴う、現実的で、構成性の高いツール使用シナリオを特徴としている。
本稿では,エージェントがアトミックツールを実行可能なスキルに自動生成し,タスク内およびタスク間のキャッシュと再利用を可能にする軽量な評価プロトコルを提案する。
論文 参考訳(メタデータ) (2026-02-28T15:44:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。