論文の概要: Skill-to-LoRA: From Using Skills to Learning Behaviors for Token-Efficient LLM Agents
- arxiv url: http://arxiv.org/abs/2606.16769v1
- Date: Mon, 15 Jun 2026 14:17:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:34.610282
- Title: Skill-to-LoRA: From Using Skills to Learning Behaviors for Token-Efficient LLM Agents
- Title(参考訳): Skill-to-LoRA:Token-Efficient LLMエージェントのスキル活用から学習行動へ
- Authors: Tianyi Zhang, Zhonghao Qi,
- Abstract要約: エージェントスキルは一般的にSKILL.mdファイルとして配布される。
本稿では,実行時スキルテキストをスキル固有のLoRAアダプタに置き換える,行動中心のスキル表現であるSkill-to-LoRAを提案する。
- 参考スコア(独自算出の注目度): 4.313916831146957
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Agent skills are commonly distributed as SKILL.md files: human-readable procedural documents that describe workflows, tools, resources, and domain conventions. While convenient for inspection and reuse, this design requires the same reusable procedure to be repeatedly injected into the runtime context. We propose Skill-to-LoRA(S2L), a behavior-centric skill representation that replaces runtime skill text with skill-specific LoRA adapters. Rather than compressing the skill document itself, S2L models the behavioral change induced by the skill text: offline, the complete SKILL.md is used to synthesize skill-guided demonstrations; online, the full document is omitted and the corresponding LoRA adapter is dynamically loaded to activate the learned skill behavior. We evaluate S2L with Qwen3.6-27B on a 21-skill subset of SWE-Skills-Bench. Compared with the no-skill and Full Skill Text baselines, S2L improves pass rate by 2.9 and 5.2 percentage points, respectively, while reducing per-step token cost by 6.6% relative to Full Skill Text prompting. S2L matches or improves Full Skill Text on 18/21 skills and the no-skill baseline on 15/21 skills. Control experiments further show that the gains depend on skill-specific adapter alignment: Wrong-LoRA and Shared-LoRA both reduce performance. These results suggest that many procedural agent skills can be converted from runtime instructions into trainable, dynamically loadable behavioral modules. Code will be released upon acceptance.
- Abstract(参考訳): エージェントスキルは一般的にSKILL.mdファイルとして配布される: ワークフロー、ツール、リソース、ドメイン規約を記述した人間可読な手続き文書。
検査や再利用には便利だが、この設計では同じ再利用可能な手順をランタイムコンテキストに繰り返し注入する必要がある。
Skill-to-LoRA(S2L)は,実行時スキルテキストをスキル固有のLoRAアダプタに置き換える動作中心のスキル表現である。
スキルドキュメント自体を圧縮するのではなく、S2Lは、スキルテキストによって引き起こされる振る舞いの変化をモデル化する:オフライン、完全なSKILL.mdは、スキルガイドされたデモを合成するために使用される。
我々は,SWE-Skills-Benchの21スキルサブセット上で,Qwen3.6-27Bを用いてS2Lを評価する。
ノースキルテキストとフルスキルテキストのベースラインと比較して、S2Lはパスレートを2.9ポイントと5.2ポイント改善し、フルスキルテキストのプロンプトに対してステップ単位のトークンコストを6.6%削減した。
S2Lは18/21スキルのフルスキルテキストと15/21スキルのノースキルベースラインをマッチまたは改善する。
Wrong-LoRAとShared-LoRAはどちらも性能を低下させる。
これらの結果は,プロシージャエージェントのスキルの多くを実行時命令からトレーニング可能な動的ロード可能な動作モジュールに変換することができることを示唆している。
コードは受理時にリリースされる。
関連論文リスト
- LatentSkill: From In-Context Textual Skills to In-Weight Latent Skills for LLM Agents [40.33528208274459]
テキストスキルをプラグアンドプレイのLoRAアダプタに変換するフレームワークであるLatentSkillを紹介する。
LatentSkillは、コンテキスト空間よりも重み空間にスキル知識を格納し、ステップ単位のスキルトークンを削除する。
ALFWorldとSearch-QAでは、LatentSkillは、かなり少ないプリフィルトークンを使用しながら、対応するインコンテキストスキルベースラインよりもパフォーマンスが高い。
論文 参考訳(メタデータ) (2026-06-04T12:26:09Z) - AIP: A Graph Representation for Learning and Governing Agent Skills [1.1458853556386797]
現在、エージェントスキルは、エージェントがすべてのセッションでどのように振る舞うかを読み、解釈し、再導出する必要があるフリーフォームの散文で構成されている。
これは、実装が重いタスクに対する信頼性の低下と、スキル創造と改善の難しさの2つの複合コストを課します。
Agent Instruction Protocol (AIP) は両方とも、有向実行グラフとしてスキルをモデル化することで対処する。
コンパイラのメタスキルは、既存の人書きスキルをこの形式に変換する。
論文 参考訳(メタデータ) (2026-06-03T12:02:49Z) - SkillsInjector: Dynamic Skill Context Construction for LLM Agents [16.631471381875816]
既存の方法では、静的なステップとしてスキルインジェクションを扱い、一定の基準でスキルを選択し、事前に予算を固定し、説明をそのまま残します。
本稿では,これらの決定に共同で対処する2段階適応手法であるSkillsInjectorを提案する。
Tau2-bench、SkillsBench、ALFWorldで、SkillsInjectorは最強のベースラインを3.9点、6.1点、7.3ポイント改善した。
論文 参考訳(メタデータ) (2026-05-28T11:44:32Z) - SkillGraph: Skill-Augmented Reinforcement Learning for Agents via Evolving Skill Graphs [70.1970574147839]
有向グラフのノードとして再利用可能なスキルを表現するフレームワークであるSKILLGRAPHを提案する。
SKILLGRAPHは個々のスキルだけでなく、多段階意思決定をガイドできる順序付きスキルサブグラフも取得する。
実験により,SKILLGRAPHはメモリ拡張RL法に対して最先端の性能を実現することが示された。
論文 参考訳(メタデータ) (2026-05-12T12:21:49Z) - From Context to Skills: Can Language Models Learn from Context Skillfully? [56.5857437218136]
Ctx2Skillは、コンテキスト固有のスキルを自律的に発見、洗練、選択する自己進化フレームワークである。
より良い文脈学習能力を得るために、どんな言語モデルにもプラグインできる。
論文 参考訳(メタデータ) (2026-04-30T09:53:15Z) - Graph of Skills: Dependency-Aware Structural Retrieval for Massive Agent Skills [27.93279540484981]
Graph of Skills (GoS)は、大規模スキルライブラリのための推論時構造検索層である。
GoSはバニラのフルスキルローディングベースラインに対して平均報酬を43.6%改善した。
GoSは、バニラスキルローディングと単純なベクトル検索の両方を一貫して上回る。
論文 参考訳(メタデータ) (2026-04-07T02:09:11Z) - SKILL0: In-Context Agentic Reinforcement Learning for Skill Internalization [61.37478254738943]
推論時のスキル向上は基本的に制限されている。
SKILL0は,スキル内部化のためのコンテキスト内強化学習フレームワークである。
SKILL0は標準のRLベースラインよりも大幅に改善されている。
論文 参考訳(メタデータ) (2026-04-02T17:03:05Z) - LoRA Soups: Merging LoRAs for Practical Skill Composition Tasks [73.09643674975591]
Low-Rank Adaptation (LoRA)は、大規模言語モデル(LLM)のパラメータ効率の高い微調整手法である。
異なるLoRAモジュールをマージして,スキルコンポジションを実現する方法について検討する。
論文 参考訳(メタデータ) (2024-10-16T20:33:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。