論文の概要: LatentSkill: From In-Context Textual Skills to In-Weight Latent Skills for LLM Agents
- arxiv url: http://arxiv.org/abs/2606.06087v1
- Date: Thu, 04 Jun 2026 12:26:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 22:39:44.783783
- Title: LatentSkill: From In-Context Textual Skills to In-Weight Latent Skills for LLM Agents
- Title(参考訳): LatentSkill: LLMエージェントのインテクストスキルからインウェイト潜在スキルへ
- Authors: Aofan Yu, Chenyu Zhou, Tianyi Xu, Zihan Guo, Rong Shan, Zhihui Fu, Jun Wang, Weiwen Liu, Yong Yu, Weinan Zhang, Jianghao Lin,
- Abstract要約: テキストスキルをプラグアンドプレイのLoRAアダプタに変換するフレームワークであるLatentSkillを紹介する。
LatentSkillは、コンテキスト空間よりも重み空間にスキル知識を格納し、ステップ単位のスキルトークンを削除する。
ALFWorldとSearch-QAでは、LatentSkillは、かなり少ないプリフィルトークンを使用しながら、対応するインコンテキストスキルベースラインよりもパフォーマンスが高い。
- 参考スコア(独自算出の注目度): 40.33528208274459
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Agent systems increasingly use textual skills to encode reusable task procedures, but injecting these skills into the prompt at every step incurs substantial context overhead and exposes skill content as plaintext. We present LatentSkill, a framework that converts textual skills into plug-and-play LoRA adapters through a pretrained hypernetwork. LatentSkill stores skill knowledge in weight space rather than context space, removing per-step skill tokens while preserving modular loading, scaling, and composition. On ALFWorld and Search-QA, LatentSkill outperforms the corresponding in-context skill baseline while using substantially fewer prefill tokens: it improves ALFWorld success by 21.4 and 13.4 points on the seen and unseen splits with 64.1% fewer prefill tokens, and improves Search-QA exact match by 3.0 points with 72.2% lower skill-token overhead. Further analysis shows that generated skill LoRAs form a structured semantic geometry, can be precisely controlled via the LoRA scaling coefficient, and can be composed through parameter-space arithmetic when skill components are aligned. These findings suggest that weight-space skills provide an efficient, modular, and less exposed substrate for extending LLM agents.
- Abstract(参考訳): エージェントシステムは、再利用可能なタスクプロシージャをエンコードするためにテキストスキルを使用することが多いが、各ステップでプロンプトにこれらのスキルを注入すると、かなりのコンテキストオーバーヘッドが発生し、スキルコンテンツをプレーンテキストとして公開する。
テキストスキルをプラグイン・アンド・プレイのLoRAアダプタに変換するフレームワークであるLatentSkillを,トレーニング済みのハイパーネットワークを通じて紹介する。
LatentSkillは、コンテキスト空間ではなく、スキル知識を重み空間に格納し、モジュールローディング、スケーリング、コンポジションを維持しながら、ステップ単位のスキルトークンを削除する。
ALFWorld と Search-QA では、LatentSkill は、対応するコンテキスト内スキルベースラインよりもはるかに少ないプリフィルトークンを使用し、ALFWorld の成功率を 21.4 と 13.4 ポイント改善し、64.1% のプリフィルトークンで、未確認のスプリットを 64.1% 削減し、サーチ-QA の正確なマッチを 3.0 ポイント改善し、スキルトーケンオーバーヘッドを 72.2% 下げた。
さらに分析したところ、生成したスキルLoRAが構造化セマンティックジオメトリを形成し、LoRAスケーリング係数を介して正確に制御でき、スキルコンポーネントのアライメント時にパラメータ空間演算によって構成できることがわかった。
これらの結果から, 重量空間技術はLLM剤の伸長に有効で, モジュール性があり, 露出が少ないことが示唆された。
関連論文リスト
- SkillGraph: Skill-Augmented Reinforcement Learning for Agents via Evolving Skill Graphs [70.1970574147839]
有向グラフのノードとして再利用可能なスキルを表現するフレームワークであるSKILLGRAPHを提案する。
SKILLGRAPHは個々のスキルだけでなく、多段階意思決定をガイドできる順序付きスキルサブグラフも取得する。
実験により,SKILLGRAPHはメモリ拡張RL法に対して最先端の性能を実現することが示された。
論文 参考訳(メタデータ) (2026-05-12T12:21:49Z) - From Context to Skills: Can Language Models Learn from Context Skillfully? [56.5857437218136]
Ctx2Skillは、コンテキスト固有のスキルを自律的に発見、洗練、選択する自己進化フレームワークである。
より良い文脈学習能力を得るために、どんな言語モデルにもプラグインできる。
論文 参考訳(メタデータ) (2026-04-30T09:53:15Z) - From Skill Text to Skill Structure: The Scheduling-Structural-Logical Representation for Agent Skills [5.327990835740087]
スケジューリング-構造論理(SSL)表現は、スキルレベルのスケジューリング信号、シーンレベルの実行構造、ロジックレベルのアクション/リソース使用エビデンスを歪めます。
SSL を LLM ベースの正規化器でインスタンス化し,SSL 由来の表現をスキル発見とリスク評価という2つのタスクで評価する。
論文 参考訳(メタデータ) (2026-04-27T04:25:15Z) - GraSP: Graph-Structured Skill Compositions for LLM Agents [29.818044584102456]
LLMエージェントのスキルエコシステムは急速に成熟しているが、最近のベンチマークでは、より多くのスキルを提供するエージェントはパフォーマンスを単調に改善しない。
スキル検索と実行の間にコンパイル層を導入する最初の実行可能なスキルグラフアーキテクチャであるGraSPを提案する。
GraSPは、フラットスキルセットをプレコンディションエフェクトエッジで型付き有向非巡回グラフ(DAG)に変換し、ノードレベルの検証でそれらを実行し、5つの型付き演算子を通して局所性バウンドな修復を行う。
論文 参考訳(メタデータ) (2026-04-20T06:31:11Z) - How Well Do Agentic Skills Work in the Wild: Benchmarking LLM Skill Usage in Realistic Settings [29.3744517703302]
本研究は,段階的に挑戦的な現実的な環境下でのスキルユーティリティの総合的研究である。
その結果、設定がよりリアルになるにつれて、パフォーマンスは一貫して低下することがわかった。
クエリ固有の改善は、初期スキルが合理的な妥当性と品質を持つ場合に、性能を著しく回復することを示す。
論文 参考訳(メタデータ) (2026-04-06T00:10:30Z) - SKILL0: In-Context Agentic Reinforcement Learning for Skill Internalization [61.37478254738943]
推論時のスキル向上は基本的に制限されている。
SKILL0は,スキル内部化のためのコンテキスト内強化学習フレームワークである。
SKILL0は標準のRLベースラインよりも大幅に改善されている。
論文 参考訳(メタデータ) (2026-04-02T17:03:05Z) - LoRA Soups: Merging LoRAs for Practical Skill Composition Tasks [73.09643674975591]
Low-Rank Adaptation (LoRA)は、大規模言語モデル(LLM)のパラメータ効率の高い微調整手法である。
異なるLoRAモジュールをマージして,スキルコンポジションを実現する方法について検討する。
論文 参考訳(メタデータ) (2024-10-16T20:33:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。