論文の概要: From Raw Experience to Skill Consumption: A Systematic Study of Model-Generated Agent Skills
- arxiv url: http://arxiv.org/abs/2605.23899v1
- Date: Fri, 22 May 2026 17:59:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 17:29:20.463938
- Title: From Raw Experience to Skill Consumption: A Systematic Study of Model-Generated Agent Skills
- Title(参考訳): 経験からスキル消費へ:モデル生成エージェントスキルの体系的研究
- Authors: Zisu Huang, Jingwen Xu, Yifan Yang, Ziyang Gong, Qihao Yang, Muzhao Tian, Xiaohua Wang, Changze Lv, Xuemei Gao, Qi Dai, Bei Liu, Kai Qiu, Xue Yang, Dongdong Chen, Xiaoqing Zheng, Chong Luo,
- Abstract要約: モデル生成スキルは平均的に有益であるが,非自明な負の伝達を示す。
モデルは強力な抽出器でありながら、弱い消費者、あるいはその逆もまた、モデルスケールやベースラインタスク強度とは無関係に、スキルユーティリティを持つことができる。
本研究は,これらの知見を,スキル抽出のガイドとなる具体的なエフェメタスキルに翻訳する。
- 参考スコア(独自算出の注目度): 46.76651106969111
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Language agents increasingly improve by reusing \emph{skills} -- structured procedural artifacts distilled from past experience. In particular, \emph{domain-level} and \emph{model-generated} skills are especially promising. They offer fast adaptation within a domain by encoding domain-specific recurring procedures, and they scale beyond labor-intensive hand-crafting. However, while extraction methods continue to proliferate, understanding remains limited, with no comprehensive study spanning the full skill lifecycle -- \textbf{experience generation}, \textbf{skill extraction}, and \textbf{skill consumption} -- to ask whether such skills actually work, when they work, and what makes them succeed or fail. To close this gap, we build a utility-grounded evaluation framework that provides systematic experimental results across extractors and target agents, covering five diverse agentic task domains. We find that model-generated skills are beneficial on average but exhibit non-trivial negative transfer, and that neither extractors nor targets behave uniformly. A model can be a strong extractor yet a weak consumer, or vice versa, with skill utility independent of model scale or baseline task strength. To explain these patterns, we then dissect each lifecycle stage in depth, analyzing how experience composition shapes skill quality, what properties characterize useful skills, and how the same skill transfers across different consumers. Finally, we translate these findings into a concrete \emph{meta-skill} that guides skill extraction toward the features tied to actual utility, which consistently improves skill quality across domains and substantially reduces negative transfer.
- Abstract(参考訳): 言語エージェントは、過去の経験から抽出された構造化手続き的アーティファクトを再利用することで、ますます改善される。
特に、 \emph{domain-level} と \emph{model- generated} スキルは特に有望である。
ドメイン固有の反復手順をコーディングすることで、ドメイン内での迅速な適応を提供し、労働集約的な手作りを超えてスケールする。
しかしながら、抽出方法が拡大を続ける一方で、理解は限定的であり、完全なスキルライフサイクル – \textbf{experience generation}、 \textbf{skill extract}、 \textbf{skill consumption} – にまたがる包括的な研究は行われていない。
このギャップを埋めるために,5つのエージェントタスクドメインをカバーする抽出器と対象エージェントを対象とする,系統的な実験結果を提供するユーティリティグラウンド評価フレームワークを構築した。
モデル生成スキルは平均的に有益であるが,非自明な負の伝達を示し,抽出者も対象者も一様に振る舞わないことがわかった。
モデルは強力な抽出器でありながら、弱い消費者、あるいはその逆もまた、モデルスケールやベースラインタスク強度とは無関係に、スキルユーティリティを持つことができる。
これらのパターンを説明するために、我々は各ライフサイクルステージを深く分析し、経験的構成がいかにスキルの質を形作るか、どのような特性が有用なスキルを特徴付けるか、そして異なる消費者間で同じスキルが伝達されるかを分析した。
最後に、これらの知見を具体的「emph{meta-skill」に翻訳し、実際のユーティリティに関連付けられた特徴に対してスキル抽出を誘導し、ドメイン間のスキル品質を一貫して改善し、負の転送を大幅に削減する。
関連論文リスト
- SkillGen: Verified Inference-Time Agent Skill Synthesis [60.927977774369516]
SkillGenは、ベースエージェントによって生成されたトラジェクトリから単一の監査可能なスキルを合成するフレームワークである。
再利用可能な成功パターン、繰り返し発生する障害モード、そして近くの成功に現れるが失敗に欠ける行動を特定する。
SkillGenの重要な特徴は、エージェントスキルを、全体的なパフォーマンスに対するスキルのネット効果を実証的に検証するための介入としてモデル化することです。
論文 参考訳(メタデータ) (2026-05-09T19:24:11Z) - MIND-Skill: Quality-Guaranteed Skill Generation via Multi-Agent Induction and Deduction [28.841138131026415]
MINDスキル(MIND-Skill, MIND-Skill, MIND-Skill, MIND-Skill, MIND-Skill, MIND-Skill, MIND-Skill, MIND-Skill)を提案する。
AppWorldとBFCL-v3の実験では、MIND-Skillは同時スキル生成方法よりも一貫して優れていた。
論文 参考訳(メタデータ) (2026-05-09T04:15:57Z) - Decompose and Recompose: Reasoning New Skills from Existing Abilities for Cross-Task Robotic Manipulation [45.91196295385836]
クロスタスクの一般化は、オープンソースのロボット操作における中核的な課題である。
中間表現としてアトミックなスキルアクションペアを用いたスキル推論フレームワークであるDecomposeとRecomposeを提案する。
われわれのアプローチでは、実演を解釈可能なスキル-アクションアライメントに分解し、モデルが見えないタスクのためにこれらのスキルを再構成できるようにする。
論文 参考訳(メタデータ) (2026-05-02T13:55:28Z) - SkillCraft: Can LLM Agents Learn to Use Tools Skillfully? [67.69996753743129]
SkillCraftは、高レベルのツールコンポジションの生成と再利用を可能にする、明示的にストレステストエージェントのベンチマークである。
SkillCraftは、定量次元と構造次元の両方に沿ってスケールする困難を伴う、現実的で、構成性の高いツール使用シナリオを特徴としている。
本稿では,エージェントがアトミックツールを実行可能なスキルに自動生成し,タスク内およびタスク間のキャッシュと再利用を可能にする軽量な評価プロトコルを提案する。
論文 参考訳(メタデータ) (2026-02-28T15:44:31Z) - SkillDiffuser: Interpretable Hierarchical Planning via Skill Abstractions in Diffusion-Based Task Execution [75.2573501625811]
拡散モデルは、ロボット軌道計画の強力な可能性を示している。
高レベルの命令からコヒーレントな軌道を生成することは依然として困難である。
エンド・ツー・エンドの階層的計画フレームワークであるSkillDiffuserを提案する。
論文 参考訳(メタデータ) (2023-12-18T18:16:52Z) - Design of Negative Sampling Strategies for Distantly Supervised Skill
Extraction [19.43668931500507]
本稿では,リテラルマッチングによる遠隔監視に基づく,スキル抽出のためのエンドツーエンドシステムを提案する。
ESCO分類を用いて、関連するスキルからネガティブな例を選択することで、最大の改善が得られます。
我々は,タスクのさらなる研究を促進するために,研究目的のベンチマークデータセットをリリースする。
論文 参考訳(メタデータ) (2022-09-13T13:37:06Z) - Learning Transferable Motor Skills with Hierarchical Latent Mixture
Policies [37.09286945259353]
階層的混合潜時変動モデルを用いて,データから抽象運動スキルを学習する手法を提案する。
提案手法は,オフラインデータを異なる実行動作に効果的にクラスタ化することができることを示す。
論文 参考訳(メタデータ) (2021-12-09T17:37:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。