論文の概要: Trace2Skill: Distill Trajectory-Local Lessons into Transferable Agent Skills
- arxiv url: http://arxiv.org/abs/2603.25158v1
- Date: Thu, 26 Mar 2026 08:26:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:48.180885
- Title: Trace2Skill: Distill Trajectory-Local Lessons into Transferable Agent Skills
- Title(参考訳): Trace2Skill: トランスファー可能なエージェントスキルにトラックローカライズされたレッスン
- Authors: Jingwei Ni, Yihao Liu, Xinpeng Liu, Yutao Sun, Mengyu Zhou, Pengyu Cheng, Dexin Wang, Xiaoxi Jiang, Guanjun Jiang,
- Abstract要約: Trace2Skillは、人間の専門家がいかにスキルを作成できるかを反映するフレームワークです。
個々のトラジェクトリにシーケンシャルに反応する代わりに、Trace2Skillは並列なサブエージェント群を派遣して、さまざまな実行プールを分析する。
トラジェクトリ固有のレッスンを抽出し、階層的にそれらをインダクティブ推論を通じて統合され、コンフリクトフリーなスキルディレクトリに集約する。
- 参考スコア(独自算出の注目度): 22.70251646778681
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Equipping Large Language Model (LLM) agents with domain-specific skills is critical for tackling complex tasks. Yet, manual authoring creates a severe scalability bottleneck. Conversely, automated skill generation often yields fragile or fragmented results because it either relies on shallow parametric knowledge or sequentially overfits to non-generalizable trajectory-local lessons. To overcome this, we introduce Trace2Skill, a framework that mirrors how human experts author skills: by holistically analyzing broad execution experience before distilling it into a single, comprehensive guide. Instead of reacting sequentially to individual trajectories, Trace2Skill dispatches a parallel fleet of sub-agents to analyze a diverse pool of executions. It extracts trajectory-specific lessons and hierarchically consolidates them into a unified, conflict-free skill directory via inductive reasoning. Trace2Skill supports both deepening existing human-written skills and creating new ones from scratch. Experiments in challenging domains, such as spreadsheet, VisionQA and math reasoning, show that Trace2Skill significantly improves upon strong baselines, including Anthropic's official xlsx skills. Crucially, this trajectory-grounded evolution does not merely memorize task instances or model-specific quirks: evolved skills transfer across LLM scales and generalize to OOD settings. For example, skills evolved by Qwen3.5-35B on its own trajectories improved a Qwen3.5-122B agent by up to 57.65 absolute percentage points on WikiTableQuestions. Ultimately, our results demonstrate that complex agent experience can be packaged into highly transferable, declarative skills -- requiring no parameter updates, no external retrieval modules, and utilizing open-source models as small as 35B parameters.
- Abstract(参考訳): 言語モデル(LLM)エージェントをドメイン固有のスキルで取得することは、複雑なタスクに取り組む上で非常に重要である。
しかし、手作業によるオーサリングは、深刻なスケーラビリティのボトルネックを生み出します。
逆に、自動化されたスキル生成は、浅いパラメトリック知識に依存するか、一般化不可能な軌道局所的なレッスンに順番に過度に適合するため、脆弱または断片化された結果をもたらすことが多い。
この問題を解決するために、私たちはTrace2Skillを紹介します。これは、人間の専門家がいかにスキルを記述しているかを反映するフレームワークです。
個々のトラジェクトリにシーケンシャルに反応する代わりに、Trace2Skillは並列なサブエージェント群を派遣して、さまざまな実行プールを分析する。
トラジェクトリ固有のレッスンを抽出し、階層的にそれらをインダクティブ推論を通じて統合され、コンフリクトフリーなスキルディレクトリに集約する。
Trace2Skillは、既存の人書きスキルの深化と、スクラッチから新しいスキルの作成の両方をサポートする。
スプレッドシート、VisionQA、数学推論といった挑戦的な領域の実験では、Trace2SkillはAnthropicの公式xlsxスキルを含む強力なベースラインで大幅に改善されている。
重要なのは、この軌道上の進化は単にタスクインスタンスやモデル固有のクォークを記憶するだけではない。
例えば、Qwen3.5-35Bが自身の軌道上で進化した技術により、Qwen3.5-122BエージェントはWikiTableQuestionsで57.65ポイントまで向上した。
最終的には、複雑なエージェントエクスペリエンスを高度に転送可能で宣言的なスキルにパッケージ化できることを示します -- パラメータの更新は不要、外部の検索モジュールは不要、オープンソースモデルを35Bパラメータまで活用できます。
関連論文リスト
- SkillRouter: Retrieve-and-Rerank Skill Selection for LLM Agents at Scale [5.512890692955285]
ユーザタスクが与えられた大きなプールから,最も関連性の高いスキルを取得するためには,スキルルーティングが必要である。
その実用的重要性にもかかわらず、スキル・ルーティングは未探索のままである。
Skillは2段階のレシーブ・アンド・リロードパイプラインで、合計1.2Bのパラメータしか持たない。
論文 参考訳(メタデータ) (2026-03-23T18:23:59Z) - XSkill: Continual Learning from Experience and Skills in Multimodal Agents [26.64381741359544]
XSkillはマルチモーダルエージェントの経験とスキルから継続的に学習するためのデュアルストリームフレームワークである。
XSkillは、視覚観察における知識抽出と検索の両方の基礎となる。
XSkillは、ツールのみのベースラインと学習ベースのベースラインの両方を一貫して、実質的に上回っている。
論文 参考訳(メタデータ) (2026-03-12T15:25:57Z) - The Unlearning Mirage: A Dynamic Framework for Evaluating LLM Unlearning [54.67958855362658]
複雑な構造化クエリを用いたアンラーニングテストを強調する動的フレームワークを提案する。
提案手法はまず,対象モデル(事前学習)から知識を抽出し,単純なクエリからマルチホップチェーンまで,対象プローブを構築する。
本フレームワークは,テストセットを手作業で構築することなく,非学習手法の実用的でスケーラブルな評価を可能にする。
論文 参考訳(メタデータ) (2026-03-11T19:51:33Z) - EvoSkill: Automated Skill Discovery for Multi-Agent Systems [6.319876096746374]
エージェントスキルを自動的に発見・洗練する自己進化型フレームワークである textbfEvoSkill を紹介する。
EvoSkillは実行障害を分析し、新しいスキルや既存のスキルへの編集を提案し、それらを構造化された再利用可能なスキルフォルダに実体化する。
われわれはEvoSkillを米国財務データの根拠となる推論ベンチマークであるOfficeQAと、ノイズの多い検索ベンチマークであるSealQAの2つのベンチマークで評価した。
論文 参考訳(メタデータ) (2026-03-03T09:07:22Z) - SkillRL: Evolving Agents via Recursive Skill-Augmented Reinforcement Learning [83.98129545309277]
生経験と政策改善のギャップを埋めるフレームワークであるSkillRLを提案する。
本手法では,階層型スキルライブラリであるSkillBankを構築するために,経験に基づく蒸留機構を導入する。
ALF、WebShop、および7つの検索強化タスクの実験結果は、SkillRLが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2026-02-09T03:17:17Z) - SAME: Stabilized Mixture-of-Experts for Multimodal Continual Instruction Tuning [83.66308307152808]
マルチモーダル・インストラクション・チューニング(MCIT)のためのStAbilized Mixture-of-Experts(SAME)を提案する。
プロプライエタリは、サブスペースへのルーティングダイナミクスを分解し、タスク関連方向のみを更新することで、専門家の選択を安定化する。
また、トレーニング中に選択した専門家を凍結するためにアダプティブな専門家アクティベーションを導入し、冗長でクロスタスクな干渉を減らす。
論文 参考訳(メタデータ) (2026-02-02T11:47:06Z) - Offline Discovery of Interpretable Skills from Multi-Task Trajectories [8.119611773942562]
オフラインスキル発見と階層的模倣のための3段階のエンドツーエンド学習フレームワークであるLOKIを紹介する。
LOKIは、挑戦的なD4RL Kitchenベンチマークで高い成功率を獲得し、標準のHILベースラインを上回っている。
論文 参考訳(メタデータ) (2026-02-01T05:03:58Z) - ET-Agent: Incentivizing Effective Tool-Integrated Reasoning Agent via Behavior Calibration [68.89572566071575]
ETAgentはエージェントのツール使用行動を調整するためのトレーニングフレームワークである。
過誤行動パターンを最適行動に段階的に校正するように設計されている。
論文 参考訳(メタデータ) (2026-01-11T11:05:26Z) - Retrieval-Augmented Reinforcement Learning [63.32076191982944]
過去の経験のデータセットを最適な行動にマップするために、ネットワークをトレーニングします。
検索プロセスは、現在のコンテキストで有用なデータセットから情報を取得するために訓練される。
検索強化R2D2はベースラインR2D2エージェントよりもかなり高速に学習し,より高いスコアを得ることを示す。
論文 参考訳(メタデータ) (2022-02-17T02:44:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。