論文の概要: Workflow-to-Skill: Skill Creation via Routing-Workflow-Semantics-Attachments Decomposition
- arxiv url: http://arxiv.org/abs/2606.06893v1
- Date: Fri, 05 Jun 2026 04:19:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.562389
- Title: Workflow-to-Skill: Skill Creation via Routing-Workflow-Semantics-Attachments Decomposition
- Title(参考訳): Workflow-to-Skill: ルーティング-ワークフロー-セマンティック-アタッチメント分解によるスキル創造
- Authors: Yuyang Zhang, Xinyuan Han, Xudong Jiang, Run Wang,
- Abstract要約: 本稿では,異種間相互作用の証拠から,実演,エージェント軌道,ツールトレース,実行ログなどの自動スキル構築について検討する。
トレースは断片化され、冗長であり、稀だが安全クリティカルな振る舞いを見逃す可能性があるため、トレース・トゥ・スキルの構築は単純な要約タスクではない、と我々は主張する。
W2Sは,トレースをセグメント化し,ローカルスキルドラフトを誘導し,共有構造を整列し,分岐を調整し,証拠と信頼アノテーションを保存しながら冗長性を圧縮するフレームワークである。
- 参考スコア(独自算出の注目度): 24.535904687887236
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language model agents increasingly rely on Skills to encode procedural knowledge, yet high-quality Skills remain costly to hand-write. This paper studies automatic Skill construction from heterogeneous interaction evidence, including demonstrations, agent trajectories, tool traces, and execution logs. We argue that trace-to-skill construction is not simple summarization tasks, because traces are fragmented, redundant, and may miss rare but safety-critical behaviors. To address this, we introduce RWSA, a workflow-oriented intermediate representation that decomposes Skills into Workflow structure, execution Semantics, and runtime Attachments, capturing task decomposition, control flow, verification, safety, rollback, and state management. Building on RWSA, we propose W2S, a framework that segments traces, induces local Skill drafts, aligns shared structures, reconciles branches, and compresses redundancy while preserving evidence and confidence annotations. Experiments on 70 Skills show that W2S improves behavioral replay consistency by 10.5% over summarization- and prompting-based baselines, highlighting the need to treat traces as executable runtime specifications rather than compressible text.
- Abstract(参考訳): 大規模言語モデルエージェントは、手続き的な知識をエンコードするためにスキルをますます頼りにしているが、高品質なスキルは手書きに費用がかかる。
本稿では,異種間相互作用の証拠から,実演,エージェント軌道,ツールトレース,実行ログなどの自動スキル構築について検討する。
トレースは断片化され、冗長であり、稀だが安全クリティカルな振る舞いを見逃す可能性があるため、トレース・トゥ・スキルの構築は単純な要約タスクではない、と我々は主張する。
この問題を解決するために、ワークフロー指向の中間表現であるRWSAを紹介します。これは、スキルをワークフロー構造、実行セマンティック、実行時アタッチメントに分解し、タスクの分解、制御フロー、検証、安全性、ロールバック、状態管理をキャプチャします。
RWSA上に構築したW2Sは,トレースのセグメンテーション,ローカルスキルドラフトの誘導,共有構造の整合,ブランチの整合,冗長性の圧縮,エビデンスと信頼アノテーションの保存を行うフレームワークである。
70スキルの実験では、W2Sは要約やプロンプトベースのベースラインよりも10.5%向上し、圧縮可能なテキストではなく、トレースを実行可能なランタイム仕様として扱う必要性を強調している。
関連論文リスト
- RepoMirage: Probing Repository Context Reasoning in Code Agents with Perturbations [51.43574078961796]
本稿では,SWE-Bench Verified上に構築された2段階評価スイートRepoMirageを紹介する。
RepoMirage-Perturbは、リポジトリレベルの摂動を保存する3つのタイプのセマンティクスを適用している。
RepoAnchorは、下流の問題解決からリポジトリの探索を分離する構造第一のプロトタイプワークフローである。
論文 参考訳(メタデータ) (2026-05-25T06:26:43Z) - SkillRAE: Agent Skill-Based Context Compilation for Retrieval-Augmented Execution [10.83969404435554]
大きな言語モデル(LLM)ベースのエージェントは、アーティファクトリッチなタスクを解決するために、再利用可能なスキルライブラリに依存している。
本稿では,スキルベースのコンテキストコンパイルに着目した2段階RAE手法であるSkillRAEを提案する。
2つの公開ベンチマークの実験によると、SkillRAEはRAEのベースラインよりも大幅に改善されている。
論文 参考訳(メタデータ) (2026-05-11T07:31:48Z) - Decompose and Recompose: Reasoning New Skills from Existing Abilities for Cross-Task Robotic Manipulation [45.91196295385836]
クロスタスクの一般化は、オープンソースのロボット操作における中核的な課題である。
中間表現としてアトミックなスキルアクションペアを用いたスキル推論フレームワークであるDecomposeとRecomposeを提案する。
われわれのアプローチでは、実演を解釈可能なスキル-アクションアライメントに分解し、モデルが見えないタスクのためにこれらのスキルを再構成できるようにする。
論文 参考訳(メタデータ) (2026-05-02T13:55:28Z) - Claw-Eval-Live: A Live Agent Benchmark for Evolving Real-World Workflows [67.92316850084575]
ワークフローエージェントのライブベンチマークであるClaw-Eval-Liveを紹介する。
各リリースは、公開ワークフロー要求信号から構築される。
Claw-Eval-Liveは実行トレース、監査ログ、サービス状態、実行後のワークスペースアーティファクトを記録する。
論文 参考訳(メタデータ) (2026-04-30T17:23:19Z) - From Skill Text to Skill Structure: The Scheduling-Structural-Logical Representation for Agent Skills [5.327990835740087]
スケジューリング-構造論理(SSL)表現は、スキルレベルのスケジューリング信号、シーンレベルの実行構造、ロジックレベルのアクション/リソース使用エビデンスを歪めます。
SSL を LLM ベースの正規化器でインスタンス化し,SSL 由来の表現をスキル発見とリスク評価という2つのタスクで評価する。
論文 参考訳(メタデータ) (2026-04-27T04:25:15Z) - WebXSkill: Skill Learning for Autonomous Web Agents [104.76374637691212]
WebXSkillは、コードベースのスキルと自然言語ガイダンスのギャップを埋めるフレームワークである。
WebArenaとWebVoyagerでは、WebXSkillはタスク成功率をベースラインで最大9.8と12.9ポイント改善する。
論文 参考訳(メタデータ) (2026-04-14T21:48:15Z) - DocSeeker: Structured Visual Reasoning with Evidence Grounding for Long Document Understanding [63.257540233507626]
本稿では、構造化解析、局所化、推論のワークフローを実行するためにモデルを必要とするパラダイムを提案する。
ショートページトレーニングから超長文書への堅牢な一般化を示し、視覚的検索・拡張生成システムと自然に相乗効果を示す。
論文 参考訳(メタデータ) (2026-04-14T14:39:26Z) - Offline Discovery of Interpretable Skills from Multi-Task Trajectories [8.119611773942562]
オフラインスキル発見と階層的模倣のための3段階のエンドツーエンド学習フレームワークであるLOKIを紹介する。
LOKIは、挑戦的なD4RL Kitchenベンチマークで高い成功率を獲得し、標準のHILベースラインを上回っている。
論文 参考訳(メタデータ) (2026-02-01T05:03:58Z) - Learning Task Representations from In-Context Learning [67.66042137487287]
大規模言語モデル(LLM)は、文脈内学習(ICL)において顕著な習熟性を示した。
ICLプロンプトにおけるタスク情報をアテンションヘッドの関数として符号化するための自動定式化を導入する。
提案手法は,テキスト中の実演からタスク固有の情報を抽出し,テキストと回帰タスクの両方で優れる。
論文 参考訳(メタデータ) (2025-02-08T00:16:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。