論文の概要: SkillsVote: Lifecycle Governance of Agent Skills from Collection, Recommendation to Evolution
- arxiv url: http://arxiv.org/abs/2605.18401v1
- Date: Mon, 18 May 2026 13:44:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:49.643032
- Title: SkillsVote: Lifecycle Governance of Agent Skills from Collection, Recommendation to Evolution
- Title(参考訳): SkillsVote: 収集、勧告から進化へのエージェントスキルのライフサイクルガバナンス
- Authors: Hongyi Liu, Haoyan Yang, Tao Jiang, Bo Tang, Feiyu Xiong, Zhiyu Li,
- Abstract要約: 本稿では,エージェントスキルのためのライフサイクル管理フレームワークであるSkillsVoteを紹介する。
SkillsVoteは、環境要件、品質、妥当性に関する100万規模のオープンソースコーパスをプロファイルしている。
トラジェクトリをスキルリンクされたサブタスクに分解し、スキル使用、エージェント探索、環境、結果信号に結果をもたらし、エビデンス付き更新に再利用可能な発見のみを認める。
- 参考スコア(独自算出の注目度): 29.961197505726528
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Long-horizon LLM agents leave traces that could become reusable experience, but raw trajectories are noisy and hard to govern. We treat Agent Skills as an experience schema that couples executable scripts, with non-executable guidance on procedures. Yet open skill ecosystems contain redundant, uneven, environment-sensitive artifacts, and indiscriminate updates can pollute future context. We present SkillsVote, a lifecycle-governance framework for Agent Skills from collection and recommendation to evolution. SkillsVote profiles a million-scale open-source corpus for environment requirements, quality, and verifiability, then synthesizes tasks for verifiable skills. Before execution, SkillsVote performs agentic library search over structured skill library to expose instructional skill context. After execution, it decomposes trajectories into skill-linked subtasks, attributes outcomes to skill use, agent exploration, environment, and result signals, and admits only successful reusable discoveries to evidence-gated updates. In our evaluation, offline evolution improves GPT-5.2 on Terminal-Bench 2.0 by up to 7.9 pp, while online evolution improves SWE-Bench Pro by up to 2.6 pp. Overall, governed external skill libraries can improve frozen agents without model updates when systems control exposure, credit, and preservation.
- Abstract(参考訳): ロングホライゾンLSM剤は、再利用可能な体験になる可能性のある痕跡を残しているが、生の軌跡は騒々しく、統治し難い。
我々はAgent Skillsを実行可能なスクリプトを結合するエクスペリエンススキーマとして扱う。
しかし、オープンスキルエコシステムには冗長で不均一で環境に敏感なアーティファクトが含まれており、非差別的な更新は将来のコンテキストを汚染する可能性がある。
本稿では,Agent Skillsのライフサイクル管理フレームワークであるSkillsVoteについて紹介する。
SkillsVoteは、環境要件、品質、妥当性に関する100万規模のオープンソースコーパスをプロファイルし、検証可能なスキルのためのタスクを合成する。
SkillsVoteは実行前に、構造化されたスキルライブラリ上でエージェントライブラリ検索を行い、命令的なスキルコンテキストを公開する。
実行後、トラジェクトリをスキルリンクされたサブタスクに分解し、スキル使用、エージェント探索、環境、結果信号に関連付ける。
我々の評価では、オフラインの進化はターミナルベンチ2.0のGPT-5.2を最大7.9pp改善し、オンラインの進化は最大2.6pp改善した。
全体として、管理された外部スキルライブラリは、システムが露出、信用、保存を制御する場合、モデル更新なしでフリーズエージェントを改善することができる。
関連論文リスト
- SkillOps: Managing LLM Agent Skill Libraries as Self-Maintaining Software Ecosystems [5.558878094816271]
大規模言語モデルエージェントは、多段階タスクのスキルライブラリにますます依存している。
これらのライブラリは、スキルの追加、再利用、パッチの適用、依存関係の変更に関連する永続的な欠陥を蓄積することができる。
本稿では,スキルライブラリをメンテナンスするためのメソッドに依存しないプラグインフレームワークであるSkillOpsを提案する。
論文 参考訳(メタデータ) (2026-05-13T16:02:25Z) - Skill-R1: Agent Skill Evolution via Reinforcement Learning [84.35984979949502]
Skill-R1は、検証可能な報酬からインスタンスレベルの繰り返しスキル最適化のための強化学習フレームワークである。
オープンソースモデルとクローズドソースモデルの両方とのブラックボックス互換性を維持しつつ、モデルレベルの更新よりも大幅に安価に適応できる。
論文 参考訳(メタデータ) (2026-05-10T06:19:15Z) - SkillOS: Learning Skill Curation for Self-Evolving Agents [67.94374107466957]
本稿では,自己進化エージェントのスキルキュレーションを学習するための,経験駆動型RLトレーニングレシピであるSkillOSを提案する。
SkillOSは、凍結したエージェントエグゼキュータとトレーニング可能なスキルキュレーターを組み合わせて、蓄積したエクスペリエンスから外部SkillRepoを更新する。
SkillOSは、メモリフリーと強力なメモリベースラインを、有効性と効率の両方で一貫して上回っていることを示す。
論文 参考訳(メタデータ) (2026-05-07T17:31:50Z) - SkillClaw: Let Skills Evolve Collectively with Agentic Evolver [18.942639318503062]
マルチユーザエージェントエコシステムにおける集合的スキル進化のためのフレームワークであるSkillClawを紹介する。
SkillClawは、クロスユーザとオーバータイムのインタラクションを、スキル向上のための主要なシグナルとして扱う。
使用中に生成された軌跡を連続的に集約し、自律的な進化器で処理する。
得られたスキルは共有リポジトリに保持され、ユーザ間で同期される。
論文 参考訳(メタデータ) (2026-04-09T15:38:27Z) - SKILLFOUNDRY: Building Self-Evolving Agent Skill Libraries from Heterogeneous Scientific Resources [5.7282243774488295]
我々は、リソースを検証されたエージェントスキルに変換する自己進化型フレームワークであるSkillFoundryを紹介する。
SkillFoundryは,比較的新規で,内部的に有効なスキルライブラリであることを示す。
また,SkillFoundryは,具体的な科学的目的の要求に応じて,新たなタスク固有のスキルを設計できることを示す。
論文 参考訳(メタデータ) (2026-04-05T05:02:18Z) - EvoSkills: Self-Evolving Agent Skills via Co-Evolutionary Verification [85.3692584167951]
Anthropicは、LLMエージェントが多段階のプロフェッショナルタスクに取り組むためのスキルの概念を提案する。
ツールは単一の自己完結型関数であり、スキルは相互依存型多ファイルアーティファクトの構造化バンドルである。
EvoSkillsは、エージェントが複雑なマルチファイルスキルパッケージを自律的に構築できる自己進化型スキルフレームワークである。
論文 参考訳(メタデータ) (2026-04-02T06:43:20Z) - SkillNet: Create, Evaluate, and Connect AI Skills [159.47504178122156]
SkillNetは、大規模にAIスキルを作成し、評価し、組織化するように設計されたオープンインフラストラクチャである。
私たちのインフラストラクチャは、20万を超えるスキルのリポジトリ、インタラクティブなプラットフォーム、多目的Pythonツールキットを統合しています。
論文 参考訳(メタデータ) (2026-02-26T14:24:02Z) - SoK: Agentic Skills -- Beyond Tool Use in LLM Agents [6.356997609995175]
エージェントシステムは、より確実にロングホライゾンを実行するために、再利用可能な手続き能力、すなわちエージェントスキルに依存している。
本論文は,全ライフサイクルのスキルレイヤ(発見,実践,蒸留,貯蔵,構成,評価,更新)をマッピングする。
我々は、スキルベースのエージェントのセキュリティとガバナンスの影響を分析し、サプライチェーンのリスク、スキルペイロードによるインジェクションの促進、信頼度の高い実行をカバーします。
論文 参考訳(メタデータ) (2026-02-24T13:11:38Z) - Autonomous Continual Learning of Computer-Use Agents for Environment Adaptation [57.65688895630163]
ACuRLは自律的なカリキュラム強化学習フレームワークで、エージェントを人間データゼロの特定の環境に継続的に適応させる。
本研究では,環境内学習と環境横断学習の両方を効果的に実現し,既存の環境を忘れずに4~22%の性能向上を実現した。
論文 参考訳(メタデータ) (2026-02-10T23:06:02Z) - SkillRL: Evolving Agents via Recursive Skill-Augmented Reinforcement Learning [83.98129545309277]
生経験と政策改善のギャップを埋めるフレームワークであるSkillRLを提案する。
本手法では,階層型スキルライブラリであるSkillBankを構築するために,経験に基づく蒸留機構を導入する。
ALF、WebShop、および7つの検索強化タスクの実験結果は、SkillRLが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2026-02-09T03:17:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。