論文の概要: OpenSkill: Open-World Self-Evolution for LLM Agents
- arxiv url: http://arxiv.org/abs/2606.06741v1
- Date: Thu, 04 Jun 2026 21:55:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.45981
- Title: OpenSkill: Open-World Self-Evolution for LLM Agents
- Title(参考訳): OpenSkill: LLMエージェントのためのオープンワールドセルフエボリューション
- Authors: Zhiling Yan, Dingjie Song, Hanrong Zhang, Wei Liang, Yuxuan Zhang, Yutong Dai, Lifang He, Philip S. Yu, Ran Xu, Xiang Li, Lichao Sun,
- Abstract要約: 我々はオープンワールドの自己進化について研究し、エージェントはそのスキルと独自の検証シグナルをゼロから構築しなければならない。
このループをブートストラップするフレームワークであるOpenSkillを提案する。
OpenSkillは、非スーパービジョン制約を満たしながら、最高の自動パスレートを達成する。
- 参考スコア(独自算出の注目度): 57.88680042818572
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Self-evolving agents requires adaptation after deployment, but existing approaches assume a usable learning loop, such as curated skills, successful trajectories, or verifier signals. Real open-world deployments may provide none of these, offering only a task prompt. In this work, we study open-world self-evolution, where an agent must build both its skills and its own verification signals from scratch, using open-world resources but no target-task supervision. We propose OpenSkill, a framework that bootstraps this loop: it acquires grounded knowledge and verification anchors from documentation, repositories, and the web, synthesizes them into transferable skills, and refines those skills against self-built virtual tasks grounded in the anchors rather than in target answers. The open world thus supplies both the knowledge to be learned and a supervision-independent practice environment, with target-task supervision reserved for final evaluation. Across three benchmarks and two target agents, OpenSkill attains the best automated pass rate while satisfying the no-supervision constraint. Analysis shows its skills transfer across models without model-specific adaptation, and its self-built verifier aligns with ground-truth outcomes despite never accessing them.
- Abstract(参考訳): 自己進化エージェントは、デプロイ後に適応する必要があるが、既存のアプローチでは、キュレートされたスキル、成功した軌道、検証信号などの有用な学習ループが想定されている。
実際のオープンワールドデプロイメントでは、これらは提供されず、タスクプロンプトのみを提供する。
本研究では、オープンワールドの自己進化について研究し、エージェントはオープンワールドのリソースを使用して、そのスキルと独自の検証信号の両方をゼロから構築しなければならないが、ターゲットタスクの監視は行わない。
私たちは、このループをブートストラップするフレームワークOpenSkillを提案します。ドキュメント、リポジトリ、Webから基盤となる知識と検証アンカーを取得し、それらを変換可能なスキルに合成し、ターゲットの回答ではなく、アンカーに基盤を置く自己構築の仮想タスクに対してそれらのスキルを洗練します。
オープンワールドは、学ぶべき知識と監督に依存しない実践環境の両方を提供し、最終評価のためにターゲットタスクを監督する。
3つのベンチマークと2つのターゲットエージェントで、OpenSkillは最良自動パスレートを獲得し、非スーパービジョン制約を満たす。
分析では、モデル固有の適応を伴わないモデル間でのスキル伝達が示され、自己構築検証器は、それらにアクセスしないにもかかわらず、地味な結果と一致している。
関連論文リスト
- OpenSkillEval: Automatically Auditing the Open Skill Ecosystem for LLM Agents [15.598856888948093]
スキル強化エージェントシステムとスキル自体の自動評価フレームワークであるtextscOpenSkillEvalを提案する。
静的ベンチマークに頼る代わりに、textscOpenSkillEvalは、現実世界のアーティファクトの進化から現実的なタスクインスタンスを自動的に構築する。
600以上の動的に生成されたタスクインスタンスと30のオープンソーススキルを使用して、最先端のモデルとエージェントフレームワークを体系的に評価する。
論文 参考訳(メタデータ) (2026-05-22T14:09:41Z) - SkillAttack: Automated Red Teaming of Agent Skills through Attack Path Refinement [66.44008181092832]
LLMベースのエージェントシステムは、その能力を拡張するためにオープンレジストリからのエージェントスキルにますます依存している。
SkillAttackは、敵のプロンプトを通じて、スキル脆弱性の脆弱性を検証できるフレームワークである。
論文 参考訳(メタデータ) (2026-04-05T06:25:11Z) - SoK: Agentic Skills -- Beyond Tool Use in LLM Agents [6.356997609995175]
エージェントシステムは、より確実にロングホライゾンを実行するために、再利用可能な手続き能力、すなわちエージェントスキルに依存している。
本論文は,全ライフサイクルのスキルレイヤ(発見,実践,蒸留,貯蔵,構成,評価,更新)をマッピングする。
我々は、スキルベースのエージェントのセキュリティとガバナンスの影響を分析し、サプライチェーンのリスク、スキルペイロードによるインジェクションの促進、信頼度の高い実行をカバーします。
論文 参考訳(メタデータ) (2026-02-24T13:11:38Z) - Agent Skills for Large Language Models: Architecture, Acquisition, Security, and the Path Forward [5.124116559484265]
モノリシックな言語モデルからモジュール化された、スキルを持ったエージェントへの移行は、大規模言語モデル(LLM)の実際のデプロイ方法に決定的な変化をもたらす。
すべての手続き的知識をモデルウェイト内にエンコードするのではなく、エージェントスキルは、再トレーニングせずに動的機能拡張を可能にする。
この調査は、エージェントスキルのランドスケープを包括的に扱うもので、ここ数ヶ月で急速に進化してきた。
論文 参考訳(メタデータ) (2026-02-12T21:33:25Z) - InternBootcamp Technical Report: Boosting LLM Reasoning with Verifiable Task Scaling [71.37579508777843]
大規模言語モデル(LLM)は、複雑な推論機能を実現することによって、人工知能に革命をもたらした。
このギャップに対処するため、1000以上のドメイン分散タスク環境からなるオープンソースのフレームワークであるInternBootcampを紹介します。
論文 参考訳(メタデータ) (2025-08-12T05:00:00Z) - Human-Timescale Adaptation in an Open-Ended Task Space [56.55530165036327]
大規模にRLエージェントを訓練することで、オープンエンドの新規な3D問題に人間と同じくらい早く適応できる一般的なコンテキスト内学習アルゴリズムが実現可能であることを示す。
我々の研究は、より大規模で適応的なRLエージェントの基礎を築いた。
論文 参考訳(メタデータ) (2023-01-18T15:39:21Z) - Choreographer: Learning and Adapting Skills in Imagination [60.09911483010824]
我々は、その世界モデルを利用して想像力のスキルを学び、適応するモデルベースのエージェントであるChoreographerを紹介する。
提案手法は探索とスキル学習のプロセスを切り離し,モデルの潜在状態空間におけるスキルの発見を可能にする。
Choreographerはオフラインデータからスキルを学ぶことができ、探索ポリシーと同時にデータを集めることができる。
論文 参考訳(メタデータ) (2022-11-23T23:31:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。