論文の概要: OpenClaw-Skill: Collective Skill Tree Search for Agentic Large Language Models
- arxiv url: http://arxiv.org/abs/2606.16774v1
- Date: Mon, 15 Jun 2026 14:20:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:34.613445
- Title: OpenClaw-Skill: Collective Skill Tree Search for Agentic Large Language Models
- Title(参考訳): OpenClaw-Skill: エージェント型大規模言語モデルの集合的スキルツリー検索
- Authors: Tianyi Lin, Chuanyu Sun, Jingyi Zhang, Changxu Wei, Huanjin Yao, Shunyu Liu, Xikun Zhang, Liu Liu, Jiaxing Huang,
- Abstract要約: 本稿では,新しい木探索技術構築フレームワークである集合スキルツリー探索(CSTS)を提案する。
CSTSは、CSN-Gen(Collective Skill Node Generation)とCSN-Assess(Collective Skill Node Assessment)の2つの反復フェーズを通じて、効果的なスキルを検索、識別、構成する。
トレーニングされたモデルであるOpenClaw-Skillは、長期計画、ツールの使用、そして挑戦的なベンチマークに対する一般化において優れたエージェント能力を示す。
- 参考スコア(独自算出の注目度): 24.582968959632762
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Equipping Large Language Model (LLM) agents with effective skills is crucial for solving complex tasks in real-world systems like OpenClaw. In this work, we aim to develop a framework that automatically constructs such reusable skills to enhance LLMs in tool use, multi-step reasoning, and dynamic environment interaction. To this end, we propose Collective Skill Tree Search (CSTS), a novel tree-search-based skill construction framework that constructs structured, diverse and generalizable tree of skills. The core idea of CSTS is to leverage collective intelligence to jointly search, identify and compose effective skills via two iterative phases: Collective Skill Node Generation (CSN-Gen) and Collective Skill Node Assessment (CSN-Assess). CSN-Gen exploits collective knowledge from multiple models to explore diverse candidate skills for each subtask, enabling comprehensive skill exploration. CSN-Assess employs multiple models as judges to evaluate and select skill nodes with two scoring mechanisms: (1) collective quality scoring that aggregates independent evaluations to produce a robust estimate of skill effectiveness, and (2) collective transferability scoring that explicitly verifies whether a skill generalizes well across different models. With CSTS, we construct a set of comprehensive tree of skills along with skill-augmented training data, enabling models to effectively learn and utilize skills. Besides, we introduce Collective Skill Reinforcement Learning, which actively selects multiple relevant skills from the tree to broaden solution-space exploration, avoid being trapped by a single skill and its resulting homogeneous or suboptimal solutions. As a result, our trained model, OpenClaw-Skill, exhibits outstanding agentic capabilities in long-horizon planning, tool use and generalization over challenging benchmarks.
- Abstract(参考訳): 大規模言語モデル(LLM)エージェントを効果的なスキルで取得することは、OpenClawのような現実世界のシステムで複雑なタスクを解くのに不可欠である。
本研究では, ツール利用, マルチステップ推論, 動的環境相互作用において, 再利用可能なスキルを自動的に構築し, LLMを向上するフレームワークを開発することを目的とする。
そこで本研究では,構造化,多様性,一般化可能なスキルツリーを構築する,新しい木探索型スキル構築フレームワークである集合スキルツリー探索(CSTS)を提案する。
CSTSの中核となる考え方は、集団知能を活用して、2つの反復フェーズ、CSN-Gen(Collective Skill Node Generation)とCSN-Assess(Collective Skill Node Assessment)を通じて効果的なスキルを検索、識別、構成することである。
CSN-Genは、複数のモデルからの集合的知識を利用して、サブタスクごとに多様な候補スキルを探索し、包括的なスキル探索を可能にする。
CSN-Assessは,(1)独立した評価を集約してスキルの有効性の堅牢な推定を行う集合的品質スコアリングと,(2)異なるモデル間でスキルが適切に一般化されるかどうかを明確に検証する集合的伝達可能性スコアリングという2つのスコアリングメカニズムで,複数のモデルを用いて,スキルノードの評価と選択を行う。
CSTSでは、スキル強化トレーニングデータとともに、一連の総合的なスキルツリーを構築し、モデルを効果的に学習し、活用することができる。
さらに,木から複数の関連スキルを積極的に選択して解空間探索を拡大し,単一のスキルと結果の同種・準最適解に閉じ込められないようにする集合スキル強化学習を導入する。
その結果、訓練されたモデルであるOpenClaw-Skillは、長期計画、ツールの使用、そして挑戦的なベンチマークに対する一般化において優れたエージェント能力を示す。
関連論文リスト
- SkillComposer: Learning to Evolve Agent Skills for Specification and Generalization [99.18305770138677]
エージェントスキルは、エージェントの推論とアクションをガイドする再利用可能な戦略である。
現在の技術構築手法は、問題を一発抽出として扱う。
本稿では,スキル構築を3つの学習可能な操作に分解するフレームワークであるSkillComposerを紹介する。
論文 参考訳(メタデータ) (2026-06-04T12:16:08Z) - Skill is Not One-Size-Fits-All: Model-Aware Skill Alignment for LLM Agents [9.144810798419975]
LLMエージェントは、長期の対話的タスクのパフォーマンスを向上させるために、意思決定時に取得した外部キュレートされたスキル・プロデューラルな指示を徐々に取り出す。
エージェントの重みを変更することなく、各ターゲットのバックボーンにスキルを適応させるフレームワークであるMASA Model-Aware Skill Alignmentを提案する。
MASAは、最強のベースラインで最大25.8ポイントを獲得して、常に最高の総合成績を収めている。
論文 参考訳(メタデータ) (2026-05-29T01:34:42Z) - SkillGraph: Skill-Augmented Reinforcement Learning for Agents via Evolving Skill Graphs [70.1970574147839]
有向グラフのノードとして再利用可能なスキルを表現するフレームワークであるSKILLGRAPHを提案する。
SKILLGRAPHは個々のスキルだけでなく、多段階意思決定をガイドできる順序付きスキルサブグラフも取得する。
実験により,SKILLGRAPHはメモリ拡張RL法に対して最先端の性能を実現することが示された。
論文 参考訳(メタデータ) (2026-05-12T12:21:49Z) - EvoSkills: Self-Evolving Agent Skills via Co-Evolutionary Verification [85.3692584167951]
Anthropicは、LLMエージェントが多段階のプロフェッショナルタスクに取り組むためのスキルの概念を提案する。
ツールは単一の自己完結型関数であり、スキルは相互依存型多ファイルアーティファクトの構造化バンドルである。
EvoSkillsは、エージェントが複雑なマルチファイルスキルパッケージを自律的に構築できる自己進化型スキルフレームワークである。
論文 参考訳(メタデータ) (2026-04-02T06:43:20Z) - Uni-Skill: Building Self-Evolving Skill Repository for Generalizable Robotic Manipulation [32.86306309089796]
Uni-Skillはスキル中心のフレームワークで、スキル対応のプランニングをサポートする。
既存のスキルが不十分な場合、新しいスキル実装に対するUni-Skillリクエスト。
Skillは、大規模な非構造化ロボットビデオから派生したVerbNetにインスパイアされたリポジトリだ。
論文 参考訳(メタデータ) (2026-03-03T05:49:37Z) - SkillNet: Create, Evaluate, and Connect AI Skills [159.47504178122156]
SkillNetは、大規模にAIスキルを作成し、評価し、組織化するように設計されたオープンインフラストラクチャである。
私たちのインフラストラクチャは、20万を超えるスキルのリポジトリ、インタラクティブなプラットフォーム、多目的Pythonツールキットを統合しています。
論文 参考訳(メタデータ) (2026-02-26T14:24:02Z) - SkillVerse : Assessing and Enhancing LLMs with Tree Evaluation [70.27631454256024]
SkillVerseは、特定の能力におけるモデル習熟度を理解するための教師なしツリー構造化診断フレームワークである。
任意のレベルの粒度の習熟度を考慮すれば、SkillVerseはモダンな大規模モデルの振る舞いの洞察を生み出す柔軟性がある。
論文 参考訳(メタデータ) (2025-05-31T00:08:59Z) - Agentic Skill Discovery [19.5703917813767]
言語条件付きロボット技術により、Large Language Models (LLMs) の高レベル推論を低レベルロボット制御に適用することができる。
残る課題は、さまざまな基本的なスキルを取得することです。
LLMによって完全に駆動されるスキル発見のための新しいフレームワークを導入する。
論文 参考訳(メタデータ) (2024-05-23T19:44:03Z) - Example-Driven Model-Based Reinforcement Learning for Solving
Long-Horizon Visuomotor Tasks [85.56153200251713]
長軸ビズモータタスクの完了に適したプリミティブスキルを学習するためのモデルベースRL手法EMBRを紹介する。
フランカ・エミカのロボットアームでは、EMBRによってロボットは85%の成功率で3つの長い水平視運動タスクを完了できることがわかった。
論文 参考訳(メタデータ) (2021-09-21T16:48:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。