論文の概要: SkillRAE: Agent Skill-Based Context Compilation for Retrieval-Augmented Execution
- arxiv url: http://arxiv.org/abs/2605.10114v1
- Date: Mon, 11 May 2026 07:31:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.601177
- Title: SkillRAE: Agent Skill-Based Context Compilation for Retrieval-Augmented Execution
- Title(参考訳): SkillRAE: Retrieval-Augmented Executionのためのエージェントスキルベースのコンテキストコンパイル
- Authors: Xiangcheng Meng, Shu Wang, Yixiang Fang,
- Abstract要約: 大きな言語モデル(LLM)ベースのエージェントは、アーティファクトリッチなタスクを解決するために、再利用可能なスキルライブラリに依存している。
本稿では,スキルベースのコンテキストコンパイルに着目した2段階RAE手法であるSkillRAEを提案する。
2つの公開ベンチマークの実験によると、SkillRAEはRAEのベースラインよりも大幅に改善されている。
- 参考スコア(独自算出の注目度): 10.83969404435554
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Model (LLM)-based agents (e.g., OpenClaw) increasingly rely on reusable skill libraries to solve artifact-rich tasks such as document-centric workflows and data-intensive analysis. As these libraries grow, a few works have attempted to study the Retrieval-Augmented Execution (RAE), which often first retrieves some external skills and other knowledge, then compiles the context using retrieved skills, and finally executes the task. Existing works mainly focus on optimizing skill retrieval and task execution, and they pay little attention to how to effectively organize the selected skill evidence in a form that is compact, grounded, and immediately usable for the downstream executors to complete tasks. To fill this gap, we propose SkillRAE, a two-stage RAE approach focusing on skill-based context compilation, which consists of the offline and online stages. Specifically, in the offline indexing stage, it builds a multi-level skill graph over skill communities, skills, and reusable subunits, for capturing their relationships. In the online retrieval stage, it first performs skill-ranked retrieval with selected-subunit evidence export in the graph, and then applies rescue-aware compact compilation to recover the key evidence. Together, these components compile a coarse-ranked skill set into a task-specific context that is compact, grounded, and immediately usable. Experiments on two public benchmarks show that SkillRAE achieves a significant improvement over baselines for RAE. For example, on SkillsBench, it achieves an improvement of 11.7% over the SOTA method. Ablation studies further show that our context compilation is crucial, instead of a mere prompt addition.
- Abstract(参考訳): 大規模言語モデル(LLM)ベースのエージェント(例:OpenClaw)は、ドキュメント中心のワークフローやデータ集約分析などのアーティファクトリッチなタスクを解決するために、再利用可能なスキルライブラリにますます依存している。
これらのライブラリが成長するにつれて、いくつかの研究がRetrieval-Augmented Execution (RAE)の研究を試みている。
既存の作業は主にスキル検索とタスク実行の最適化に重点を置いており、選択したスキルエビデンスをどのように効果的に整理するかにはほとんど注意を払っていない。
このギャップを埋めるために、オフラインおよびオンラインのステージで構成されるスキルベースのコンテキストコンパイルに焦点を当てた2段階RAEアプローチであるSkillRAEを提案する。
具体的には、オフラインインデックス化の段階では、スキルコミュニティ、スキル、再利用可能なサブユニットに対するマルチレベルスキルグラフを構築し、それらの関係をキャプチャする。
オンライン検索段階では、まず、選択されたサブユニットのエビデンスをグラフにエクスポートしてスキルランク付き検索を行い、次に、レスキュー対応のコンパクトコンパイルを適用して重要なエビデンスを復元する。
これらのコンポーネントは、粗いランク付けされたスキルセットを、コンパクトで、接地され、すぐに使用可能なタスク固有のコンテキストにコンパイルする。
2つの公開ベンチマークの実験によると、SkillRAEはRAEのベースラインよりも大幅に改善されている。
例えば、SkillsBenchでは、SOTA法よりも11.7%改善されている。
アブレーション研究は、単なる即時追加ではなく、文脈のコンパイルが重要であることをさらに示しています。
関連論文リスト
- Group of Skills: Group-Structured Skill Retrieval for Agent Skill Libraries [17.05120726889683]
グループ・オブ・スキルズ(Group of Skills)は、エージェントが対象とする検索対象をフラットなスキルリストからコンパクトなロールラベル付き実行コンテキストに変更する推論時グループ構造化検索手法である。
GoSkillsは、型付きスキルグラフからアンカー中心のスキルグループを構築し、グループグラフを通じてサポートグループを拡張し、スタート、サポート、チェック、回避フィールドとの固定実行契約をレンダリングする。
SkillsBenchとALFWorldの実験によると、GoSkillsは小さなスキル予算の下で可視的要求カバレッジを保ち、フラットなスキルアクセスベースラインよりも改善し、報酬とエージェントのみのランタイムを相対的に改善する。
論文 参考訳(メタデータ) (2026-05-07T21:51:59Z) - Decompose and Recompose: Reasoning New Skills from Existing Abilities for Cross-Task Robotic Manipulation [45.91196295385836]
クロスタスクの一般化は、オープンソースのロボット操作における中核的な課題である。
中間表現としてアトミックなスキルアクションペアを用いたスキル推論フレームワークであるDecomposeとRecomposeを提案する。
われわれのアプローチでは、実演を解釈可能なスキル-アクションアライメントに分解し、モデルが見えないタスクのためにこれらのスキルを再構成できるようにする。
論文 参考訳(メタデータ) (2026-05-02T13:55:28Z) - From Context to Skills: Can Language Models Learn from Context Skillfully? [56.5857437218136]
Ctx2Skillは、コンテキスト固有のスキルを自律的に発見、洗練、選択する自己進化フレームワークである。
より良い文脈学習能力を得るために、どんな言語モデルにもプラグインできる。
論文 参考訳(メタデータ) (2026-04-30T09:53:15Z) - SKILLFOUNDRY: Building Self-Evolving Agent Skill Libraries from Heterogeneous Scientific Resources [5.7282243774488295]
我々は、リソースを検証されたエージェントスキルに変換する自己進化型フレームワークであるSkillFoundryを紹介する。
SkillFoundryは,比較的新規で,内部的に有効なスキルライブラリであることを示す。
また,SkillFoundryは,具体的な科学的目的の要求に応じて,新たなタスク固有のスキルを設計できることを示す。
論文 参考訳(メタデータ) (2026-04-05T05:02:18Z) - SKILL0: In-Context Agentic Reinforcement Learning for Skill Internalization [61.37478254738943]
推論時のスキル向上は基本的に制限されている。
SKILL0は,スキル内部化のためのコンテキスト内強化学習フレームワークである。
SKILL0は標準のRLベースラインよりも大幅に改善されている。
論文 参考訳(メタデータ) (2026-04-02T17:03:05Z) - SkillCraft: Can LLM Agents Learn to Use Tools Skillfully? [67.69996753743129]
SkillCraftは、高レベルのツールコンポジションの生成と再利用を可能にする、明示的にストレステストエージェントのベンチマークである。
SkillCraftは、定量次元と構造次元の両方に沿ってスケールする困難を伴う、現実的で、構成性の高いツール使用シナリオを特徴としている。
本稿では,エージェントがアトミックツールを実行可能なスキルに自動生成し,タスク内およびタスク間のキャッシュと再利用を可能にする軽量な評価プロトコルを提案する。
論文 参考訳(メタデータ) (2026-02-28T15:44:31Z) - SkillRL: Evolving Agents via Recursive Skill-Augmented Reinforcement Learning [83.98129545309277]
生経験と政策改善のギャップを埋めるフレームワークであるSkillRLを提案する。
本手法では,階層型スキルライブラリであるSkillBankを構築するために,経験に基づく蒸留機構を導入する。
ALF、WebShop、および7つの検索強化タスクの実験結果は、SkillRLが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2026-02-09T03:17:17Z) - Pre-training Multi-task Contrastive Learning Models for Scientific
Literature Understanding [52.723297744257536]
事前学習言語モデル(LM)は、科学文献理解タスクにおいて有効であることを示す。
文献理解タスク間の共通知識共有を容易にするために,マルチタスクのコントラスト学習フレームワークであるSciMultを提案する。
論文 参考訳(メタデータ) (2023-05-23T16:47:22Z) - Design of Negative Sampling Strategies for Distantly Supervised Skill
Extraction [19.43668931500507]
本稿では,リテラルマッチングによる遠隔監視に基づく,スキル抽出のためのエンドツーエンドシステムを提案する。
ESCO分類を用いて、関連するスキルからネガティブな例を選択することで、最大の改善が得られます。
我々は,タスクのさらなる研究を促進するために,研究目的のベンチマークデータセットをリリースする。
論文 参考訳(メタデータ) (2022-09-13T13:37:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。