論文の概要: Agent Skills for Large Language Models: Architecture, Acquisition, Security, and the Path Forward
- arxiv url: http://arxiv.org/abs/2602.12430v1
- Date: Thu, 12 Feb 2026 21:33:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-16 23:37:53.765718
- Title: Agent Skills for Large Language Models: Architecture, Acquisition, Security, and the Path Forward
- Title(参考訳): 大規模言語モデルのためのエージェントスキル:アーキテクチャ、獲得、セキュリティ、そしてこれからの道
- Authors: Renjun Xu, Yang Yan,
- Abstract要約: エージェントスキルは、再トレーニングなしで動的機能拡張を可能にする。
本調査はエージェント・スキル・ランドスケープを包括的に扱う。
本稿では,4階層のゲートベースパーミッションモデルを提案する。
- 参考スコア(独自算出の注目度): 5.124116559484265
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The transition from monolithic language models to modular, skill-equipped agents marks a defining shift in how large language models (LLMs) are deployed in practice. Rather than encoding all procedural knowledge within model weights, agent skills -- composable packages of instructions, code, and resources that agents load on demand -- enable dynamic capability extension without retraining. It is formalized in a paradigm of progressive disclosure, portable skill definitions, and integration with the Model Context Protocol (MCP). This survey provides a comprehensive treatment of the agent skills landscape, as it has rapidly evolved during the last few months. We organize the field along four axes: (i) architectural foundations, examining the SKILL.md specification, progressive context loading, and the complementary roles of skills and MCP; (ii) skill acquisition, covering reinforcement learning with skill libraries (SAGE), autonomous skill discovery (SEAgent), and compositional skill synthesis; (iii) deployment at scale, including the computer-use agent (CUA) stack, GUI grounding advances, and benchmark progress on OSWorld and SWE-bench; and (iv) security, where recent empirical analyses reveal that 26.1\% of community-contributed skills contain vulnerabilities, motivating our proposed Skill Trust and Lifecycle Governance Framework -- a four-tier, gate-based permission model that maps skill provenance to graduated deployment capabilities. We identify seven open challenges -- from cross-platform skill portability to capability-based permission models -- and propose a research agenda for realizing trustworthy, self-improving skill ecosystems. Unlike prior surveys that broadly cover LLM agents or tool use, this work focuses specifically on the emerging skill abstraction layer and its implications for the next generation of agentic systems. Project repo: https://github.com/scienceaix/agentskills.
- Abstract(参考訳): モノリシックな言語モデルからモジュール化された、スキルを持ったエージェントへの移行は、大規模言語モデル(LLM)の実際のデプロイ方法に決定的な変化をもたらす。
モデルウェイト内で手続き的な知識をすべてエンコードする代わりに、エージェントスキル -- エージェントがオンデマンドでロードする命令、コード、リソースの構成可能なパッケージ -- は、再トレーニングせずに動的機能拡張を可能にする。
プログレッシブな開示、ポータブルなスキル定義、モデルコンテキストプロトコル(MCP)との統合というパラダイムで形式化されている。
この調査は、エージェントスキルのランドスケープを包括的に扱うもので、ここ数ヶ月で急速に進化してきた。
私たちは4つの軸に沿ってフィールドを整理します。
(i)SKILL.md仕様、プログレッシブコンテキストローディング及びスキルとMPPの補完的役割を検証した建築基盤
(二 技能取得、強化学習をスキルライブラリー(SAGE)、自律的スキル発見(SEAgent)、作曲スキル合成
三 コンピュータ利用エージェント(CUA)スタック、GUI基盤の進歩、OSWorld および SWE-bench のベンチマークの進歩を含む大規模展開
原文(投稿日:2012/09/17)へのリンク セキュリティは、最近の実証分析によって、26.1\%のコミュニティに分散したスキルが脆弱性を含んでいることが明らかとなり、提案したスキル信頼とライフサイクルガバナンスフレームワークを動機付けている。
クロスプラットフォームのスキルポータビリティから機能ベースのパーミッションモデルに至るまで,7つのオープンな課題を特定します。
LLMエージェントやツールの使用を幅広くカバーする以前の調査とは異なり、この研究は、新しいスキル抽象化層と次世代のエージェントシステムへのその影響に焦点を当てている。
プロジェクトリポジトリ:https://github.com/scienceaix/agentskills.com
関連論文リスト
- Agent Skills: A Data-Driven Analysis of Claude Skills for Extending Large Language Model Functionality [9.192260493061754]
エージェントスキルは、再利用可能なプログラムのようなモジュールで大きな言語モデル(LLM)エージェントを拡張する。
主要なマーケットプレースから40,285の公開スキルを大規模かつデータ駆動で分析する。
以上の結果から,コミュニティの注目度の変化を追及する短時間でスキルパブリッシュが発生する傾向が示唆された。
論文 参考訳(メタデータ) (2026-02-08T15:14:12Z) - Youtu-LLM: Unlocking the Native Agentic Potential for Lightweight Large Language Models [78.73992315826035]
ネイティブエージェントインテリジェンスと高い計算効率を調和させる軽量言語モデルであるYoutu-LLMを紹介する。
Youtu-LLMは、スクラッチから体系的に推論と計画能力の育成まで事前訓練されている。
論文 参考訳(メタデータ) (2025-12-31T04:25:11Z) - Reinforcement Learning for Self-Improving Agent with Skill Library [14.717149089634718]
大規模言語モデル(LLM)に基づくエージェントは、複雑な推論とマルチターン相互作用において顕著な機能を示した。
有望なアプローチの1つは、エージェントが新しいスキルを学び、検証し、適用できるスキルライブラリを実装することである。
スキルライブラリによるエージェントの自己改善能力を高めるための強化学習(RL)に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2025-12-18T21:58:19Z) - The Landscape of Agentic Reinforcement Learning for LLMs: A Survey [103.32591749156416]
エージェント強化学習(Agentic RL)の出現は、大規模言語モデル(LLM RL)に適用された従来の強化学習からパラダイムシフトを示している。
本研究では, LLM-RLの縮退した単段階マルコフ決定過程(MDPs)と, エージェントRLを定義する部分可観測マルコフ決定過程(POMDPs)とを対比することにより, この概念シフトを定式化する。
論文 参考訳(メタデータ) (2025-09-02T17:46:26Z) - Capability-Driven Skill Generation with LLMs: A RAG-Based Approach for Reusing Existing Libraries and Interfaces [40.638726615548954]
本稿では,スキル実装のコントラクトとして機能を扱うとともに,大規模言語モデルを用いて自然言語ユーザ入力に基づくコード生成を行う手法を提案する。
このアプローチの重要な特徴は、既存のソフトウェアライブラリとインターフェース技術の統合です。
コード生成プロセスに独自のライブラリやリソースインターフェースを組み込むことができるフレームワークを導入する。
論文 参考訳(メタデータ) (2025-05-06T08:27:04Z) - MaestroMotif: Skill Design from Artificial Intelligence Feedback [67.17724089381056]
MaestroMotifはAI支援スキルデザインの手法であり、高性能で適応可能なエージェントを生成する。
本稿では,AIを活用したスキルデザイン手法であるMaestroMotifについて述べる。
論文 参考訳(メタデータ) (2024-12-11T16:59:31Z) - Agentic Skill Discovery [19.5703917813767]
言語条件付きロボット技術により、Large Language Models (LLMs) の高レベル推論を低レベルロボット制御に適用することができる。
残る課題は、さまざまな基本的なスキルを取得することです。
LLMによって完全に駆動されるスキル発見のための新しいフレームワークを導入する。
論文 参考訳(メタデータ) (2024-05-23T19:44:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。