論文の概要: A Comprehensive Survey on Agent Skills: Taxonomy, Techniques, and Applications
- arxiv url: http://arxiv.org/abs/2605.07358v1
- Date: Fri, 08 May 2026 07:10:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.879611
- Title: A Comprehensive Survey on Agent Skills: Taxonomy, Techniques, and Applications
- Title(参考訳): エージェントスキルに関する包括的調査--分類学・技術・応用
- Authors: Yingli Zhou, Wang Shu, Yaodong Su, Wenchuan Du, Yixiang Fang, Xuemin Lin,
- Abstract要約: 大きな言語モデル(LLM)ベースのエージェントは、複雑なタスクを自動化するための有望なパラダイムとして、ツール、メモリ、構造化された相互作用を推論し、計画し、行動する。
しかし、エージェントがオープンエンドの現実世界のデプロイメントに向かっていくにつれ、すべてのタスクに対するオフスクラッチ推論と低レベルのツールコールが、ますます非効率になり、エラーが発生し、メンテナンスが困難になる。
本研究は,タスク固有の制約の下で,ツール,メモリ,ランタイムコンテキストを協調する再利用可能な手続き的アーティファクトとして定義する。
- 参考スコア(独自算出の注目度): 18.01291032624805
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language model (LLM)-based agents that reason, plan, and act through tools, memory, and structured interaction are emerging as a promising paradigm for automating complex workflows. Recent systems such as OpenClaw and Claude Code exemplify a broader shift from passive response generation to action-oriented task execution. Yet as agents move toward open-ended, real-world deployment, relying on from-scratch reasoning and low-level tool calls for every task become increasingly inefficient, error-prone, and hard to maintain. This survey examines this challenge through the lens of \emph{agent skills}, which we define as reusable procedural artifacts that coordinate tools, memory, and runtime context under task-specific constraints. Under this view, agents and skills play complementary roles: agents handle high-level reasoning and planning, while skills form the operational layer that enables reliable, reusable, and composable execution. Skills are therefore central to the scalability, robustness, and maintainability of modern agent systems. We organize the literature around four stages of the agent skill lifecycle -- representation, acquisition, retrieval, and evolution -- and review representative methods, ecosystem resources, and application settings across each stage. We conclude by discussing open challenges in quality control, interoperability, safe updating, and long-term capability management. All related resources, including research papers, open-source data, and projects, are collected for the community in \textcolor{blue}{https://github.com/JayLZhou/Awesome-Agent-Skills}.
- Abstract(参考訳): 大きな言語モデル(LLM)ベースのエージェントは、複雑なワークフローを自動化するための有望なパラダイムとして、ツール、メモリ、構造化されたインタラクションを推論し、計画し、行動する。
OpenClawやClaude Codeといった最近のシステムは、受動的応答生成からアクション指向タスク実行への移行を実証している。
しかし、エージェントがオープンソースで現実世界のデプロイメントへと移行するにつれて、すべてのタスクに対するオフスクラッチ推論と低レベルのツールコールが、ますます非効率になり、エラーが発生し、メンテナンスが困難になる。
本稿では,タスク固有の制約の下でツール,メモリ,ランタイムコンテキストを調整する再利用可能な手続き的アーティファクトとして定義する,emph{agent skills} のレンズを用いて,この課題を検証する。
エージェントは高いレベルの推論と計画を処理し、スキルは信頼性、再利用可能な、構成可能な実行を可能にする運用層を形成する。
したがって、スキルは現代のエージェントシステムのスケーラビリティ、堅牢性、保守性の中心である。
エージェントスキルライフサイクルの4つの段階(表現、取得、検索、進化)に関する文献を整理し、各段階にわたる代表的手法、エコシステムリソース、アプリケーション設定をレビューします。
品質管理、相互運用性、安全な更新、長期的な能力管理におけるオープンな課題について議論することで、私たちは結論付けます。
研究論文、オープンソースデータ、プロジェクトを含むすべての関連リソースは、コミュニティのために、textcolor{blue}{https://github.com/JayLZhou/Awesome-Agent-Skills}で収集されている。
関連論文リスト
- SoK: Agentic Skills -- Beyond Tool Use in LLM Agents [6.356997609995175]
エージェントシステムは、より確実にロングホライゾンを実行するために、再利用可能な手続き能力、すなわちエージェントスキルに依存している。
本論文は,全ライフサイクルのスキルレイヤ(発見,実践,蒸留,貯蔵,構成,評価,更新)をマッピングする。
我々は、スキルベースのエージェントのセキュリティとガバナンスの影響を分析し、サプライチェーンのリスク、スキルペイロードによるインジェクションの促進、信頼度の高い実行をカバーします。
論文 参考訳(メタデータ) (2026-02-24T13:11:38Z) - Agent Skills for Large Language Models: Architecture, Acquisition, Security, and the Path Forward [5.124116559484265]
モノリシックな言語モデルからモジュール化された、スキルを持ったエージェントへの移行は、大規模言語モデル(LLM)の実際のデプロイ方法に決定的な変化をもたらす。
すべての手続き的知識をモデルウェイト内にエンコードするのではなく、エージェントスキルは、再トレーニングせずに動的機能拡張を可能にする。
この調査は、エージェントスキルのランドスケープを包括的に扱うもので、ここ数ヶ月で急速に進化してきた。
論文 参考訳(メタデータ) (2026-02-12T21:33:25Z) - AgentIF-OneDay: A Task-level Instruction-Following Benchmark for General AI Agents in Daily Scenarios [49.90735676070039]
持続時間と複雑さが増大するタスクを効果的に処理するAIエージェントの能力は、成長を続けている。
エージェントタスクの多様性に十分対処することなく,タスクの難易度の向上を優先している。
本稿では,自然言語命令とAIエージェントを多種多様な日常タスクに活用できるかどうかを判定するエージェントIF-OneDayを提案する。
論文 参考訳(メタデータ) (2026-01-28T13:49:18Z) - AI Agent Systems: Architectures, Applications, and Evaluation [4.967019713320407]
AIエージェントは、基礎モデルと推論、計画、メモリ、ツールの使用を組み合わせる。
先行作業は、エージェントコンポーネントにまたがる統一された分類にまとめます。
レイテンシ対精度、自律性対可制御性、能力対信頼性といった重要な設計トレードオフについて論じます。
論文 参考訳(メタデータ) (2026-01-05T02:38:40Z) - Autonomous Data Agents: A New Opportunity for Smart Data [50.02229219403014]
DataAgentsは、自律的なデータから知識システムへのパラダイムシフトを表している、とReportは主張する。
DataAgentsは、複雑で非構造化されたデータをコヒーレントで行動可能な知識に変換する。
エージェントAIとデータ・トゥ・ナレッジシステムの収束が重要なトレンドとなっている理由を最初に検討する。
論文 参考訳(メタデータ) (2025-09-23T06:46:41Z) - A Survey on Agent Workflow -- Status and Future [2.817843718857682]
この調査は、エージェントワークフローシステムの包括的なレビューを提供する。
既存のシステムを機能機能機能とアーキテクチャの2つの重要な側面に沿って分類する。
共通パターン、潜在的な技術的課題、新たなトレンドを強調します。
論文 参考訳(メタデータ) (2025-08-02T04:15:30Z) - A Survey on Complex Tasks for Goal-Directed Interactive Agents [60.53915548970061]
この調査は、目標指向の対話エージェントを評価するための、関連するタスクと環境をコンパイルする。
関連リソースの最新のコンパイルは、プロジェクトのWebサイトにある。
論文 参考訳(メタデータ) (2024-09-27T08:17:53Z) - TaskBench: Benchmarking Large Language Models for Task Automation [82.2932794189585]
タスク自動化における大規模言語モデル(LLM)の機能を評価するためのフレームワークであるTaskBenchを紹介する。
具体的には、タスクの分解、ツールの選択、パラメータ予測を評価する。
提案手法は, 自動構築と厳密な人的検証を組み合わせることで, 人的評価との整合性を確保する。
論文 参考訳(メタデータ) (2023-11-30T18:02:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。