論文の概要: Red Skills or Blue Skills? A Dive Into Skills Published on ClawHub
- arxiv url: http://arxiv.org/abs/2604.13064v1
- Date: Thu, 19 Mar 2026 14:31:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-19 19:09:11.650537
- Title: Red Skills or Blue Skills? A Dive Into Skills Published on ClawHub
- Title(参考訳): Red SkillsかBlue Skillsか? ClawHubで公開されているDive Into Skills
- Authors: Haichuan Hu, Ye Shang, Quanjun Zhang,
- Abstract要約: 公共スキルレジストリの機能,エコシステム構造,セキュリティリスクについて検討する。
26,502のスキルのデータセットを構築し、それらの言語分布、機能組織、人気度、セキュリティ信号の体系的な分析を行う。
筆者らは,公共スキル登録をエージェント能力の再利用の鍵となるものと位置づけ,生態系規模のセキュリティリスクの新たな表面と位置づけた。
- 参考スコア(独自算出の注目度): 6.900491771165292
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Skill ecosystems have emerged as an increasingly important layer in Large Language Model (LLM) agent systems, enabling reusable task packaging, public distribution, and community-driven capability sharing. However, despite their rapid growth, the functionality, ecosystem structure, and security risks of public skill registries remain underexplored. In this paper, we present an empirical study of ClawHub, a large public registry of agent skills. We build and normalize a dataset of 26,502 skills, and conduct a systematic analysis of their language distribution, functional organization, popularity, and security signals. Our clustering results show clear cross-lingual differences: English skills are more infrastructure-oriented and centered on technical capabilities such as APIs, automation, and memory, whereas Chinese skills are more application-oriented, with clearer scenario-driven clusters such as media generation, social content production, and finance-related services. We further find that more than 30% of all crawled skills are labeled as suspicious or malicious by available platform signals, while a substantial fraction of skills still lack complete safety observability. To study early risk assessment, we formulate submission-time skill risk prediction using only information available at publication time, and construct a balanced benchmark of 11,010 skills. Across 12 classifiers, the best Logistic Regression achieves a accuracy of 72.62% and an AUROC of 78.95%, with primary documentation emerging as the most informative submission-time signal. Our findings position public skill registries as both a key enabler of agent capability reuse and a new surface for ecosystem-scale security risk.
- Abstract(参考訳): スキルエコシステムは、再利用可能なタスクパッケージング、パブリックディストリビューション、コミュニティ主導の能力共有を可能にする、Large Language Model(LLM)エージェントシステムにおいて、ますます重要なレイヤとして現れています。
しかし、その急速な成長にもかかわらず、公共スキル登録所の機能、エコシステム構造、セキュリティリスクは未解明のままである。
本稿では,エージェントスキルの大規模公開レジストリであるClawHubについて,実証的研究を行った。
26,502のスキルのデータセットを構築し、それらの言語分布、機能組織、人気度、セキュリティ信号の体系的な分析を行う。
英語のスキルはインフラストラクチャ指向であり、APIや自動化、メモリといった技術的能力に重点を置いているのに対して、中国語のスキルはアプリケーション指向であり、メディア生成やソーシャルコンテンツ制作、金融関連サービスといった、より明確なシナリオ駆動のクラスタである。
さらに、クロールされたスキルの30%以上が、利用可能なプラットフォーム信号によって疑わしい、あるいは悪意のあるものとしてラベル付けされていることもわかりました。
早期リスクアセスメントを検討するために,出版時に利用可能な情報のみを用いて応募時のスキルリスク予測を定式化し,11,010のスキルのバランスの取れたベンチマークを構築した。
12の分類器で最高のロジスティック回帰は72.62%の精度と78.95%のAUROCを達成し、主要な文書が最も有意義な提出時信号として現れる。
筆者らは,公共スキル登録をエージェント能力の再利用の鍵となるものと位置づけ,生態系規模のセキュリティリスクの新たな表面と位置づけた。
関連論文リスト
- SkillAttack: Automated Red Teaming of Agent Skills through Attack Path Refinement [66.44008181092832]
LLMベースのエージェントシステムは、その能力を拡張するためにオープンレジストリからのエージェントスキルにますます依存している。
SkillAttackは、敵のプロンプトを通じて、スキル脆弱性の脆弱性を検証できるフレームワークである。
論文 参考訳(メタデータ) (2026-04-05T06:25:11Z) - Credential Leakage in LLM Agent Skills: A Large-Scale Empirical Study [51.717224133855886]
サードパーティのスキルはLLMエージェントを強力な能力で拡張するが、特権のある環境では機密情報を扱うことが多い。
静的解析,サンドボックステスト,手動検査を用いて17,022のスキル(SkillsMPで170,226からサンプリング)を分析した。
我々は,1,708の課題で520の脆弱なスキルを識別し,10の漏洩パターン(事故4件,反対6件)の分類を導出する。
論文 参考訳(メタデータ) (2026-04-03T14:50:16Z) - Malicious Or Not: Adding Repository Context to Agent Skill Classification [3.773312847224526]
我々は、AIエージェントスキルエコシステムにおける最大の経験的セキュリティ分析を提示する。
3つの主要なディストリビューションプラットフォームとGitHubから238,180のユニークなスキルを集めています。
我々の分析では、現在文書化されていない現実世界の攻撃ベクトルもいくつか発見されている。
論文 参考訳(メタデータ) (2026-03-17T14:27:35Z) - SkillNet: Create, Evaluate, and Connect AI Skills [159.47504178122156]
SkillNetは、大規模にAIスキルを作成し、評価し、組織化するように設計されたオープンインフラストラクチャである。
私たちのインフラストラクチャは、20万を超えるスキルのリポジトリ、インタラクティブなプラットフォーム、多目的Pythonツールキットを統合しています。
論文 参考訳(メタデータ) (2026-02-26T14:24:02Z) - Agent Skills for Large Language Models: Architecture, Acquisition, Security, and the Path Forward [5.124116559484265]
モノリシックな言語モデルからモジュール化された、スキルを持ったエージェントへの移行は、大規模言語モデル(LLM)の実際のデプロイ方法に決定的な変化をもたらす。
すべての手続き的知識をモデルウェイト内にエンコードするのではなく、エージェントスキルは、再トレーニングせずに動的機能拡張を可能にする。
この調査は、エージェントスキルのランドスケープを包括的に扱うもので、ここ数ヶ月で急速に進化してきた。
論文 参考訳(メタデータ) (2026-02-12T21:33:25Z) - Agent Skills: A Data-Driven Analysis of Claude Skills for Extending Large Language Model Functionality [9.192260493061754]
エージェントスキルは、再利用可能なプログラムのようなモジュールで大きな言語モデル(LLM)エージェントを拡張する。
主要なマーケットプレースから40,285の公開スキルを大規模かつデータ駆動で分析する。
以上の結果から,コミュニティの注目度の変化を追及する短時間でスキルパブリッシュが発生する傾向が示唆された。
論文 参考訳(メタデータ) (2026-02-08T15:14:12Z) - WebSailor-V2: Bridging the Chasm to Proprietary Agents via Synthetic Data and Scalable Reinforcement Learning [73.91893534088798]
WebSailorは、この重要な機能を組み込むように設計された、完全なポストトレーニング方法論である。
我々のアプローチは、構造化サンプリングと情報難読化によって、新しい、不確実なタスクを生成することである。
WebSailorは複雑な情報検索タスクにおいて、すべてのオープンソースエージェントを著しく上回る。
論文 参考訳(メタデータ) (2025-09-16T17:57:03Z) - An Overview of Large Language Models for Statisticians [109.38601458831545]
大規模言語モデル(LLM)は人工知能(AI)の変換ツールとして登場した。
本稿では, 統計学者がLLMの開発に重要な貢献できる可能性について考察する。
我々は不確実性定量化、解釈可能性、公正性、プライバシー、透かし、モデル適応といった問題に焦点を当てる。
論文 参考訳(メタデータ) (2025-02-25T03:40:36Z) - Multi Agent System for Machine Learning Under Uncertainty in Cyber
Physical Manufacturing System [78.60415450507706]
近年の予測機械学習の進歩は、製造における様々なユースケースに応用されている。
ほとんどの研究は、それに関連する不確実性に対処することなく予測精度を最大化することに焦点を当てた。
本稿では,機械学習における不確実性の原因を特定し,不確実性下での機械学習システムの成功基準を確立する。
論文 参考訳(メタデータ) (2021-07-28T10:28:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。