論文の概要: SkillClone: Multi-Modal Clone Detection and Clone Propagation Analysis in the Agent Skill Ecosystem
- arxiv url: http://arxiv.org/abs/2603.22447v1
- Date: Mon, 23 Mar 2026 18:17:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 19:53:37.136037
- Title: SkillClone: Multi-Modal Clone Detection and Clone Propagation Analysis in the Agent Skill Ecosystem
- Title(参考訳): SkillClone:エージェントスキル生態系におけるマルチモーダルクローン検出とクローン伝播解析
- Authors: Jiaying Zhu, Lyuye Zhang, Wenbo Guo, Yang Liu,
- Abstract要約: エージェントスキルのための最初のマルチモーダルクローン検出手法であるSkillCloneを提案する。
SkillClone-Bench では、SkillClone は 0.939 の F1 を精度 0.952 で達成し、平坦な TF-IDF を上回っている。
SkillCloneを20Kスキルに適用すると、すべてのスキルの75%が258Kクローンペアで、40%が著者の境界を越えたことが分かる。
- 参考スコア(独自算出の注目度): 16.221297353469957
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Agent skills are modular instruction packages that combine YAML metadata, natural language instructions, and embedded code, and they have reached 196K publicly available instances, yet no mechanism exists to detect clone relationships among them. This gap creates systemic risks: a vulnerability in a widely copied skill silently persists across derivatives with no alert to maintainers. Existing clone detectors, designed for single-modality source code, cannot handle the multi-modal structure of skills, where clone evidence is distributed across three interleaved content channels. We present SkillClone, the first multi-modal clone detection approach for agent skills. SkillClone fuses flat TF-IDF similarity with per-channel decomposition (YAML, NL, code) through logistic regression, combining strong detection with interpretable type classification. We construct SkillClone-Bench, a balanced benchmark of 300 ground-truth pairs with stratified difficulty. On SkillClone-Bench, SkillClone achieves F1 of 0.939 with precision 0.952, outperforming flat TF-IDF (F1 = 0.881) and achieving 4.2x higher Type-4 (semantic) recall than MinHash. Applying SkillClone to 20K skills reveals 258K clone pairs involving 75% of all skills, with 40% crossing author boundaries. A deduplication analysis shows the ecosystem is inflated 3.5x: only 5,642 unique skill concepts underlie the 20K listed skills, and 41% of skills in clone families are superseded by a strictly better variant.
- Abstract(参考訳): エージェントスキルは、YAMLメタデータ、自然言語命令、組み込みコードを組み合わせたモジュラー命令パッケージであり、196Kのパブリックインスタンスに到達しているが、それらの間のクローン関係を検出するメカニズムは存在しない。
広くコピーされたスキルの脆弱性は、メンテナに警告することなく、デリバティブ間で静かに持続する。
既存のクローン検出器は、単一のモダリティのソースコードのために設計されており、3つのインターリーブされたコンテンツチャネルにクローン証拠が分散している、多モードのスキル構造を処理できない。
エージェントスキルのための最初のマルチモーダルクローン検出手法であるSkillCloneを提案する。
SkillCloneは、ロジスティック回帰を通じて、チャネルごとの分解(YAML、NL、コード)とフラットなTF-IDF類似性を融合し、強い検出と解釈可能な型分類を組み合わせた。
SkillClone-Benchは,300の接地トラス対のバランスの取れたベンチマークで,成層化が困難である。
SkillClone-Bench では、SkillClone は 0.939 の F1 を精度 0.952 で達成し、フラットTF-IDF (F1 = 0.881) を上回り、MinHash よりも4.2倍高い Type-4 (semantic) リコールを達成した。
SkillCloneを20Kスキルに適用すると、すべてのスキルの75%が258Kクローンペアで、40%が著者の境界を越えたことが分かる。
5,642のユニークなスキル概念だけで20Kのスキルを達成でき、クローンファミリーのスキルの41%は、厳格に優れた変種に取って代わられている。
関連論文リスト
- Formal Analysis and Supply Chain Security for Agentic AI Skills [0.0]
SkillFortifyは、エージェントスキルサプライチェーンのための最初の公式分析フレームワークである。
抽象解釈に基づく健全な静的解析フレームワークを提供する。
SATベースの解像度は1000ノードグラフを100ミリ秒以下で処理するのに対し、100%精度と0%偽陽性率は540スキルで達成する。
論文 参考訳(メタデータ) (2026-02-27T06:21:53Z) - SkillNet: Create, Evaluate, and Connect AI Skills [159.47504178122156]
SkillNetは、大規模にAIスキルを作成し、評価し、組織化するように設計されたオープンインフラストラクチャである。
私たちのインフラストラクチャは、20万を超えるスキルのリポジトリ、インタラクティブなプラットフォーム、多目的Pythonツールキットを統合しています。
論文 参考訳(メタデータ) (2026-02-26T14:24:02Z) - SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks [61.89812116484928]
エージェントスキルは、LLMエージェントを推論時に増強する手続き的知識の構造化パッケージである。
SkillsBenchは、11のドメインにわたる86のタスクのベンチマークであり、キュレートされたスキルと決定論的検証との組み合わせを示す。
キュレートされたスキルは平均パスレートを16.2ポイント(pp)上昇させるが、効果は領域によって大きく異なる。
自己生成スキルは平均的に何の利益も与えず、モデルが消費から得られる手続き的な知識を確実に説明できないことを示している。
論文 参考訳(メタデータ) (2026-02-13T07:06:06Z) - Agent Skills in the Wild: An Empirical Study of Security Vulnerabilities at Scale [26.757365536859453]
AIエージェントフレームワークの台頭はエージェントスキル、命令を含むモジュールパッケージ、エージェント機能を動的に拡張する実行可能なコードを導入した。
このアーキテクチャは強力なカスタマイズを可能にするが、スキルは暗黙の信頼と最小限の拒否によって実行され、重要なが不適合なアタックサーフェスを生み出す。
2つの主要な市場から42,447のスキルを収集し、この新興エコシステムの最初の大規模な経験的セキュリティ分析を行います。
論文 参考訳(メタデータ) (2026-01-15T12:31:52Z) - The Trojan in the Vocabulary: Stealthy Sabotage of LLM Composition [31.827344197678126]
トケナイザー移植はサプライチェーンの脆弱性を導入する。
係数再利用の幾何学を利用して、我々の攻撃は非対称的な実現可能性ギャップを生み出す。
実験的に、攻撃は訓練なしで、スペクトルの模倣を達成し、異常検出を回避する。
論文 参考訳(メタデータ) (2025-12-31T19:00:03Z) - Detecting Semantic Clones of Unseen Functionality [7.660632979515074]
我々は,未確認機能のクローンを検出するタスクにおいて,タスク固有モデルと生成LDMの両方を含む6つの最先端モデルを再評価する。
そこで本研究では,既存モデルの非可視機能のクローン上での性能向上を図るために,コントラッシブ・ラーニング(コントラッシブ・ラーニング)の使用法を提案し,評価する。
論文 参考訳(メタデータ) (2025-10-05T10:45:52Z) - CLIPure: Purification in Latent Space via CLIP for Adversarially Robust Zero-Shot Classification [65.46685389276443]
画像とテキストプロンプトをマッチングすることでゼロショット分類を行うことができる、視覚言語で事前訓練されたエンコーダモデルであるCLIPについて検討する。
次に, 共分散精製プロセス間のKL分散として精製リスクを定式化する。
画像の潜伏ベクトルの確率をモデル化するCLI-Diffと、画像の埋め込みとaの写真とのコサイン類似度をモデル化するCLI-Cosの2つのバリエーションを提案する。
論文 参考訳(メタデータ) (2025-02-25T13:09:34Z) - Law of the Weakest Link: Cross Capabilities of Large Language Models [102.91861246827797]
我々は,Large Language Models (LLMs) が "Law of the Weakest Link" を示すことを示した。
これらの結果は, クロスキャパビリティタスクにおけるLLMの低性能化を浮き彫りにした。
論文 参考訳(メタデータ) (2024-09-30T05:12:01Z) - Skill-Mix: a Flexible and Expandable Family of Evaluations for AI models [50.11814354654953]
AIエージェントの主な能力は、必要に応じて、学習した基本的なスキルを柔軟に組み合わせることである。
この研究は、スキルを組み合わせる能力を測定するための新しい評価であるSkill-Mixを導入している。
論文 参考訳(メタデータ) (2023-10-26T16:55:05Z) - GPTCloneBench: A comprehensive benchmark of semantic clones and
cross-language clones using GPT-3 model and SemanticCloneBench [1.8687918300580921]
本稿では,SemanticCloneBenchとOpenAIのGPT-3モデルを利用して,包括的セマンティッククローンと言語間クローンベンチマークGPTCloneBenchを提案する。
GPT-3出力の79,928個のクローンペアから、37,149個の真のセマンティッククローンペア、19,288個の偽セマンティックペア(Type-1/Type-2)、および4言語(Java、C、C#、Python)にわたる20,770個のクロス言語クローンのベンチマークを作成しました。
論文 参考訳(メタデータ) (2023-08-26T21:50:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。