Fugu-MT 論文翻訳(概要): SkillProbe: Security Auditing for Emerging Agent Skill Marketplaces via Multi-Agent Collaboration

論文の概要: SkillProbe: Security Auditing for Emerging Agent Skill Marketplaces via Multi-Agent Collaboration

arxiv url: http://arxiv.org/abs/2603.21019v1
Date: Sun, 22 Mar 2026 02:31:27 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-24 19:11:39.196537
Title: SkillProbe: Security Auditing for Emerging Agent Skill Marketplaces via Multi-Agent Collaboration
Title（参考訳）: SkillProbe:マルチエージェントコラボレーションによるエージェントスキルマーケットプレースのセキュリティ監査
Authors: Zihan Guo, Zhiyu Chen, Xiaohang Nie, Jianghao Lin, Yuanjian Zhou, Weinan Zhang,
Abstract要約: SkillProbeはマルチエージェントコラボレーションによって駆動されるマルチステージセキュリティ監査フレームワークである。 ClawHubから2500の現実世界スキルを対象とした8つの主流シリーズを用いた大規模評価を行った。私たちの結果は、ダウンロードボリュームが信頼できるプロキシのセキュリティ品質ではないという、重大な人気セキュリティのパラドックスを明らかにしました。
参考スコア（独自算出の注目度）: 22.680481305584028
License: http://creativecommons.org/licenses/by/4.0/
Abstract: With the rapid evolution of Large Language Model (LLM) agent ecosystems, centralized skill marketplaces have emerged as pivotal infrastructure for augmenting agent capabilities. However, these marketplaces face unprecedented security challenges, primarily stemming from semantic-behavioral inconsistency and inter-skill combinatorial risks, where individually benign skills induce malicious behaviors during collaborative invocation. To address these vulnerabilities, we propose SkillProbe, a multi-stage security auditing framework driven by multi-agent collaboration. SkillProbe introduces a "Skills-for-Skills" design paradigm, encapsulating auditing processes into standardized skill modules to drive specialized agents through a rigorous pipeline, including admission filtering, semantic-behavioral alignment detection, and combinatorial risk simulation. We conducted a large-scale evaluation using 8 mainstream LLM series across 2,500 real-world skills from ClawHub. Our results reveal a striking popularity-security paradox, where download volume is not a reliable proxy for security quality, as over 90% of high-popularity skills failed to pass rigorous auditing. Crucially, we discovered that high-risk skills form a single giant connected component within the risk-link dimension, demonstrating that cascaded risks are systemic rather than isolated occurrences. We hope that SkillProbe will inspire researchers to provide a scalable governance infrastructure for constructing a trustworthy Agentic Web. SkillProbe is accessible for public experience at skillhub.holosai.io.
Abstract（参考訳）: 大規模言語モデル(LLM)エージェントエコシステムの急速な進化に伴い、中央集権的なスキルマーケットプレースがエージェント機能を増強するための重要な基盤として現れている。しかし、これらのマーケットプレースは、主にセマンティックビヘイビアの不整合と、個別に良心的なスキルが協調的呼び出し中に悪意ある振る舞いを誘発するスキル間の複合的リスクに起因して、前例のないセキュリティ上の課題に直面している。これらの脆弱性に対処するため,マルチエージェントコラボレーションによるマルチステージセキュリティ監査フレームワークであるSkillProbeを提案する。 SkillProbeは"スキル・フォー・スキル(Skills-for-Skills)"設計パラダイムを導入し、監査プロセスを標準化されたスキルモジュールにカプセル化して、入出力フィルタリング、セマンティックビヘイビアアライメント検出、組合せリスクシミュレーションを含む厳密なパイプラインを通じて専門エージェントを駆動する。我々はClawHubから2500の現実世界スキルを対象とした8つのLLMシリーズを用いた大規模評価を行った。高い人気を持つスキルの90%以上が厳格な監査に合格しなかったため、ダウンロード量はセキュリティ品質の信頼できるプロキシにはならない。重要なことに、リスクリンクの次元において、リスクの高いスキルが単一の巨大連結コンポーネントを形成し、カスケードされたリスクは孤立した事象ではなく体系的であることを示した。 SkillProbeが研究者に、信頼できるエージェントWebを構築するためのスケーラブルなガバナンスインフラストラクチャを提供することを願っています。 SkillProbe は skillhub.holosai.io で一般公開されている。

論文の概要: SkillProbe: Security Auditing for Emerging Agent Skill Marketplaces via Multi-Agent Collaboration

関連論文リスト