論文の概要: WebWeaver: Breaking Topology Confidentiality in LLM Multi-Agent Systems with Stealthy Context-Based Inference
- arxiv url: http://arxiv.org/abs/2603.11132v2
- Date: Thu, 19 Mar 2026 17:37:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-20 14:52:42.128748
- Title: WebWeaver: Breaking Topology Confidentiality in LLM Multi-Agent Systems with Stealthy Context-Based Inference
- Title(参考訳): WebWeaver: 静的コンテキストベース推論を用いたLLMマルチエージェントシステムにおけるトポロジの信頼性を破る
- Authors: Zixun Xiong, Gaoyi Wu, Lingfeng Yao, Miao Pan, Xiaojiang Du, Hao Wang,
- Abstract要約: 通信トポロジはマルチエージェントシステム(LLM-MAS)の実用性と安全性において重要な要素である
我々は、管理エージェントの代わりに単一の任意のエージェントのみを妥協することにより、完全なLLM-MASトポロジを推論する攻撃フレームワークである textitWebWeaver を提案する。
WebWeaverは、最先端(SOTA)ベースラインを大幅に上回り、無視可能なオーバーヘッドを持つアクティブディフェンスの下で約60%高い推論精度を達成する。
- 参考スコア(独自算出の注目度): 16.388024157151484
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Communication topology is a critical factor in the utility and safety of LLM-based multi-agent systems (LLM-MAS), making it a high-value intellectual property (IP) whose confidentiality remains insufficiently studied. Existing topology inference attempts rely on impractical assumptions, including control over the administrative agent and direct identity queries via jailbreaks, which are easily defeated by basic keyword-based defenses. As a result, prior analyses fail to capture the real-world threat of such attacks. To bridge this realism gap, we propose \textit{WebWeaver}, an attack framework that infers the complete LLM-MAS topology by compromising only a single arbitrary agent instead of the administrative agent. Unlike prior approaches, WebWeaver relies solely on agent contexts rather than agent IDs, enabling significantly stealthier inference. WebWeaver further introduces a new covert jailbreak-based mechanism and a novel fully jailbreak-free diffusion design to handle cases where jailbreaks fail. Additionally, we address a key challenge in diffusion-based inference by proposing a masking strategy that preserves known topology during diffusion, with theoretical guarantees of correctness. Extensive experiments show that WebWeaver substantially outperforms state-of-the-art (SOTA) baselines, achieving about 60\% higher inference accuracy under active defenses with negligible overhead.
- Abstract(参考訳): 通信トポロジはLLMベースのマルチエージェントシステム(LLM-MAS)の有用性と安全性において重要な要素であり、機密性が不十分な高価値知的財産(IP)となっている。
既存のトポロジ推論の試みは、管理エージェントの制御やジェイルブレイクによる直接的なIDクエリなど、非現実的な仮定に依存しており、基本的なキーワードベースの防御によって簡単に倒される。
その結果、事前分析ではそのような攻撃の現実世界の脅威を捉えられなかった。
このリアリズムギャップを埋めるために,行政エージェントの代わりに単一の任意のエージェントのみを妥協することにより,完全な LLM-MAS トポロジを推論する攻撃フレームワークである \textit{WebWeaver} を提案する。
従来のアプローチとは異なり、WebWeaverはエージェントIDではなくエージェントコンテキストのみに依存しており、かなりステルスな推論を可能にしている。
WebWeaverはさらに、新しい秘密のJailbreakベースのメカニズムと、Jailbreakが失敗するケースを扱うための、完全にJailbreakのない拡散設計を導入している。
さらに,拡散型推論における重要な課題として,拡散中の既知のトポロジを保存するマスキング戦略を提案する。
大規模な実験により、WebWeaverは最先端(SOTA)ベースラインを大幅に上回り、無視可能なオーバーヘッドを持つアクティブディフェンスの下で約60%高い推論精度を達成した。
関連論文リスト
- From Similarity to Vulnerability: Key Collision Attack on LLM Semantic Caching [7.164841206695704]
本稿では,キャッシュ衝突による整合性リスクに関する最初の体系的研究について述べる。
我々は、ブラックボックス衝突攻撃を起動する自動化フレームワークであるCacheAttackを紹介した。
金融エージェントに関するケーススタディでは、これらの脆弱性の現実的な影響が示されている。
論文 参考訳(メタデータ) (2026-01-30T15:37:00Z) - Just Ask: Curious Code Agents Reveal System Prompts in Frontier LLMs [65.6660735371212]
textbftextscJustAskは,インタラクションのみで効果的な抽出戦略を自律的に発見するフレームワークである。
これは、アッパー信頼境界に基づく戦略選択と、原子プローブと高レベルのオーケストレーションにまたがる階層的なスキル空間を用いて、オンライン探索問題として抽出を定式化する。
この結果から,現代のエージェントシステムにおいて,システムプロンプトは致命的ではあるがほぼ無防備な攻撃面であることがわかった。
論文 参考訳(メタデータ) (2026-01-29T03:53:25Z) - Tipping the Dominos: Topology-Aware Multi-Hop Attacks on LLM-Based Multi-Agent Systems [14.555944084540435]
LLMベースのマルチエージェントシステム(MAS)は、デジタルランドスケープを創発的コーディネーションと問題解決能力で再構築した。
我々は,MASを対象としたトポロジ対応マルチホップ攻撃方式であるTOMAを提案する。
論文 参考訳(メタデータ) (2025-12-03T05:10:39Z) - Rethinking Security in Semantic Communication: Latent Manipulation as a New Threat [4.488447044579913]
ディープラーニングに基づくセマンティックコミュニケーション(SemCom)は,次世代無線ネットワークにおいて有望なパラダイムとして登場した。
本論文では,マン・イン・ザ・ミドル(MitM)攻撃者が送信されたセマンティクスを隠蔽的に操作できる基本的な潜時空間脆弱性を明らかにする。
論文 参考訳(メタデータ) (2025-12-03T01:54:11Z) - The Trojan Knowledge: Bypassing Commercial LLM Guardrails via Harmless Prompt Weaving and Adaptive Tree Search [58.8834056209347]
大規模言語モデル(LLM)は、有害な出力を誘導するために安全ガードレールをバイパスするジェイルブレイク攻撃に弱いままである。
CKA-Agent(Correlated Knowledge Attack Agent)は、ターゲットモデルの知識基盤の適応的木構造探索としてジェイルブレイクを再構成する動的フレームワークである。
論文 参考訳(メタデータ) (2025-12-01T07:05:23Z) - FocusAgent: Simple Yet Effective Ways of Trimming the Large Context of Web Agents [76.12500510390439]
大規模言語モデル(LLM)を利用したWebエージェントは、ユーザの目標を達成するために、長いWebページの観察を処理しなければならない。
既存のプルーニング戦略は、関連するコンテンツを捨てるか、無関係なコンテキストを保持するかのいずれかであり、最適以下の行動予測につながる。
FocusAgentは軽量LCMレトリバーを利用してアクセシビリティツリー(AxTree)観測から最も関連性の高い線を抽出するシンプルで効果的なアプローチである。
論文 参考訳(メタデータ) (2025-10-03T17:41:30Z) - AgentVigil: Generic Black-Box Red-teaming for Indirect Prompt Injection against LLM Agents [54.29555239363013]
本稿では,間接的なインジェクション脆弱性を自動的に検出し,悪用するための汎用的なブラックボックスファジリングフレームワークであるAgentVigilを提案する。
我々はAgentVigilをAgentDojoとVWA-advの2つの公開ベンチマークで評価し、o3-miniとGPT-4oに基づくエージェントに対して71%と70%の成功率を達成した。
攻撃を現実世界の環境に適用し、悪質なサイトを含む任意のURLに誘導するエージェントをうまく誘導する。
論文 参考訳(メタデータ) (2025-05-09T07:40:17Z) - Amplified Vulnerabilities: Structured Jailbreak Attacks on LLM-based Multi-Agent Debate [26.12314848354772]
本稿では,商業LLM上に構築された4つの著名なMADフレームワークのジェイルブレイク脆弱性を系統的に調査する。
我々はMADダイナミックスを利用した新しい構造化されたプロンプト-リライトフレームワークを提案する。
提案手法は, この脆弱性を著しく増幅し, 平均有害度を28.14%から80.34%に増加させ, 特定のシナリオにおける攻撃成功率を80%まで向上させる。
論文 参考訳(メタデータ) (2025-04-23T08:01:50Z) - Targeting the Core: A Simple and Effective Method to Attack RAG-based Agents via Direct LLM Manipulation [4.241100280846233]
大規模言語モデル(LLM)を駆使したAIエージェントは、シームレスで自然な、コンテキスト対応のコミュニケーションを可能にすることによって、人間とコンピュータのインタラクションを変革した。
本稿では,AIエージェント内のLLMコアを標的とした敵攻撃という,重大な脆弱性について検討する。
論文 参考訳(メタデータ) (2024-12-05T18:38:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。