論文の概要: Architecture Matters for Multi-Agent Security
- arxiv url: http://arxiv.org/abs/2604.23459v1
- Date: Sat, 25 Apr 2026 22:25:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.362981
- Title: Architecture Matters for Multi-Agent Security
- Title(参考訳): マルチエージェントセキュリティのためのアーキテクチャ
- Authors: Ben Hagag, William L. Anderson, Christian Schroeder de Witt, Sarah Scheffler,
- Abstract要約: 本研究では,マルチエージェントシステムがタスク性能と攻撃抵抗のトレードオフをいかに形成するかを検討する。
マルチエージェントアーキテクチャは、構成の大部分においてスタンドアロンのエージェントよりも脆弱であることがわかった。
- 参考スコア(独自算出の注目度): 1.699014226195857
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-agent systems (MAS), composed of networks of two or more autonomous AI agents, have become increasingly popular in production deployments, yet introduce security risks that do not arise in single-agent settings. Even if individual agents exhibit robust security, architectural decisions governing their coordination can create attack surfaces that have not been systematically characterized. In this work, we present an empirical study of how MAS design decisions shape the tradeoff between task performance and attack resistance. Across three agentic environments (browser, desktop, and code) and 13 architectural configurations, we use stagewise evaluations that distinguish planning refusal, execution-stage interception, partial harmful execution, and successful attack completion to study three key design choices: (i) agent roles, which determine how authority and responsibility are allocated; (ii) communication topology, which shapes how and when agents interact; and (iii) memory, which determines the context and state visibility accessible to each agent. We find that multi-agent architectures are more vulnerable than standalone agents in the majority of configurations, with attack success rates varying by up to 3.8x at comparable or higher benign accuracy, and that no single design is universally safer. These results motivate the development of further evaluations that move beyond the security properties of a single agent.
- Abstract(参考訳): 2つ以上の自律型AIエージェントのネットワークで構成されるマルチエージェントシステム(MAS)は、運用デプロイメントでますます人気を博しているが、単一エージェント設定では発生しないセキュリティリスクがもたらされている。
個々のエージェントが堅牢なセキュリティを示すとしても、その調整を管理するアーキテクチャ上の決定は、体系的に特徴づけられていない攻撃面を生成することができる。
本研究では,MAS設計決定がタスク性能と攻撃抵抗のトレードオフをいかに形成するかを実証研究する。
3つのエージェント環境(ブラウザ、デスクトップ、コード)と13のアーキテクチャ構成にまたがって、計画の拒絶、実行段階のインターセプション、部分的な有害な実行、攻撃完了を区別する段階的な評価を用いて、3つの重要な設計選択を調査します。
一 権限及び責任の配分方法を決定する代理役
二 エージェントの相互作用の仕方及び時期を規定する通信トポロジ
(iii)各エージェントがアクセス可能なコンテキストと状態の可視性を決定するメモリ。
マルチエージェントアーキテクチャは、ほとんどの構成においてスタンドアロンのエージェントよりも脆弱であり、攻撃成功率は同等または高い良性で3.8倍まで変化し、単一の設計が普遍的に安全でないことが判明した。
これらの結果は、単一のエージェントのセキュリティ特性を超えたさらなる評価の開発を動機付けている。
関連論文リスト
- Architecting Secure AI Agents: Perspectives on System-Level Defenses Against Indirect Prompt Injection Attacks [46.32011684548212]
AIエージェントは間接的なプロンプトインジェクションに対して脆弱であり、信頼できないデータに埋め込まれた悪意のある命令は危険なエージェントアクションを引き起こす可能性がある。
本稿では,間接的インジェクション攻撃に対するシステムレベルの防御の展望について論じる。
論文 参考訳(メタデータ) (2026-03-31T17:15:46Z) - Security Considerations for Multi-agent Systems [4.004329206052807]
マルチエージェント人工知能システム(英: Multi-agent AI system、MAS)は、エージェント間のコミュニケーションを通じて、委任されたツール権限を行使し、永続的なメモリを共有し、コーディネートする自律エージェントのシステムである。
本研究は、MASの脅威景観を体系的に特徴づけ、それに対するAIのための16のセキュリティフレームワークを定量的に評価する。
論文 参考訳(メタデータ) (2026-03-09T22:46:27Z) - OMNI-LEAK: Orchestrator Multi-Agent Network Induced Data Leakage [59.3826294523924]
オーケストレータ設定として知られる,一般的なマルチエージェントパターンのセキュリティ脆弱性について検討する。
本報告では,フロンティアモデルの攻撃カテゴリに対する感受性を報告し,推論モデルと非推論モデルの両方が脆弱であることが確認された。
論文 参考訳(メタデータ) (2026-02-13T21:32:32Z) - AgentDoG: A Diagnostic Guardrail Framework for AI Agent Safety and Security [126.49733412191416]
現在のガードレールモデルは、リスク診断におけるエージェント的リスク認識と透明性を欠いている。
エージェントリスクをソース(場所)、障害モード(方法)、結果(何)で分類する統合された3次元分類法を提案する。
AgentDoG(AgentDoG)のための,エージェント安全性ベンチマーク(ATBench)と診断ガードレールフレームワークを新たに導入する。
論文 参考訳(メタデータ) (2026-01-26T13:45:41Z) - Designing Domain-Specific Agents via Hierarchical Task Abstraction Mechanism [61.01709143437043]
階層型タスク抽象化機構(HTAM)を中心とした新しいエージェント設計フレームワークを提案する。
具体的には、HTAMは、社会的役割のエミュレーションを超えて、代わりに、複数のエージェントシステムを、あるドメインの固有のタスク依存グラフを反映する論理階層に構造化する。
我々は、複雑な地理空間解析に適したマルチエージェントシステムであるEarthAgentとして、このフレームワークをインスタンス化する。
論文 参考訳(メタデータ) (2025-11-21T12:25:47Z) - Formalizing the Safety, Security, and Functional Properties of Agentic AI Systems [10.734711935895225]
本稿では2つの基礎モデルからなるエージェントAIシステムのためのモデリングフレームワークを提案する。
1つ目はホストエージェントモデルで、ユーザと対話するトップレベルのエンティティを形式化し、タスクを分解し、外部エージェントやツールを活用して実行をオーケストレーションする。
第2のタスクライフサイクルモデルでは、個々のサブタスクの状態と、作成から完了までの遷移を詳述し、タスク管理とエラー処理の詳細なビューを提供します。
論文 参考訳(メタデータ) (2025-10-15T22:02:30Z) - AgentArch: A Comprehensive Benchmark to Evaluate Agent Architectures in Enterprise [0.0]
本稿では、オーケストレーション戦略、エージェントプロンプト実装(ReAct vs. 関数呼び出し)、メモリアーキテクチャ、思考ツール統合の4つの重要なエージェントシステム側面について検討する。
我々のベンチマークでは、エージェントAIシステムにおいて、一般的なワンサイズ・オールパラダイムに挑戦する、重要なモデル固有のアーキテクチャ上の嗜好を明らかにしている。
論文 参考訳(メタデータ) (2025-09-13T01:18:23Z) - DoomArena: A framework for Testing AI Agents Against Evolving Security Threats [81.73540246946015]
本稿では,AIエージェントのセキュリティ評価フレームワークであるDoomArenaを紹介する。
プラグインフレームワークであり、現実的なエージェントフレームワークと簡単に統合できる。
モジュールであり、エージェントがデプロイされる環境の詳細から攻撃の開発を分離する。
論文 参考訳(メタデータ) (2025-04-18T20:36:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。