論文の概要: When Child Inherits: Modeling and Exploiting Subagent Spawn in Multi-Agent Networks
- arxiv url: http://arxiv.org/abs/2605.08460v1
- Date: Fri, 08 May 2026 20:27:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:49.664928
- Title: When Child Inherits: Modeling and Exploiting Subagent Spawn in Multi-Agent Networks
- Title(参考訳): 子どもの遺伝:マルチエージェントネットワークにおけるサブエージェントのスプーンのモデル化と爆発
- Authors: Ziwen Cai, Yihe Zhang, Xiali Hei,
- Abstract要約: 我々は、サブエージェント継承のレンズを通して、現代のマルチエージェントネットワークをモデル化する。
我々の分析によると、現在のフレームワークは、安全でないメモリ継承、リソース制御の弱い、スポーニング後の古い状態、不適切な終了権限を通じて、信頼境界に違反する可能性がある。
- 参考スコア(独自算出の注目度): 4.0552376861221635
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Since the official release of ChatGPT in 2022, large language models (LLMs) have rapidly evolved from chatbot-style interfaces into agentic systems that can delegate work through tools and newly spawned subagents. While these capabilities improve automation and scalability, they also pose new security risks in multi-agent networks. Existing research has studied how individual LLM-based agents can be compromised through prompt injection, jailbreaking, poisoned retrieval data, or malicious extensions. Less is known about what happens after one agent is compromised inside a multi-agent network. In particular, inherited memory from parent agents can carry malicious instructions, outdated states, or unintended behavioral rules into newly created subagents, allowing a local compromise to spread across agent boundaries. In this paper, we model contemporary multi-agent networks through the lens of subagent inheritance. Our analysis shows that current frameworks can violate trust boundaries through insecure memory inheritance, weak resource control, stale post-spawn state, and improper termination authority. We demonstrate these risks in real agent frameworks and propose defenses based on explicit security invariants. Our findings show that inheritance is not merely an implementation detail, but a central component influencing the security of multi-agent systems.
- Abstract(参考訳): 2022年のChatGPTの公式リリース以来、大きな言語モデル(LLM)は、チャットボットスタイルのインターフェースから、ツールや新しく生成されたサブエージェントを通じて作業を委譲できるエージェントシステムへと急速に進化してきた。
これらの機能は自動化とスケーラビリティを改善するが、マルチエージェントネットワークでは新たなセキュリティリスクも生じている。
既存の研究では、個別のLSMベースのエージェントが、即時注射、脱獄、中毒性検索データ、悪意のある拡張によってどのように汚染されるかが研究されている。
エージェントがマルチエージェントネットワーク内で侵入された後に何が起こるかは、あまり分かっていない。
特に、親エージェントから受け継がれたメモリは、悪意のある命令、古い状態、意図しない振る舞い規則を新しく作成されたサブエージェントに運び、エージェントの境界を越えてローカルな妥協を可能にする。
本稿では,同時代のマルチエージェントネットワークをサブエージェント継承のレンズを用いてモデル化する。
我々の分析によると、現在のフレームワークは、安全でないメモリ継承、リソース制御の弱い、スポーニング後の古い状態、不適切な終了権限を通じて、信頼境界に違反する可能性がある。
これらのリスクを実際のエージェントフレームワークで実証し、明示的なセキュリティ不変量に基づく防御を提案する。
以上の結果から,継承は単なる実装詳細ではなく,マルチエージェントシステムのセキュリティに影響を及ぼす中心的なコンポーネントであることが示唆された。
関連論文リスト
- OMNI-LEAK: Orchestrator Multi-Agent Network Induced Data Leakage [59.3826294523924]
オーケストレータ設定として知られる,一般的なマルチエージェントパターンのセキュリティ脆弱性について検討する。
本報告では,フロンティアモデルの攻撃カテゴリに対する感受性を報告し,推論モデルと非推論モデルの両方が脆弱であることが確認された。
論文 参考訳(メタデータ) (2026-02-13T21:32:32Z) - BackdoorAgent: A Unified Framework for Backdoor Attacks on LLM-based Agents [58.83028403414688]
大規模言語モデル(LLM)エージェントは、計画、メモリ、ツールの使用を組み合わせた多段階ワークフローを通じてタスクを実行する。
エージェントワークフローの特定のステージに注入されたバックドアトリガーは、複数の中間状態を通して持続し、下流出力に悪影響を及ぼす可能性がある。
LLMエージェントにおけるバックドア脅威を統一したエージェント中心のビューを提供するモジュールおよびステージアウェアフレームワークである textbfBackdoorAgent を提案する。
論文 参考訳(メタデータ) (2026-01-08T03:49:39Z) - Exposing Weak Links in Multi-Agent Systems under Adversarial Prompting [5.544819942438653]
本稿では,マルチエージェントシステムのセキュリティ評価を行うフレームワークであるSafeAgentsを提案する。
広く採用されている5つのマルチエージェントアーキテクチャについて検討する。
この結果から,一般的なデザインパターンには重大な脆弱性があることが判明した。
論文 参考訳(メタデータ) (2025-11-14T04:22:49Z) - Sentinel Agents for Secure and Trustworthy Agentic AI in Multi-Agent Systems [0.42970700836450487]
本稿では,マルチエージェントシステム(MAS)のセキュリティと信頼性向上を目的とした新しいアーキテクチャフレームワークを提案する。
このフレームワークの中心的なコンポーネントは、分散セキュリティ層として機能するSentinel Agentsのネットワークである。
このようなエージェントは、エージェント間のコミュニケーションを監督し、潜在的な脅威を特定し、プライバシーとアクセス制御を強制し、包括的な監査記録を維持することができる。
論文 参考訳(メタデータ) (2025-09-18T13:39:59Z) - Kaleidoscopic Teaming in Multi Agent Simulations [75.47388708240042]
我々は,エージェントが行う複雑な行動,思考プロセス,行動の安全性リスクを評価する上で,既存のレッドチームや安全評価フレームワークは不十分であると主張している。
我々は,新しいコンテキスト内最適化手法を導入し,安全解析のためのより良いシナリオを生成する。
エージェントの安全性を測定するためのフレームワークとともに使用できる適切なメトリクスを提案する。
論文 参考訳(メタデータ) (2025-06-20T23:37:17Z) - SentinelAgent: Graph-based Anomaly Detection in Multi-Agent Systems [11.497269773189254]
大規模言語モデル(LLM)に基づくマルチエージェントシステム(MAS)に適したシステムレベルの異常検出フレームワークを提案する。
本稿では,エージェント間相互作用を動的実行グラフとしてモデル化し,ノード,エッジ,パスレベルでの意味的異常検出を可能にするグラフベースのフレームワークを提案する。
第2に,セキュリティポリシとコンテキスト推論に基づくMAS実行の監視,解析,介入を行うLLMによる監視エージェントである,プラグイン可能なSentinelAgentを導入する。
論文 参考訳(メタデータ) (2025-05-30T04:25:19Z) - On the Resilience of LLM-Based Multi-Agent Collaboration with Faulty Agents [58.79302663733703]
大規模言語モデルに基づくマルチエージェントシステムは、専門家エージェントの協力により、様々なタスクにまたがる優れた能力を示している。
不器用なエージェントや悪意のあるエージェントが与える影響 - システム全体のパフォーマンスにおいて、頻繁にタスクでエラーを犯すものは、いまだに過小評価されていない。
本稿では,下流タスクにおける障害要因下での各種システム構造のレジリエンスについて検討する。
論文 参考訳(メタデータ) (2024-08-02T03:25:20Z) - Dissecting Adversarial Robustness of Multimodal LM Agents [70.2077308846307]
我々は、VisualWebArena上に現実的な脅威モデルを用いて、200の敵タスクと評価スクリプトを手動で作成する。
我々は,クロボックスフロンティアLMを用いた最新のエージェントを,リフレクションやツリーサーチを行うエージェントを含む,壊すことに成功している。
AREを使用して、新しいコンポーネントの追加に伴うロバスト性の変化を厳格に評価しています。
論文 参考訳(メタデータ) (2024-06-18T17:32:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。