論文の概要: The End of Trust: How Agentic AI Breaks Security Assumptions
- arxiv url: http://arxiv.org/abs/2605.16436v1
- Date: Thu, 14 May 2026 21:30:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:46.40148
- Title: The End of Trust: How Agentic AI Breaks Security Assumptions
- Title(参考訳): 信頼の終焉:エージェントAIがセキュリティの前提を破る方法
- Authors: Osama Zafar, Alexander Nemecek, Erman Ayday,
- Abstract要約: Infinite Impostorは、自律エージェントが既に信頼している2つの当事者間で相互に介在する攻撃モデルである。
本稿では,アクターの認証から行動評価へセキュリティを移行させる疑似デフォルトでのパラダイムを提案する。
- 参考スコア(独自算出の注目度): 45.13166202592558
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: For decades, the security of digital interaction has rested on an unacknowledged economic constraint. Attackers faced a tradeoff between the fidelity of a deception and the scale at which it could be deployed. Convincing impersonation required sustained human effort and was confined to a narrow set of high-value targets, while mass-market attacks sacrificed plausibility for reach. Detection systems, verification mechanisms, and user awareness training have all been implicitly calibrated to the artifacts of cheap deception that this tradeoff produced. Agentic AI collapses the tradeoff, allowing high-fidelity, individually tailored deception to be produced at mass-market scale. We argue that this shift exhausts a security paradigm rather than merely intensifying the threat landscape. We introduce the Infinite Impostor, an attack model in which an autonomous agent interposes itself between two parties who already trust each other, hijacking an existing relationship rather than building a new one from scratch. Detection-oriented defenses share an assumption that generative progress is eliminating, that synthetic outputs are distinguishable from authentic ones. We propose a suspect-by-default paradigm that shifts security from authenticating actors to evaluating actions, and examine the governance tensions that arise when platforms become the regulatory substrate of digital interaction.
- Abstract(参考訳): 何十年もの間、デジタルインタラクションのセキュリティは、未承認の経済的制約にかかってきた。
攻撃者は詐欺の忠実さとそれが展開できる規模との間にトレードオフに直面した。
偽装を許すことは、人間の努力を継続させ、より限られた高価値な目標に制限され、一方、大衆の攻撃は到達可能性の低下を犠牲にした。
検出システム、検証機構、ユーザ認識トレーニングはすべて、このトレードオフが生み出した安価な偽装の成果物に暗黙的に調整されている。
エージェントAIはトレードオフを崩壊させ、大量市場規模で個別にカスタマイズされた偽装を高忠実にできる。
このシフトは、単に脅威の状況を強化するのではなく、セキュリティパラダイムを欠いている、と私たちは主張する。
Infinite Impostorは、自律的なエージェントがお互いを信頼している2つの当事者間で相互に介在し、ゼロから新しいエージェントを構築するのではなく、既存の関係をハイジャックする攻撃モデルである。
検出指向の防御は、生成的進歩が排除されているという仮定を共有しており、合成出力は真のものと区別可能である。
本稿では,アクターの認証から行動評価へセキュリティを移行させる疑似デフォルトでのパラダイムを提案し,プラットフォームがデジタルインタラクションの規制基盤となる際に生じるガバナンスの緊張について検討する。
関連論文リスト
- Breaking the Secret: Economic Interventions for Combating Collusion in Embodied Multi-Agent Systems [22.697901881084068]
自律エージェント間の衝突は、エンボディ化されたマルチエージェントシステムにおいて重要なセキュリティ脅威となる。
本稿では,エージェントの報酬構造を変えることで,共謀を緩和するインセンティブ的介入手法を提案する。
実験結果から,本手法はシステム効率を保ちながら,欠陥の誘発による癒着を効果的に抑制できることが示唆された。
論文 参考訳(メタデータ) (2026-04-26T03:13:47Z) - Taming Actor-Observer Asymmetry in Agents via Dialectical Alignment [59.536125286960186]
セルフリフレクションと相互監査を可能にするために、専門的な役割を割り当てるマルチエージェントフレームワークがますます採用されている。
アクター・オブザーバ非対称性(Actor-Observer Asymmetric)と呼ばれる認知バイアスを同時に誘発する。
ReTASは、対立する視点を客観的なコンセンサスに合成するためにエージェントを誘導する。
論文 参考訳(メタデータ) (2026-04-21T15:05:58Z) - Don't Trust Stubborn Neighbors: A Security Framework for Agentic Networks [32.791374704820925]
悪意または妥協されたエージェントは、誤った情報を伝達し、集合的な結果を操作するために通信チャネルを利用することができる。
本研究では,社会科学からFriedkin-Johnsen意見形成モデルを借りて,このような操作がいかに広まるかを検討する。
本稿では,エージェント間の信頼を動的に調整し,敵の影響力を抑えることによって脅威を軽減する新しいメカニズムを提案する。
論文 参考訳(メタデータ) (2026-03-16T18:41:21Z) - OMNI-LEAK: Orchestrator Multi-Agent Network Induced Data Leakage [59.3826294523924]
オーケストレータ設定として知られる,一般的なマルチエージェントパターンのセキュリティ脆弱性について検討する。
本報告では,フロンティアモデルの攻撃カテゴリに対する感受性を報告し,推論モデルと非推論モデルの両方が脆弱であることが確認された。
論文 参考訳(メタデータ) (2026-02-13T21:32:32Z) - The Devil Behind Moltbook: Anthropic Safety is Always Vanishing in Self-Evolving AI Societies [57.387081435669835]
大規模言語モデルから構築されたマルチエージェントシステムは、スケーラブルな集合知性と自己進化のための有望なパラダイムを提供する。
エージェント社会が継続的自己進化、完全隔離、安全性の不変性を満たすことは不可能であることを示す。
我々は、特定された安全上の懸念を軽減するために、いくつかの解決方法を提案する。
論文 参考訳(メタデータ) (2026-02-10T15:18:19Z) - SoK: Trust-Authorization Mismatch in LLM Agent Interactions [16.633676842555044]
大規模言語モデル(LLM)は、外の世界と対話できる自律エージェントへと急速に進化している。
本稿ではエージェント・インタラクション・セキュリティのための統一型フォーマルレンズを提供する。
本稿では,信頼と権限のギャップに着目した新たなリスク分析モデルを提案する。
論文 参考訳(メタデータ) (2025-12-07T16:41:02Z) - SentinelNet: Safeguarding Multi-Agent Collaboration Through Credit-Based Dynamic Threat Detection [22.242243610133215]
大規模言語モデル(LLM)を用いたマルチエージェントシステム(MAS)の信頼性と意思決定能力に悪質なエージェントが重大な脅威をもたらす
マルチエージェントコラボレーションにおいて,悪意ある動作を積極的に検出・緩和する,最初の分散化フレームワークであるSentinelNetを提案する。
MASベンチマークの実験では、SentinelNetは2回の討論ラウンドで100%近く、悪意のあるエージェントのほぼ完全な検出を実現し、漏洩したベースラインからシステム精度の95%を回復している。
論文 参考訳(メタデータ) (2025-10-17T21:10:35Z) - Illusory Attacks: Information-Theoretic Detectability Matters in Adversarial Attacks [76.35478518372692]
エプシロン・イリューソリー(epsilon-illusory)は、シーケンシャルな意思決定者に対する敵対的攻撃の新たな形態である。
既存の攻撃と比較して,エプシロン・イリューソリーの自動検出は極めて困難である。
以上の結果から, より優れた異常検知器, 効果的なハードウェアおよびシステムレベルの防御の必要性が示唆された。
論文 参考訳(メタデータ) (2022-07-20T19:49:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。