論文の概要: Architecture-Agnostic Feature Synergy for Universal Defense Against Heterogeneous Generative Threats
- arxiv url: http://arxiv.org/abs/2603.14860v1
- Date: Mon, 16 Mar 2026 05:59:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 16:19:36.08397
- Title: Architecture-Agnostic Feature Synergy for Universal Defense Against Heterogeneous Generative Threats
- Title(参考訳): 不均一な生成脅威に対する普遍的防御のためのアーキテクチャ非依存的特徴相乗効果
- Authors: Bingxue Zhang, Yang Gao, Feida Zhu, Yanyan Shen, Yang Shi,
- Abstract要約: 生成的AIデプロイメントは、コンテンツの安全性とプライバシに前例のない課題をもたらす。
既存の防御機構は、しばしば特定のアーキテクチャに適合する。
本稿では,アーキテクチャに依存しない特徴相乗効果フレームワークを提案する。
- 参考スコア(独自算出の注目度): 26.478799500933558
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative AI deployment poses unprecedented challenges to content safety and privacy. However, existing defense mechanisms are often tailored to specific architectures (e.g., Diffusion Models or GANs), creating fragile "defense silos" that fail against heterogeneous generative threats. This paper identifies a fundamental optimization barrier in naive pixel-space ensemble strategies: due to divergent objective functions, pixel-level gradients from heterogeneous generators become statistically orthogonal, causing destructive interference. To overcome this, we observe that despite disparate low-level mechanisms, high-level feature representations of generated content exhibit alignment across architectures. Based on this, we propose the Architecture-Agnostic Targeted Feature Synergy (ATFS) framework. By introducing a target guidance image, ATFS reformulates multi-model defense as a unified feature space alignment task, enabling intrinsic gradient alignment without complex rectification. Extensive experiments show ATFS achieves SOTA protection in heterogeneous scenarios (e.g., Diffusion+GAN). It converges rapidly, reaching over 90% performance within 40 iterations, and maintains strong attack potency even under tight perturbation budgets. The framework seamlessly extends to unseen architectures (e.g., VQ-VAE) by switching the feature extractor, and demonstrates robust resistance to JPEG compression and scaling. Being computationally efficient and lightweight, ATFS offers a viable pathway to dismantle defense silos and enable universal generative security. Code and models are open-sourced for reproducibility.
- Abstract(参考訳): 生成的AIデプロイメントは、コンテンツの安全性とプライバシに前例のない課題をもたらす。
しかし、既存の防御機構は特定のアーキテクチャ(例えば拡散モデルやGAN)に合わせて調整され、不均一な生成的脅威に対して失敗する脆弱な「防御サイロ」を生成する。
そこで本研究では,異種発電機からの画素レベルの勾配が統計的に直交し,破壊的干渉を引き起こしている。
これを解決するために、異なる低レベルメカニズムにもかかわらず、生成されたコンテンツの高レベルな特徴表現がアーキテクチャ間の整合性を示すことを観察する。
これに基づいて,アーキテクチャに依存しない特徴構文(ATFS)フレームワークを提案する。
対象の誘導画像を導入することで、ATFSは複合的な特徴空間アライメントタスクとしてマルチモデルディフェンスを再構成し、複雑な修正なしに固有の勾配アライメントを可能にする。
大規模な実験は、ATFSが異種シナリオ(例えばDiffusion+GAN)でSOTA保護を達成することを示している。
40イテレーションで90%以上のパフォーマンスを達成し、厳しい摂動予算の下でも強力な攻撃能力を維持します。
このフレームワークは機能抽出器を切り替えることで、目に見えないアーキテクチャ(例えばVQ-VAE)にシームレスに拡張し、JPEG圧縮とスケーリングに対する堅牢な耐性を示す。
計算的に効率的で軽量であるため、ATFSは防衛サイロを分解し、普遍的な生成セキュリティを実現するための実行可能な経路を提供する。
コードとモデルは再現性のためにオープンソース化されている。
関連論文リスト
- Architecture-Aware Multi-Design Generation for Repository-Level Feature Addition [53.50448142467294]
RAIMは、リポジトリレベルの機能追加のための、多設計およびアーキテクチャ対応のフレームワークである。
複数の多様な実装設計を生成することで、線形パッチから切り離される。
NoCode-bench Verifiedデータセットの実験では、RAIMが新しい最先端のパフォーマンスを確立することが示されている。
論文 参考訳(メタデータ) (2026-03-02T12:50:40Z) - BadRSSD: Backdoor Attacks on Regularized Self-Supervised Diffusion Models [10.286339414754499]
Bad RSSDは自己教師付き拡散モデルの表現層をターゲットにした最初のバックドア攻撃である。
標的画像に対するPCA空間のトリガーで有毒なサンプルのセマンティック表現をハイジャックする。
悪い RSSD は FID と MSE の両方で既存の攻撃を著しく上回っている。
論文 参考訳(メタデータ) (2026-03-01T09:56:26Z) - Rethinking Transferable Adversarial Attacks on Point Clouds from a Compact Subspace Perspective [55.919842734983156]
CoSAは、共有された低次元セマンティック空間内で機能する転送可能なアタックフレームワークである。
CoSAは、最先端のトランスファー可能な攻撃を一貫して上回っている。
論文 参考訳(メタデータ) (2026-01-30T15:48:11Z) - Beyond the Dirac Delta: Mitigating Diversity Collapse in Reinforcement Fine-Tuning for Versatile Image Generation [51.305316234962554]
textbfDRIFT(textbfDivetextbfRsity-textbfIncentivized Reinforcement textbfFine-textbfTuning for Versatile Image Generation)を提案する。
DRIFTはタスクアライメントとジェネレーションの多様性に関して優れた優位性を達成し、9.08%!sim! 43.46%$多様性等価アライメントレベルの増加と59.65ドルとなる。
論文 参考訳(メタデータ) (2026-01-18T13:25:43Z) - EchoGen: Generating Visual Echoes in Any Scene via Feed-Forward Subject-Driven Auto-Regressive Model [56.53617289548353]
EchoGenは、主観駆動生成機能を備えたVisual Auto-Regressive(VAR)モデルを強化する先駆的なフレームワークである。
対象の抽象的アイデンティティを抽出するためにセマンティックエンコーダを用いており、このエンコーダは分離されたクロスアテンションを通して注入され、全体の構成を導出する。
私たちの知る限りでは、EchoGenはVARモデル上に構築された最初のフィードフォワードの主観駆動フレームワークです。
論文 参考訳(メタデータ) (2025-09-30T11:45:48Z) - JANUS: A Dual-Constraint Generative Framework for Stealthy Node Injection Attacks [3.543515488496546]
グラフニューラルネットワーク(GNN)は、様々なアプリケーションで顕著なパフォーマンスを示しているが、高度な敵攻撃には弱い。
我々は、JANUS(Joint Alignment of Nodal and Universal Structures)と呼ばれる二重拘束ステルスノード注入フレームワークを提案する。
局所的なレベルでは、特徴空間における幾何的整合性を達成するために、局所的特徴多様体アライメント戦略を導入する。
グローバルレベルでは、構造化潜在変数を組み込んで、生成した構造との相互情報を最大化し、注入された構造が元のグラフのセマンティックパターンと整合していることを保証する。
論文 参考訳(メタデータ) (2025-09-16T17:24:30Z) - Revisiting the Privacy Risks of Split Inference: A GAN-Based Data Reconstruction Attack via Progressive Feature Optimization [49.32786615205064]
Split Inference (SI)は、エッジデバイスとクラウドの間の計算を分割することで、レイテンシを低減し、ユーザのプライバシを保護する。
データ再構成攻撃(DRA)の最近の進歩は、SIで交換された中間的特徴を利用して機密入力データを復元できることを明らかにしている。
既存のDRAは一般的に浅いモデルにのみ有効であり、セマンティックな事前を十分に活用できない。
本稿では,プログレッシブ・フィーチャー・オプティマイゼーション(PFO)を用いた新しいGANベースのDRAフレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-28T10:00:39Z) - DOPA: Stealthy and Generalizable Backdoor Attacks from a Single Client under Challenging Federated Constraints [2.139012072214621]
フェデレーテッド・ラーニング(FL)は、プライバシー保護のための協調トレーニングにますます採用されているが、その分散した性質は、バックドア攻撃の影響を受けやすい。
しかし、既存の攻撃方法は、しばしば理想化された仮定に依存し、現実の制約の下で有効に保たない。
異種ローカルトレーニングのダイナミクスをシミュレートし,多種多様な最適化トラジェクトリ間のコンセンサスを求める新しいフレームワークであるDOPAを提案する。
論文 参考訳(メタデータ) (2025-08-20T08:39:12Z) - SPA: Towards More Stealth and Persistent Backdoor Attacks in Federated Learning [10.924427077035915]
フェデレートラーニング(FL)は、プライバシ保護のための分散機械学習の主要なパラダイムとして登場したが、FLの分散特性にはユニークなセキュリティ上の課題が伴っている。
特徴空間アライメントを活用することによって従来のアプローチから離れるSPAという,斬新でステルス的なバックドアアタックフレームワークを提案する。
本研究は,FLにおけるバックドア脅威の高度化に緊急注意を喚起し,高度な機能レベル防衛技術の必要性を強調した。
論文 参考訳(メタデータ) (2025-06-26T01:33:14Z) - Autonomous Cyber Resilience via a Co-Evolutionary Arms Race within a Fortified Digital Twin Sandbox [0.0]
本稿では「信頼の傾向」に対処するARC(Adversarial Resilience Co-evolution)フレームワークを紹介する。
ARCは、Fortified Secure Digital Twin内での共同進化型武器レースを開催する。
包括的なアブレーション調査は、共進化プロセス自体が27%のパフォーマンス改善に寄与していることを示している。
論文 参考訳(メタデータ) (2025-06-25T03:28:48Z) - MISLEADER: Defending against Model Extraction with Ensembles of Distilled Models [56.09354775405601]
モデル抽出攻撃は、クエリアクセスを通じてブラックボックスモデルの機能を複製することを目的としている。
既存のディフェンスでは、アタッカークエリにはオフ・オブ・ディストリビューション(OOD)サンプルがあることを前提としており、不審な入力を検出し破壊することができる。
OOD仮定に依存しない新しい防衛戦略であるMISLEADERを提案する。
論文 参考訳(メタデータ) (2025-06-03T01:37:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。