論文の概要: Interpreting Structured Perturbations in Image Protection Methods for Diffusion Models
- arxiv url: http://arxiv.org/abs/2512.08329v1
- Date: Tue, 09 Dec 2025 07:55:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-10 22:28:07.86699
- Title: Interpreting Structured Perturbations in Image Protection Methods for Diffusion Models
- Title(参考訳): 拡散モデルにおける画像保護法における構造的摂動の解釈
- Authors: Michael R. Martin, Garrick Chan, Kwan-Liu Ma,
- Abstract要約: GlazeとNightshadeは、下流のテキストから画像への生成モデルを破壊するために、不可避で逆向きに設計された摂動を導入した。
この研究は、ホワイトボックスの特徴空間検査とブラックボックス信号レベル探索を統合した統合フレームワークを用いた、体系的で説明可能なAI分析を提供する。
保護機構は, 表現領域, 空間領域, スペクトル領域をまたいだ画像内容と密結合した, 構造的かつ低エントロピーな摂動として機能することを示す。
- 参考スコア(独自算出の注目度): 17.625614970517884
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent image protection mechanisms such as Glaze and Nightshade introduce imperceptible, adversarially designed perturbations intended to disrupt downstream text-to-image generative models. While their empirical effectiveness is known, the internal structure, detectability, and representational behavior of these perturbations remain poorly understood. This study provides a systematic, explainable AI analysis using a unified framework that integrates white-box feature-space inspection and black-box signal-level probing. Through latent-space clustering, feature-channel activation analysis, occlusion-based spatial sensitivity mapping, and frequency-domain characterization, we show that protection mechanisms operate as structured, low-entropy perturbations tightly coupled to underlying image content across representational, spatial, and spectral domains. Protected images preserve content-driven feature organization with protection-specific substructure rather than inducing global representational drift. Detectability is governed by interacting effects of perturbation entropy, spatial deployment, and frequency alignment, with sequential protection amplifying detectable structure rather than suppressing it. Frequency-domain analysis shows that Glaze and Nightshade redistribute energy along dominant image-aligned frequency axes rather than introducing diffuse noise. These findings indicate that contemporary image protection operates through structured feature-level deformation rather than semantic dislocation, explaining why protection signals remain visually subtle yet consistently detectable. This work advances the interpretability of adversarial image protection and informs the design of future defenses and detection strategies for generative AI systems.
- Abstract(参考訳): 近年のGlazeやNightshadeのような画像保護機構は、下流のテキストから画像への生成モデルを妨害することを目的とした、不可避で逆向きに設計された摂動を導入している。
彼らの経験的効果は知られているが、これらの摂動の内部構造、検出可能性、表現行動はいまだに理解されていない。
この研究は、ホワイトボックスの特徴空間検査とブラックボックス信号レベル探索を統合した統合フレームワークを用いた、体系的で説明可能なAI分析を提供する。
遅延空間クラスタリング,特徴チャネルアクティベーション解析,オクルージョンに基づく空間感度マッピング,周波数領域のキャラクタリゼーションにより,保護機構が構造的,低エントロピーな摂動として機能し,表現的,空間的,スペクトル的領域にわたって画像内容と密結合していることを示す。
保護された画像は、グローバルな表現の漂流を引き起こすのではなく、保護固有のサブ構造を持つコンテンツ駆動型特徴組織を保存する。
検出性は、摂動エントロピー、空間展開、周波数アライメントの相互作用効果と、検出可能な構造を抑えるのではなく、順次保護することで制御される。
周波数領域解析により、グレイズとナイトシェードは拡散雑音を導入するのではなく、画像整列周波数軸に沿ってエネルギーを再分配することを示した。
これらの結果から,現代画像保護は意味的転位よりも構造的特徴レベルの変形によって機能し,なぜ保護信号が視覚的に微妙に検出され続けるのかが示唆された。
この研究は、敵画像保護の解釈可能性を高め、生成型AIシステムにおける将来の防衛と検出戦略の設計を通知する。
関連論文リスト
- Noise & pattern: identity-anchored Tikhonov regularization for robust structural anomaly detection [58.535473924035365]
異常検出は自動産業検査において重要な役割を担い、他の均一な視覚パターンの微妙な欠陥や稀な欠陥を識別することを目的としている。
自己教師型オートエンコーダを用いて, 破損した入力の修復を学習する構造的異常検出に取り組む。
構造欠陥を模倣した画像に人工的破壊を注入する汚職モデルを導入する。
論文 参考訳(メタデータ) (2025-11-10T15:48:50Z) - Delving into Cascaded Instability: A Lipschitz Continuity View on Image Restoration and Object Detection Synergy [95.93943805282868]
リプシッツ規則化物体検出(LROD)
本稿では,リプシッツ規則化YOLO(LR-YOLO)を提案する。
ヘイズと低照度ベンチマークの実験では、LR-YOLOは検出安定性、最適化のスムーズさ、全体的な精度を一貫して改善している。
論文 参考訳(メタデータ) (2025-10-28T09:41:42Z) - Verification of Visual Controllers via Compositional Geometric Transformations [49.81690518952909]
到達可能な集合の外部近似を生成できる知覚ベースのコントローラのための新しい検証フレームワークを提案する。
提案手法の音質を理論的に保証し,ベンチマーク制御環境における有効性を示す。
論文 参考訳(メタデータ) (2025-07-06T20:22:58Z) - FOAM: A General Frequency-Optimized Anti-Overlapping Framework for Overlapping Object Perception [7.258172311752019]
重なり合う物体知覚は、ランダムに重なり合う前景の特徴を分離し、背景の特徴を抑えつつ前景の特徴を抽出することを目的としている。
本稿では、よりテクスチャや輪郭情報を抽出する際のモデルを支援するために、一般周波数ベースのアンチオーバーラップフレームワーク(FOAM)を提案する。
具体的には、周波数空間変換器ブロック(FSTB)を設計し、周波数領域と空間領域の両方から特徴を同時に抽出し、ネットワークがフォアグラウンドからより多くのテクスチャ特徴をキャプチャするのに役立つ。
論文 参考訳(メタデータ) (2025-06-16T13:58:49Z) - Structure Disruption: Subverting Malicious Diffusion-Based Inpainting via Self-Attention Query Perturbation [14.837992188868858]
広告主はソーシャルメディアからユーザー画像を利用して、誤解を招くコンテンツや有害なコンテンツを生成することができる。
本研究では,インペイントベースの編集からセンシティブな画像領域を保護するための強力な保護フレームワークであるStructure Disruption Attack (SDA)を提案する。
論文 参考訳(メタデータ) (2025-05-26T02:32:22Z) - AdvLogo: Adversarial Patch Attack against Object Detectors based on Diffusion Models [12.678320577368051]
セマンティックの観点からパッチアタックの新たな枠組みを提案し,これをAdvLogoと呼ぶ。
拡散復調過程のセマンティックな理解を活用し,最終段階において潜伏および非条件埋め込みを摂動させることにより,逆境の準領域へとプロセスを進める。
実験により、AdvLogoは高い視覚的品質を維持しながら強力な攻撃性能を発揮することが示された。
論文 参考訳(メタデータ) (2024-09-11T04:30:45Z) - StealthDiffusion: Towards Evading Diffusion Forensic Detection through Diffusion Model [62.25424831998405]
StealthDiffusionは、AI生成した画像を高品質で受け入れがたい敵の例に修正するフレームワークである。
ホワイトボックスとブラックボックスの設定の両方で有効であり、AI生成した画像を高品質な敵の偽造に変換する。
論文 参考訳(メタデータ) (2024-08-11T01:22:29Z) - Rethinking and Defending Protective Perturbation in Personalized Diffusion Models [21.30373461975769]
パーソナライズされた拡散モデル(PDM)の微調整過程について,ショートカット学習のレンズを用いて検討した。
PDMは小さな逆境の摂動に影響を受けやすいため、破損したデータセットを微調整すると著しく劣化する。
本稿では,データ浄化と対照的なデカップリング学習を含むシステム防衛フレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-27T07:14:14Z) - Subspace Defense: Discarding Adversarial Perturbations by Learning a Subspace for Clean Signals [52.123343364599094]
敵の攻撃は、正常な例に基づいて慎重に摂動を行い、ディープニューラルネットワーク(DNN)を騙す
まず,低次元線形部分空間において,クリーン信号と逆方向の摂動の特徴が冗長であり,重なりが最小であることを示す。
これにより、DNNは、摂動が破棄されている間、クリーン信号の特徴のみが存在する部分空間を学習することができる。
論文 参考訳(メタデータ) (2024-03-24T14:35:44Z) - Spatial-Frequency Discriminability for Revealing Adversarial Perturbations [53.279716307171604]
敵の摂動に対するディープニューラルネットワークの脆弱性は、コンピュータビジョンコミュニティで広く認識されている。
現在のアルゴリズムは、通常、自然および敵対的なデータの識別的分解を通じて、敵のパターンを検出する。
空間周波数Krawtchouk分解に基づく識別検出器を提案する。
論文 参考訳(メタデータ) (2023-05-18T10:18:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。