論文の概要: The Orthogonal Vulnerabilities of Generative AI Watermarks: A Comparative Empirical Benchmark of Spatial and Latent Provenance
- arxiv url: http://arxiv.org/abs/2603.10323v2
- Date: Thu, 12 Mar 2026 06:10:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-13 14:46:25.465524
- Title: The Orthogonal Vulnerabilities of Generative AI Watermarks: A Comparative Empirical Benchmark of Spatial and Latent Provenance
- Title(参考訳): 生成型AI透かしの直交的脆弱性:空間的および潜時的確率の実証的ベンチマーク
- Authors: Jesse Yu, Nicholas Wei,
- Abstract要約: デジタルプロフェランスは、オープンウェイトな生成AIが急速に増殖するので、重要なサイバーセキュリティの衝動である。
現在、最先端の目に見えない透かしは、2つの主要な数学多様体のうちの1つで機能している。
我々は,2つの代表的なパラダイム,RivaGAN(Spatial)とTree-Ring(Latent)を実証的に評価する。
単一ドメインの透かしは、現代の敵ツールセットに対して根本的に不十分であることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As open-weights generative AI rapidly proliferates, the ability to synthesize hyper-realistic media has introduced profound challenges to digital trust. Automated disinformation and AI-generated imagery have made robust digital provenance a critical cybersecurity imperative. Currently, state-of-the-art invisible watermarks operate within one of two primary mathematical manifolds: the spatial domain (post-generation pixel embedding) or the latent domain (pre-generation frequency embedding). While existing literature frequently evaluates these models against isolated, classical distortions, there is a critical lack of rigorous, comparative benchmarking against modern generative AI editing tools. In this study, we empirically evaluate two leading representative paradigms, RivaGAN (Spatial) and Tree-Ring (Latent), utilizing an automated Attack Simulation Engine across 30 intensity intervals of geometric and generative perturbations. We formalize an "Adversarial Evasion Region" (AER) framework to measure cryptographic degradation against semantic visual retention (OpenCLIP > 75.0). Our statistical analysis ($n=100$ per interval, $MOE = \pm 3.92\%$) reveals that these domains possess mutually exclusive, mathematically orthogonal vulnerabilities. Spatial watermarks experience severe cryptographic degradation under algorithmic pixel-rewriting (exhibiting a 67.47% AER evasion rate under Img2Img translation), whereas latent watermarks exhibit profound fragility against geometric misalignment (yielding a 43.20% AER evasion rate under static cropping). By proving that single-domain watermarking is fundamentally insufficient against modern adversarial toolsets, this research exposes a systemic vulnerability in current digital provenance standards and establishes the foundational exigence for future multi-domain cryptographic architectures.
- Abstract(参考訳): オープンウェイト生成AIが急速に普及するにつれ、超現実的なメディアを合成する能力は、デジタル信頼に重大な課題をもたらしている。
自動偽情報とAI生成画像は、堅牢なデジタル証明を重要なサイバーセキュリティ命令にしている。
現在、最先端の目に見えない透かしは、空間領域 (ポストジェネレーションピクセル埋め込み) または潜在領域 (プレジェネレーション周波数埋め込み) の2つの主要な数学的多様体のうちの1つで機能している。
既存の文献では、これらのモデルを孤立した古典的な歪みに対して頻繁に評価しているが、現代の生成AI編集ツールに対する厳密な比較ベンチマークが欠如している。
本研究では,RivaGAN(Spatial)とTree-Ring(Latent)の2つの代表的なパラダイムを実験的に評価した。
我々は,意味的視覚保持(OpenCLIP > 75.0)に対する暗号劣化を測定するために,AER(Adversarial Evasion Region)フレームワークを形式化した。
我々の統計分析(n=100$ per interval, $MOE = \pm 3.92\%$)は、これらの領域が互いに排他的で数学的に直交する脆弱性を持っていることを示している。
空間透かしは、アルゴリズムによるピクセルリライト(Img2Img翻訳によるAER回避率67.47%)で深刻な暗号劣化を経験する一方、潜伏した透かしは幾何学的不整合(静的収穫によるAER回避率43.20%)に対して深刻な脆弱性を示す。
単一ドメインの透かしは、現代の敵対的ツールセットに対して根本的に不十分であることを証明することによって、現在のデジタルプロファイランス標準におけるシステム的脆弱性を明らかにし、将来のマルチドメイン暗号アーキテクチャの基盤となるエグゼクティブを確立する。
関連論文リスト
- TopoReformer: Mitigating Adversarial Attacks Using Topological Purification in OCR Models [2.8272661103123258]
テキストの逆摂動画像は、OCRシステムが人間の目に見えない変化から誤った書き起こしや誤った書き起こしを発生させる可能性がある。
既存の防御、例えば、敵の訓練、入力前処理、あるいは認識後の補正は、しばしばモデル固有であり、計算的に高価であり、摂動しない入力のパフォーマンスに影響する。
TopoReformerは、テキストイメージの構造的整合性を保ちながら、敵対的摂動を緩和するモデルに依存しない改革パイプラインである。
論文 参考訳(メタデータ) (2025-11-19T19:01:51Z) - A Dual-Branch CNN for Robust Detection of AI-Generated Facial Forgeries [4.313893060699182]
顔偽造技術は、AIセキュリティ、デジタルメディアの完全性、および公的な信頼に重大な脅威をもたらす。
顔偽造検出のための新しい二分岐畳み込みニューラルネットワークを提案する。
4つの代表法から生成された鍛造画像を含むDiFFベンチマークを用いて,本モデルの評価を行った。
論文 参考訳(メタデータ) (2025-10-28T17:06:40Z) - An Ensemble Framework for Unbiased Language Model Watermarking [60.99969104552168]
本研究では,アンサンブル・フレームワークであるENSを提案する。
ENSは複数の独立した透かしインスタンスを順次構成し、それぞれ異なるキーによって管理され、透かし信号を増幅する。
実験的な評価では、ENSは信頼できる検出に必要なトークンの数を大幅に減らし、平滑化やパラフレージング攻撃に対する耐性を高めている。
論文 参考訳(メタデータ) (2025-09-28T19:37:44Z) - Zero-Shot Visual Deepfake Detection: Can AI Predict and Prevent Fake Content Before It's Created? [7.89029114152292]
デジタルセキュリティ、メディアの完全性、および公的な信頼に対するディープフェイクの脅威は急速に増加している。
本研究は、モデルが特定のディープフェイク変化を見たことがない場合でも、ゼロショットディープフェイク検出(ゼロショットディープフェイク検出)を新たに行う方法である。
論文 参考訳(メタデータ) (2025-09-22T22:33:16Z) - Character-Level Perturbations Disrupt LLM Watermarks [64.60090923837701]
我々は,Large Language Model (LLM)ウォーターマーキングのためのシステムモデルを定式化する。
我々は、透かし検出器への限られたアクセスに制約された2つの現実的な脅威モデルの特徴付けを行う。
我々は,最も制限的な脅威モデルの下で,キャラクタレベルの摂動が透かし除去に著しく有効であることを実証した。
現実的な制約下での透かし除去における文字レベルの摂動の優位性と遺伝的アルゴリズム(GA)の有効性を実験的に検証した。
論文 参考訳(メタデータ) (2025-09-11T02:50:07Z) - Uncovering and Mitigating Destructive Multi-Embedding Attacks in Deepfake Proactive Forensics [17.112388802067425]
積極的法医学は 信頼できない 透かしを埋め込んで 信頼できる情報源の追跡を 可能にします
既存の手法は、1つの透かしを埋め込むという理想的な仮定に依存しており、これは現実のシナリオでは非現実的であることを証明している。
本稿では,この脆弱性に対処するため,AIS(Adversarial Interference Simulation)という訓練パラダイムを提案する。
本手法は,第2の埋め込み後であっても,元の透かしを正しく抽出する能力を維持することができる。
論文 参考訳(メタデータ) (2025-08-24T07:57:32Z) - Deep Learning Models for Robust Facial Liveness Detection [56.08694048252482]
本研究では,現代のアンチスプーフィング手法の欠陥に対処する新しい深層学習モデルを用いて,ロバストな解を提案する。
テクスチャ解析と実際の人間の特性に関連する反射特性を革新的に統合することにより、我々のモデルは、顕著な精度でレプリカと真の存在を区別する。
論文 参考訳(メタデータ) (2025-08-12T17:19:20Z) - Safe and Robust Watermark Injection with a Single OoD Image [90.71804273115585]
高性能なディープニューラルネットワークをトレーニングするには、大量のデータと計算リソースが必要である。
安全で堅牢なバックドア型透かし注入法を提案する。
我々は,透かし注入時のモデルパラメータのランダムな摂動を誘導し,一般的な透かし除去攻撃に対する防御を行う。
論文 参考訳(メタデータ) (2023-09-04T19:58:35Z) - Exploring Structure Consistency for Deep Model Watermarking [122.38456787761497]
Deep Neural Network(DNN)の知的財産権(IP)は、代理モデルアタックによって簡単に盗まれる。
本稿では,新しい構造整合モデルウォーターマーキングアルゴリズムを設計した新しい透かし手法,すなわち構造整合性'を提案する。
論文 参考訳(メタデータ) (2021-08-05T04:27:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。