論文の概要: Provenance Detection for AI-Generated Images: Combining Perceptual Hashing, Homomorphic Encryption, and AI Detection Models
- arxiv url: http://arxiv.org/abs/2503.11195v1
- Date: Fri, 14 Mar 2025 08:42:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-17 13:07:17.416486
- Title: Provenance Detection for AI-Generated Images: Combining Perceptual Hashing, Homomorphic Encryption, and AI Detection Models
- Title(参考訳): AI生成画像の異常検出:知覚ハッシュ、同型暗号化、AI検出モデルの組み合わせ
- Authors: Shree Singhi, Aayan Yadav, Aayush Gupta, Shariar Ebrahimi, Parisa Hassanizadeh,
- Abstract要約: 我々は、セキュアでトランスフォーメーションに耐性のあるAIコンテンツ検出のためのフレームワークを開発する。
我々は、対角的に頑健な最先端の知覚ハッシュモデルDinoHashを開発した。
我々は,ユーザクエリとレジストリプライバシの両方の保護を確保するために,MP-FHE(Multi-Party Fully Homomorphic Encryption)方式を提案フレームワークに統合する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: As AI-generated sensitive images become more prevalent, identifying their source is crucial for distinguishing them from real images. Conventional image watermarking methods are vulnerable to common transformations like filters, lossy compression, and screenshots, often applied during social media sharing. Watermarks can also be faked or removed if models are open-sourced or leaked since images can be rewatermarked. We have developed a three-part framework for secure, transformation-resilient AI content provenance detection, to address these limitations. We develop an adversarially robust state-of-the-art perceptual hashing model, DinoHash, derived from DINOV2, which is robust to common transformations like filters, compression, and crops. Additionally, we integrate a Multi-Party Fully Homomorphic Encryption~(MP-FHE) scheme into our proposed framework to ensure the protection of both user queries and registry privacy. Furthermore, we improve previous work on AI-generated media detection. This approach is useful in cases where the content is absent from our registry. DinoHash significantly improves average bit accuracy by 12% over state-of-the-art watermarking and perceptual hashing methods while maintaining superior true positive rate (TPR) and false positive rate (FPR) tradeoffs across various transformations. Our AI-generated media detection results show a 25% improvement in classification accuracy on commonly used real-world AI image generators over existing algorithms. By combining perceptual hashing, MP-FHE, and an AI content detection model, our proposed framework provides better robustness and privacy compared to previous work.
- Abstract(参考訳): AIが生成するセンシティブなイメージがより普及するにつれて、実際のイメージと区別するためには、ソースを特定することが不可欠である。
従来の画像透かし手法は、フィルター、損失圧縮、スクリーンショットなどの一般的な変換に対して脆弱であり、ソーシャルメディアの共有時にしばしば適用される。
画像を再ウォーターマークできるため、モデルがオープンソース化されたりリークされたりしても、ウォーターマークは偽造または削除することもできる。
我々は、これらの制限に対処するために、セキュアでトランスフォーメーションに耐性のあるAIコンテンツ検出のための3つのフレームワークを開発した。
我々は,DINOV2から派生した,逆向きに頑健な知覚ハッシュモデルDinoHashを開発し,フィルタや圧縮,作物などの共通変換に頑健である。
さらに、ユーザクエリとレジストリのプライバシの両方の保護を確保するために、提案したフレームワークにマルチパーティ完全同型暗号化~(MP-FHE)スキームを統合する。
さらに,AI生成メディア検出におけるこれまでの取り組みを改善した。
このアプローチは、コンテンツがレジストリから欠落している場合に有効です。
DinoHashは、最先端の透かしと知覚的ハッシュ法に対して平均ビット精度を12%向上させ、優れた真正レート(TPR)と偽正レート(FPR)のトレードオフを様々な変換で維持する。
我々のAI生成メディア検出結果は、既存のアルゴリズムよりもよく使われている実世界のAI画像生成装置の分類精度が25%向上したことを示している。
知覚的ハッシュ、MP-FHE、AIコンテンツ検出モデルを組み合わせることで、提案するフレームワークは、これまでの作業よりも堅牢性とプライバシを提供する。
関連論文リスト
- Robust Watermarks Leak: Channel-Aware Feature Extraction Enables Adversarial Watermark Manipulation [21.41643665626451]
本稿では,事前学習された視覚モデルを用いて,透かしパターンの漏洩を抽出する攻撃フレームワークを提案する。
大量のデータや検出器のアクセスを必要とする従来の作業とは異なり,本手法は1つの透かし画像による偽造と検出の両方を達成している。
現在の"ロバスト"な透かしは、歪み抵抗に対するセキュリティを犠牲にして、将来の透かし設計の洞察を与えます。
論文 参考訳(メタデータ) (2025-02-10T12:55:08Z) - Zero-Shot Detection of AI-Generated Images [54.01282123570917]
AI生成画像を検出するゼロショットエントロピー検出器(ZED)を提案する。
機械によるテキスト検出の最近の研究に触発された私たちのアイデアは、分析対象の画像が実際の画像のモデルと比較してどれだけ驚くかを測定することである。
ZEDは精度の点でSoTAよりも平均3%以上改善されている。
論文 参考訳(メタデータ) (2024-09-24T08:46:13Z) - Safe-SD: Safe and Traceable Stable Diffusion with Text Prompt Trigger for Invisible Generative Watermarking [20.320229647850017]
安定拡散(SD)モデルは一般的に画像合成とパーソナライズされた編集の分野で栄えている。
AIが作成したコンテンツを公開プラットフォームに公開することで、法的および倫理的リスクが高まる可能性がある。
本研究では,透かしを認識不能な構造に適応させる,安全かつ高追従性安定拡散フレームワーク(SafeSD)を提案する。
論文 参考訳(メタデータ) (2024-07-18T05:53:17Z) - Certifiably Robust Image Watermark [57.546016845801134]
ジェネレーティブAIは、偽情報やプロパガンダキャンペーンの促進など、多くの社会的懸念を提起する。
ウォーターマークAI生成コンテンツは、これらの懸念に対処するための重要な技術である。
本報告では, 除去・偽造攻撃に対するロバスト性保証を保証した最初の画像透かしを提案する。
論文 参考訳(メタデータ) (2024-07-04T17:56:04Z) - RIGID: A Training-free and Model-Agnostic Framework for Robust AI-Generated Image Detection [60.960988614701414]
RIGIDは、堅牢なAI生成画像検出のためのトレーニング不要でモデルに依存しない方法である。
RIGIDは、既存のトレーニングベースおよびトレーニング不要な検出器を著しく上回っている。
論文 参考訳(メタデータ) (2024-05-30T14:49:54Z) - RAW: A Robust and Agile Plug-and-Play Watermark Framework for AI-Generated Images with Provable Guarantees [33.61946642460661]
本稿ではRAWと呼ばれる堅牢でアジャイルな透かし検出フレームワークを紹介する。
我々は、透かしの存在を検出するために、透かしと共同で訓練された分類器を用いる。
このフレームワークは,透かし画像の誤分類に対する偽陽性率に関する証明可能な保証を提供する。
論文 参考訳(メタデータ) (2024-01-23T22:00:49Z) - Safe and Robust Watermark Injection with a Single OoD Image [90.71804273115585]
高性能なディープニューラルネットワークをトレーニングするには、大量のデータと計算リソースが必要である。
安全で堅牢なバックドア型透かし注入法を提案する。
我々は,透かし注入時のモデルパラメータのランダムな摂動を誘導し,一般的な透かし除去攻撃に対する防御を行う。
論文 参考訳(メタデータ) (2023-09-04T19:58:35Z) - Exploring Structure Consistency for Deep Model Watermarking [122.38456787761497]
Deep Neural Network(DNN)の知的財産権(IP)は、代理モデルアタックによって簡単に盗まれる。
本稿では,新しい構造整合モデルウォーターマーキングアルゴリズムを設計した新しい透かし手法,すなわち構造整合性'を提案する。
論文 参考訳(メタデータ) (2021-08-05T04:27:15Z) - Reversible Watermarking in Deep Convolutional Neural Networks for
Integrity Authentication [78.165255859254]
整合性認証のための可逆透かしアルゴリズムを提案する。
可逆透かしを埋め込むことが分類性能に及ぼす影響は0.5%未満である。
同時に、可逆的な透かしを適用することでモデルの完全性を検証することができる。
論文 参考訳(メタデータ) (2021-04-09T09:32:21Z) - Generating Image Adversarial Examples by Embedding Digital Watermarks [38.93689142953098]
本稿では,DNN(Deep Neural Network, ディープ・ニューラル・ネットワーク)モデルに対する画像逆転例を生成する,新しいデジタル透かしに基づく手法を提案する。
ホスト画像と透かし画像を選択するための効率的な機構を考案し、改良された離散ウェーブレット変換(DWT)に基づく透かしアルゴリズムを利用する。
我々のスキームは、CIFAR-10データセット上の各画像に対する攻撃を完了する平均1.17秒で、多数の敵例を効率的に生成することができる。
論文 参考訳(メタデータ) (2020-08-14T09:03:26Z) - Robust watermarking with double detector-discriminator approach [0.5330240017302621]
透かしのための新しいディープフレームワーク - コピーからメッセージを取り出す方法として、透過的なメッセージをイメージに埋め込むテクニックを提供する。
我々のフレームワークは、攻撃スペクトルに対する堅牢性という文脈において、近年の手法より優れています。
また、画像に埋め込みメッセージが含まれているか否かを検知し、識別する手法である二重検出器-識別器のアプローチも提示する。
論文 参考訳(メタデータ) (2020-06-06T17:15:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。