論文の概要: Optimization-Free Image Immunization Against Diffusion-Based Editing
- arxiv url: http://arxiv.org/abs/2411.17957v1
- Date: Wed, 27 Nov 2024 00:30:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-28 15:26:53.159131
- Title: Optimization-Free Image Immunization Against Diffusion-Based Editing
- Title(参考訳): 拡散に基づく編集に対する画像免疫の最適化
- Authors: Tarik Can Ozden, Ozgur Kara, Oguzhan Akcin, Kerem Zaman, Shashank Srivastava, Sandeep P. Chinchali, James M. Rehg,
- Abstract要約: DiffVaxは、画像免疫のためのスケーラブルで軽量で最適化のないフレームワークである。
提案手法は, 効率的な一般化によるコンテンツの発見, 計算コストの削減, 免疫時間を数日からミリ秒に短縮する。
- 参考スコア(独自算出の注目度): 23.787546784989484
- License:
- Abstract: Current image immunization defense techniques against diffusion-based editing embed imperceptible noise in target images to disrupt editing models. However, these methods face scalability challenges, as they require time-consuming re-optimization for each image-taking hours for small batches. To address these challenges, we introduce DiffVax, a scalable, lightweight, and optimization-free framework for image immunization, specifically designed to prevent diffusion-based editing. Our approach enables effective generalization to unseen content, reducing computational costs and cutting immunization time from days to milliseconds-achieving a 250,000x speedup. This is achieved through a loss term that ensures the failure of editing attempts and the imperceptibility of the perturbations. Extensive qualitative and quantitative results demonstrate that our model is scalable, optimization-free, adaptable to various diffusion-based editing tools, robust against counter-attacks, and, for the first time, effectively protects video content from editing. Our code is provided in our project webpage.
- Abstract(参考訳): 拡散型編集に対する現在の画像免疫防御技術は、ターゲット画像に知覚不可能なノイズを埋め込んで編集モデルを妨害する。
しかし、これらの手法は、小さなバッチに対して各画像撮影時間に対して、時間を要するため、スケーラビリティ上の課題に直面している。
これらの課題に対処するために、拡散ベースの編集を防ぐために特別に設計された画像免疫のためのスケーラブルで軽量で最適化のないフレームワークであるDiffVaxを紹介した。
提案手法は,効率的な一般化によるコンテンツの発見,計算コストの削減,免疫時間を数日からミリ秒に短縮し,25万倍の高速化を実現する。
これは、編集の失敗と摂動の認識不能を確実にする損失項によって達成される。
大規模定性的かつ定量的な結果から、我々のモデルはスケーラブルで、最適化不要で、様々な拡散ベースの編集ツールに適応でき、反撃に対して堅牢であり、ビデオコンテンツが編集から効果的に保護されることを示した。
私たちのコードはプロジェクトのWebページで提供されています。
関連論文リスト
- DiffusionGuard: A Robust Defense Against Malicious Diffusion-based Image Editing [93.45507533317405]
DiffusionGuardは、拡散ベースの画像編集モデルによる不正な編集に対する堅牢で効果的な防御方法である。
拡散過程の初期段階をターゲットとした対向雑音を発生させる新しい目的を提案する。
また,テスト期間中の各種マスクに対するロバスト性を高めるマスク強化手法も導入した。
論文 参考訳(メタデータ) (2024-10-08T05:19:19Z) - PostEdit: Posterior Sampling for Efficient Zero-Shot Image Editing [63.38854614997581]
拡散サンプリングプロセスを制御するために後続のスキームを組み込んだPostEditを導入する。
提案したPostEditは、未編集領域を正確に保存しながら、最先端の編集性能を実現する。
インバージョンもトレーニングも不要で、約1.5秒と18GBのGPUメモリを必要とするため、高品質な結果が得られる。
論文 参考訳(メタデータ) (2024-10-07T09:04:50Z) - TurboEdit: Text-Based Image Editing Using Few-Step Diffusion Models [53.757752110493215]
テキストベースの一般的な編集フレームワーク – 編集フレンドリーなDDPM-noiseインバージョンアプローチ – に注目します。
高速サンプリング法への適用を解析し、その失敗を視覚的アーティファクトの出現と編集強度の不足という2つのクラスに分類する。
そこで我々は,新しいアーティファクトを導入することなく,効率よく編集の規模を拡大する疑似誘導手法を提案する。
論文 参考訳(メタデータ) (2024-08-01T17:27:28Z) - Zero-Shot Video Editing through Adaptive Sliding Score Distillation [51.57440923362033]
本研究は,オリジナルビデオコンテンツの直接操作を容易にする,ビデオベースのスコア蒸留の新たなパラダイムを提案する。
本稿では,グローバルとローカルの両方の動画ガイダンスを取り入れた適応スライディングスコア蒸留方式を提案する。
論文 参考訳(メタデータ) (2024-06-07T12:33:59Z) - The Curious Case of End Token: A Zero-Shot Disentangled Image Editing using CLIP [4.710921988115686]
ここでは,CLIPはゼロショット方式でアンタングル編集を行うことができることを示す。
この知見は、画像やビデオ編集など、様々なタスクにこの手法を適用する機会を開く可能性がある。
論文 参考訳(メタデータ) (2024-06-01T14:46:57Z) - LASPA: Latent Spatial Alignment for Fast Training-free Single Image Editing [43.20273464866661]
拡散モデルを用いた実画像のテキスト編集のためのトレーニング不要な手法を提案する。
参照画像を用いて拡散過程が空間的誘導にどう影響するかを実証し,意味的コヒーレントな編集に繋がることを示す。
提案手法は,ユーザスタディにおいて62-71%の選好を達成し,モデルベース編集強度と画像保存スコアを大幅に改善する。
論文 参考訳(メタデータ) (2024-03-19T09:47:08Z) - FastVideoEdit: Leveraging Consistency Models for Efficient Text-to-Video Editing [8.907836546058086]
既存のビデオ編集における画像生成モデルへのアプローチは、ワンショットの微調整、追加条件抽出、DDIMの逆変換といった時間を要する。
我々は、一貫性モデル(CM)にインスパイアされた効率的なゼロショットビデオ編集手法であるFastVideoEditを提案する。
本手法は,特別な分散スケジュールを用いて,ソース映像からターゲット映像への直接マッピングを可能にする。
論文 参考訳(メタデータ) (2024-03-10T17:12:01Z) - Object-Centric Diffusion for Efficient Video Editing [64.71639719352636]
拡散ベースのビデオ編集は素晴らしい品質に達している。
このようなソリューションは通常、時間的に整合性のあるフレームを生成するために重いメモリと計算コストを発生させる。
品質を維持しつつ、大幅なスピードアップを可能にする修正を提案する。
論文 参考訳(メタデータ) (2024-01-11T08:36:15Z) - Raising the Cost of Malicious AI-Powered Image Editing [82.71990330465115]
本研究では,大規模な拡散モデルによる悪意ある画像編集のリスクを軽減するためのアプローチを提案する。
鍵となるアイデアは、イメージを免疫して、これらのモデルによる操作に抵抗するようにすることだ。
論文 参考訳(メタデータ) (2023-02-13T18:38:42Z) - Blended Latent Diffusion [18.043090347648157]
本稿では,汎用画像の局所的なテキスト駆動編集の課題に対して,ユーザが提供するマスクに所望の編集を限定する高速化されたソリューションを提案する。
提案手法は,低次元の潜伏空間で操作することで拡散を高速化する,最近のテキストから画像への潜伏拡散モデル (LDM) を利用する。
論文 参考訳(メタデータ) (2022-06-06T17:58:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。