論文の概要: Efficient Zero-Shot Inpainting with Decoupled Diffusion Guidance
- arxiv url: http://arxiv.org/abs/2512.18365v1
- Date: Sat, 20 Dec 2025 13:32:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.306817
- Title: Efficient Zero-Shot Inpainting with Decoupled Diffusion Guidance
- Title(参考訳): 脱カップリング拡散誘導による高効率ゼロショット塗布
- Authors: Badr Moufad, Navid Bagheri Shouraki, Alain Oliviero Durmus, Thomas Hirtz, Eric Moulines, Jimmy Olsson, Yazid Janati,
- Abstract要約: 拡散モデルは、塗装や局所的な修正といった画像編集タスクの強力な先駆者として現れてきた。
本稿では,ガウス後続遷移のサンプリングをシンプルかつ効率的に行う新しいサロゲートを提案する。
提案手法は,微調整ベースラインに比べて強い観測一貫性を実現し,コヒーレントで高品質な再構成を実現する。
- 参考スコア(独自算出の注目度): 28.412652896195684
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Diffusion models have emerged as powerful priors for image editing tasks such as inpainting and local modification, where the objective is to generate realistic content that remains consistent with observed regions. In particular, zero-shot approaches that leverage a pretrained diffusion model, without any retraining, have been shown to achieve highly effective reconstructions. However, state-of-the-art zero-shot methods typically rely on a sequence of surrogate likelihood functions, whose scores are used as proxies for the ideal score. This procedure however requires vector-Jacobian products through the denoiser at every reverse step, introducing significant memory and runtime overhead. To address this issue, we propose a new likelihood surrogate that yields simple and efficient to sample Gaussian posterior transitions, sidestepping the backpropagation through the denoiser network. Our extensive experiments show that our method achieves strong observation consistency compared with fine-tuned baselines and produces coherent, high-quality reconstructions, all while significantly reducing inference cost. Code is available at https://github.com/YazidJanati/ding.
- Abstract(参考訳): 拡散モデルは、着色や局所的な修正といった画像編集タスクの強力な先駆者として現れており、観察された領域と整合したリアルなコンテンツを生成することが目的である。
特に、事前訓練された拡散モデルを利用するゼロショットアプローチは、いかなる再訓練もせずに、非常に効果的な再構成を実現することが示されている。
しかし、最先端のゼロショット法は典型的には、そのスコアが理想的なスコアのプロキシとして使われるような代理確率関数の列に依存している。
しかしこの手順では、逆ステップ毎にデノイザを通じてベクトル・ヤコビアン製品が必要となり、メモリとランタイムのオーバーヘッドが大幅に増大する。
この問題に対処するため,我々はガウス後続遷移の標本化をシンプルかつ効率的に行う新しい確率代理法を提案し,デノイザネットワークを介してバックプロパゲーションをサイドステッピングする。
大規模な実験により,提案手法は微調整ベースラインと比較して強い観測整合性を実現し,コヒーレントで高品質な再構成を実現するとともに,推論コストを著しく低減することを示した。
コードはhttps://github.com/YazidJanati/ding.comで入手できる。
関連論文リスト
- Discrete Guidance Matching: Exact Guidance for Discrete Flow Matching [36.348940136801296]
この問題に対処するために、離散データのための新しいガイダンスフレームワークを提案する。
学習した離散フローマッチングモデルにより、所望の分布の正確な遷移率を導出する。
本稿では,エネルギー誘導型シミュレーションと嗜好アライメントによるテキスト・ツー・イメージ生成とマルチモーダル理解タスクの有効性を示す。
論文 参考訳(メタデータ) (2025-09-26T05:51:31Z) - Score-Based Turbo Message Passing for Plug-and-Play Compressive Image Recovery [24.60447255507278]
オフ・ザ・シェルフのイメージ・デノイザは概して、一般的なまたは手作りの先駆者に依存している。
我々は, スコアベース最小二乗誤差(MMSE)デノイザを統合した, 圧縮画像復元のためのメッセージパッシングフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-28T04:30:58Z) - Robust Representation Consistency Model via Contrastive Denoising [83.47584074390842]
ランダムな平滑化は、敵の摂動に対する堅牢性を証明する理論的保証を提供する。
拡散モデルは、ノイズ摂動サンプルを浄化するためにランダムな平滑化に成功している。
我々は,画素空間における拡散軌跡に沿った生成的モデリングタスクを,潜在空間における識別的タスクとして再構成する。
論文 参考訳(メタデータ) (2025-01-22T18:52:06Z) - DGTR: Distributed Gaussian Turbo-Reconstruction for Sparse-View Vast Scenes [81.56206845824572]
新規ビュー合成(NVS)アプローチは、広大なシーン再構築において重要な役割を担っている。
大規模な環境下では、復元の質が悪くなる場合が少なくない。
本稿では,スパース・ビュー・ワイド・シーンのための効率的なガウス再構成のための分散フレームワークであるDGTRを提案する。
論文 参考訳(メタデータ) (2024-11-19T07:51:44Z) - Fast constrained sampling in pre-trained diffusion models [80.99262780028015]
任意の制約下で高速で高品質な生成を可能にするアルゴリズムを提案する。
我々の手法は、最先端のトレーニングフリー推論手法に匹敵するか、超越した結果をもたらす。
論文 参考訳(メタデータ) (2024-10-24T14:52:38Z) - Vanishing Feature: Diagnosing Model Merging and Beyond [1.1510009152620668]
結合モデルによる伝搬中に入力誘起特徴が減少する「消滅特徴」現象を同定する。
既存の正規化戦略は、消滅する特徴問題を的確に標的にすることで強化できることを示す。
初期層機能の保存に重点を置いたPFM(Preserve-First Merging')戦略を提案する。
論文 参考訳(メタデータ) (2024-02-05T17:06:26Z) - Speech Enhancement and Dereverberation with Diffusion-based Generative Models [40.239246150027235]
本稿では,微分方程式に基づく拡散過程について概説する。
提案手法により,30段階の拡散しか行わず,高品質なクリーン音声推定が可能であることを示す。
大規模なクロスデータセット評価では、改良された手法が近年の識別モデルと競合することを示す。
論文 参考訳(メタデータ) (2022-08-11T13:55:12Z) - Gaussian MRF Covariance Modeling for Efficient Black-Box Adversarial
Attacks [86.88061841975482]
我々は,ゼロオーダーのオラクルにのみアクセス可能なブラックボックス設定において,逆例を生成する問題について検討する。
我々はこの設定を用いて、FGSM(Fast Gradient Sign Method)のブラックボックス版と同様に、高速な1ステップの敵攻撃を見つける。
提案手法はクエリを少なくし,現在の技術よりも攻撃成功率が高いことを示す。
論文 参考訳(メタデータ) (2020-10-08T18:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。