論文の概要: Inverting the Generation Process of Denoising Diffusion Implicit Models: Empirical Evaluation and a Novel Method
- arxiv url: http://arxiv.org/abs/2606.03111v1
- Date: Tue, 02 Jun 2026 03:56:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 22:00:04.741538
- Title: Inverting the Generation Process of Denoising Diffusion Implicit Models: Empirical Evaluation and a Novel Method
- Title(参考訳): 拡散インシシデントモデルの生成過程の反転:実証評価と新しい方法
- Authors: Yan Zeng, Masanori Suganuma, Takayuki Okatani,
- Abstract要約: 本稿では,DDIM画像生成過程を逆転して潜伏変数を復元する問題について検討する。
既存の手法は、このタスクでしばしば正確さに苦しむ。
そこで本研究では,第1段階の勾配勾配降下による直接反転と,第2段階の固定点法を併用した新しいハイブリッド手法を提案する。
- 参考スコア(独自算出の注目度): 19.739734630921195
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper studies the problem of inverting the DDIM image generation process to recover latent variables, particularly the initial noise map, from a generated image. Existing methods often struggle with accuracy in this task. We propose a novel hybrid approach that combines direct inversion via gradient descent for the first step, followed by a fixed-point method for subsequent steps. Empirical evaluations across three datasets demonstrate that our method significantly improves the prediction of initial latent variables while achieving superior reconstruction accuracy. Additionally, we introduce a new evaluation, called the self-interpolation test, which assesses the quality of images generated from interpolated points between the true and predicted latent maps, offering deeper insights into performance. Our results reveal that while existing methods perform reasonably well in reconstruction, they consistently fail to accurately predict the initial latent variables, resulting in poor performance on the self-interpolation test. In contrast, our method outperforms all others across all metrics, providing valuable insights into diffusion models and enhancing their applications in image generation and editing.
- Abstract(参考訳): 本稿では,DDIM画像生成過程を逆転させて遅延変数,特に初期雑音マップを生成画像から復元する問題について検討する。
既存の手法は、このタスクでしばしば正確さに苦しむ。
そこで本研究では,第1段階の勾配勾配降下による直接反転と,第2段階の固定点法を併用した新しいハイブリッド手法を提案する。
3つのデータセットにまたがる実験的な評価により,提案手法は再現精度を向上しつつ,初期潜伏変数の予測を著しく改善することを示した。
さらに,自己補間テスト(セルフ補間テスト)と呼ばれる新たな評価手法を導入し,真と予測された潜時マップ間の補間点から生成した画像の品質を評価し,性能に関する深い洞察を提供する。
この結果から,既存手法の再現性は良好に向上するが,初期潜伏変数の正確な予測には失敗し,自己補間試験における性能が低下することが判明した。
対照的に,本手法はすべての指標において他よりも優れており,拡散モデルに対する貴重な洞察を与え,画像生成や編集におけるそれらの応用を強化する。
関連論文リスト
- A Meaningful Perturbation Metric for Evaluating Explainability Methods [55.09730499143998]
本稿では,画像生成モデルを用いて標的摂動を行う新しい手法を提案する。
具体的には,画像の忠実さを保ちながら,入力画像の高関連画素のみを塗布し,モデルの予測を変更することに焦点を当てる。
これは、しばしばアウト・オブ・ディストリビューションの修正を生み出し、信頼できない結果をもたらす既存のアプローチとは対照的である。
論文 参考訳(メタデータ) (2025-04-09T11:46:41Z) - Reconstruction-Free Anomaly Detection with Diffusion Models [30.099399014193573]
Inversion-based Anomaly Detection (AD) 手法を提案する。
元の確率フローODEを近似する際、クリーンな画像にノイズを与えるための反転ステップはごくわずかである。
付加雑音が学習拡散モデルに適応的に導出されるので、クリーンテスト画像の原特徴を引き続き利用して高い検出精度を得ることができる。
論文 参考訳(メタデータ) (2025-04-08T04:23:43Z) - Empirical Bayesian image restoration by Langevin sampling with a denoising diffusion implicit prior [0.18434042562191813]
本稿では,新しい高効率画像復元手法を提案する。
DDPMデノイザーを経験的ベイズアン・ランゲヴィンアルゴリズムに組み込む。
画像推定精度と計算時間の両方において最先端の戦略を改善する。
論文 参考訳(メタデータ) (2024-09-06T16:20:24Z) - ReNoise: Real Image Inversion Through Iterative Noising [62.96073631599749]
本研究では,操作数を増やすことなく,高い品質と操作率の逆転法を導入し,再現精度を向上する。
我々は,近年の高速化拡散モデルを含む様々なサンプリングアルゴリズムとモデルを用いて,Renoise手法の性能を評価する。
論文 参考訳(メタデータ) (2024-03-21T17:52:08Z) - Diffusion Posterior Proximal Sampling for Image Restoration [27.35952624032734]
我々は拡散に基づく画像復元のための洗練されたパラダイムを提案する。
具体的には,各生成段階における測定値と一致したサンプルを選択する。
選択に使用する候補サンプルの数は、タイムステップの信号対雑音比に基づいて適応的に決定される。
論文 参考訳(メタデータ) (2024-02-25T04:24:28Z) - SinSR: Diffusion-Based Image Super-Resolution in a Single Step [119.18813219518042]
拡散モデルに基づく超解像(SR)法は有望な結果を示す。
しかし、それらの実践的応用は、必要な推論ステップのかなりの数によって妨げられている。
本稿では,SinSRという単一ステップのSR生成を実現するための,シンプルで効果的な手法を提案する。
論文 参考訳(メタデータ) (2023-11-23T16:21:29Z) - Gradpaint: Gradient-Guided Inpainting with Diffusion Models [71.47496445507862]
Denoising Diffusion Probabilistic Models (DDPM) は近年,条件付きおよび非条件付き画像生成において顕著な成果を上げている。
我々はGradPaintを紹介し、グローバルな一貫性のあるイメージに向けて世代を操る。
我々は、様々なデータセットで訓練された拡散モデルによく適応し、現在最先端の教師付きおよび教師なしの手法を改善している。
論文 参考訳(メタデータ) (2023-09-18T09:36:24Z) - IRGen: Generative Modeling for Image Retrieval [82.62022344988993]
本稿では,画像検索を生成モデルの一種として再フレーミングする新しい手法を提案する。
我々は、イメージを意味単位の簡潔なシーケンスに変換するという技術的課題に対処するため、IRGenと呼ばれるモデルを開発した。
本モデルは,広範に使用されている3つの画像検索ベンチマークと200万件のデータセットに対して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-03-17T17:07:36Z) - Deblurring via Stochastic Refinement [85.42730934561101]
条件付き拡散モデルに基づくブラインドデブロアリングのための代替フレームワークを提案する。
提案手法は,PSNRなどの歪み指標の点で競合する。
論文 参考訳(メタデータ) (2021-12-05T04:36:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。