論文の概要: Kernel Density Steering: Inference-Time Scaling via Mode Seeking for Image Restoration
- arxiv url: http://arxiv.org/abs/2507.05604v1
- Date: Tue, 08 Jul 2025 02:33:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-09 16:34:37.529933
- Title: Kernel Density Steering: Inference-Time Scaling via Mode Seeking for Image Restoration
- Title(参考訳): カーネル密度ステアリング:画像復元のためのモード探索による推論時間スケーリング
- Authors: Yuyang Hu, Kangfu Mei, Mojtaba Sahraee-Ardakan, Ulugbek S. Kamilov, Peyman Milanfar, Mauricio Delbracio,
- Abstract要約: カーネル密度ステアリング(KDS)は、明示的な局所モード探索を通じて、堅牢で高忠実な出力を促進する新しい推論時フレームワークである。
KDSは、拡散サンプルの$N$粒子アンサンブルを使用し、それらの集合出力からパッチワイドのカーネル密度推定勾配を計算する。
この集団的な局所的なモード探索機構は「収集知恵」として機能し、刺激的なモードからアーティファクトへと引き離される。
- 参考スコア(独自算出の注目度): 23.098667686003928
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion models show promise for image restoration, but existing methods often struggle with inconsistent fidelity and undesirable artifacts. To address this, we introduce Kernel Density Steering (KDS), a novel inference-time framework promoting robust, high-fidelity outputs through explicit local mode-seeking. KDS employs an $N$-particle ensemble of diffusion samples, computing patch-wise kernel density estimation gradients from their collective outputs. These gradients steer patches in each particle towards shared, higher-density regions identified within the ensemble. This collective local mode-seeking mechanism, acting as "collective wisdom", steers samples away from spurious modes prone to artifacts, arising from independent sampling or model imperfections, and towards more robust, high-fidelity structures. This allows us to obtain better quality samples at the expense of higher compute by simultaneously sampling multiple particles. As a plug-and-play framework, KDS requires no retraining or external verifiers, seamlessly integrating with various diffusion samplers. Extensive numerical validations demonstrate KDS substantially improves both quantitative and qualitative performance on challenging real-world super-resolution and image inpainting tasks.
- Abstract(参考訳): 拡散モデルは画像復元を約束するが、既存の手法は矛盾しない忠実さと望ましくない人工物に悩まされることが多い。
そこで我々はKDS(Kernel Density Steering)という新しい推論時フレームワークを導入し,局所モード探索による高忠実度な出力を推し進める。
KDSは、拡散サンプルの$N$粒子アンサンブルを使用し、それらの集合出力からパッチワイドのカーネル密度推定勾配を計算する。
これらの勾配は、アンサンブル内で同定された共有された高密度領域に対して各粒子のパッチを操る。
この集団的な局所的なモード探索機構は「協調知恵」として機能し、独立したサンプリングやモデル不完全性から引き起こされる刺激的なモードから、より堅牢で高忠実な構造へと引き離される。
これにより、複数の粒子を同時にサンプリングすることで、より高い計算を犠牲にして、より良い品質のサンプルを得ることができる。
プラグアンドプレイフレームワークとして、KDSはリトレーニングや外部検証を必要とせず、様々な拡散サンプリングとシームレスに統合する。
大規模な数値検証により、KDSは現実世界の超解像課題における定量化と定性化の両面を大幅に改善することを示した。
関連論文リスト
- Diffusion Sampling Path Tells More: An Efficient Plug-and-Play Strategy for Sample Filtering [18.543769006014383]
拡散モデルはしばしば、サンプリング軌跡に固有の変化のために、一貫性のないサンプル品質を示す。
CFG-リジェクション(CFG-Rejection)は,デノナイジングプロセスの初期段階において,低品質なサンプルをフィルタリングする効率的なプラグアンドプレイ戦略である。
画像生成におけるCFG-Rejectionの有効性を広範囲な実験により検証する。
論文 参考訳(メタデータ) (2025-05-29T11:08:24Z) - Deep Clustering with Diffused Sampling and Hardness-aware
Self-distillation [4.550555443103878]
本稿では, 拡散サンプリングと硬度認識型自己蒸留(HaDis)を併用した, エンドツーエンドの深層クラスタリング手法を提案する。
5つの課題の画像データセットの結果は、最先端のHaDis法よりも優れたクラスタリング性能を示している。
論文 参考訳(メタデータ) (2024-01-25T09:33:49Z) - Deep Equilibrium Diffusion Restoration with Parallel Sampling [120.15039525209106]
拡散モデルに基づく画像復元(IR)は、拡散モデルを用いて劣化した画像から高品質な(本社)画像を復元し、有望な性能を達成することを目的としている。
既存のほとんどの手法では、HQイメージをステップバイステップで復元するために長いシリアルサンプリングチェーンが必要であるため、高価なサンプリング時間と高い計算コストがかかる。
本研究では,拡散モデルに基づくIRモデルを異なる視点,すなわちDeqIRと呼ばれるDeQ(Deep equilibrium)固定点系で再考することを目的とする。
論文 参考訳(メタデータ) (2023-11-20T08:27:56Z) - Hierarchical Integration Diffusion Model for Realistic Image Deblurring [71.76410266003917]
拡散モデル (DM) は画像劣化に導入され, 有望な性能を示した。
本稿では,階層型統合拡散モデル(HI-Diff)を提案する。
人工的および実世界のぼかしデータセットの実験は、HI-Diffが最先端の手法より優れていることを示した。
論文 参考訳(メタデータ) (2023-05-22T12:18:20Z) - Deep Equilibrium Approaches to Diffusion Models [1.4275201654498746]
拡散に基づく生成モデルは高品質な画像を生成するのに極めて効果的である。
これらのモデルは通常、高忠実度画像を生成するために長いサンプリングチェーンを必要とする。
我々は、異なる観点からの拡散モデル、すなわち(深い)平衡(DEQ)固定点モデルについて考察する。
論文 参考訳(メタデータ) (2022-10-23T22:02:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。