論文の概要: InverFill: One-Step Inversion for Enhanced Few-Step Diffusion Inpainting
- arxiv url: http://arxiv.org/abs/2603.23463v1
- Date: Tue, 24 Mar 2026 17:32:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 19:53:37.614103
- Title: InverFill: One-Step Inversion for Enhanced Few-Step Diffusion Inpainting
- Title(参考訳): InverFill:Few-Step Diffusion Inpaintingのためのワンステップインバージョン
- Authors: Duc Vu, Kien Nguyen, Trong-Tung Nguyen, Ngan Nguyen, Phong Nguyen, Khoi Nguyen, Cuong Pham, Anh Tran,
- Abstract要約: InverFillは、インペイント用に調整されたワンステップのインバージョンメソッドである。
入力されたマスク画像から初期ノイズに意味情報を注入し、高忠実度な数ステップの塗装を可能にする。
- 参考スコア(独自算出の注目度): 14.766289236102345
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent diffusion-based models achieve photorealism in image inpainting but require many sampling steps, limiting practical use. Few-step text-to-image models offer faster generation, but naively applying them to inpainting yields poor harmonization and artifacts between the background and inpainted region. We trace this cause to random Gaussian noise initialization, which under low function evaluations causes semantic misalignment and reduced fidelity. To overcome this, we propose InverFill, a one-step inversion method tailored for inpainting that injects semantic information from the input masked image into the initial noise, enabling high-fidelity few-step inpainting. Instead of training inpainting models, InverFill leverages few-step text-to-image models in a blended sampling pipeline with semantically aligned noise as input, significantly improving vanilla blended sampling and even matching specialized inpainting models at low NFEs. Moreover, InverFill does not require real-image supervision and only adds minimal inference overhead. Extensive experiments show that InverFill consistently boosts baseline few-step models, improving image quality and text coherence without costly retraining or heavy iterative optimization.
- Abstract(参考訳): 近年の拡散モデルでは、画像の塗布において光リアリズムが達成されているが、多くのサンプリングステップが必要であり、実用的利用が制限されている。
わずかなステップのテキスト・ツー・イメージ・モデルはより高速な生成を提供するが、それを塗布に生かすことによって、背景と塗布された領域間の調和やアーティファクトが低下する。
この原因をランダムなガウス雑音の初期化に辿り着き、低機能評価では意味的不整合が生じ、忠実度が低下する。
これを解決するために,入力されたマスク画像から意味情報を初期雑音に注入する1ステップのインバージョン手法InverFillを提案する。
インペインティングモデルをトレーニングする代わりに、InverFillは、意味的に整合したノイズを入力として、混合サンプリングパイプライン内の数ステップのテキスト・ツー・イメージモデルを活用する。
さらに、InverFillはリアルタイムの監視を必要としないため、最小限の推論オーバーヘッドしか追加しない。
大規模な実験により、InverFillはベースライン数ステップモデルを継続的に強化し、コストのかかる再トレーニングや重い反復最適化なしに画像品質とテキストコヒーレンスを改善している。
関連論文リスト
- ImageRAGTurbo: Towards One-step Text-to-Image Generation with Retrieval-Augmented Diffusion Models [33.09645476860831]
本稿では,画像RAGTurboを提案する。
テキストプロンプトが与えられた場合、関連するテキストイメージペアをデータベースから取得し、それらを生成プロセスの条件付けに使用する。
実験の結果,提案手法は既存の手法と比較して遅延を伴わずに高忠実度画像を生成することがわかった。
論文 参考訳(メタデータ) (2026-02-13T05:59:57Z) - FreeInpaint: Tuning-free Prompt Alignment and Visual Rationality Enhancement in Image Inpainting [98.04041133839088]
ユーザからのテキストプロンプトを用いて,画像の特定領域内で新たなコンテンツを生成する。
FreeInpaintは,画像の忠実度を向上させるために,インジェクション中の拡散潜水剤を直接最適化する,プラグアンドプレイのチューニング不要な手法である。
論文 参考訳(メタデータ) (2025-12-24T11:06:26Z) - Fast constrained sampling in pre-trained diffusion models [80.99262780028015]
任意の制約下で高速で高品質な生成を可能にするアルゴリズムを提案する。
我々の手法は、最先端のトレーニングフリー推論手法に匹敵するか、超越した結果をもたらす。
論文 参考訳(メタデータ) (2024-10-24T14:52:38Z) - Provably Robust Score-Based Diffusion Posterior Sampling for Plug-and-Play Image Reconstruction [31.503662384666274]
科学と工学において、ゴールは、ある画像のモダリティを記述する既知のフォワードモデルから収集された少数の測定値から未知の画像を推測することである。
モチベートされたスコアベース拡散モデルはその経験的成功により、画像再構成に先立って模範の印象的な候補として現れた。
論文 参考訳(メタデータ) (2024-03-25T15:58:26Z) - Gradpaint: Gradient-Guided Inpainting with Diffusion Models [71.47496445507862]
Denoising Diffusion Probabilistic Models (DDPM) は近年,条件付きおよび非条件付き画像生成において顕著な成果を上げている。
我々はGradPaintを紹介し、グローバルな一貫性のあるイメージに向けて世代を操る。
我々は、様々なデータセットで訓練された拡散モデルによく適応し、現在最先端の教師付きおよび教師なしの手法を改善している。
論文 参考訳(メタデータ) (2023-09-18T09:36:24Z) - ExposureDiffusion: Learning to Expose for Low-light Image Enhancement [87.08496758469835]
この研究は、拡散モデルと物理ベースの露光モデルとをシームレスに統合することで、この問題に対処する。
提案手法は,バニラ拡散モデルと比較して性能が大幅に向上し,推論時間を短縮する。
提案するフレームワークは、実際のペア付きデータセット、SOTAノイズモデル、および異なるバックボーンネットワークの両方で動作する。
論文 参考訳(メタデータ) (2023-07-15T04:48:35Z) - Simultaneous Image-to-Zero and Zero-to-Noise: Diffusion Models with Analytical Image Attenuation [53.04220377034574]
高品質(未条件)な画像生成のための前方拡散プロセスに解析的画像減衰プロセスを導入することを提案する。
本手法は,フォワード画像からノイズへのマッピングを,テクスチメジからゼロへのマッピングとテクスティケロ・ツー・ノイズマッピングの同時マッピングとして表現する。
我々は,CIFAR-10やCelebA-HQ-256などの無条件画像生成や,超解像,サリエンシ検出,エッジ検出,画像インペインティングなどの画像条件下での下流処理について実験を行った。
論文 参考訳(メタデータ) (2023-06-23T18:08:00Z) - High-Fidelity Image Inpainting with GAN Inversion [23.49170140410603]
本稿では,InvertFillと呼ばれる画像インペイントのための新しいGANインバージョンモデルを提案する。
エンコーダ内では、事前変調ネットワークがマルチスケール構造を利用して、より差別的なセマンティクスをスタイルベクトルにエンコードする。
忠実でフォトリアリスティックなイメージを再構築するために、シンプルだが効果的なSoft-update Mean Latentモジュールは、大規模な腐敗のために高忠実なテクスチャを合成する、より多様なドメイン内パターンをキャプチャするように設計されている。
論文 参考訳(メタデータ) (2022-08-25T03:39:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。