論文の概要: Prompt-tuning latent diffusion models for inverse problems
- arxiv url: http://arxiv.org/abs/2310.01110v1
- Date: Mon, 2 Oct 2023 11:31:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-04 22:12:35.156163
- Title: Prompt-tuning latent diffusion models for inverse problems
- Title(参考訳): 逆問題に対するプロンプトチューニング潜在拡散モデル
- Authors: Hyungjin Chung, Jong Chul Ye, Peyman Milanfar, Mauricio Delbracio
- Abstract要約: 本稿では,テキストから画像への遅延拡散モデルを用いた逆問題の画像化手法を提案する。
P2Lと呼ばれる本手法は,超解像,デブロアリング,インパインティングなどの様々なタスクにおいて,画像拡散モデルと潜時拡散モデルに基づく逆問題解法の両方に優れる。
- 参考スコア(独自算出の注目度): 72.13952857287794
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We propose a new method for solving imaging inverse problems using
text-to-image latent diffusion models as general priors. Existing methods using
latent diffusion models for inverse problems typically rely on simple null text
prompts, which can lead to suboptimal performance. To address this limitation,
we introduce a method for prompt tuning, which jointly optimizes the text
embedding on-the-fly while running the reverse diffusion process. This allows
us to generate images that are more faithful to the diffusion prior. In
addition, we propose a method to keep the evolution of latent variables within
the range space of the encoder, by projection. This helps to reduce image
artifacts, a major problem when using latent diffusion models instead of
pixel-based diffusion models. Our combined method, called P2L, outperforms both
image- and latent-diffusion model-based inverse problem solvers on a variety of
tasks, such as super-resolution, deblurring, and inpainting.
- Abstract(参考訳): 本稿では,テキストから画像への遅延拡散モデルを用いた逆問題の画像化手法を提案する。
逆問題に潜伏拡散モデルを用いる既存の手法は、通常単純なnullテキストプロンプトに依存している。
この制限に対処するために,逆拡散処理を実行しながらオンザフライでテキスト埋め込みを最適化するプロンプトチューニング法を提案する。
これにより、以前の拡散に忠実な画像を生成することができる。
さらに,エンコーダの範囲空間内における潜在変数の進化を投影によって維持する手法を提案する。
これはピクセルベースの拡散モデルではなく潜在拡散モデルを使う際に大きな問題となる画像アーティファクトを減らすのに役立つ。
P2Lと呼ばれる組み合わせの手法は,超解像,デブロアリング,塗装などの様々なタスクにおいて,画像拡散モデルと潜時拡散モデルに基づく逆問題解法の両方に優れる。
関連論文リスト
- Inverse Problem Sampling in Latent Space Using Sequential Monte Carlo [16.986994008343153]
画像処理において、逆問題(英: inverse problem)とは、いくつかの(通常知られている)劣化モデルによって破損した画像のもっともらしい再構成を見つけるタスクである。
本稿では,拡散モデルの潜在空間における連続モンテカルロ(SMC)に基づく新しいサンプリング手法を提案する。
ImageNet と FFHQ の実証評価は,様々な逆問題タスクにおける競合手法に対するアプローチの利点を示している。
論文 参考訳(メタデータ) (2025-02-09T14:03:47Z) - Diffusing Differentiable Representations [60.72992910766525]
本稿では,事前学習した拡散モデルを用いて,微分可能な表現(拡散)をサンプリングする,新しい学習自由な手法を提案する。
差分によって引き起こされるサンプルに対する暗黙の制約を特定し、この制約に対処することで、生成されたオブジェクトの一貫性と詳細が大幅に改善されることを示す。
論文 参考訳(メタデータ) (2024-12-09T20:42:58Z) - Warped Diffusion: Solving Video Inverse Problems with Image Diffusion Models [56.691967706131]
我々は、フレームを2次元空間における連続関数と見なし、ビデオは異なるフレーム間の連続的なワープ変換の列と見なす。
この観点から,画像上でのみ関数空間拡散モデルを訓練し,時間的に相関した逆問題を解くことができる。
本手法により,ビデオ逆問題を解決するために,安定拡散XLのような最先端の潜伏拡散モデルを展開することができる。
論文 参考訳(メタデータ) (2024-10-21T16:19:34Z) - G2D2: Gradient-guided Discrete Diffusion for image inverse problem solving [55.185588994883226]
本稿では,従来の離散拡散に基づく画像生成モデルを活用することによって,線形逆問題に対処する新しい手法を提案する。
我々の知る限りでは、これは画像逆問題を解決するために離散拡散モデルに基づく先行手法を使う最初のアプローチである。
論文 参考訳(メタデータ) (2024-10-09T06:18:25Z) - Solving Video Inverse Problems Using Image Diffusion Models [58.464465016269614]
本稿では,画像拡散モデルのみを活用する革新的なビデオ逆解法を提案する。
本手法は,映像の時間次元をバッチ次元画像拡散モデルとして扱う。
また、バッチ間の一貫性を促進するバッチ一貫性サンプリング戦略も導入しています。
論文 参考訳(メタデータ) (2024-09-04T09:48:27Z) - Fast Diffusion EM: a diffusion model for blind inverse problems with
application to deconvolution [0.0]
現在の手法では、劣化が知られており、復元と多様性の点で印象的な結果をもたらすと仮定している。
本研究では、これらのモデルの効率を活用し、復元された画像と未知のパラメータを共同で推定する。
本手法は,拡散モデルから抽出したサンプルを用いて,問題の対数類似度を近似し,未知のモデルパラメータを推定する方法とを交互に比較する。
論文 参考訳(メタデータ) (2023-09-01T06:47:13Z) - A Variational Perspective on Solving Inverse Problems with Diffusion
Models [101.831766524264]
逆タスクは、データ上の後続分布を推測するものとして定式化することができる。
しかし、拡散過程の非線形的かつ反復的な性質が後部を引き付けるため、拡散モデルではこれは困難である。
そこで我々は,真の後続分布を近似する設計手法を提案する。
論文 参考訳(メタデータ) (2023-05-07T23:00:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。