Fugu-MT 論文翻訳(概要): G2D2: Gradient-guided Discrete Diffusion for image inverse problem solving

論文の概要: G2D2: Gradient-guided Discrete Diffusion for image inverse problem solving

arxiv url: http://arxiv.org/abs/2410.14710v1
Date: Wed, 09 Oct 2024 06:18:25 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:37.638685
Title: G2D2: Gradient-guided Discrete Diffusion for image inverse problem solving
Title（参考訳）: G2D2:画像逆問題解のための勾配誘導離散拡散
Authors: Naoki Murata, Chieh-Hsin Lai, Yuhta Takida, Toshimitsu Uesaka, Bac Nguyen, Stefano Ermon, Yuki Mitsufuji,
Abstract要約: 本稿では,従来の離散拡散に基づく画像生成モデルを活用することによって,線形逆問題に対処する新しい手法を提案する。我々の知る限りでは、これは画像逆問題を解決するために離散拡散モデルに基づく先行手法を使う最初のアプローチである。
参考スコア（独自算出の注目度）: 55.185588994883226
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Recent literature has effectively utilized diffusion models trained on continuous variables as priors for solving inverse problems. Notably, discrete diffusion models with discrete latent codes have shown strong performance, particularly in modalities suited for discrete compressed representations, such as image and motion generation. However, their discrete and non-differentiable nature has limited their application to inverse problems formulated in continuous spaces. This paper presents a novel method for addressing linear inverse problems by leveraging image-generation models based on discrete diffusion as priors. We overcome these limitations by approximating the true posterior distribution with a variational distribution constructed from categorical distributions and continuous relaxation techniques. Furthermore, we employ a star-shaped noise process to mitigate the drawbacks of traditional discrete diffusion models with absorbing states, demonstrating that our method performs comparably to continuous diffusion techniques. To the best of our knowledge, this is the first approach to use discrete diffusion model-based priors for solving image inverse problems.
Abstract（参考訳）: 近年の文献では、連続変数に基づいて訓練された拡散モデルを、逆問題の解法として効果的に活用している。特に、離散遅延符号を持つ離散拡散モデルは、特に画像やモーション生成などの離散圧縮表現に適したモダリティにおいて、強い性能を示している。しかし、その離散的で微分不可能な性質は、連続空間で定式化された逆問題への応用に制限されている。本稿では,従来の離散拡散に基づく画像生成モデルを活用することによって,線形逆問題に対処する新しい手法を提案する。これらの制限を,カテゴリー分布と連続緩和法から構築した変動分布を用いて,真の後部分布を近似することで克服する。さらに, 従来の離散拡散モデルの欠点を吸収状態で緩和するために, 恒星型ノイズ法を用い, 連続拡散法と相容れない性能を示す。我々の知る限りでは、これは画像逆問題を解決するために離散拡散モデルに基づく先行手法を使う最初のアプローチである。

関連論文リスト

Coevolutionary Continuous Discrete Diffusion: Make Your Diffusion Language Model a Latent Reasoner [66.86440230599656]
拡散言語モデルは必ずしも離散空間にある必要はないと主張する。特に、連続拡散モデルが離散拡散やループ変換器よりも強い表現性を持つことを示す。本稿では,連続表現空間と離散トークン空間の結合に関する共同多モード拡散過程を定義する共進化連続拡散法(CCDD)を提案する。
論文参考訳（メタデータ） (2025-10-03T17:44:41Z)
EquiReg: Equivariance Regularized Diffusion for Inverse Problems [67.01847869495558]
拡散に基づく逆問題解法における後方サンプリングを正規化するためのフレームワークであるEquiReg拡散法を提案する。様々な解法に適用すると、EquiRegは線形および非線形画像復元タスクにおいて最先端の拡散モデルより優れる。
論文参考訳（メタデータ） (2025-05-29T01:25:43Z)
Continuous Diffusion Model for Language Modeling [57.396578974401734]
離散データに対する既存の連続拡散モデルは、離散的アプローチと比較して性能が限られている。本稿では,下層の分類分布の幾何学を組み込んだ言語モデリングのための連続拡散モデルを提案する。
論文参考訳（メタデータ） (2025-02-17T08:54:29Z)
VIPaint: Image Inpainting with Pre-Trained Diffusion Models via Variational Inference [5.852077003870417]
我々のVIPaint法は,提案手法の妥当性と多様性の両方において,従来の手法よりも優れていることを示す。我々のVIPaint法は,提案手法の妥当性と多様性の両方において,従来の手法よりも優れていることを示す。
論文参考訳（メタデータ） (2024-11-28T05:35:36Z)
Distillation of Discrete Diffusion through Dimensional Correlations [21.078500510691747]
「ミクチャー」モデルは、拡張性を維持しながら次元相関を扱える。損失関数により、混合モデルは、次元相関を学習することで、そのような多くのステップの従来のモデルをほんの数ステップに蒸留することができる。その結果、画像領域と言語領域をまたいだ事前学習した離散拡散モデルの蒸留における提案手法の有効性が示された。
論文参考訳（メタデータ） (2024-10-11T10:53:03Z)
Diffusion State-Guided Projected Gradient for Inverse Problems [82.24625224110099]
逆問題に対する拡散状態ガイド型射影勾配(DiffStateGrad)を提案する。 DiffStateGrad は拡散過程の中間状態の低ランク近似である部分空間に測定勾配を投影する。 DiffStateGradは、測定手順のステップサイズとノイズの選択によって拡散モデルのロバスト性を向上させる。
論文参考訳（メタデータ） (2024-10-04T14:26:54Z)
Solving Video Inverse Problems Using Image Diffusion Models [58.464465016269614]
本稿では,画像拡散モデルのみを活用する革新的なビデオ逆解法を提案する。本手法は,映像の時間次元をバッチ次元画像拡散モデルとして扱う。また、バッチ間の一貫性を促進するバッチ一貫性サンプリング戦略も導入しています。
論文参考訳（メタデータ） (2024-09-04T09:48:27Z)
Prompt-tuning latent diffusion models for inverse problems [72.13952857287794]
本稿では,テキストから画像への遅延拡散モデルを用いた逆問題の画像化手法を提案する。 P2Lと呼ばれる本手法は,超解像,デブロアリング,インパインティングなどの様々なタスクにおいて,画像拡散モデルと潜時拡散モデルに基づく逆問題解法の両方に優れる。
論文参考訳（メタデータ） (2023-10-02T11:31:48Z)
Blackout Diffusion: Generative Diffusion Models in Discrete-State Spaces [0.0]
前方拡散過程における任意の離散状態マルコフ過程の理論的定式化を開発する。例えばBlackout Diffusion'は、ノイズからではなく、空のイメージからサンプルを生成することを学習する。
論文参考訳（メタデータ） (2023-05-18T16:24:12Z)
A Variational Perspective on Solving Inverse Problems with Diffusion Models [101.831766524264]
逆タスクは、データ上の後続分布を推測するものとして定式化することができる。しかし、拡散過程の非線形的かつ反復的な性質が後部を引き付けるため、拡散モデルではこれは困難である。そこで我々は,真の後続分布を近似する設計手法を提案する。
論文参考訳（メタデータ） (2023-05-07T23:00:47Z)
Diffusion Models Generate Images Like Painters: an Analytical Theory of Outline First, Details Later [1.8416014644193066]
画像生成の基盤となる逆拡散過程には,以下の特性がある。個々の軌道は低次元であり、2次元回転に似ている」。本手法は,事前学習したモデルに対する画像生成の初期フェーズを正確に記述する。
論文参考訳（メタデータ） (2023-03-04T20:08:57Z)
Infinite-Dimensional Diffusion Models [4.342241136871849]
拡散に基づく生成モデルを無限次元で定式化し、関数の生成モデルに適用する。我々の定式化は無限次元の設定においてよく成り立っていることを示し、サンプルから目標測度への次元非依存距離境界を提供する。また,無限次元拡散モデルの設計ガイドラインも作成する。
論文参考訳（メタデータ） (2023-02-20T18:00:38Z)
Unifying Diffusion Models' Latent Space, with Applications to CycleDiffusion and Guidance [95.12230117950232]
関係領域で独立に訓練された2つの拡散モデルから共通潜時空間が現れることを示す。テキスト・画像拡散モデルにCycleDiffusionを適用することで、大規模なテキスト・画像拡散モデルがゼロショット画像・画像拡散エディタとして使用できることを示す。
論文参考訳（メタデータ） (2022-10-11T15:53:52Z)
Come-Closer-Diffuse-Faster: Accelerating Conditional Diffusion Models for Inverse Problems through Stochastic Contraction [31.61199061999173]
拡散モデルには重要な欠点がある。純粋なガウスノイズから画像を生成するために数千ステップの反復を必要とするため、サンプリングが本質的に遅い。ガウスノイズから始めることは不要であることを示す。代わりに、より優れた初期化を伴う単一前方拡散から始めると、逆条件拡散におけるサンプリングステップの数を大幅に減少させる。 ComeCloser-DiffuseFaster (CCDF)と呼ばれる新しいサンプリング戦略は、逆問題に対する既存のフィードフォワードニューラルネットワークアプローチが拡散モデルと相乗的に組み合わせられる方法について、新たな洞察を明らかにしている。
論文参考訳（メタデータ） (2021-12-09T04:28:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。