論文の概要: ResPanDiff: Diffusion Model for Pansharpening by Inferring Residual Inference
- arxiv url: http://arxiv.org/abs/2501.05091v2
- Date: Fri, 10 Jan 2025 08:43:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-13 12:07:28.044848
- Title: ResPanDiff: Diffusion Model for Pansharpening by Inferring Residual Inference
- Title(参考訳): ResPanDiff:残差推定によるパンハーペン拡散モデル
- Authors: Shiqi Cao, Liangjian Deng, Shangqi Deng,
- Abstract要約: ResPanDiff(ResPanDiff)を用いたパンシャーピングのための拡散モデルを提案する。
ResPanDiffは、パンシャーピングタスクに取り組むパフォーマンスを犠牲にすることなく、拡散ステップの数を著しく削減する。
提案手法は最近の最先端技術(SOTA)と比較して優れた結果が得られることを示す。
- 参考スコア(独自算出の注目度): 8.756657890124766
- License:
- Abstract: The implementation of diffusion-based pansharpening task is predominantly constrained by its slow inference speed, which results from numerous sampling steps. Despite the existing techniques aiming to accelerate sampling, they often compromise performance when fusing multi-source images. To ease this limitation, we introduce a novel and efficient diffusion model named Diffusion Model for Pansharpening by Inferring Residual Inference (ResPanDiff), which significantly reduces the number of diffusion steps without sacrificing the performance to tackle pansharpening task. In ResPanDiff, we innovatively propose a Markov chain that transits from noisy residuals to the residuals between the LRMS and HRMS images, thereby reducing the number of sampling steps and enhancing performance. Additionally, we design the latent space to help model extract more features at the encoding stage, Shallow Cond-Injection~(SC-I) to help model fetch cond-injected hidden features with higher dimensions, and loss functions to give a better guidance for the residual generation task. enabling the model to achieve superior performance in residual generation. Furthermore, experimental evaluations on pansharpening datasets demonstrate that the proposed method achieves superior outcomes compared to recent state-of-the-art~(SOTA) techniques, requiring only 15 sampling steps, which reduces over $90\%$ step compared with the benchmark diffusion models. Our experiments also include thorough discussions and ablation studies to underscore the effectiveness of our approach.
- Abstract(参考訳): 拡散に基づくパンシャルペニングタスクの実装は、多くのサンプリングステップの結果、その遅い推論速度によって主に制約される。
サンプリングを高速化する既存の技術にもかかわらず、複数のソースイメージを融合する際の性能を損なうことがしばしばある。
この制限を緩和するために,ResPanDiff(Residual Inference)によるパンシャーピングのための拡散モデル(Diffusion Model for Pansharpening)を提案する。
ResPanDiff では,ノイズ残差から LRMS 画像と HRMS 画像間の残差へ遷移するマルコフ連鎖を革新的に提案する。
さらに,符号化段階におけるさらなる特徴の抽出を支援するために潜在空間を設計し,より高次元のコンドインジェクション付き隠れ特徴のフェッチを支援するためにSC-I(Shallow Cond-Injection~)と,残余生成タスクのより良いガイダンスを提供するためのロス関数を設計する。
モデルが残余生成において優れた性能を達成できるようにする。
さらに, パンシャーペニングデータセットを用いた実験結果から, 提案手法は最近の最先端技術(SOTA)技術よりも優れた結果が得られ, サンプリングステップは15ステップしか必要とせず, ベンチマークモデルと比較して90 %以上のステップを削減できることがわかった。
我々の実験には、我々のアプローチの有効性を評価するための徹底的な議論とアブレーション研究も含まれています。
関連論文リスト
- One Step Diffusion-based Super-Resolution with Time-Aware Distillation [60.262651082672235]
拡散に基づく画像超解像(SR)法は,低解像度画像から細部まで細部まで,高解像度画像の再構成に有望であることを示す。
近年,拡散型SRモデルの知識蒸留によるサンプリング効率の向上が試みられている。
我々は,効率的な画像超解像を実現するため,TAD-SRというタイムアウェア拡散蒸留法を提案する。
論文 参考訳(メタデータ) (2024-08-14T11:47:22Z) - Distilling Diffusion Models into Conditional GANs [90.76040478677609]
複雑な多段階拡散モデルを1段階条件付きGAN学生モデルに蒸留する。
E-LatentLPIPSは,拡散モデルの潜在空間で直接動作する知覚的損失である。
我々は, 最先端の1ステップ拡散蒸留モデルよりも優れた1ステップ発生器を実証した。
論文 参考訳(メタデータ) (2024-05-09T17:59:40Z) - Efficient Diffusion Model for Image Restoration by Residual Shifting [63.02725947015132]
本研究では,画像復元のための新しい,効率的な拡散モデルを提案する。
提案手法は,推論中の後処理の高速化を回避し,関連する性能劣化を回避する。
提案手法は,3つの古典的IRタスクにおける現在の最先端手法よりも優れた,あるいは同等の性能を実現する。
論文 参考訳(メタデータ) (2024-03-12T05:06:07Z) - Decoupled Data Consistency with Diffusion Purification for Image Restoration [15.043002968696978]
本稿では,データ整合性ステップから逆処理を分離することで問題に対処する拡散型画像復元法を提案する。
我々の手法は多目的性を示し、潜在空間における効率的な問題解決に高い適応性を与える。
提案手法の有効性は,画像のデノイング,デブロアリング,インペイント,超解像など,画像修復作業における総合的な実験を通じて検証される。
論文 参考訳(メタデータ) (2024-03-10T00:47:05Z) - SinSR: Diffusion-Based Image Super-Resolution in a Single Step [119.18813219518042]
拡散モデルに基づく超解像(SR)法は有望な結果を示す。
しかし、それらの実践的応用は、必要な推論ステップのかなりの数によって妨げられている。
本稿では,SinSRという単一ステップのSR生成を実現するための,シンプルで効果的な手法を提案する。
論文 参考訳(メタデータ) (2023-11-23T16:21:29Z) - ResShift: Efficient Diffusion Model for Image Super-resolution by
Residual Shifting [70.83632337581034]
拡散に基づく画像超解像法(SR)は主に低推論速度によって制限される。
本稿では,SRの拡散段数を大幅に削減する新しい,効率的な拡散モデルを提案する。
本手法は,残差をシフトすることで高分解能画像と低分解能画像の間を移動させるマルコフ連鎖を構成する。
論文 参考訳(メタデータ) (2023-07-23T15:10:02Z) - Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。
本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T03:08:28Z) - Come-Closer-Diffuse-Faster: Accelerating Conditional Diffusion Models
for Inverse Problems through Stochastic Contraction [31.61199061999173]
拡散モデルには重要な欠点がある。純粋なガウスノイズから画像を生成するために数千ステップの反復を必要とするため、サンプリングが本質的に遅い。
ガウスノイズから始めることは不要であることを示す。代わりに、より優れた初期化を伴う単一前方拡散から始めると、逆条件拡散におけるサンプリングステップの数を大幅に減少させる。
ComeCloser-DiffuseFaster (CCDF)と呼ばれる新しいサンプリング戦略は、逆問題に対する既存のフィードフォワードニューラルネットワークアプローチが拡散モデルと相乗的に組み合わせられる方法について、新たな洞察を明らかにしている。
論文 参考訳(メタデータ) (2021-12-09T04:28:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。