論文の概要: SALAD-Pan: Sensor-Agnostic Latent Adaptive Diffusion for Pan-Sharpening
- arxiv url: http://arxiv.org/abs/2602.04473v1
- Date: Wed, 04 Feb 2026 12:01:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-05 19:45:11.515961
- Title: SALAD-Pan: Sensor-Agnostic Latent Adaptive Diffusion for Pan-Sharpening
- Title(参考訳): SALAD-Pan:Pan-Sharpeningのためのセンサ非依存型適応拡散
- Authors: Junjie Li, Congyang Ou, Haokui Zhang, Guoting Wei, Shengqin Jiang, Ying Li, Chunhua Shen,
- Abstract要約: SALAD-Panは、効率的なパンシャーピングのためのセンサ非依存の潜時空間拡散法である。
バンドワイドの単一チャネルVAEを訓練し、高解像度のマルチスペクトル画像をコンパクトな潜在表現に符号化する。
拡散過程における高精度核融合と強いゼロショット(クロスセンサー)能力を実現する。
- 参考スコア(独自算出の注目度): 50.44337053599724
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, diffusion models bring novel insights for Pan-sharpening and notably boost fusion precision. However, most existing models perform diffusion in the pixel space and train distinct models for different multispectral (MS) imagery, suffering from high latency and sensor-specific limitations. In this paper, we present SALAD-Pan, a sensor-agnostic latent space diffusion method for efficient pansharpening. Specifically, SALAD-Pan trains a band-wise single-channel VAE to encode high-resolution multispectral (HRMS) into compact latent representations, supporting MS images with various channel counts and establishing a basis for acceleration. Then spectral physical properties, along with PAN and MS images, are injected into the diffusion backbone through unidirectional and bidirectional interactive control structures respectively, achieving high-precision fusion in the diffusion process. Finally, a lightweight cross-spectral attention module is added to the central layer of diffusion model, reinforcing spectral connections to boost spectral consistency and further elevate fusion precision. Experimental results on GaoFen-2, QuickBird, and WorldView-3 demonstrate that SALAD-Pan outperforms state-of-the-art diffusion-based methods across all three datasets, attains a 2-3x inference speedup, and exhibits robust zero-shot (cross-sensor) capability.
- Abstract(参考訳): 近年、拡散モデルによりパンシャーピングの新たな知見が得られ、特に核融合の精度が向上している。
しかし、既存のほとんどのモデルはピクセル空間で拡散し、異なるマルチスペクトル(MS)画像の異なるモデルを訓練し、高いレイテンシとセンサー固有の制限に悩まされている。
本稿では,センサに依存しない効率的なパンシャーピングのための潜在空間拡散法であるSALAD-Panを提案する。
具体的には、SALAD-Panは、高分解能マルチスペクトル(HRMS)をコンパクトな潜在表現に符号化し、様々なチャネル数でMS画像をサポートし、加速度の基盤を確立するために、バンドワイド単一チャネルVAEを訓練する。
次に、PANおよびMS画像とともにスペクトル物理特性を一方向および双方向の相互制御構造を介して拡散バックボーンに注入し、拡散過程における高精度な融合を実現する。
最後に、拡散モデルの中心層に軽量なクロススペクトルアテンションモジュールを追加し、スペクトルの一貫性を高め、融合精度をさらに高めるためにスペクトル接続を強化する。
GaoFen-2、QuickBird、WorldView-3の実験結果から、SALAD-Panは3つのデータセットすべてで最先端の拡散ベースのメソッドよりも優れており、2~3倍の推論スピードアップを実現し、堅牢なゼロショット(クロスセンサー)能力を示している。
関連論文リスト
- DIFF-MF: A Difference-Driven Channel-Spatial State Space Model for Multi-Modal Image Fusion [51.07069814578009]
マルチモーダル画像融合は、複数のソース画像から補完的な情報を統合して、リッチなコンテンツで高品質な融合画像を生成することを目的としている。
マルチモーダル画像融合のための差動駆動型チャネル空間空間モデルDIFF-MFを提案する。
本手法は,視覚的品質と定量的評価の両方において,既存の手法よりも優れている。
論文 参考訳(メタデータ) (2026-01-09T05:26:54Z) - FOD-Diff: 3D Multi-Channel Patch Diffusion Model for Fiber Orientation Distribution [48.932538822216436]
単殻低角分解能dMRI(LAR-FOD)からFODを推定するのに対し、多殻高角分解能dMRI(HAR-FOD)からFODを推定するには長い走査時間が必要である。
LAR-FODからHAR-FODを予測するための3次元マルチチャネルパッチ拡散モデルを提案する。
提案手法は,HAR-FOD予測における最高の性能を達成し,他の最先端手法よりも優れる。
論文 参考訳(メタデータ) (2025-12-18T01:51:05Z) - CHORDS: Diffusion Sampling Accelerator with Multi-core Hierarchical ODE Solvers [72.23291099555459]
拡散に基づく生成モデルは、高忠実度画像やビデオの主要な生成元となっているが、計算コストのかかる推論手順によって制限されている。
本稿では,マルチコア並列処理による一般,トレーニング不要,モデルに依存しない高速化戦略について検討する。
ChoRDSは様々な大規模画像およびビデオ拡散モデルのサンプリングを著しく加速し、4コアで2.1倍のスピードアップを実現し、ベースラインで50%改善し、8コアで2.9倍のスピードアップを実現した。
論文 参考訳(メタデータ) (2025-07-21T05:48:47Z) - Kernel Space Diffusion Model for Efficient Remote Sensing Pansharpening [8.756657890124766]
Kernel Space Diffusion Model (KSDiff)は、グローバルな文脈情報に富んだ畳み込みカーネルを生成するために、潜在空間における拡散プロセスを活用する新しいアプローチである。
WorldView-3、GaoFen-2、QuickBirdを含む広く使われている3つのデータセットの実験では、KSDiffの質的かつ定量的に優れた性能が示されている。
論文 参考訳(メタデータ) (2025-05-25T06:25:31Z) - SSDiff: Spatial-spectral Integrated Diffusion Model for Remote Sensing Pansharpening [14.293042131263924]
本稿では,空間スペクトル統合拡散モデルを導入し,リモートセンシングパンシャーピングタスクであるSSDiffについて述べる。
SSDiffは、パンシャルペン過程を部分空間分解の観点から、空間成分とスペクトル成分の融合過程とみなしている。
論文 参考訳(メタデータ) (2024-04-17T16:30:56Z) - DifFUSER: Diffusion Model for Robust Multi-Sensor Fusion in 3D Object Detection and BEV Segmentation [34.42067276754897]
DifFは3次元オブジェクト検出とBEVマップセグメンテーションにおける多モード融合のための拡散モデルを利用する新しいアプローチである。
DifFは拡散の固有のノイズ発生特性から利点を生かし、センサーの故障時にセンサーの特徴を洗練または合成することができる。
論文 参考訳(メタデータ) (2024-04-06T13:25:29Z) - Smooth Diffusion: Crafting Smooth Latent Spaces in Diffusion Models [82.8261101680427]
滑らかな潜伏空間は、入力潜伏空間上の摂動が出力画像の定常的な変化に対応することを保証している。
この特性は、画像の反転、反転、編集を含む下流タスクにおいて有益である。
スムース拡散(Smooth Diffusion, Smooth Diffusion)は, 高速かつスムーズな拡散モデルである。
論文 参考訳(メタデータ) (2023-12-07T16:26:23Z) - ToddlerDiffusion: Interactive Structured Image Generation with Cascaded Schrödinger Bridge [63.00793292863]
ToddlerDiffusionは、RGB画像生成の複雑なタスクを、よりシンプルで解釈可能なステージに分解するための新しいアプローチである。
提案手法はToddler Diffusionと呼ばれ,それぞれが中間表現を生成する責務を担っている。
ToddlerDiffusionは、常に最先端のメソッドより優れています。
論文 参考訳(メタデータ) (2023-11-24T15:20:01Z) - DiffUCD:Unsupervised Hyperspectral Image Change Detection with Semantic
Correlation Diffusion Model [46.68717345017946]
ハイパースペクトル画像変化検出(HSI-CD)はリモートセンシングにおいて重要な研究領域となっている。
意味相関拡散モデル(DiffUCD)を用いた新しい教師なしHSI-CDを提案する。
提案手法は,多数のサンプルを必要とする完全教師付き手法に匹敵する結果が得られる。
論文 参考訳(メタデータ) (2023-05-21T09:21:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。