論文の概要: R2H-Diff: Guided Spectral Diffusion Model for RGB-to-Hyperspectral Reconstruction
- arxiv url: http://arxiv.org/abs/2605.05688v1
- Date: Thu, 07 May 2026 05:28:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.530924
- Title: R2H-Diff: Guided Spectral Diffusion Model for RGB-to-Hyperspectral Reconstruction
- Title(参考訳): R2H-Diff:RGB-ハイパースペクトル再構成のための誘導スペクトル拡散モデル
- Authors: Songyu Ding, Ronggiang Zhao, Mingchun Sun, Jie Liu,
- Abstract要約: RGB-to-HSI再構成に適した効率的な拡散ベースフレームワークであるR2H-Diffを提案する。
R2H-Diffは、条件付き反復精製プロセスとしてスペクトル回復を定式化し、RGB誘導の下で進行的再構成を可能にする。
NTIRE2022、CAVE、Harvardの実験では、R2H-Diffは再構成品質と計算効率のバランスが良好であることを実証している。
- 参考スコア(独自算出の注目度): 3.6195340076207447
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: RGB-to-hyperspectral image reconstruction is a highly ill-posed inverse problem, since multiple plausible spectral distributions may correspond to the same RGB observation. Existing regression-based methods usually learn a deterministic mapping, which limits their ability to model reconstruction uncertainty and often leads to over-smoothed spectral responses. Although diffusion models provide strong distribution modeling capability, their direct application to hyperspectral reconstruction remains challenging due to the high spectral dimensionality, strong inter-band correlations, and strict requirement for spectral fidelity. To this end, we propose R2H-Diff, an efficient diffusion-based framework tailored for RGB-to-HSI reconstruction. Specifically, R2H-Diff formulates spectral recovery as a conditional iterative refinement process, enabling progressive reconstruction under RGB guidance. We proposed a Guided Spectral Refinement Module for RGB-conditioned feature fusion and a Hyperspectral-Adaptive Transposed Attention module for efficient spatial--spectral dependency modeling. Furthermore, a normalization-free denoising backbone is adopted to preserve spectral amplitude consistency, while a task-adapted linear noise schedule enables high-quality reconstruction with only five denoising steps. Extensive experiments on NTIRE2022, CAVE, and Harvard demonstrate that R2H-Diff achieves a favorable balance between reconstruction quality and computational efficiency. Notably, on NTIRE2022, R2H-Diff obtains 35.37 dB PSNR with a sub-million-parameter model of 0.58M parameters and 12.25G FLOPs, achieving the lowest model complexity among the evaluated methods while maintaining strong reconstruction fidelity.
- Abstract(参考訳): RGB-ハイパースペクトル画像再構成は、複数の可視スペクトル分布が同じRGB観測に対応する可能性があるため、非常に不適切な逆問題である。
既存の回帰に基づく手法は通常、決定論的マッピングを学習するが、これは再構成の不確実性をモデル化する能力を制限するものであり、しばしば過度に平滑なスペクトル応答をもたらす。
拡散モデルは強い分布モデリング機能を提供するが、高スペクトル次元、強いバンド間相関、スペクトル忠実性の厳密な要求により、超スペクトル再構成への直接的適用は依然として困難である。
そこで本研究では,RGB-to-HSI再構成に適した効率的な拡散ベースフレームワークであるR2H-Diffを提案する。
具体的には、R2H-Diffはスペクトル回復を条件付き反復精製法として定式化し、RGB誘導による進行的再構成を可能にする。
我々は,RGB条件による特徴核融合のためのガイド付きスペクトル再構成モジュールと,空間-スペクトル依存性の効率的なモデリングのためのハイパースペクトル適応変換アテンションモジュールを提案する。
さらに、スペクトル振幅の整合性を維持するために正規化不要な復調バックボーンが採用され、タスク適応線形雑音スケジュールは、5段階のみの復調を可能とした。
NTIRE2022、CAVE、Harvardの大規模な実験により、R2H-Diffは再構成品質と計算効率のバランスが良好であることが示された。
特に NTIRE2022 では、R2H-Diff は 0.58M パラメータと 12.25G FLOPs のサブミリオンパラメータモデルで 35.37 dB PSNR を取得し、高い再現率を維持しながら評価方法の中で最低のモデル複雑性を達成している。
関連論文リスト
- SR$^{2}$-Net: A General Plug-and-Play Model for Spectral Refinement in Hyperspectral Image Super-Resolution [3.4888894498274747]
HSI-SRは、スペクトル的に忠実で物理的に妥当な特性を維持しながら、空間分解能を高めることを目的としている。
これらの方法はしばしばバンド間のスペクトルの一貫性を無視し、刺激的な振動と物理的に不可解な人工物をもたらす。
本稿では,この問題に対処するための軽量なプラグ・アンド・プレイ方式であるSpectral Rectification Super-Resolution Network (SR$2$-Net)を提案する。
論文 参考訳(メタデータ) (2026-01-29T07:00:00Z) - Latent Harmony: Synergistic Unified UHD Image Restoration via Latent Space Regularization and Controllable Refinement [89.99237142387655]
LH-VAEを導入し、視覚的意味的制約や進行的劣化による意味的堅牢性を高める。
Latent Harmonyは、UHD修復のためのVAEを再定義する2段階のフレームワークである。
実験により、Latent HarmonyはUHDおよび標準解像度タスクにまたがって最先端のパフォーマンスを実現し、効率、知覚品質、再現精度を効果的にバランスさせることが示されている。
論文 参考訳(メタデータ) (2025-10-09T08:54:26Z) - Hybrid Deep Learning for Hyperspectral Single Image Super-Resolution [9.467214671383875]
本稿では,標準的な2次元畳み込みアーキテクチャにシームレスに統合可能な新しいモジュールであるSpectral-Spatial Unmixing Fusion (SSUF)を紹介する。
SSUFはスペクトルアンミックスとスペクトル空間特徴抽出を組み合わせ、ResNetベースの畳み込みニューラルネットワークを誘導して再構成を改善する。
3つのパブリックリモートセンシングハイパースペクトルデータセットの実験は、提案したハイブリッドディープラーニングモデルが競合性能を達成することを示す。
論文 参考訳(メタデータ) (2025-09-26T08:28:07Z) - RGB Pre-Training Enhanced Unobservable Feature Latent Diffusion Model for Spectral Reconstruction [16.54284634377436]
スペクトル構造表現学習とスペクトル-空間共分散学習からなる2段階パイプラインを提案する。
第1段階では、スペクトル可観測特徴オートエンコーダ(SpeUAE)を訓練し、その可観測特徴をRGB空間に整列した3次元多様体に抽出し圧縮する。
その後、ULDMを取得し、対応するRGB画像からのガイダンスで符号化された観測不能な特徴の分布をモデル化する。
論文 参考訳(メタデータ) (2025-07-17T10:07:32Z) - FRN: Fractal-Based Recursive Spectral Reconstruction Network [32.54705293932158]
スペクトル再構成は、RGB画像からのハイパースペクトル画像(HSI)のコストを大幅に削減することができる。
スペクトル再構成をプログレッシブなプロセスとして扱うフラクタルベース再帰スペクトル再構成ネットワーク(FRN)を提案する。
FRNは, 定量評価と定性評価の両方において, 最先端手法と比較して, 再現性に優れる。
論文 参考訳(メタデータ) (2025-05-21T12:20:59Z) - Unleashing Correlation and Continuity for Hyperspectral Reconstruction from RGB Images [64.80875911446937]
RGB画像からのHSI再構成のための相関連続性ネットワーク(CCNet)を提案する。
局所スペクトルの相関について,GrSCM(Group-wise Spectral correlation Modeling)モジュールを紹介する。
グローバルスペクトルの連続性のために、我々はNeSCMモジュールを設計する。
論文 参考訳(メタデータ) (2025-01-02T15:14:40Z) - Contourlet Refinement Gate Framework for Thermal Spectrum Distribution Regularized Infrared Image Super-Resolution [54.293362972473595]
画像超解像(SR)は、高解像度(HR)画像を低解像度(LR)画像から再構成することを目的としている。
SRタスクに対処する現在のアプローチは、RGB画像の特徴を抽出するか、同様の劣化パターンを仮定するものである。
スペクトル分布の忠実さを保ちつつ、赤外線変調特性を復元するコントゥーレット改質ゲートフレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-19T14:24:03Z) - Tuning IR-cut Filter for Illumination-aware Spectral Reconstruction from
RGB [84.1657998542458]
再現精度は、使用中のRGBカメラのスペクトル応答に大きく依存していることが証明されている。
本稿では,既存のrgbカメラのフィルタアレイに基づくカラーイメージング機構を調査し,irカットフィルタの設計方法を提案する。
論文 参考訳(メタデータ) (2021-03-26T19:42:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。