論文の概要: FSCM: Frequency-Enhanced Spatial-Spectral Coupled Mamba for Infrared Hyperspectral Image Colorization
- arxiv url: http://arxiv.org/abs/2605.15880v1
- Date: Wed, 13 May 2026 15:48:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-18 21:22:26.273003
- Title: FSCM: Frequency-Enhanced Spatial-Spectral Coupled Mamba for Infrared Hyperspectral Image Colorization
- Title(参考訳): FSCM:赤外線ハイパースペクトル画像色化のための周波数強調空間スペクトル結合型マンバ
- Authors: Tingting Liu, Yuan Liu, Guiping Chen, Xiubao Sui, Qian Chen,
- Abstract要約: 本稿では、赤外色化のためのスペクトル情報誘導型GANフレームワークを提案する。
FSCM内では、カスケードFSBユニットからなる周波数増幅空間スペクトル状態空間ジェネレータが構築される。
実験により、FSCMは、視覚的品質と意味的忠実度において、既存の赤外色化法よりも優れていることが示された。
- 参考スコア(独自算出の注目度): 10.509841173943387
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Thermal infrared imaging is robust to illumination variations and smoke interference, making it important for all-weather perception. However, the lack of natural color and fine texture limits target recognition, human visual interpretation, and the transfer of visible-light models. Existing infrared colorization methods mainly rely on single-band images, where insufficient spectral cues may lead to structural distortion and semantic confusion. Although infrared hyperspectral images provide rich spectral responses and material information, existing single-band frameworks remain limited in modeling spatial-spectral coupling and weak texture details. To address these issues, this paper presents FSCM, a spectral-information-guided GAN framework. Within FSCM, a frequency-enhanced spatial-spectral state-space generator composed of cascaded FSB units is constructed. Each FSB integrates three complementary components: state-space modeling captures global spatial-spectral dependencies; the frequency enhancement module (FEM) combines multi-level wavelet decomposition and Fourier gating to recover structural contours, directional high-frequency details, and global frequency responses; and the dual-stream hybrid gating module (DGM) integrates deformation-aware sampling with sparse attention to enhance effective local structures and suppress background interference. Additionally, an online semantic segmentation-guided loss is introduced to constrain the generated results, improving semantic consistency in complex road scenes. Experiments show that FSCM outperforms existing infrared colorization methods in visual quality and semantic fidelity.
- Abstract(参考訳): 熱赤外イメージングは照明のバリエーションや煙の干渉に対して堅牢であり、全天候の知覚にとって重要である。
しかし、自然色や微妙なテクスチャの欠如は、目標認識、人間の視覚的解釈、可視光モデルの伝達を制限している。
既存の赤外線カラー化法は主に単一帯域画像に依存しており、スペクトルが不足すると構造歪みや意味的混乱が生じる可能性がある。
赤外線ハイパースペクトル画像は、豊富なスペクトル応答と物質情報を提供するが、既存の単一バンドフレームワークは、空間-スペクトル結合と弱いテクスチャの詳細をモデル化するのに制限されている。
これらの問題に対処するために,スペクトル情報誘導型GANフレームワークFSCMを提案する。
FSCM内では、カスケードFSBユニットからなる周波数増幅空間スペクトル状態空間ジェネレータが構築される。
各FSBは3つの相補的なコンポーネントを統合する: 状態空間モデリングは、大域的空間スペクトル依存性をキャプチャする; 周波数拡張モジュール(FEM)は、マルチレベルウェーブレット分解とフーリエゲーティングを組み合わせて、構造輪郭、指向性高周波詳細、および大域的周波数応答を復元する; デュアルストリームハイブリッドゲーティングモジュール(DGM)は、変形認識サンプリングとスパースアテンションを統合し、効果的な局所構造を増強し、バックグラウンド干渉を抑制する。
さらに、オンラインセマンティックセグメンテーション誘導損失を導入して、生成された結果を制約し、複雑な道路シーンにおけるセマンティック一貫性を向上させる。
実験により、FSCMは、視覚的品質と意味的忠実度において、既存の赤外色化法よりも優れていることが示された。
関連論文リスト
- AnyBand-Diff: A Unified Remote Sensing Image Generation and Band Repair Framework with Spectral Priors [10.352581041881864]
本稿では,頑健なスペクトル再構成に適したスペクトル優先拡散フレームワークであるAnyBand-Diffを紹介する。
ラジオメトリックの忠実性を確保するため,物理誘導サンプリング機構を提案する。
実験は、AnyBand-Diffが信頼できる画像を生成するための有効性を確認する。
論文 参考訳(メタデータ) (2026-05-14T04:04:34Z) - Phy-CoSF: Physics-Guided Continuous Spectral Fields Reconstruction and Super-Resolution for Snapshot Compressive Imaging [79.35520607451187]
暗黙のニューラル表現で深層展開ネットワークを相乗化するPhy-CoSFを提案する。
具体的には、連続的なスペクトルレンダリングで離散波長トレーニングをブリッジする2相アーキテクチャを提案する。
論文 参考訳(メタデータ) (2026-05-13T14:17:02Z) - S2ML: Spatio-Spectral Mutual Learning for Depth Completion [56.26679539288063]
RGB-Dカメラで撮影した生深度画像は、弱い反射、境界影、アーティファクトによって不完全な深度値に悩まされることが多い。
既存の手法では、画像領域の深度補完によってこの問題に対処するが、それらは生の深度画像の物理的特性を見落としている。
本研究では,空間領域と周波数領域の両方の利点を両立させるため,S2ML(Spatio-Spectral Mutual Learning framework)を提案する。
論文 参考訳(メタデータ) (2025-11-08T15:01:55Z) - MTSIC: Multi-stage Transformer-based GAN for Spectral Infrared Image Colorization [26.33768545616346]
既存のカラー化手法は、スペクトル情報に制限があり、特徴抽出能力が不十分なシングルバンド画像に依存している。
本稿では、スペクトル情報を統合し、赤外線画像のカラー化を強化するために、GAN(Generative Adversarial Network)ベースのフレームワークを提案する。
実験の結果,提案手法は従来の手法よりも優れ,赤外線画像の視覚的品質を効果的に向上させることがわかった。
論文 参考訳(メタデータ) (2025-06-21T01:42:25Z) - PAD: Phase-Amplitude Decoupling Fusion for Multi-Modal Land Cover Classification [49.37555541088792]
位相振幅デカップリング(PAD)は、位相(モダリティ共有)と振幅(モダリティ補完)を分離する周波数対応のフレームワークである。
この研究は、リモートセンシングにおける物理を意識したマルチモーダル融合の新しいパラダイムを確立する。
論文 参考訳(メタデータ) (2025-04-27T07:21:42Z) - FUSION: Frequency-guided Underwater Spatial Image recOnstructioN [0.0]
水中画像は、色歪み、可視性低下、波長依存性の減衰と散乱による構造的詳細の喪失など、深刻な劣化に悩まされている。
既存の拡張手法は主に空間領域処理に重点を置いており、グローバルな色分布と長距離依存を捉える周波数領域の可能性を無視している。
本稿では,空間領域情報と周波数領域情報を併用した2領域深層学習フレームワーク「フュージョン」を提案する。
論文 参考訳(メタデータ) (2025-04-01T23:16:19Z) - Unleashing Correlation and Continuity for Hyperspectral Reconstruction from RGB Images [64.80875911446937]
RGB画像からのHSI再構成のための相関連続性ネットワーク(CCNet)を提案する。
局所スペクトルの相関について,GrSCM(Group-wise Spectral correlation Modeling)モジュールを紹介する。
グローバルスペクトルの連続性のために、我々はNeSCMモジュールを設計する。
論文 参考訳(メタデータ) (2025-01-02T15:14:40Z) - Contourlet Refinement Gate Framework for Thermal Spectrum Distribution Regularized Infrared Image Super-Resolution [54.293362972473595]
画像超解像(SR)は、高解像度(HR)画像を低解像度(LR)画像から再構成することを目的としている。
SRタスクに対処する現在のアプローチは、RGB画像の特徴を抽出するか、同様の劣化パターンを仮定するものである。
スペクトル分布の忠実さを保ちつつ、赤外線変調特性を復元するコントゥーレット改質ゲートフレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-19T14:24:03Z) - A Dual Domain Multi-exposure Image Fusion Network based on the
Spatial-Frequency Integration [57.14745782076976]
マルチ露光画像融合は、異なる露光で画像を統合することにより、単一の高ダイナミック画像を生成することを目的としている。
本稿では,MEF-SFI と呼ばれる空間周波数統合フレームワークによるマルチ露光画像融合の新たな視点を提案する。
提案手法は,最先端のマルチ露光画像融合手法に対する視覚的近似核融合結果を実現する。
論文 参考訳(メタデータ) (2023-12-17T04:45:15Z) - RSFDM-Net: Real-time Spatial and Frequency Domains Modulation Network
for Underwater Image Enhancement [5.3240763486073055]
水中画像における色や細部を効率的に拡張するためのリアルタイム空間・周波数領域変調ネットワーク(RSFDM-Net)を提案する。
提案した条件付きネットワークは,適応フーリエゲーティング機構 (AFGM) とマルチスケール・コントラルアテンションモジュール (MCAM) を用いて設計されている。
画像のカラーキャストと低彩度をより正確に補正するために、一次ネットに3分岐特徴抽出(TFE)ブロックを導入する。
論文 参考訳(メタデータ) (2023-02-23T17:27:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。