論文の概要: Uncertainty-aware Spatial-Frequency Registration and Fusion for Infrared and Visible Images
- arxiv url: http://arxiv.org/abs/2605.13049v1
- Date: Wed, 13 May 2026 06:12:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:27.839748
- Title: Uncertainty-aware Spatial-Frequency Registration and Fusion for Infrared and Visible Images
- Title(参考訳): 近赤外・可視画像における不確実性を考慮した空間周波数登録と融合
- Authors: Xingyuan Li, Haoyuan Xu, Xingyue Zhu, Jun Ma, Yang Zou, Zhiying Jiang, Jinyuan Liu,
- Abstract要約: Infrared and Visible Image Fusion (IVIF)は、挑戦的な環境下での視覚的タスクにおいて有望であることを示す。
これらを解決するための現在の研究は、粗い粒度(粗い粒度と粗い粒度)の変形パラメータを予測するか、複数スケールで変形場を推定するかのどちらかである。
本研究では,不確実性推定と赤外線放射分布の整合性を考慮した空間周波数登録・融合フレームワークを提案する。
- 参考スコア(独自算出の注目度): 18.12337107064327
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Infrared and Visible Image Fusion (IVIF) has shown promise in visual tasks under challenging environments, but fusion under unregistered conditions faces inherent misalignments. Current studies to solve them either predict the deformation parameters coarse-to-fine (i.e., coarse registration and fine registration) or estimate the deformation fields in multi-scales for registration. Though straightforward, they overlook the cumulative errors in registration, which contaminate the fusion stage and severely deteriorate the resulting images. We introduce the Spatial-Frequency Registration and Fusion (SFRF) framework, which incorporates uncertainty estimation and infrared thermal radiation distribution consistency into a unified pipeline to handle the error accumulation for robust registration and fusion across both spatial and frequency domains. Specifically, SFRF constructs a Multi-scale Iterative Registration (MIR) framework that iteratively refines the deformation field across scales, leveraging uncertainty estimation at each stage to mitigate error accumulation and enhance alignment accuracy dynamically. To ensure the accurate alignment of infrared thermal distributions during registration, thermal radiation distribution consistency is employed as a frequency-domain supervisory signal, promoting global consistency in the frequency domain. Based on the spatial-frequency alignment, SFRF further adopts a Dual-branch Spatial-Frequency Fusion (DSFF) module, which incorporates spatial geometric features and frequency distribution information to reconstruct visually appealing images. SFRF achieves impressive performance across diverse datasets.
- Abstract(参考訳): Infrared and Visible Image Fusion (IVIF) は、困難な環境下での視覚的タスクにおいて、将来性を示すが、登録されていない条件下での融合は固有の不適応に直面している。
これらを解決するための現在の研究は、粗い粒度(粗い粒度と粗い粒度)の変形パラメータを予測するか、複数スケールで変形場を推定するかのどちらかである。
単純なことではあるが、彼らは累積誤差を見落とし、融合ステージを汚染し、その結果のイメージを著しく悪化させる。
本研究では、不確実性推定と赤外線熱放射分布の整合性を統合パイプラインに組み込んだ空間周波数登録・融合(SFRF)フレームワークを導入する。
具体的には,マルチスケール反復登録(MIR)フレームワークを構築し,各段階における不確実性推定を利用して誤りの蓄積を軽減し,アライメント精度を動的に向上する。
登録中の赤外線熱分布の正確なアライメントを確保するため、周波数領域監視信号として熱放射分布の整合性を使用し、周波数領域における大域的整合性を促進する。
この空間周波数アライメントに基づいて、SFRFはさらに、空間幾何学的特徴と周波数分布情報を組み込んだDual-branch Space-Frequency Fusion (DSFF)モジュールを採用して、視覚的に魅力的な画像を再構成する。
SFRFは多様なデータセット間で素晴らしいパフォーマンスを達成する。
関連論文リスト
- Alignment-Aware and Reliability-Gated Multimodal Fusion for Unmanned Aerial Vehicle Detection Across Heterogeneous Thermal-Visual Sensors [6.686898063543218]
本研究は,Registration-Aware Guided Image Fusion (RGIF)とReliability-Gated Modality-Attention Fusion (RGMAF)の2つの融合戦略を紹介する。
RGIFは拡張相関係数(ECC)ベースのアフィン登録とガイドフィルターを組み合わせて熱塩分濃度を維持しながら構造的詳細を増強する。
RGMAFは、アフィンと光フローの登録と、熱コントラストと視覚的シャープネスを適応的にバランスさせる信頼性の高い注意機構を統合する。
論文 参考訳(メタデータ) (2026-03-09T10:39:26Z) - Iterative Inference-time Scaling with Adaptive Frequency Steering for Image Super-Resolution [75.3690742776891]
適応周波数ステアリング(IAFS)を用いた反復拡散推論時間スケーリングを提案する。
IAFSは、構造的偏差の反復的補正によって生成した画像を徐々に精細化することで、知覚品質と構造的忠実性のバランスをとるという課題に対処する。
実験の結果、IAFSは知覚と忠実性の対立を効果的に解決し、知覚の細部と構造的精度を一貫して改善し、既存の推論時間スケーリング手法よりも優れていた。
論文 参考訳(メタデータ) (2025-12-29T15:09:20Z) - Morphing Through Time: Diffusion-Based Bridging of Temporal Gaps for Robust Alignment in Change Detection [51.56484100374058]
既存の変更検出ネットワークを変更することなく空間的・時間的ロバスト性を改善するモジュールパイプラインを導入する。
拡散モジュールは、大きな外観ギャップをブリッジする中間変形フレームを合成し、RoMaは段階的に対応を推定できる。
LEVIR-CD、WHU-CD、DSIFN-CDの実験は、登録精度と下流変化検出の両方において一貫した利得を示した。
論文 参考訳(メタデータ) (2025-11-11T08:40:28Z) - Frequency Domain-Based Diffusion Model for Unpaired Image Dehazing [92.61216319417208]
そこで本稿では,未確認データにおける有益な知識を十分に活用するための,新しい周波数領域ベース拡散モデルを提案する。
拡散モデル(DM)が示す強い生成能力に着想を得て,周波数領域再構成の観点からデハージング課題に取り組む。
論文 参考訳(メタデータ) (2025-07-02T01:22:46Z) - FUSION: Frequency-guided Underwater Spatial Image recOnstructioN [0.0]
水中画像は、色歪み、可視性低下、波長依存性の減衰と散乱による構造的詳細の喪失など、深刻な劣化に悩まされている。
既存の拡張手法は主に空間領域処理に重点を置いており、グローバルな色分布と長距離依存を捉える周波数領域の可能性を無視している。
本稿では,空間領域情報と周波数領域情報を併用した2領域深層学習フレームワーク「フュージョン」を提案する。
論文 参考訳(メタデータ) (2025-04-01T23:16:19Z) - NukesFormers: Unpaired Hyperspectral Image Generation with Non-Uniform Domain Alignment [8.49203851084488]
本研究では,非ペアデータの幾何学的およびスペクトル的分布を整列するために,コントラッシブラーニングを導入する。
二重領域入力の周波数表現をマッピングし、ヌル空間を徹底的にマイニングする。
新たなベンチマークをUnHIGで確立している。
論文 参考訳(メタデータ) (2025-03-10T07:38:46Z) - Improving Misaligned Multi-modality Image Fusion with One-stage
Progressive Dense Registration [67.23451452670282]
多モード画像間の相違は、画像融合の課題を引き起こす。
マルチスケールプログレッシブ・センス・レジストレーション方式を提案する。
このスキームは、一段階最適化のみで粗大な登録を行う。
論文 参考訳(メタデータ) (2023-08-22T03:46:24Z) - Breaking Modality Disparity: Harmonized Representation for Infrared and
Visible Image Registration [66.33746403815283]
シーン適応型赤外線と可視画像の登録を提案する。
我々は、異なる平面間の変形をシミュレートするためにホモグラフィーを用いる。
我々は、まず、赤外線と可視画像のデータセットが不一致であることを示す。
論文 参考訳(メタデータ) (2023-04-12T06:49:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。