論文の概要: HATIR: Heat-Aware Diffusion for Turbulent Infrared Video Super-Resolution
- arxiv url: http://arxiv.org/abs/2601.04682v1
- Date: Thu, 08 Jan 2026 07:49:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 17:01:53.084311
- Title: HATIR: Heat-Aware Diffusion for Turbulent Infrared Video Super-Resolution
- Title(参考訳): HATIR: 乱流赤外ビデオ超解像のための熱認識拡散
- Authors: Yang Zou, Xingyue Zhu, Kaiqi Han, Jun Ma, Xingyuan Li, Zhiying Jiang, Jinyuan Liu,
- Abstract要約: 既存のビデオ超解像法 (VSR) は、赤外線と可視像の固有のモード差を無視したり、乱流による歪みの回復に失敗したりする。
乱流赤外ビデオスーパーリゾリューションのための熱認識拡散法を導入し, 拡散サンプリング経路に熱認識変形先行を注入する。
FLIR-IVSRは、FLIR T1050scカメラから一対のLR-HRシーケンスを合成した、乱流赤外VSRの最初のデータセットである。
- 参考スコア(独自算出の注目度): 17.384587661698028
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Infrared video has been of great interest in visual tasks under challenging environments, but often suffers from severe atmospheric turbulence and compression degradation. Existing video super-resolution (VSR) methods either neglect the inherent modality gap between infrared and visible images or fail to restore turbulence-induced distortions. Directly cascading turbulence mitigation (TM) algorithms with VSR methods leads to error propagation and accumulation due to the decoupled modeling of degradation between turbulence and resolution. We introduce HATIR, a Heat-Aware Diffusion for Turbulent InfraRed Video Super-Resolution, which injects heat-aware deformation priors into the diffusion sampling path to jointly model the inverse process of turbulent degradation and structural detail loss. Specifically, HATIR constructs a Phasor-Guided Flow Estimator, rooted in the physical principle that thermally active regions exhibit consistent phasor responses over time, enabling reliable turbulence-aware flow to guide the reverse diffusion process. To ensure the fidelity of structural recovery under nonuniform distortions, a Turbulence-Aware Decoder is proposed to selectively suppress unstable temporal cues and enhance edge-aware feature aggregation via turbulence gating and structure-aware attention. We built FLIR-IVSR, the first dataset for turbulent infrared VSR, comprising paired LR-HR sequences from a FLIR T1050sc camera (1024 X 768) spanning 640 diverse scenes with varying camera and object motion conditions. This encourages future research in infrared VSR. Project page: https://github.com/JZ0606/HATIR
- Abstract(参考訳): 赤外線ビデオは、困難な環境下での視覚的なタスクに大きな関心を集めてきたが、しばしば激しい大気の乱流と圧縮劣化に悩まされている。
既存のビデオ超解像法 (VSR) は、赤外線と可視像の固有のモード差を無視したり、乱流による歪みの回復に失敗したりする。
VSR法による直接カスケード乱流緩和 (TM) アルゴリズムは, 乱流と分解の分解の非結合モデリングにより, 誤差の伝播と蓄積を引き起こす。
乱流赤外ビデオ超解法のための熱認識拡散法であるHATIRを導入し, 拡散サンプリング経路に熱認識変形先行を注入し, 乱流劣化の逆過程と構造的詳細損失を連成的にモデル化する。
具体的には、熱活性領域が時間とともに一貫したファサー応答を示すという物理原理に根ざしたファザーガイド型流れ推定器を構築し、逆拡散過程を導くための信頼性の高い乱流認識フローを可能にする。
非一様歪み下での構造回復の忠実性を確保するため、乱流認識デコーダを提案し、不安定な時間的手がかりを選択的に抑制し、乱流ゲーティングと構造認識によるエッジ認識特徴の集約を強化する。
FLIR-IVSRは、FLIR T1050scカメラ(1024×768)のLR-HRシーケンスを、様々なカメラと物体の動き条件の異なる640の多様なシーンにまたがって構築した。
これにより、赤外線VSRの研究が促進される。
プロジェクトページ:https://github.com/JZ0606/HATIR
関連論文リスト
- Rethinking Diffusion Model-Based Video Super-Resolution: Leveraging Dense Guidance from Aligned Features [51.5076190312734]
ビデオ超解法アプローチは、エラーの蓄積、空間的アーティファクト、知覚的品質と忠実さのトレードオフに悩まされる。
ビデオ超解像(DGAF-VSR)に適した特徴を持つ新しい誘導拡散モデルを提案する。
合成および実世界のデータセットの実験では、DGAF-VSRがVSRの重要な側面において最先端の手法を超越していることが示されている。
論文 参考訳(メタデータ) (2025-11-21T03:40:45Z) - Enhancing Infrared Vision: Progressive Prompt Fusion Network and Benchmark [58.61079960074608]
既存の赤外線画像強調法は、個々の劣化に対処することに焦点を当てている。
一般的にRGBセンサーに適用されるオールインワンエンハンスメント法は、有効性が制限されることが多い。
論文 参考訳(メタデータ) (2025-10-10T12:55:54Z) - DiTVR: Zero-Shot Diffusion Transformer for Video Restoration [48.97196894658511]
DiTVRはゼロショットビデオ復元フレームワークで、拡散トランスフォーマーと軌跡を意識した注意と流れ一貫したサンプルを結合する。
我々の注意機構は、光流路に沿ってトークンを整列させ、特に時間力学に最も敏感な重要な層に重点を置いている。
フローガイドされたサンプリング装置は、低周波帯域にのみデータの一貫性を注入し、キャッシュを加速させながら高周波事前保存を行う。
論文 参考訳(メタデータ) (2025-08-11T09:54:45Z) - TIR-Diffusion: Diffusion-based Thermal Infrared Image Denoising via Latent and Wavelet Domain Optimization [11.970228442183476]
本稿では拡散型TIR画像復調フレームワークを提案する。
提案手法は、遅延空間と離散ウェーブレット変換(DWT)/二重ツリー複合ウェーブレット変換(DTCWT)の損失を組み合わせた新しい損失関数を用いてモデルを微調整する。
ベンチマークデータセットの実験は、最先端のデノナイジング手法と比較して、我々のアプローチの優れた性能を示している。
論文 参考訳(メタデータ) (2025-07-30T06:27:32Z) - UltraVSR: Achieving Ultra-Realistic Video Super-Resolution with Efficient One-Step Diffusion Space [46.43409853027655]
拡散モデルは、現実的な画像の詳細を生成する大きな可能性を示している。
これらのモデルをビデオ超解像(VSR)に適応させることは、その性質と時間的モデリングの欠如により、依然として困難である。
我々は,超現実的で時間的に整合したVSRを,効率的なワンステップ拡散空間で実現するための新しいフレームワークであるUltraVSRを提案する。
論文 参考訳(メタデータ) (2025-05-26T13:19:27Z) - DifIISR: A Diffusion Model with Gradient Guidance for Infrared Image Super-Resolution [32.53713932204663]
DifIISRは、視覚品質と知覚性能に最適化された赤外線画像超解像拡散モデルである。
我々は、視力を維持するために赤外線熱スペクトル分布制御を導入する。
下流の視覚課題に対する知覚的ガイダンスとして,様々な視覚基盤モデルを組み込んだ。
論文 参考訳(メタデータ) (2025-03-03T05:20:57Z) - Contourlet Refinement Gate Framework for Thermal Spectrum Distribution Regularized Infrared Image Super-Resolution [54.293362972473595]
画像超解像(SR)は、高解像度(HR)画像を低解像度(LR)画像から再構成することを目的としている。
SRタスクに対処する現在のアプローチは、RGB画像の特徴を抽出するか、同様の劣化パターンを仮定するものである。
スペクトル分布の忠実さを保ちつつ、赤外線変調特性を復元するコントゥーレット改質ゲートフレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-19T14:24:03Z) - AT-DDPM: Restoring Faces degraded by Atmospheric Turbulence using
Denoising Diffusion Probabilistic Models [64.24948495708337]
大気の乱流は、ぼやけや幾何学的歪みを導入して画質を著しく劣化させる。
CNNベースやGANインバージョンベースなど,深層学習に基づく単一画像大気乱流低減手法が提案されている。
Denoising Diffusion Probabilistic Models (DDPMs) は、その安定したトレーニングプロセスと高品質な画像を生成する能力により、最近注目を集めている。
論文 参考訳(メタデータ) (2022-08-24T03:13:04Z) - Thermal Image Super-Resolution Using Second-Order Channel Attention with
Varying Receptive Fields [4.991042925292453]
熱画像の効率よく再構成するシステムを提案する。
熱画像の復元は、安全、捜索、救助、軍事活動を含む用途に不可欠である。
論文 参考訳(メタデータ) (2021-07-30T22:17:51Z) - Learning to Restore a Single Face Image Degraded by Atmospheric
Turbulence using CNNs [93.72048616001064]
このような条件下で撮影された画像は、幾何学的変形と空間のぼかしの組合せに悩まされる。
乱流劣化顔画像の復元問題に対する深層学習に基づく解法を提案する。
論文 参考訳(メタデータ) (2020-07-16T15:25:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。