論文の概要: Enhancing Infrared Vision: Progressive Prompt Fusion Network and Benchmark
- arxiv url: http://arxiv.org/abs/2510.09343v1
- Date: Fri, 10 Oct 2025 12:55:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 00:38:48.997549
- Title: Enhancing Infrared Vision: Progressive Prompt Fusion Network and Benchmark
- Title(参考訳): 赤外線ビジョンの強化 - プログレッシブ・プロンプト・フュージョン・ネットワークとベンチマーク
- Authors: Jinyuan Liu, Zihang Chen, Zhu Liu, Zhiying Jiang, Long Ma, Xin Fan, Risheng Liu,
- Abstract要約: 既存の赤外線画像強調法は、個々の劣化に対処することに焦点を当てている。
一般的にRGBセンサーに適用されるオールインワンエンハンスメント法は、有効性が制限されることが多い。
- 参考スコア(独自算出の注目度): 58.61079960074608
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We engage in the relatively underexplored task named thermal infrared image enhancement. Existing infrared image enhancement methods primarily focus on tackling individual degradations, such as noise, contrast, and blurring, making it difficult to handle coupled degradations. Meanwhile, all-in-one enhancement methods, commonly applied to RGB sensors, often demonstrate limited effectiveness due to the significant differences in imaging models. In sight of this, we first revisit the imaging mechanism and introduce a Progressive Prompt Fusion Network (PPFN). Specifically, the PPFN initially establishes prompt pairs based on the thermal imaging process. For each type of degradation, we fuse the corresponding prompt pairs to modulate the model's features, providing adaptive guidance that enables the model to better address specific degradations under single or multiple conditions. In addition, a Selective Progressive Training (SPT) mechanism is introduced to gradually refine the model's handling of composite cases to align the enhancement process, which not only allows the model to remove camera noise and retain key structural details, but also enhancing the overall contrast of the thermal image. Furthermore, we introduce the most high-quality, multi-scenarios infrared benchmark covering a wide range of scenarios. Extensive experiments substantiate that our approach not only delivers promising visual results under specific degradation but also significantly improves performance on complex degradation scenes, achieving a notable 8.76\% improvement. Code is available at https://github.com/Zihang-Chen/HM-TIR.
- Abstract(参考訳): 我々は熱赤外画像強調という比較的未探索の課題に従事している。
既存の赤外線画像強調法は主にノイズ、コントラスト、ぼやけなどの個々の劣化に対処することに焦点を当てており、複合劣化の処理が困難である。
一方、RGBセンサーに一般的に適用されるオールインワンエンハンスメント法は、画像モデルに顕著な違いがあるため、効果が限られていることが多い。
そこで我々はまず,撮像機構を再考し,プログレッシブ・プロンプト・フュージョン・ネットワーク(PPFN)を導入する。
具体的には、PPFNは、最初に熱イメージングプロセスに基づいてプロンプトペアを確立する。
各種類の劣化に対して、対応するプロンプトペアを融合してモデルの特徴を変調し、モデルが単一または複数の条件下での特定の劣化によりよく対処できる適応的なガイダンスを提供する。
さらに、SPT機構を導入し、合成ケースの扱いを徐々に洗練し、拡張プロセスを整列させ、モデルがカメラノイズを除去し、重要な構造的詳細を保持するだけでなく、熱画像の全体的なコントラストを高める。
さらに,様々なシナリオをカバーする,高品質なマルチシナリオ赤外線ベンチマークについても紹介する。
広汎な実験は、我々のアプローチが特定の劣化下で有望な視覚的結果をもたらすだけでなく、複雑な劣化シーンのパフォーマンスも著しく向上し、注目すべき8.766%の改善を実現していることを裏付けている。
コードはhttps://github.com/Zihang-Chen/HM-TIRで入手できる。
関連論文リスト
- UniLDiff: Unlocking the Power of Diffusion Priors for All-in-One Image Restoration [16.493990086330985]
UniLDiffは、デグレッションとディテールを意識したメカニズムで強化された統合フレームワークである。
劣化認識機能融合(DAFF:Degradation-Aware Feature Fusion)を導入し,低品質機能を各段階に動的に注入する。
また,Detail-Aware Expert Module (DAEM) をデコーダ内に設計し,テクスチャと微細構造の回復性を高める。
論文 参考訳(メタデータ) (2025-07-31T16:02:00Z) - Nonlocal Retinex-Based Variational Model and its Deep Unfolding Twin for Low-Light Image Enhancement [3.174882428337821]
本稿では,Retinex分解に基づく低照度画像強調のための変分法を提案する。
低照度画像に色補正前処理ステップを適用し、分解時に観察された入力として使用する。
我々は、演算子を学習可能なネットワークに置き換える深層展開モデルを導入することにより、モデルを拡張する。
論文 参考訳(メタデータ) (2025-04-10T14:48:26Z) - DifIISR: A Diffusion Model with Gradient Guidance for Infrared Image Super-Resolution [32.53713932204663]
DifIISRは、視覚品質と知覚性能に最適化された赤外線画像超解像拡散モデルである。
我々は、視力を維持するために赤外線熱スペクトル分布制御を導入する。
下流の視覚課題に対する知覚的ガイダンスとして,様々な視覚基盤モデルを組み込んだ。
論文 参考訳(メタデータ) (2025-03-03T05:20:57Z) - DEAL: Data-Efficient Adversarial Learning for High-Quality Infrared Imaging [47.22313650077835]
温度劣化シミュレーションをミニマックス最適化によりトレーニングプロセスに統合する。
シミュレーションは、目的関数を最大化するために動的であり、これにより、劣化したデータ分布の幅広いスペクトルをキャプチャする。
このアプローチにより、限られたデータによるトレーニングが可能になり、モデルのパフォーマンスが向上する。
論文 参考訳(メタデータ) (2025-03-02T14:15:44Z) - Contourlet Refinement Gate Framework for Thermal Spectrum Distribution Regularized Infrared Image Super-Resolution [54.293362972473595]
画像超解像(SR)は、高解像度(HR)画像を低解像度(LR)画像から再構成することを目的としている。
SRタスクに対処する現在のアプローチは、RGB画像の特徴を抽出するか、同様の劣化パターンを仮定するものである。
スペクトル分布の忠実さを保ちつつ、赤外線変調特性を復元するコントゥーレット改質ゲートフレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-19T14:24:03Z) - Retinex-RAWMamba: Bridging Demosaicing and Denoising for Low-Light RAW Image Enhancement [71.13353154514418]
低照度画像の強化、特に生ドメインからsRGBドメインへのマッピングのようなクロスドメインタスクは、依然として大きな課題である。
RAWMambaと呼ばれる低照度RAW画像用にカスタマイズされた新しいMambaベースの手法を提案する。
低照度RAW画像の高精細化を図り、復調を施すことにより、高精細化を実現する。
論文 参考訳(メタデータ) (2024-09-11T06:12:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。