論文の概要: TIR-Diffusion: Diffusion-based Thermal Infrared Image Denoising via Latent and Wavelet Domain Optimization
- arxiv url: http://arxiv.org/abs/2508.03727v1
- Date: Wed, 30 Jul 2025 06:27:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-07 20:09:22.335093
- Title: TIR-Diffusion: Diffusion-based Thermal Infrared Image Denoising via Latent and Wavelet Domain Optimization
- Title(参考訳): TIR拡散:遅延及びウェーブレット領域最適化による拡散に基づく熱赤外画像デノイング
- Authors: Tai Hyoung Rhee, Dong-guw Lee, Ayoung Kim,
- Abstract要約: 本稿では拡散型TIR画像復調フレームワークを提案する。
提案手法は、遅延空間と離散ウェーブレット変換(DWT)/二重ツリー複合ウェーブレット変換(DTCWT)の損失を組み合わせた新しい損失関数を用いてモデルを微調整する。
ベンチマークデータセットの実験は、最先端のデノナイジング手法と比較して、我々のアプローチの優れた性能を示している。
- 参考スコア(独自算出の注目度): 11.970228442183476
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Thermal infrared imaging exhibits considerable potentials for robotic perception tasks, especially in environments with poor visibility or challenging lighting conditions. However, TIR images typically suffer from heavy non-uniform fixed-pattern noise, complicating tasks such as object detection, localization, and mapping. To address this, we propose a diffusion-based TIR image denoising framework leveraging latent-space representations and wavelet-domain optimization. Utilizing a pretrained stable diffusion model, our method fine-tunes the model via a novel loss function combining latent-space and discrete wavelet transform (DWT) / dual-tree complex wavelet transform (DTCWT) losses. Additionally, we implement a cascaded refinement stage to enhance fine details, ensuring high-fidelity denoising results. Experiments on benchmark datasets demonstrate superior performance of our approach compared to state-of-the-art denoising methods. Furthermore, our method exhibits robust zero-shot generalization to diverse and challenging real-world TIR datasets, underscoring its effectiveness for practical robotic deployment.
- Abstract(参考訳): 熱赤外イメージングは、特に可視性や困難な照明条件の低い環境では、ロボット知覚タスクのかなりの可能性を示す。
しかし、TIR画像は通常、重い不均一な固定パターンノイズに悩まされ、オブジェクト検出、ローカライゼーション、マッピングなどのタスクが複雑になる。
そこで本研究では,遅延空間表現とウェーブレット領域最適化を利用した拡散型TIR画像復調フレームワークを提案する。
既訓練の安定拡散モデルを用いて、遅延空間と離散ウェーブレット変換(DWT)と二重ツリー複合ウェーブレット変換(DTCWT)の損失を組み合わせた新しい損失関数を用いてモデルを微調整する。
さらに, 細部を細部まで高精細化し, 高精細度デノナイズ結果の確保を図るために, カスケード型精細化ステージを実装した。
ベンチマークデータセットの実験は、最先端のデノナイジング手法と比較して、我々のアプローチの優れた性能を示している。
さらに,本手法は,多種多様な実世界のTIRデータセットに対するロバストなゼロショット一般化を示し,実用的ロボット展開の有効性を裏付けるものである。
関連論文リスト
- FD-DiT: Frequency Domain-Directed Diffusion Transformer for Low-Dose CT Reconstruction [3.980622332603746]
低線量CT(LDCT)は、放射線被曝を減らすが、画像のアーチファクトや、量子および電子ノイズによる詳細の喪失に悩まされる。
FD-DiTは、分布がLDCTデータと統計的に一致するまで、ノイズを徐々に導入する拡散戦略に重点を置いている。
次に、ハイブリッドな復調ネットワークを使用して、全体のデータ再構成プロセスを最適化する。
FD-DiTにより再構成されたLDCT画像は,同じ線量レベルでは,最先端の手法に比べて優れたノイズ抑制とアーチファクト抑制を示すことが示された。
論文 参考訳(メタデータ) (2025-06-30T02:16:38Z) - DifIISR: A Diffusion Model with Gradient Guidance for Infrared Image Super-Resolution [32.53713932204663]
DifIISRは、視覚品質と知覚性能に最適化された赤外線画像超解像拡散モデルである。
我々は、視力を維持するために赤外線熱スペクトル分布制御を導入する。
下流の視覚課題に対する知覚的ガイダンスとして,様々な視覚基盤モデルを組み込んだ。
論文 参考訳(メタデータ) (2025-03-03T05:20:57Z) - WTCL-Dehaze: Rethinking Real-world Image Dehazing via Wavelet Transform and Contrastive Learning [17.129068060454255]
自律運転や監視といったアプリケーションには、単一イメージのデハジングが不可欠だ。
コントラスト損失と離散ウェーブレット変換を統合した半教師付きデハージングネットワークを提案する。
提案アルゴリズムは,最先端の単一画像復調法と比較して,優れた性能とロバスト性を実現している。
論文 参考訳(メタデータ) (2024-10-07T05:36:11Z) - NIR-Assisted Image Denoising: A Selective Fusion Approach and A Real-World Benchmark Dataset [53.79524776100983]
近赤外(NIR)画像を活用して、視認可能なRGB画像の復調を支援することで、この問題に対処する可能性を示している。
既存の作品では、NIR情報を効果的に活用して現実のイメージを飾ることに苦戦している。
先進デノナイジングネットワークにプラグイン・アンド・プレイ可能な効率的な選択核融合モジュール(SFM)を提案する。
論文 参考訳(メタデータ) (2024-04-12T14:54:26Z) - NoiseDiffusion: Correcting Noise for Image Interpolation with Diffusion Models beyond Spherical Linear Interpolation [86.7260950382448]
画像の妥当性を補正する新しい手法としてノイズ拡散法を提案する。
NoiseDiffusionはノイズの多い画像空間内で動作し、これらのノイズの多い画像に生画像を注入することで、情報損失の課題に対処する。
論文 参考訳(メタデータ) (2024-03-13T12:32:25Z) - Spatial-and-Frequency-aware Restoration method for Images based on
Diffusion Models [7.947387272047602]
画像復元のための空間・周波数対応拡散モデルSaFaRIを提案する。
本モデルでは,空間領域と周波数領域の両領域において画像の忠実度を保ち,再現性の向上を図っている。
我々の徹底的な評価は、SaFaRIがImageNetデータセットとFFHQデータセットの両方で最先端のパフォーマンスを実現していることを示している。
論文 参考訳(メタデータ) (2024-01-31T07:11:01Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - Towards High-quality HDR Deghosting with Conditional Diffusion Models [88.83729417524823]
高ダイナミックレンジ(LDR)画像は、既存のディープニューラルネットワーク(DNN)技術により、複数の低ダイナミックレンジ(LDR)画像から復元することができる。
DNNは、LDR画像が飽和度と大きな動きを持つ場合、ゴーストアーティファクトを生成する。
拡散モデルの条件としてLDR特徴を利用する画像生成としてHDRデゴースト問題を定式化する。
論文 参考訳(メタデータ) (2023-11-02T01:53:55Z) - ACDMSR: Accelerated Conditional Diffusion Models for Single Image
Super-Resolution [84.73658185158222]
本稿では,ACDMSRと呼ばれる拡散モデルに基づく超解像法を提案する。
提案手法は, 決定論的反復分解過程を通じて超解像を行うために, 標準拡散モデルに適応する。
提案手法は,低解像度画像に対してより視覚的に現実的な表現を生成し,現実的なシナリオにおけるその有効性を強調した。
論文 参考訳(メタデータ) (2023-07-03T06:49:04Z) - Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。
本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T03:08:28Z) - Denoising Diffusion Models for Plug-and-Play Image Restoration [135.6359475784627]
本稿では,従来のプラグアンドプレイ方式を拡散サンプリングフレームワークに統合したDiffPIRを提案する。
DiffPIRは、差別的なガウスのデノイザーに依存するプラグアンドプレイIR法と比較して、拡散モデルの生成能力を継承することが期待されている。
論文 参考訳(メタデータ) (2023-05-15T20:24:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。