論文の概要: CLIP-Guided Data Augmentation for Night-Time Image Dehazing
- arxiv url: http://arxiv.org/abs/2604.05500v1
- Date: Tue, 07 Apr 2026 06:43:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-08 17:42:09.671062
- Title: CLIP-Guided Data Augmentation for Night-Time Image Dehazing
- Title(参考訳): 夜間画像復調のためのCLIP-Guided Data Augmentation
- Authors: Xining Ge, Weijun Yuan, Gengjia Chang, Xuyang Li, Shuhong Liu,
- Abstract要約: 本稿では,NTIRE 2026 Night Time Image Dehazing Challengeに対して,統合されたフレームワークとして構築したソリューションを提案する。
NAFNetは2つの段階でトレーニングされ、まずターゲットドメインに適応し、その後より広範な劣化パターンに拡張される。
推論時に、TLC、x8自己アンサンブル、重み付きスナップショット融合を組み合わせて出力安定性を向上させる。
- 参考スコア(独自算出の注目度): 4.407514620852976
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Nighttime image dehazing faces a more complex degradation pattern than its daytime counterpart, as haze scattering couples with low illumination, non-uniform lighting, and strong light interference. Under limited supervision, this complexity aggravates domain drift and training instability, since target-domain samples are scarce while naively introducing external data may weaken adaptation due to distribution mismatch. This paper presents our solution to the NTIRE 2026 Night Time Image Dehazing Challenge, built as a unified framework that integrates domain-aligned data construction, stage-wise training, and inference-time enhancement. Specifically, a pre-trained CLIP visual encoder screens candidate external samples by similarity to construct training data closer to the target domain. NAFNet is then trained in two stages, first adapting to the target domain and then expanding to broader degradation patterns. At inference time, TLC, x8 self-ensemble, and weighted snapshot fusion are combined to improve output stability. Rather than relying on complex network redesign, the proposed framework offers a practical and effective pipeline for nighttime image dehazing.
- Abstract(参考訳): 夜間の露光は、日中よりも複雑な劣化パターンに直面する。
限定的な監視の下では、この複雑さはドメインのドリフトとトレーニングの不安定性を増大させる。
本稿では,NTIRE 2026 Night Time Image Dehazing Challengeに対する解決策を提案する。
具体的には、トレーニング済みのCLIPビジュアルエンコーダが、対象ドメインに近いトレーニングデータを構築するために、類似性で候補外部サンプルをスクリーニングする。
NAFNetは2つのステージでトレーニングされ、まずターゲットドメインに適応し、その後、より広範な劣化パターンに拡張される。
推論時に、TLC、x8自己アンサンブル、重み付きスナップショット融合を組み合わせて出力安定性を向上させる。
複雑なネットワークの再設計に頼るのではなく、提案されたフレームワークは、夜間のイメージデハージングに実用的で効果的なパイプラインを提供する。
関連論文リスト
- HistoFusionNet: Histogram-Guided Fusion and Frequency-Adaptive Refinement for Nighttime Image Dehazing [20.95434972260448]
HistoFusionNetは、夜間のイメージデハージングに適したトランスフォーマー強化アーキテクチャである。
当社のチームは22の参加チームの中で1位にランクインし、当社の手法の堅牢性と競争性を強調しました。
論文 参考訳(メタデータ) (2026-04-04T17:08:13Z) - Exploring Fourier Prior and Event Collaboration for Low-Light Image Enhancement [1.8724535169356553]
イベントカメラは低照度画像強調のための性能向上を提供する。
現在、既存のイベントベースのメソッドは、フレームとイベントを直接単一のモデルにフィードする。
本稿では,振幅-位相絡み付き可視性回復ネットワークを提案する。
第2段階では、空間的ミスマッチを軽減するために、動的アライメントを伴う融合戦略を提案する。
論文 参考訳(メタデータ) (2025-08-01T04:25:00Z) - The Devil is in the Darkness: Diffusion-Based Nighttime Dehazing Anchored in Brightness Perception [58.895000127068194]
本稿では,Diffusion-based Nighttime Dehazingフレームワークについて紹介する。
輝度知覚ネットワークによって導かれる事前学習拡散モデルを統合する復元モデルを提案する。
実験では、データセットの有用性と、ジョイントヘイズ除去と輝度マッピングにおけるモデルの優れたパフォーマンスを検証する。
論文 参考訳(メタデータ) (2025-06-03T03:21:13Z) - FUSE: Label-Free Image-Event Joint Monocular Depth Estimation via Frequency-Decoupled Alignment and Degradation-Robust Fusion [92.4205087439928]
画像強調共同深度推定法は、頑健な知覚に相補的なモダリティを利用するが、一般化可能性の課題に直面している。
自己監督型転送(PST)と周波数デカップリング型フュージョンモジュール(FreDF)を提案する。
PSTは、画像基盤モデルとの遅延空間アライメントによるクロスモーダルな知識伝達を確立し、データ不足を効果的に軽減する。
FreDFは、低周波構造成分から高周波エッジ特性を明示的に分離し、モード比周波数ミスマッチを解消する。
この組み合わせのアプローチにより、FUSEはターゲットデータセットに対する軽量デコーダ適応のみを必要とするユニバーサルなイメージイベントを構築することができる。
論文 参考訳(メタデータ) (2025-03-25T15:04:53Z) - WTCL-Dehaze: Rethinking Real-world Image Dehazing via Wavelet Transform and Contrastive Learning [17.129068060454255]
自律運転や監視といったアプリケーションには、単一イメージのデハジングが不可欠だ。
コントラスト損失と離散ウェーブレット変換を統合した半教師付きデハージングネットワークを提案する。
提案アルゴリズムは,最先端の単一画像復調法と比較して,優れた性能とロバスト性を実現している。
論文 参考訳(メタデータ) (2024-10-07T05:36:11Z) - Unrolled Decomposed Unpaired Learning for Controllable Low-Light Video Enhancement [48.76608212565327]
本稿では,2対の地上真実を使わずに,低照度映像のエンハンスメントを学習する上での取り組みについて述べる。
低照度画像の強調に比べて、空間領域におけるノイズ、露出、コントラストの相互干渉効果により、時間的コヒーレンスの必要性が伴うため、低照度映像の強調は困難である。
本稿では,信号の空間的・時間的関連要因に分解するために,最適化関数を深層ネットワークにアンロールすることで低照度映像の高精細化を実現するUnrolled Decompposed Unpaired Network (UDU-Net)を提案する。
論文 参考訳(メタデータ) (2024-08-22T11:45:11Z) - FCL-GAN: A Lightweight and Real-Time Baseline for Unsupervised Blind
Image Deblurring [72.43250555622254]
本稿では,周波数領域の競合損失制約型軽量サイクルGANと呼ばれる,軽量でリアルタイムな非教師付きBIDベースラインを提案する。
FCL-GANは、画像領域制限がなく、画像解像度制限がなく、SOTAより25倍軽く、SOTAより5倍高速である。
いくつかの画像データセットの実験では、性能、モデルサイズ、参照時間の観点からFCL-GANの有効性が示されている。
論文 参考訳(メタデータ) (2022-04-16T15:08:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。