論文の概要: Bilevel Layer-Positioning LoRA for Real Image Dehazing
- arxiv url: http://arxiv.org/abs/2603.10872v1
- Date: Wed, 11 Mar 2026 15:22:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-12 16:22:33.023516
- Title: Bilevel Layer-Positioning LoRA for Real Image Dehazing
- Title(参考訳): 実像脱ハージングのための2レベル層化LORA
- Authors: Yan Zhang, Long Ma, Yuxin Feng, Zhe Huang, Fan Zhou, Zhuo Su,
- Abstract要約: 学習に基づくリアルイメージのデハージング手法は目覚ましい進歩を遂げてきたが、それでも多様なリアルヘイズシーンにおいて適応の課題に直面している。
本稿では,遅延空間における意味的アライメント問題として,実画像のデハジングを再構成するヘイズ・ツー・クリアテキスト指向の損失を提案する。
また、Bilevel Layer-positioning LoRA(BiLaLoRA)戦略を導入し、LoRAパラメータの両方を学習し、インジェクション層を自動的に検索する。
- 参考スコア(独自算出の注目度): 18.289871748711082
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning-based real image dehazing methods have achieved notable progress, yet they still face adaptation challenges in diverse real haze scenes. These challenges mainly stem from the lack of effective unsupervised mechanisms for unlabeled data and the heavy cost of full model fine-tuning. To address these challenges, we propose the haze-to-clear text-directed loss that leverages CLIP's cross-modal capabilities to reformulate real image dehazing as a semantic alignment problem in latent space, thereby providing explicit unsupervised cross-modal guidance in the absence of reference images. Furthermore, we introduce the Bilevel Layer-positioning LoRA (BiLaLoRA) strategy, which learns both the LoRA parameters and automatically search the injection layers, enabling targeted adaptation of critical network layers. Extensive experiments demonstrate our superiority against state-of-the-art methods on multiple real-world dehazing benchmarks. The code is publicly available at https://github.com/YanZhang-zy/BiLaLoRA.
- Abstract(参考訳): 学習に基づくリアルイメージのデハージング手法は目覚ましい進歩を遂げてきたが、それでも多様なリアルヘイズシーンにおいて適応の課題に直面している。
これらの課題は主に、ラベルのないデータに対する効果的な教師なしのメカニズムの欠如と、フルモデルファインチューニングの重いコストが原因である。
これらの課題に対処するために,CLIPのクロスモーダル機能を活用して,遅延空間における意味的アライメント問題として実画像デハジングを再構成し,参照画像がない場合に明確な教師なしのクロスモーダルガイダンスを提供するヘイズ・ツー・クリア・テキスト指向の損失を提案する。
さらに、Bilevel Layer-positioning LoRA(BiLaLoRA)戦略を導入し、LoRAパラメータの両方を学習し、インジェクション層を自動的に検索し、重要なネットワーク層のターゲット適応を可能にする。
大規模な実験は、複数の実世界のデハージングベンチマークにおける最先端の手法に対する我々の優位性を実証している。
コードはhttps://github.com/YanZhang-zy/BiLaLoRAで公開されている。
関連論文リスト
- Rectifying Latent Space for Generative Single-Image Reflection Removal [16.341477336909765]
単一画像の除去は、既存の手法が崩壊した領域の構成を推論するのに苦労する、非常に不適切な問題である。
この研究は、編集目的の潜在拡散モデルを再設計し、高度に曖昧で層状な画像入力を効果的に知覚し、処理する。
論文 参考訳(メタデータ) (2025-12-06T09:16:14Z) - Unpaired Object-Level SAR-to-Optical Image Translation for Aircraft with Keypoints-Guided Diffusion Models [4.6570959687411975]
SAR画像を光学画像に変換することは、下流タスクの解釈とサポートを強化するための有望な解決策である。
本研究では,無人航空機のSAR-光画像変換のためのキーポイント誘導拡散モデル(KeypointDiff)を提案する。
論文 参考訳(メタデータ) (2025-03-25T16:05:49Z) - Interpretable Unsupervised Joint Denoising and Enhancement for Real-World low-light Scenarios [18.622785498617223]
本稿では,現実のシナリオに適した,解釈可能でゼロ参照のジョイント denoising と低照度拡張フレームワークを提案する。
提案手法は,照明レベルと騒音レベルが異なるペアサブイメージに基づくトレーニング戦略を導出する。
バックボーンネットワークの設計において、暗黙の劣化表現機構によって導かれる網膜分解ネットワークを開発する。
論文 参考訳(メタデータ) (2025-03-17T12:08:52Z) - LoRA-IR: Taming Low-Rank Experts for Efficient All-in-One Image Restoration [62.3751291442432]
高速なオールインワン画像復元を実現するために,コンパクトな低ランクの専門家を動的に活用する,フレキシブルなフレームワークであるLoRA-IRを提案する。
LoRA-IRは、劣化誘導前訓練とパラメータ効率の良い微調整の2つの訓練段階で構成されている。
実験により、LoRA-IRは計算効率を維持しつつ、14のIRタスクと29のベンチマークでSOTA性能を達成することが示された。
論文 参考訳(メタデータ) (2024-10-20T13:00:24Z) - Retinex-RAWMamba: Bridging Demosaicing and Denoising for Low-Light RAW Image Enhancement [71.13353154514418]
低照度画像の強化、特に生ドメインからsRGBドメインへのマッピングのようなクロスドメインタスクは、依然として大きな課題である。
RAWMambaと呼ばれる低照度RAW画像用にカスタマイズされた新しいMambaベースの手法を提案する。
低照度RAW画像の高精細化を図り、復調を施すことにより、高精細化を実現する。
論文 参考訳(メタデータ) (2024-09-11T06:12:03Z) - AGLLDiff: Guiding Diffusion Models Towards Unsupervised Training-free Real-world Low-light Image Enhancement [37.274077278901494]
本稿では,AGLLDiff (Atribute Guidance Diffusion framework) を提案する。
AGLLDiffはパラダイムをシフトし、通常光画像の露出、構造、色などの望ましい属性をモデル化する。
我々の手法は、歪みベースのメトリクスと知覚ベースのメトリクスの点で、現在の非教師なしのLIEメソッドよりも優れています。
論文 参考訳(メタデータ) (2024-07-20T15:17:48Z) - Towards Unsupervised Sketch-based Image Retrieval [126.77787336692802]
本稿では,教師なし表現学習とスケッチ写真領域アライメントを同時に行う新しいフレームワークを提案する。
このフレームワークは,新しい教師なし設定では優れた性能を達成し,ゼロショット設定では最先端以上の性能を発揮する。
論文 参考訳(メタデータ) (2021-05-18T02:38:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。