論文の概要: CLIP-Guided Unsupervised Semantic-Aware Exposure Correction
- arxiv url: http://arxiv.org/abs/2601.19129v1
- Date: Tue, 27 Jan 2026 02:53:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-28 15:26:51.145536
- Title: CLIP-Guided Unsupervised Semantic-Aware Exposure Correction
- Title(参考訳): CLIP-Guided Unsupervised Semantic-Aware Exposure Correction
- Authors: Puzhen Wu, Han Weng, Quan Zheng, Yi Zhan, Hewei Wang, Yiming Li, Jiahui Han, Rui Xu,
- Abstract要約: 教師なしセマンティック・アウェア・露出補正ネットワークを提案する。
事前訓練されたFast Segment Anything Modelから抽出された意味情報を共有画像特徴空間に融合する。
CLIPでガイドされた擬似地上真実生成装置を微調整し、露光状況を自動的に識別し、調整された修正を指示する。
- 参考スコア(独自算出の注目度): 13.05173129182012
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Improper exposure often leads to severe loss of details, color distortion, and reduced contrast. Exposure correction still faces two critical challenges: (1) the ignorance of object-wise regional semantic information causes the color shift artifacts; (2) real-world exposure images generally have no ground-truth labels, and its labeling entails massive manual editing. To tackle the challenges, we propose a new unsupervised semantic-aware exposure correction network. It contains an adaptive semantic-aware fusion module, which effectively fuses the semantic information extracted from a pre-trained Fast Segment Anything Model into a shared image feature space. Then the fused features are used by our multi-scale residual spatial mamba group to restore the details and adjust the exposure. To avoid manual editing, we propose a pseudo-ground truth generator guided by CLIP, which is fine-tuned to automatically identify exposure situations and instruct the tailored corrections. Also, we leverage the rich priors from the FastSAM and CLIP to develop a semantic-prompt consistency loss to enforce semantic consistency and image-prompt alignment for unsupervised training. Comprehensive experimental results illustrate the effectiveness of our method in correcting real-world exposure images and outperforms state-of-the-art unsupervised methods both numerically and visually.
- Abstract(参考訳): 不適切な露光は、しばしば詳細の深刻な損失、色歪み、コントラストの低下につながる。
露光補正は,(1) 空間的意味情報の無知が色ずれの原因となること,(2) 現実世界の露光画像には一般に地味ラベルがなく,そのラベル付けには膨大な手作業による編集が必要であること,の2つの重要な課題に直面している。
そこで本研究では,教師なしセマンティック・アウェア・露出補正ネットワークを提案する。
適応的なセマンティック・アウェア・フュージョンモジュールを含み、事前訓練されたFast Segment Anything Modelから抽出されたセマンティック情報を共有画像特徴空間に効果的に融合する。
次に, マルチスケール空間マンバ群を用いて, 詳細を復元し, 露出を調整した。
手動による編集を避けるために,CLIPによって導かれる疑似地下真実生成器を提案する。
また、FastSAMとCLIPからの豊富な事前情報を活用して、意味論的一貫性の喪失を発生させ、教師なしトレーニングにセマンティック一貫性とイメージ・プロンプトアライメントを強制する。
総合的な実験結果から,実世界の露光画像の修正と,数値的にも視覚的にも最先端の教師なし手法に優れる手法の有効性が示された。
関連論文リスト
- LoopExpose: An Unsupervised Framework for Arbitrary-Length Exposure Correction [43.00059667275665]
任意の長さの露光補正を行うために,LoopExposeと呼ばれる擬似ラベルに基づく教師なし手法を提案する。
露光補正問題に対処するため,ネストループ最適化手法を提案する。
異なるベンチマークデータセットの実験により、LoopExposeはより優れた露光補正と融合性能を達成することが示された。
論文 参考訳(メタデータ) (2025-11-08T16:36:52Z) - Leveraging Hierarchical Image-Text Misalignment for Universal Fake Image Detection [58.927873049646024]
実画像と比較して,偽画像は対応するキャプションと適切に一致しないことを示す。
本稿では,視覚空間における画像テキストの不一致を識別的手がかりとして活用し,簡易かつ効果的なITEMを提案する。
論文 参考訳(メタデータ) (2025-11-01T06:51:14Z) - WEC-DG: Multi-Exposure Wavelet Correction Method Guided by Degradation Description [7.873244458995218]
多重露光補正技術は、照明不足や過度な照明の影響を受ける画像の復元に不可欠である。
現在のマルチ露光補正法は、様々な照明条件によるクラス内変動に対処する際の課題となることが多い。
本稿では,分解誘導(WEC-DG)を用いたウェーブレットを用いた露光補正手法を提案する。
論文 参考訳(メタデータ) (2025-08-13T07:31:44Z) - Multimodal LLM-Guided Semantic Correction in Text-to-Image Diffusion [52.315729095824906]
MLLM Semantic-Corrected Ping-Pong-Ahead Diffusion (PPAD) は,マルチモーダル大言語モデル(MLLM)を推論中の意味的オブザーバとして導入する新しいフレームワークである。
中間世代をリアルタイムに分析し、潜在意味的不整合を識別し、フィードバックを制御可能な信号に変換し、残りの認知ステップを積極的に導く。
大規模な実験ではPPADの大幅な改善が示されている。
論文 参考訳(メタデータ) (2025-05-26T14:42:35Z) - Pseudo-Label Guided Real-World Image De-weathering: A Learning Framework with Imperfect Supervision [57.5699142476311]
非理想的な監視を伴う実世界のイメージデウェザリングのための統一的なソリューションを提案する。
本手法は,不完全整合型非整合性データセットのトレーニングにおいて,大きな利点を示す。
論文 参考訳(メタデータ) (2025-04-14T07:24:03Z) - UIP2P: Unsupervised Instruction-based Image Editing via Edit Reversibility Constraint [87.20985852686785]
本研究では,教師なし指導に基づく画像編集手法を提案する。
本稿では,編集可逆性制約 (ERC) と呼ばれる新しい編集機構を導入することで,これらの課題に対処する。
これにより、地道に編集されたイメージの必要性を回避し、実際のイメージキャプチャペアまたはイメージキャプチャインストラクショントリプルからなるデータセットで、初めてトレーニングをアンロックすることが可能になります。
論文 参考訳(メタデータ) (2024-12-19T18:59:58Z) - Learning Camouflaged Object Detection from Noisy Pseudo Label [60.9005578956798]
本稿では,まず,弱い半教師付きカモフラージュオブジェクト検出(COD)法を提案する。
予算効率が高く高精度なカモフラージュされたオブジェクトセグメンテーションを目標とし、完全にラベル付けされた画像が極めて限られている。
本稿では,早期の学習段階において,モデルが正しい画素の学習を容易にするノイズ補正損失を提案する。
完全ラベル付きデータの20%しか使用しない場合,本手法は最先端の手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2024-07-18T04:53:51Z) - Region-Aware Exposure Consistency Network for Mixed Exposure Correction [26.30138794484646]
本研究では,複合露光処理が可能な領域対応露光補正ネットワーク(RECNet)を提案する。
混合露光シナリオの局所的特徴を露光不変の特徴空間に効果的に変換する領域認識型露光モジュールを開発した。
本研究では,地域間露光連続性と地域間露光連続性の制約下での露光コントラスト正則化戦略を提案する。
論文 参考訳(メタデータ) (2024-02-28T10:24:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。