論文の概要: GFRRN: Explore the Gaps in Single Image Reflection Removal
- arxiv url: http://arxiv.org/abs/2602.22695v1
- Date: Thu, 26 Feb 2026 07:17:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-27 18:41:22.570197
- Title: GFRRN: Explore the Gaps in Single Image Reflection Removal
- Title(参考訳): GFRRN: 単一画像のリフレクション除去におけるギャップの探索
- Authors: Yu Chen, Zewei He, Xingyu Liu, Zixuan Chen, Zheming Lu,
- Abstract要約: 単一画像の反射除去のためのギャップフリー反射除去ネットワーク(GFRRN)を提案する。
本研究では,まず,パラメータ効率のよい微調整(PEFT)戦略を採用し,トレーニングの方向性を調整する。
そして、ラベル生成装置は、合成データと実世界のデータの両方のリフレクションラベルを統合するように設計されている。
GFRRNの有効性を実証し,最先端SIRR法に対して優れた性能を示した。
- 参考スコア(独自算出の注目度): 23.018215754935753
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Prior dual-stream methods with the feature interaction mechanism have achieved remarkable performance in single image reflection removal (SIRR). However, they often struggle with (1) semantic understanding gap between the features of pre-trained models and those of reflection removal models, and (2) reflection label inconsistencies between synthetic and real-world training data. In this work, we first adopt the parameter efficient fine-tuning (PEFT) strategy by integrating several learnable Mona layers into the pre-trained model to align the training directions. Then, a label generator is designed to unify the reflection labels for both synthetic and real-world data. In addition, a Gaussian-based Adaptive Frequency Learning Block (G-AFLB) is proposed to adaptively learn and fuse the frequency priors, and a Dynamic Agent Attention (DAA) is employed as an alternative to window-based attention by dynamically modeling the significance levels across windows (inter-) and within an individual window (intra-). These components constitute our proposed Gap-Free Reflection Removal Network (GFRRN). Extensive experiments demonstrate the effectiveness of our GFRRN, achieving superior performance against state-of-the-art SIRR methods.
- Abstract(参考訳): 特徴相互作用機構を持つ従来の二重ストリーム法は、単一反射除去(SIRR)において顕著な性能を達成している。
しかし,(1)事前学習モデルの特徴と反射除去モデルの特徴とのセマンティックな理解のギャップ,(2)合成と実世界のトレーニングデータ間のリフレクションラベルの不整合に悩まされることがしばしばある。
本研究では,まず,学習可能なモナ層を事前学習モデルに統合し,学習方向を調整することで,パラメータ効率の良い微細チューニング(PEFT)戦略を採用する。
そして、ラベル生成装置は、合成データと実世界のデータの両方のリフレクションラベルを統合するように設計されている。
さらに、ガウスに基づく適応周波数学習ブロック(G-AFLB)を提案し、各窓(インター)および個々の窓(イントラ)における重要度を動的にモデル化することにより、動的エージェント注意(DAA)をウィンドウベースの注意の代替として採用する。
これらのコンポーネントは、提案したギャップフリー反射除去ネットワーク(GFRRN)を構成する。
GFRRNの有効性を実証し,最先端SIRR法に対して優れた性能を示した。
関連論文リスト
- FRISM: Fine-Grained Reasoning Injection via Subspace-Level Model Merging for Vision-Language Models [20.47311573790516]
FRISM(Fine-fine Reasoning Injection via Subspace-level Model Merging)を提案する。
実験により、FRISMはモデルの本来の視覚能力を損なうことなく推論能力を効果的に改善することが示された。
論文 参考訳(メタデータ) (2026-01-29T02:36:19Z) - Supervised Contrastive Machine Unlearning of Background Bias in Sonar Image Classification with Fine-Grained Explainable AI [1.4610038284393168]
音響ソナー画像解析は、物体の検出と分類において重要な役割を果たす。
高精度を実現する既存のAIモデルは、しばしば海底の特徴に過度に依存し、一般化が不十分になる。
i) 海底による背景バイアスを低減するために従来の三重項損失を拡大するTCUモジュール,(ii) 浮き彫りソナーフレームワーク(UESF) という2つの重要なモジュールを統合した新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-01T05:25:34Z) - Interpretable Few-Shot Image Classification via Prototypical Concept-Guided Mixture of LoRA Experts [79.18608192761512]
自己説明可能なモデル(SEM)は、視覚認識プロセスをより解釈可能なものにするために、プロトタイプ概念学習(PCL)に依存している。
パラメトリック不均衡と表現の不整合という2つの重要な課題を緩和するFew-Shotプロトタイプ概念分類フレームワークを提案する。
我々のアプローチは、既存のSEMを顕著な差で常に上回っており、5-way 5-shot分類では4.2%-8.7%の相対的な利得がある。
論文 参考訳(メタデータ) (2025-06-05T06:39:43Z) - iEBAKER: Improved Remote Sensing Image-Text Retrieval Framework via Eliminate Before Align and Keyword Explicit Reasoning [80.44805667907612]
iEBAKERは、弱い相関のサンプルペアをフィルタリングする革新的な戦略である。
SAR(Sort After Reversed Retrieval)戦略の代替として,SAR(Sort After Retrieval)戦略を導入する。
キーワード明示型推論(KER)モジュールを組み込んで、微妙なキー概念の区別による有益な影響を促進する。
論文 参考訳(メタデータ) (2025-04-08T03:40:19Z) - Reconciling Stochastic and Deterministic Strategies for Zero-shot Image Restoration using Diffusion Model in Dual [47.141811103506036]
我々はDualにおけるReconciling Model(RDMD)と呼ばれる新しいゼロショット画像復元手法を提案する。
RDMDはbftextsingle事前学習拡散モデルのみを使用してテキスト2正規化器を構成する。
提案手法は,FFHQ と ImageNet の両方のデータセットに対する既存手法と比較して,優れた結果が得られる。
論文 参考訳(メタデータ) (2025-03-03T08:25:22Z) - Efficient Diffusion as Low Light Enhancer [63.789138528062225]
RATR(Reflectance-Aware Trajectory Refinement)は、イメージの反射成分を用いて教師の軌跡を洗練するための、シンプルで効果的なモジュールである。
textbfReDDiT (textbfDistilled textbfTrajectory) は低照度画像強調(LLIE)に適した効率的で柔軟な蒸留フレームワークである。
論文 参考訳(メタデータ) (2024-10-16T08:07:18Z) - Visual Prompt Tuning in Null Space for Continual Learning [51.96411454304625]
既存のプロンプトチューニング手法は、継続学習(CL)における印象的な性能を示す。
本稿では,従来のタスクの特徴に代表される部分空間に直交する方向のプロンプトを調整し,各タスクを学習することを目的とする。
実際には、即時勾配予測を実装するために、実効的なヌル空間に基づく近似解が提案されている。
論文 参考訳(メタデータ) (2024-06-09T05:57:40Z) - Two-Stage Single Image Reflection Removal with Reflection-Aware Guidance [78.34235841168031]
シングルイメージリフレクション除去(SIRR)のためのリフレクション・アウェア・ガイダンス(RAGNet)を用いた新しい2段階ネットワークを提案する。
RAGは、(i)観測からの反射の効果を緩和するために、(ii)線形結合仮説から逸脱する効果を緩和するための部分畳み込みにおいてマスクを生成するために用いられる。
5つの一般的なデータセットの実験は、最先端のSIRR法と比較して、RAGNetの量的および質的な優位性を実証している。
論文 参考訳(メタデータ) (2020-12-02T03:14:57Z) - Incorporating Reinforced Adversarial Learning in Autoregressive Image
Generation [39.55651747758391]
本稿では,自己回帰モデルに対するポリシー勾配最適化に基づく強化適応学習(RAL)を提案する。
RALはまた、VQ-VAEフレームワークの異なるモジュール間のコラボレーションを強化する。
提案手法は,64$times$64画像解像度でCelebaの最先端結果を実現する。
論文 参考訳(メタデータ) (2020-07-20T08:10:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。