論文の概要: ReflexSplit: Single Image Reflection Separation via Layer Fusion-Separation
- arxiv url: http://arxiv.org/abs/2601.17468v1
- Date: Sat, 24 Jan 2026 13:52:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:07.800179
- Title: ReflexSplit: Single Image Reflection Separation via Layer Fusion-Separation
- Title(参考訳): ReflexSplit: 層融合分離による単一画像のリフレクション分離
- Authors: Chia-Ming Lee, Yu-Fan Lin, Jing-Hui Jung, Yu-Jou Hsiao, Chih-Chung Hsu, Yu-Lun Liu,
- Abstract要約: 単一画像反射分離(SIRS)は混合画像を透過層と反射層に分離する。
既存の方法は非線形混合下での透過・反射混乱に悩まされる。
3つの重要なイノベーションを持つデュアルストリームフレームワークであるReflexSplitを提案する。
- 参考スコア(独自算出の注目度): 13.290464696196366
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Single Image Reflection Separation (SIRS) disentangles mixed images into transmission and reflection layers. Existing methods suffer from transmission-reflection confusion under nonlinear mixing, particularly in deep decoder layers, due to implicit fusion mechanisms and inadequate multi-scale coordination. We propose ReflexSplit, a dual-stream framework with three key innovations. (1) Cross-scale Gated Fusion (CrGF) adaptively aggregates semantic priors, texture details, and decoder context across hierarchical depths, stabilizing gradient flow and maintaining feature consistency. (2) Layer Fusion-Separation Blocks (LFSB) alternate between fusion for shared structure extraction and differential separation for layer-specific disentanglement. Inspired by Differential Transformer, we extend attention cancellation to dual-stream separation via cross-stream subtraction. (3) Curriculum training progressively strengthens differential separation through depth-dependent initialization and epoch-wise warmup. Extensive experiments on synthetic and real-world benchmarks demonstrate state-of-the-art performance with superior perceptual quality and robust generalization. Our code is available at https://github.com/wuw2135/ReflexSplit.
- Abstract(参考訳): 単一画像反射分離(SIRS)は混合画像を透過層と反射層に分離する。
既存の方法では、特に深層デコーダ層において、暗黙の融合機構とマルチスケール調整が不十分なため、非線形混合下での伝送・反射の混乱に悩まされている。
3つの重要なイノベーションを持つデュアルストリームフレームワークであるReflexSplitを提案する。
1) クロススケールGated Fusion (CrGF) は, 階層的な深さにまたがるセマンティック先行, テクスチャ詳細, デコーダコンテキストを適応的に集約し, 勾配流の安定化と特徴の整合性を維持する。
2) 拡散分離ブロック(LFSB)は, 共有構造抽出のための核融合と, 層特異的な非絡み合いのための分離を交互に行う。
差分変換器にインスパイアされ、クロスストリームサブトラクションによる二重ストリーム分離への注意キャンセルを拡大する。
3) カリキュラム・トレーニングは, 深度依存初期化とエポックワイド・ウォームアップを通じて, 段階的に差分分離を強化する。
人工的および実世界のベンチマークに関する大規模な実験は、知覚的品質と堅牢な一般化による最先端のパフォーマンスを示す。
私たちのコードはhttps://github.com/wuw2135/ReflexSplit.comから入手可能です。
関連論文リスト
- Excavate the potential of Single-Scale Features: A Decomposition Network for Water-Related Optical Image Enhancement [22.353926184394002]
単一スケールの特徴抽出は、マルチスケールメソッドのパフォーマンスにマッチするか、上回る可能性がある。
SSD-Netは、CNNのローカル機能抽出機能とTransformerのグローバルなモデリング長所を組み合わせる。
論文 参考訳(メタデータ) (2025-08-06T06:41:58Z) - AFUNet: Cross-Iterative Alignment-Fusion Synergy for HDR Reconstruction via Deep Unfolding Paradigm [41.09028235123695]
既存の学習ベース手法は,マルチ露光LDR入力から動的範囲を拡張してHDR画像を効果的に再構成し,ディテールを向上する。
本稿では,これらの制約に対処するため,横断的アライメントとフュージョン深層展開ネットワーク(AFUNet)を提案する。
本手法は最大A Posteriori (MAP) 推定視点から多露光HDR再構成を定式化する。
論文 参考訳(メタデータ) (2025-06-30T06:03:34Z) - Single Image Reflection Removal via inter-layer Complementarity [63.37693451363996]
二重ストリームアーキテクチャのための新しい層間相補性モデルと効率的な層間相補性注意機構を導入する。
提案手法は,複数の公開データセット上での最先端の分離品質を実現するとともに,計算コストとモデルの複雑さを著しく低減する。
論文 参考訳(メタデータ) (2025-05-19T02:50:15Z) - FUSE: Label-Free Image-Event Joint Monocular Depth Estimation via Frequency-Decoupled Alignment and Degradation-Robust Fusion [92.4205087439928]
画像強調共同深度推定法は、頑健な知覚に相補的なモダリティを利用するが、一般化可能性の課題に直面している。
自己監督型転送(PST)と周波数デカップリング型フュージョンモジュール(FreDF)を提案する。
PSTは、画像基盤モデルとの遅延空間アライメントによるクロスモーダルな知識伝達を確立し、データ不足を効果的に軽減する。
FreDFは、低周波構造成分から高周波エッジ特性を明示的に分離し、モード比周波数ミスマッチを解消する。
この組み合わせのアプローチにより、FUSEはターゲットデータセットに対する軽量デコーダ適応のみを必要とするユニバーサルなイメージイベントを構築することができる。
論文 参考訳(メタデータ) (2025-03-25T15:04:53Z) - A Hybrid Transformer-Mamba Network for Single Image Deraining [70.64069487982916]
既存のデラリング変換器では、固定レンジウィンドウやチャネル次元に沿って自己アテンション機構を採用している。
本稿では,多分岐型トランスフォーマー・マンバネットワーク(Transformer-Mamba Network,TransMamba Network,Transformer-Mamba Network)を提案する。
論文 参考訳(メタデータ) (2024-08-31T10:03:19Z) - Mutual Information-driven Triple Interaction Network for Efficient Image
Dehazing [54.168567276280505]
画像デハージングのための相互情報駆動型トリプルインタラクションネットワーク(MITNet)を提案する。
振幅誘導ヘイズ除去と呼ばれる第1段階は、ヘイズ除去のためのヘイズ画像の振幅スペクトルを復元することを目的としている。
第2段階は位相誘導構造が洗練され、位相スペクトルの変換と微細化を学ぶことに尽力した。
論文 参考訳(メタデータ) (2023-08-14T08:23:58Z) - Layer-wise Representation Fusion for Compositional Generalization [26.771056871444692]
合成一般化における失敗の主な理由は、エンコーダとデコーダの両方の最上層におけるシーケンスの構文的および意味的表現が絡み合っていることである。
トランスフォーマー層の下部から上部まで、表現の進化メカニズムを解析することにより、なぜそのメカニズムが存在するのかを説明する。
そこで我々は,従来のレイヤの情報を符号化・復号処理に融合させることを学習するCGのための新しい textbfLayer-wise textbfRepresentation textbfFusion フレームワークである LRF を提案する。
論文 参考訳(メタデータ) (2023-07-20T12:01:40Z) - CDDFuse: Correlation-Driven Dual-Branch Feature Decomposition for
Multi-Modality Image Fusion [138.40422469153145]
本稿では,CDDFuse(Relationed-Driven Feature Decomposition Fusion)ネットワークを提案する。
近赤外可視画像融合や医用画像融合など,複数の融合タスクにおいてCDDFuseが有望な結果をもたらすことを示す。
論文 参考訳(メタデータ) (2022-11-26T02:40:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。