論文の概要: RIDE: Retinex-Informed Decoupling for Exposing Concealed Objects
- arxiv url: http://arxiv.org/abs/2605.15450v1
- Date: Thu, 14 May 2026 22:19:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-18 17:44:16.280686
- Title: RIDE: Retinex-Informed Decoupling for Exposing Concealed Objects
- Title(参考訳): RIDE: Retinex-Informed Decoupling for Exposing Concealed Objects
- Authors: Chunming He, Rihan Zhang, Dingming Zhang, Chengyu Fang, Longxiang Tang, Jingjia Feng, Fengyang Xiao, Sina Farsiu,
- Abstract要約: Concealed Object(COS)は、カモフラージュされたオブジェクト検出、ポリプセグメンテーション、透明なオブジェクト検出、産業欠陥検査など、一連の密集した予測タスクを含む。
既存の方法はRGB画像を直接操作するか、スケール/周波数係数をまたいで空間的証拠を再分配する等質分解を用いる。
我々は基本的に異なる視点を導入する:textbfhomogeneous image decomposition via Retinex theory, which factors a image into lightumination and reflectance components in the emphsame space domain。
- 参考スコア(独自算出の注目度): 13.362481648112444
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Concealed Object Segmentation (COS) encompasses a family of dense-prediction tasks, including camouflaged object detection, polyp segmentation, transparent object detection, and industrial defect inspection, where targets are visually entangled with their surroundings through different physical mechanisms. Existing methods either operate directly on RGB images or employ \emph{heterogeneous} decompositions (\eg, Fourier, wavelet) that redistribute spatial evidence across scale/frequency coefficients, making pixel-aligned cues less direct. We introduce a fundamentally different perspective: \textbf{homogeneous image decomposition} via Retinex theory, which factorizes an image into illumination and reflectance components within the \emph{same} spatial domain. Our key insight is that visual entanglement enforces appearance matching in the composite space, but this does \emph{not} necessitate simultaneous matching in both component spaces, a phenomenon we formalize as the \textbf{Discriminability Gap Theorem}. Crucially, we show that across diverse COS sub-tasks, the underlying physical processes systematically anti-correlate illumination and reflectance differences, yielding theoretical guarantees that Retinex decomposition preserves or strictly improves total foreground--background discriminability across the full physical regime, with anti-correlation maximizing the gain. Building on this, we propose \textbf{RIDE} comprising: (i) a Task-Driven Retinex Decomposition module that learns segmentation-optimal factorizations end-to-end; (ii) a Discriminability Gap Attention mechanism that adaptively exploits where decomposition helps; and (iii) a Camouflage-Breaking Contrastive loss operating in reflectance feature space.
- Abstract(参考訳): Concealed Object Segmentation (COS) は、カモフラージュされた物体検出、ポリプセグメンテーション、透明な物体検出、産業欠陥検査など、様々な物理的メカニズムによって、ターゲットが周囲と視覚的に絡み合っているような、密集した予測タスクのファミリーを含んでいる。
既存の方法は、RGB画像を直接操作するか、スケール/周波数係数をまたいで空間的証拠を再分配する「emph{heterogeneous}」分解(\eg, Fourier, wavelet)を用いる。
本稿では,レチネックス理論(Retinex theory)を用いて,空間領域における画像の照明成分と反射成分に分解する。
我々の重要な洞察は、視覚的絡み合いは合成空間における外観整合を強制するが、これは両方の成分空間において同時マッチングを必要とする現象であり、この現象は \textbf{Discriminability Gap Theorem} として形式化される。
重要なことは、様々なCOSサブタスクにおいて、その基盤となる物理過程は、体系的に、照明と反射率の違いを反相関し、レチネックス分解が全物理機構をまたいで全前景の識別性を保存または厳格に改善し、反相関が利得を最大化するという理論的な保証を与える。
これに基づいて、次のように構成するtextbf{RIDE}を提案する。
(i)節分-最適因数分解をエンドツーエンドに学習するタスク駆動のRetinex分解モジュール
二 分解の助けとなる場所を適応的に活用する識別性ギャップ注意機構
三 反射特性空間で作動するカモフラージュ焼成コントラスト損失
関連論文リスト
- Oversmoothing as Representation Degeneracy in Neural Sheaf Diffusion [0.0]
NSD(Neural Sheaf Diffusion)は、スカラーグラフラプラシアンをシーフラプラシアンに置き換えることで、拡散に基づくグラフニューラルネットワークを一般化する。
グラフ上の細胞シーブを関連頻度の表現で同定し,NSDのクイバー理論的解釈を開発する。
そこで本研究では,基礎となる入射平均表現の直和分解が拡散限界に到達した調和空間の分解を誘導することを示す。
論文 参考訳(メタデータ) (2026-05-11T19:41:56Z) - Adjoint Inversion Reveals Holographic Superposition and Destructive Interference in CNN Classifiers [0.33842793760651557]
等相デカップリングと局所共役補正を基盤とした幻覚のない逆転フレームワークを提案する。
提案手法は,各再構成の空間勾配が真に活発なチャネルから厳密に支えられていることを数学的に保証する。
この枠組みを幾何学的プローブとして用いて、視覚エンコーダにおける強重畳みの最初のピクセルレベルの証拠を明らかにする。
論文 参考訳(メタデータ) (2026-04-30T07:32:07Z) - Hyperbolic Enhanced Representation Learning for Incomplete Multi-view Clustering [57.38215918201251]
本稿では,不完全なマルチビュークラスタリングのためのハイパーボリック拡張表現学習フレームワークであるHERLを提案する。
ポアンカレボール内で操作すると、HERLは表現学習を強化するために構造を意識した潜在空間を構築する。
HERLは最先端のアプローチよりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2026-04-18T10:50:46Z) - Beyond Cosine Similarity: Zero-Initialized Residual Complex Projection for Aspect-Based Sentiment Analysis [3.154269505086155]
Aspect-Based Sentiment Analysis (ABSA)は、表現の絡み合いによって根本的に挑戦される。
標準的な対照的な学習は、偽陰性衝突に悩まされ、高周波の面において著しく性能が低下する。
本稿では,ゼロ残差複素射影とアンチ・コリジョン・マスケッド・アングル・ロスを特徴とする新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-30T09:23:04Z) - Spectral Disentanglement and Enhancement: A Dual-domain Contrastive Framework for Representation Learning [28.392130815615545]
SDE(Spectral Disentanglement and Enhancement)は、埋め込み空間の幾何学とスペクトル特性の間のギャップを埋める新しいフレームワークである。
SDEは一貫して表現と堅牢性を改善し、最先端の手法より優れている。
論文 参考訳(メタデータ) (2026-02-09T07:29:43Z) - MirrorLA: Reflecting Feature Map for Vision Linear Attention [49.41670925034762]
リニアアテンションはトランスフォーマーの2次から線形への計算複雑性を著しく低下させるが、パフォーマンスにおけるソフトマックスに基づくアテンションの遅れは一貫して遅れる。
我々は、受動トランケーションをアクティブなリオリエンテーションに置き換える幾何学的枠組みであるMirrorLAを提案する。
MirrorLAは標準的なベンチマークで最先端のパフォーマンスを実現し、表現の忠実さを損なうことなく厳密な線形効率を実現できることを示した。
論文 参考訳(メタデータ) (2026-02-04T09:14:09Z) - Interpreting Structured Perturbations in Image Protection Methods for Diffusion Models [17.625614970517884]
GlazeとNightshadeは、下流のテキストから画像への生成モデルを破壊するために、不可避で逆向きに設計された摂動を導入した。
この研究は、ホワイトボックスの特徴空間検査とブラックボックス信号レベル探索を統合した統合フレームワークを用いた、体系的で説明可能なAI分析を提供する。
保護機構は, 表現領域, 空間領域, スペクトル領域をまたいだ画像内容と密結合した, 構造的かつ低エントロピーな摂動として機能することを示す。
論文 参考訳(メタデータ) (2025-12-09T07:55:11Z) - Manifold-aware Representation Learning for Degradation-agnostic Image Restoration [135.90908995927194]
画像復元(IR)は、ノイズ、ぼかし、迷路、雨、低照度といった様々な汚職に影響を受ける劣化した入力から高品質な画像を復元することを目的としている。
我々は、入力特徴空間を3つのセマンティックに整列した並列分岐に明示的に分解する1つのIRにおいて、すべてに統一されたフレームワークであるMIRAGEを提案する。
このモジュラ分解は、多種多様な分解の一般化と効率を大幅に改善する。
論文 参考訳(メタデータ) (2025-05-24T12:52:10Z) - Low-Light Video Enhancement via Spatial-Temporal Consistent Decomposition [52.89441679581216]
低照度ビデオエンハンスメント(LLVE)は、激しい視認性とノイズに悩まされる動的または静的なシーンの復元を目指している。
本稿では、ビューに依存しない、ビューに依存しないコンポーネントを組み込んだ革新的なビデオ分解戦略を提案する。
我々のフレームワークは、既存のメソッドを一貫して上回り、新しいSOTAパフォーマンスを確立します。
論文 参考訳(メタデータ) (2024-05-24T15:56:40Z) - ZoomNeXt: A Unified Collaborative Pyramid Network for Camouflaged Object Detection [70.11264880907652]
最近のオブジェクト(COD)は、現実のシナリオでは極めて複雑で難しい、視覚的にブレンドされたオブジェクトを周囲に分割しようと試みている。
本研究では,不明瞭な画像を観察したり,ズームインしたりアウトしたりする際の人間の行動を模倣する,効果的な統合協調ピラミッドネットワークを提案する。
我々のフレームワークは、画像とビデオのCODベンチマークにおいて、既存の最先端の手法を一貫して上回っている。
論文 参考訳(メタデータ) (2023-10-31T06:11:23Z) - Maximum Spatial Perturbation Consistency for Unpaired Image-to-Image
Translation [56.44946660061753]
本稿では,最大空間摂動整合(MSPC)と呼ばれる普遍正規化手法を提案する。
MSPCは空間摂動関数(T)と変換演算子(G)を可換(TG = GT)に強制する。
提案手法は,ほとんどのI2Iベンチマークにおいて最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2022-03-23T19:59:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。