論文の概要: DeshadowMamba: Deshadowing as 1D Sequential Similarity
- arxiv url: http://arxiv.org/abs/2510.24260v1
- Date: Tue, 28 Oct 2025 10:14:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-29 15:35:37.015276
- Title: DeshadowMamba: Deshadowing as 1D Sequential Similarity
- Title(参考訳): DeshadowMamba: Deshadowing as 1D Sequential similarity
- Authors: Zhaotong Yang, Yi Chen, Yanying Li, Shengfeng He, Yangyang Xu, Junyu Dong, Jian Yang, Yong Du,
- Abstract要約: 指向性状態遷移を通じてグローバルなコンテキストを伝播する選択状態空間モデルであるMambaを紹介する。
その可能性にもかかわらず、マンバを画像データに直接適用することは、シャドー・ノン・シャドウ・セマンティクスの認識が欠けているため、最適ではない。
我々は,マンバの入力ゲートにシャドウ・アウェアの類似性を注入する方向変調機構であるCrossGateを提案する。
外観の忠実度をさらに高めるために,グローバルな色統計によって駆動される対照的な学習目標であるColorShift正則化を導入する。
- 参考スコア(独自算出の注目度): 85.07259906446588
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent deep models for image shadow removal often rely on attention-based architectures to capture long-range dependencies. However, their fixed attention patterns tend to mix illumination cues from irrelevant regions, leading to distorted structures and inconsistent colors. In this work, we revisit shadow removal from a sequence modeling perspective and explore the use of Mamba, a selective state space model that propagates global context through directional state transitions. These transitions yield an efficient global receptive field while preserving positional continuity. Despite its potential, directly applying Mamba to image data is suboptimal, since it lacks awareness of shadow-non-shadow semantics and remains susceptible to color interference from nearby regions. To address these limitations, we propose CrossGate, a directional modulation mechanism that injects shadow-aware similarity into Mamba's input gate, allowing selective integration of relevant context along transition axes. To further ensure appearance fidelity, we introduce ColorShift regularization, a contrastive learning objective driven by global color statistics. By synthesizing structured informative negatives, it guides the model to suppress color contamination and achieve robust color restoration. Together, these components adapt sequence modeling to the structural integrity and chromatic consistency required for shadow removal. Extensive experiments on public benchmarks demonstrate that DeshadowMamba achieves state-of-the-art visual quality and strong quantitative performance.
- Abstract(参考訳): 画像シャドウ除去のための最近のディープモデルは、しばしば長距離依存関係をキャプチャするために注意に基づくアーキテクチャに依存している。
しかし、それらの固定された注意パターンは、無関係な領域からの照明手段を混合する傾向があり、歪んだ構造と一貫性のない色に繋がる。
本研究では、シーケンスモデリングの観点から影の除去を再考し、指向性状態遷移を通じてグローバルなコンテキストを伝播する選択状態空間モデルであるMambaの利用について検討する。
これらの遷移は、位置連続性を保持しながら効率的な大域受容場をもたらす。
その可能性にもかかわらず、マンバを画像データに直接適用することは、シャドー・ノン・シャドウ・セマンティクスの認識が欠如し、近隣地域の色干渉の影響を受けにくいため、最適ではない。
これらの制約に対処するために、Mambaの入力ゲートにシャドウ・アウェアの類似性を注入する方向変調機構であるCrossGateを提案する。
外観の忠実度をさらに高めるために,グローバルな色統計によって駆動される対照的な学習目標であるColorShift正則化を導入する。
構造化情報負の合成により、色汚染を抑制し、堅牢な色復元を実現するためのモデルが導かれる。
これらのコンポーネントは、シャドウ除去に必要な構造整合性と色調の整合性にシーケンスモデリングを適用する。
公開ベンチマークに関する大規模な実験は、DeshadowMambaが最先端の視覚的品質と強力な定量的パフォーマンスを達成したことを示している。
関連論文リスト
- VRS-UIE: Value-Driven Reordering Scanning for Underwater Image Enhancement [104.78586859995333]
状態空間モデル(SSM)は、線形複雑性と大域的受容場のために、視覚タスクの有望なバックボーンとして登場した。
大型で均質だが無意味な海洋背景の優位性は、希少で価値ある標的の特徴表現応答を希薄にすることができる。
水中画像強調(UIE)のための新しい値駆動リダクションスキャンフレームワークを提案する。
本フレームワークは, 水バイアスを効果的に抑制し, 構造や色彩の忠実さを保ち, 優れた向上性能(WMambaを平均0.89dB超える)を実現する。
論文 参考訳(メタデータ) (2025-05-02T12:21:44Z) - ShadowMamba: State-Space Model with Boundary-Region Selective Scan for Shadow Removal [3.5734732877967392]
本稿では,シャドウ除去用に設計された最初のマンバモデルであるShadowMambaを提案する。
実験の結果,提案手法はAISTD, ISTD, SRDデータセットにおいて, 従来の主流手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2024-11-05T16:59:06Z) - SwinShadow: Shifted Window for Ambiguous Adjacent Shadow Detection [90.4751446041017]
スウィンシャドウ(SwinShadow)は、隣接する影を検出するための強力なシフトウインドウ機構をフル活用したトランスフォーマーベースのアーキテクチャである。
プロセス全体は、エンコーダ、デコーダ、機能統合の3つの部分に分けられる。
SBU, UCF, ISTDの3つのシャドウ検出ベンチマークデータセットの実験により, ネットワークがバランスエラー率(BER)の点で優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2024-08-07T03:16:33Z) - Cross-Modal Spherical Aggregation for Weakly Supervised Remote Sensing Shadow Removal [22.4845448174729]
本研究では,S2-ShadowNetと呼ばれる球面特徴空間を持つ弱教師付きシャドウ除去ネットワークを提案する。
具体的には、クロスドメインマッピングを学習するために、モーダル変換(可視赤外)モデルを使用し、現実的な赤外線サンプルを生成する。
シャドウマスクを用いた4000個のシャドウ画像を含む,大規模に監督されたシャドウ除去ベンチマークに寄与する。
論文 参考訳(メタデータ) (2024-06-25T11:14:09Z) - DocDeshadower: Frequency-Aware Transformer for Document Shadow Removal [36.182923899021496]
現在のシャドウ除去技術は、さまざまなシャドウインテンシティの扱いやドキュメントの保存において制限に直面している。
ラプラシアンピラミッド上に構築された新しい多周波トランスフォーマーモデルDocDeshadowerを提案する。
DocDeshadowerは最先端の手法に比べて優れた性能を示している。
論文 参考訳(メタデータ) (2023-07-28T05:35:37Z) - DeS3: Adaptive Attention-driven Self and Soft Shadow Removal using ViT Similarity [54.831083157152136]
本稿では,適応的注意とViT類似性に基づいて,ハード,ソフト,セルフシャドーを除去する手法を提案する。
提案手法はSRD, AISTD, LRSS, USR, UIUCデータセットの最先端手法より優れている。
論文 参考訳(メタデータ) (2022-11-15T12:15:29Z) - Shadow-Aware Dynamic Convolution for Shadow Removal [80.82708225269684]
シャドウ領域と非シャドウ領域間の相互依存を分離するための新しいシャドウ・アウェア・ダイナミック・コンボリューション(SADC)モジュールを提案する。
我々のSADCは、非シャドウ領域の色マッピングが学習しやすいという事実に触発され、軽量な畳み込みモジュールで非シャドウ領域を処理する。
我々は,非シャドウ地域からシャドウ地域への情報フローを強化するために,新しいコンボリューション内蒸留損失を開発した。
論文 参考訳(メタデータ) (2022-05-10T14:00:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。