論文の概要: Retinex-guided Histogram Transformer for Mask-free Shadow Removal
- arxiv url: http://arxiv.org/abs/2504.14092v1
- Date: Fri, 18 Apr 2025 22:19:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-30 05:19:55.58849
- Title: Retinex-guided Histogram Transformer for Mask-free Shadow Removal
- Title(参考訳): マスクレスシャドウ除去のための網膜誘導ヒストグラム変換器
- Authors: Wei Dong, Han Zhou, Seyed Amirreza Mousavi, Jun Chen,
- Abstract要約: ReHiTは、Retinex理論でガイドされたハイブリッドCNN-Transformerアーキテクチャに基づく、効率的なマスクフリーのシャドウ除去フレームワークである。
提案手法は,最少パラメータの1つと最上位エントリ間の高速推論速度で競合する結果を提供する。
- 参考スコア(独自算出の注目度): 12.962534359029103
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While deep learning methods have achieved notable progress in shadow removal, many existing approaches rely on shadow masks that are difficult to obtain, limiting their generalization to real-world scenes. In this work, we propose ReHiT, an efficient mask-free shadow removal framework based on a hybrid CNN-Transformer architecture guided by Retinex theory. We first introduce a dual-branch pipeline to separately model reflectance and illumination components, and each is restored by our developed Illumination-Guided Hybrid CNN-Transformer (IG-HCT) module. Second, besides the CNN-based blocks that are capable of learning residual dense features and performing multi-scale semantic fusion, multi-scale semantic fusion, we develop the Illumination-Guided Histogram Transformer Block (IGHB) to effectively handle non-uniform illumination and spatially complex shadows. Extensive experiments on several benchmark datasets validate the effectiveness of our approach over existing mask-free methods. Trained solely on the NTIRE 2025 Shadow Removal Challenge dataset, our solution delivers competitive results with one of the smallest parameter sizes and fastest inference speeds among top-ranked entries, highlighting its applicability for real-world applications with limited computational resources. The code is available at https://github.com/dongw22/oath.
- Abstract(参考訳): 深層学習手法は影の除去において顕著な進歩を遂げてきたが、既存の多くのアプローチは取得が困難な影マスクに依存しており、その一般化を現実の場面に限定している。
本研究では,Retinex 理論で導かれるハイブリッド CNN-Transformer アーキテクチャをベースとした,マスクのない効率的なシャドウ除去フレームワーク ReHiT を提案する。
まず、反射率と照明成分を別々にモデル化するためのデュアルブランチパイプラインを導入し、そのそれぞれを改良したIllumination-Guided Hybrid CNN-Transformer (IG-HCT)モジュールで復元する。
第2に,高密度な特徴を学習し,マルチスケールのセマンティックフュージョン,マルチスケールのセマンティックフュージョンを実行することができるCNNベースのブロックに加えて,照明誘導ヒストグラム変換器ブロック(IGHB)を開発し,非均一照明と空間的に複雑な影を効果的に処理する。
いくつかのベンチマークデータセットに対する大規模な実験により、既存のマスクフリー手法に対するアプローチの有効性が検証された。
NTIRE 2025シャドウ除去チャレンジのデータセットのみに基づいてトレーニングされ、私たちのソリューションは、最上位のエントリの中で最小のパラメータサイズと最速の推論速度の1つで競合する結果を提供し、計算リソースが限られている現実世界のアプリケーションへの適用性を強調します。
コードはhttps://github.com/dongw22/oath.comで公開されている。
関連論文リスト
- WavShadow: Wavelet Based Shadow Segmentation and Removal [0.0]
本研究では,Masked Autoencoder(MAE)とFast Fourier Convolution(FFC)ブロックを組み込むことで,ShadowFormerモデルを改善する新しい手法を提案する。
1)Places2データセットでトレーニングされたMAE事前情報の統合によるコンテキスト理解,(2)エッジ検出とマルチスケール解析のためのハールウェーブレット機能の導入,(3)ロバストシャドーセグメンテーションのための改良SAMアダプタの実装。
論文 参考訳(メタデータ) (2024-11-08T18:08:33Z) - ShadowMamba: State-Space Model with Boundary-Region Selective Scan for Shadow Removal [3.5734732877967392]
シャドーはいくつかの領域で突然の明るさ変化を引き起こし、下流のタスクの精度に影響を与える可能性がある。
本研究では,影領域,境界領域,非影領域を別々にスキャンする境界領域選択走査機構を提案する。
私たちはShadowMambaと呼ばれる、最初のMambaベースの軽量シャドウ除去モデルを設計した。
論文 参考訳(メタデータ) (2024-11-05T16:59:06Z) - RelitLRM: Generative Relightable Radiance for Large Reconstruction Models [52.672706620003765]
本稿では,新しい照明下での3Dオブジェクトの高品質なガウススプレイティング表現を生成するためのRelitLRMを提案する。
複雑なキャプチャと遅い最適化を必要とする従来の逆レンダリングとは異なり、RelitLRMはフィードフォワードトランスフォーマーベースのモデルを採用している。
スパースビューフィードフォワードRelitLRMは、最先端の密集ビュー最適化ベースラインに対して、競争力のあるリライティング結果を提供する。
論文 参考訳(メタデータ) (2024-10-08T17:40:01Z) - SwinShadow: Shifted Window for Ambiguous Adjacent Shadow Detection [90.4751446041017]
スウィンシャドウ(SwinShadow)は、隣接する影を検出するための強力なシフトウインドウ機構をフル活用したトランスフォーマーベースのアーキテクチャである。
プロセス全体は、エンコーダ、デコーダ、機能統合の3つの部分に分けられる。
SBU, UCF, ISTDの3つのシャドウ検出ベンチマークデータセットの実験により, ネットワークがバランスエラー率(BER)の点で優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2024-08-07T03:16:33Z) - ShadowMaskFormer: Mask Augmented Patch Embeddings for Shadow Removal [13.983288991595614]
シャドウ除去に適した新しいパッチ埋め込みを備えたトランスフォーマーベースのフレームワークを提案する。
本稿では,シャドウ情報の統合と,シャドウ領域の知識獲得を重視したモデルの構築を目的とした,シンプルで効果的なマスク拡張パッチ埋め込みを提案する。
論文 参考訳(メタデータ) (2024-04-29T05:17:33Z) - ShadowRefiner: Towards Mask-free Shadow Removal via Fast Fourier Transformer [41.008740643546226]
影に影響された画像は、しばしば色と照明の空間的な違いが顕著に現れる。
我々はFast Fourier Transformerを介してマスクレスシャドウ除去・精細ネットワーク(ShadowRefiner)を導入する。
本手法は,NTIRE 2024画像シャドウ除去チャレンジのフィデリティトラックにおいて,第2位を達成し,パーセプチュアルトラックのタイトルを獲得した。
論文 参考訳(メタデータ) (2024-04-18T03:53:33Z) - Towards Image Ambient Lighting Normalization [47.42834070783831]
環境照明正規化(ALN)は、より広い文脈で影間の相互作用を研究し、画像復元と影除去を統一する。
ベンチマークでは、様々な主流手法を選択し、Ambient6K上でそれらを厳格に評価する。
IFBlendは、Ambient6K上でSOTAスコアを達成し、従来のシャドウ除去ベンチマークで競合性能を示す。
論文 参考訳(メタデータ) (2024-03-27T16:20:55Z) - Progressive Recurrent Network for Shadow Removal [99.1928825224358]
シングルイメージのシャドー削除は、まだ解決されていない重要なタスクである。
既存のディープラーニングベースのアプローチのほとんどは、シャドウを直接削除しようとするが、シャドウをうまく扱えない。
本稿では,影を段階的に除去する簡易かつ効果的なプログレッシブ・リカレント・ネットワーク(PRNet)を提案する。
論文 参考訳(メタデータ) (2023-11-01T11:42:45Z) - DocDeshadower: Frequency-Aware Transformer for Document Shadow Removal [36.182923899021496]
現在のシャドウ除去技術は、さまざまなシャドウインテンシティの扱いやドキュメントの保存において制限に直面している。
ラプラシアンピラミッド上に構築された新しい多周波トランスフォーマーモデルDocDeshadowerを提案する。
DocDeshadowerは最先端の手法に比べて優れた性能を示している。
論文 参考訳(メタデータ) (2023-07-28T05:35:37Z) - Multi-scale Transformer Network with Edge-aware Pre-training for
Cross-Modality MR Image Synthesis [52.41439725865149]
クロスモダリティ磁気共鳴(MR)画像合成は、与えられたモダリティから欠落するモダリティを生成するために用いられる。
既存の(教師付き学習)手法は、効果的な合成モデルを訓練するために、多くのペア化されたマルチモーダルデータを必要とすることが多い。
マルチスケールトランスフォーマーネットワーク(MT-Net)を提案する。
論文 参考訳(メタデータ) (2022-12-02T11:40:40Z) - Progressively-connected Light Field Network for Efficient View Synthesis [69.29043048775802]
本稿では、複雑な前方シーンのビュー合成のためのプログレッシブ・コネクテッド・ライトフィールド・ネットワーク(ProLiF)を提案する。
ProLiFは4Dライトフィールドをエンコードし、画像やパッチレベルの損失に対するトレーニングステップで大量の光線をレンダリングすることができる。
論文 参考訳(メタデータ) (2022-07-10T13:47:20Z) - Recurrent Multi-view Alignment Network for Unsupervised Surface
Registration [79.72086524370819]
非厳格な登録をエンドツーエンドで学習することは、本質的に高い自由度とラベル付きトレーニングデータの欠如により困難である。
我々は、いくつかの剛性変換のポイントワイドな組み合わせで、非剛性変換を表現することを提案する。
また,投影された多視点2次元深度画像上での3次元形状の類似度を計測する可微分損失関数も導入する。
論文 参考訳(メタデータ) (2020-11-24T14:22:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。