論文の概要: Winner of CVPR2026 NTIRE Challenge on Image Shadow Removal: Semantic and Geometric Guidance for Shadow Removal via Cascaded Refinement
- arxiv url: http://arxiv.org/abs/2604.16177v2
- Date: Tue, 21 Apr 2026 08:32:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 14:04:47.706514
- Title: Winner of CVPR2026 NTIRE Challenge on Image Shadow Removal: Semantic and Geometric Guidance for Shadow Removal via Cascaded Refinement
- Title(参考訳): CVPR2026 NTIRE Challenge on Image Shadow removal: Semantic and Geometric Guidance for Shadow removal by Cascaded Refinement (特集 バイオサイバネティックスとバイオサイバネティックス)
- Authors: Lorenzo Beltrame, Jules Salzinger, Filip Svoboda, Jasmin Lampert, Phillipp Fanta-Jende, Radu Timofte, Marco Körner,
- Abstract要約: CVPR2026 NTIRE WSRD+チャレンジのための3段階のプログレッシブシャドウ除去パイプラインを提案する。
このモデルは、RGBの外観と凍ったDINOv2のセマンティックガイダンスと、単眼深度と表面正常度の幾何学的手がかりを組み合わせたものである。
WSRD+ 2026の公式テストセットでは、最終アンサンブルは26.680 PSNR、0.8740 SSIM、0.0578 LPIPS、26.135 FIDを獲得し、NTIRE 2026 Image Shadow Prevention Challengeで優勝した。
- 参考スコア(独自算出の注目度): 36.90985364531957
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We present a three-stage progressive shadow-removal pipeline for the CVPR2026 NTIRE WSRD+ challenge. Built on OmniSR, our method treats deshadowing as iterative direct refinement, where later stages correct residual artefacts left by earlier predictions. The model combines RGB appearance with frozen DINOv2 semantic guidance and geometric cues from monocular depth and surface normals, reused across all stages. To stabilise multi-stage optimisation, we introduce a contraction-constrained objective that encourages non-increasing reconstruction error across the cascade. A staged training pipeline transfers from earlier WSRD pretraining to WSRD+ supervision and final WSRD+ 2026 adaptation with cosine-annealed checkpoint ensembling. On the official WSRD+ 2026 hidden test set, our final ensemble achieved 26.680 PSNR, 0.8740 SSIM, 0.0578 LPIPS, and 26.135 FID, ranked first overall, and won the NTIRE 2026 Image Shadow Removal Challenge. The strong performance of the proposed model is further validated on the ISTD+ and UAV-SC+ datasets.
- Abstract(参考訳): CVPR2026 NTIRE WSRD+チャレンジのための3段階のプログレッシブシャドウ除去パイプラインを提案する。
提案手法はOmniSRに基づいて構築され,デシェードイングを反復的直接改良として扱う。
このモデルは、RGBの外観と凍結したDINOv2のセマンティックガイダンスと、すべてのステージで再利用された単眼深度と表面の正常度の幾何学的手がかりを組み合わせる。
複数段階の最適化を安定化するために,カスケード全体の非増加的再構成誤りを助長する制約付き目標を導入する。
訓練パイプラインは、初期のWSRDの事前訓練からWSRD+の監督と、コサインアニールによるチェックポイントのアンサンブルによる最終WSRD+2026への適応へと移行する。
WSRD+ 2026の公式テストセットでは、最終アンサンブルは26.680 PSNR、0.8740 SSIM、0.0578 LPIPS、26.135 FIDを獲得し、NTIRE 2026 Image Shadow Prevention Challengeで優勝した。
提案モデルの性能は, ISTD+およびUAV-SC+データセットでさらに検証される。
関連論文リスト
- Dehaze-then-Splat: Generative Dehazing with Physics-Informed 3D Gaussian Splatting for Smoke-Free Novel View Synthesis [3.2976150695237827]
我々は,NTIRE 2026 3Dレコンストラクションチャレンジのトラック2で開発されたマルチビュー煙除去と新しいビュー合成のための2段階パイプラインであるDehaze-then-Splatを提案する。
第1段階では,Nano Banana Pro を用いたフレーム毎生成脱ハージングによる擬似クリーントレーニング画像を作成し,続いて輝度正規化を行った。
第2段階では,物理インフォームドされた補助損失を伴って3次元ガウススプラッティングを訓練する。
論文 参考訳(メタデータ) (2026-04-15T07:52:53Z) - Beyond Model Design: Data-Centric Training and Self-Ensemble for Gaussian Color Image Denoising [7.344881114730842]
NTIRE 2026 Image Denoising Challenge (ガウス色画像の固定ノイズレベル$=50$でのデノイング)の解法について述べる。
成熟したRestormerアーキテクチャのパフォーマンス境界を、より強力なデータ中心のトレーニングと、より完全なTest-Time機能リリースという2つの相補的な方向から見直す。
100枚の画像の挑戦検証セットでは,30.762 dB PSNRと0.861 SSIMを達成し,公開Restormer $!=50$事前トレーニングベースラインを最大3.366 dB PSNRで改善した。
論文 参考訳(メタデータ) (2026-04-13T13:42:13Z) - The Tenth NTIRE 2025 Efficient Super-Resolution Challenge Report [170.81876816944754]
NTIRE 2025 Challenge on Single-Image Efficient Super-Resolution (ESR)は、主要な計算メトリクスを最適化するモデルの開発を進めることを目的としている。
本稿では,最先端のシングルイメージESR技術における画期的な進歩を強調し,これらの手法と成果を慎重に分析する。
論文 参考訳(メタデータ) (2025-04-14T20:18:21Z) - Detail-Preserving Latent Diffusion for Stable Shadow Removal [24.18957090960958]
安定かつ効率的なシャドウ除去に安定拡散モデルを適用するための2段階微調整パイプラインを提案する。
実験の結果,提案手法は最先端のシャドウ除去技術より優れていた。
論文 参考訳(メタデータ) (2024-12-23T15:06:46Z) - Progressive Recurrent Network for Shadow Removal [99.1928825224358]
シングルイメージのシャドー削除は、まだ解決されていない重要なタスクである。
既存のディープラーニングベースのアプローチのほとんどは、シャドウを直接削除しようとするが、シャドウをうまく扱えない。
本稿では,影を段階的に除去する簡易かつ効果的なプログレッシブ・リカレント・ネットワーク(PRNet)を提案する。
論文 参考訳(メタデータ) (2023-11-01T11:42:45Z) - ShadowDiffusion: When Degradation Prior Meets Diffusion Model for Shadow
Removal [74.86415440438051]
画像と劣化先行情報を統合した統合拡散フレームワークを提案する。
SRDデータセット上でのPSNRは31.69dBから34.73dBへと大幅に向上した。
論文 参考訳(メタデータ) (2022-12-09T07:48:30Z) - Deep Neural Networks are Surprisingly Reversible: A Baseline for
Zero-Shot Inversion [90.65667807498086]
本稿では、内部表現のみを与えられたトレーニングモデルへの入力を復元するゼロショット直接モデル逆変換フレームワークを提案する。
ImageNetの最新の分類モデルでは、20層以上の表現から元の224x224px画像を近似的に復元できることを実証的に示す。
論文 参考訳(メタデータ) (2021-07-13T18:01:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。