論文の概要: CFSR: Geometry-Conditioned Shadow Removal via Physical Disentanglement
- arxiv url: http://arxiv.org/abs/2604.18032v1
- Date: Mon, 20 Apr 2026 09:58:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.798689
- Title: CFSR: Geometry-Conditioned Shadow Removal via Physical Disentanglement
- Title(参考訳): CFSR: 物理的遠絡による幾何構成陰影除去
- Authors: Pan Wang, Yihao Hu, Xiujin Liu, Hang Wang,
- Abstract要約: CFSRは、物理制約のある復元プロセスとしてシャドー除去を再構成する、マルチモーダルな事前駆動フレームワークである。
CFSRは、複数の挑戦的なベンチマークで最先端のパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 22.031783191814323
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Traditional shadow removal networks often treat image restoration as an unconstrained mapping, lacking the physical interpretability required to balance localized texture recovery with global illumination consistency. To address this, we propose CFSR, a multi-modal prior-driven framework that reframes shadow removal as a physics-constrained restoration process. By seamlessly integrating 3D geometric cues with large-scale foundation model semantics, CFSR effectively bridges the 2D-3D domain gap. Specifically, we first map observations into a custom HVI color space to suppress shadow-induced noise and robustly fuse RGB data with estimated depth priors. At its core, our Geometric & Semantic Dual Explicit Guided Attention mechanism utilizes DINO features and 3D surface normals to directly modulate the attention affinity matrix, structurally enforcing physical lighting constraints. To recover severely degraded regions, we inject holistic priors via a frozen CLIP encoder. Finally, our Frequency Collaborative Reconstruction Module (FCRM) achieves an optimal synthesis by decoupling the decoding process. Conditioned on geometric priors, FCRM seamlessly harmonizes the reconstruction of sharp high-frequency occlusion boundaries with the restoration of low-frequency global illumination. Extensive experiments demonstrate that CFSR achieves state-of-the-art performance across multiple challenging benchmarks.
- Abstract(参考訳): 従来のシャドウ除去ネットワークは、画像復元を制約のないマッピングとして扱うことが多く、局所的なテクスチャ回復と大域的な照明の一貫性のバランスをとるために必要な物理的解釈性が欠如している。
そこで本研究では,影除去を物理制約付き復元プロセスとして再設計する,マルチモーダルな事前駆動型フレームワークCFSRを提案する。
3次元幾何学的キューを大規模基礎モデル意味論とシームレスに統合することにより、CFSRは2D-3D領域ギャップを効果的に橋渡しする。
具体的には、まず、観測結果を独自のHVI色空間にマッピングし、影によるノイズを抑え、推定深度事前のRGBデータを頑健に融合させる。
我々のGeometric & Semantic Dual Explicit Guided Attentionメカニズムは、DINOの特徴と3D表面の正常さを利用して、物理的光の制約を構造化し、注意親和性行列を直接調整します。
高度に劣化した領域を回復するため,凍結したCLIPエンコーダを介し,包括的前駆体を注入する。
最後に、周波数協調再構成モジュール(FCRM)は、復号プロセスを切り離して最適な合成を実現する。
幾何学的先行条件により、FCRMは低周波の大域照明の復元とともに、鋭い高周波閉塞境界の復元をシームレスに調和させる。
大規模な実験により、CFSRは複数の挑戦的なベンチマークで最先端のパフォーマンスを達成している。
関連論文リスト
- Naka-GS: A Bionics-inspired Dual-Branch Naka Correction and Progressive Point Pruning for Low-Light 3DGS [5.922483935990404]
我々は,低照度3次元ガウススプラッティングのためのバイオニックスに着想を得たフレームワークであるNaka-GSを提案する。
本手法は,物理優先の低照度化,デュアルブランチ入力モデリング,周波数分離補正,マスク誘導最適化を組み合わせた。
提案手法は, NTIRE 3D Restoration and Reconstruction (DRR) Challenge において提案され, ベースライン法よりも高い性能を示した。
論文 参考訳(メタデータ) (2026-04-13T07:58:58Z) - R-PGA: Robust Physical Adversarial Camouflage Generation via Relightable 3D Gaussian Splatting [59.29134814041703]
物理的敵対的なカモフラージュは、自律運転システムに深刻なセキュリティ上の脅威をもたらす。
現在の手法は、様々な幾何学的(例えば、視線構成)とラジオメトリックのバリエーションにまたがる一般化に失敗する。
Relightable Physical 3D Gaussian Splatting framework (R-PGA)を提案する。
論文 参考訳(メタデータ) (2026-03-27T04:38:04Z) - PolGS++: Physically-Guided Polarimetric Gaussian Splatting for Fast Reflective Surface Reconstruction [76.9760302941819]
PolGS++は高速反射面再構成のための偏光ガウス散乱フレームワークである。
本稿では,アングル・オブ・ポラライゼーション(AoP)に基づくタンジェント空間の整合性制約を実現するための,奥行き誘導型可視マスク取得機構を提案する。
論文 参考訳(メタデータ) (2026-03-11T14:11:42Z) - STAvatar: Soft Binding and Temporal Density Control for Monocular 3D Head Avatars Reconstruction [18.777422532112105]
既存の3次元ガウス散乱に基づく手法は、通常、ガウス多様体を線形ブレンドスキニングのみを通してメッシュ三角形とモデル変形に結合する。
本研究では,(1)UV空間内のガウス特徴オフセットを学習するために,画像ベースと幾何学的先行情報の両方を活用するUV-Temporal Soft BindingフレームワークであるSTAvatarを提案する。
STAvatarは、特に細かな細部を捉え、しばしば閉鎖された領域を再構築する際に、最先端の再構築性能を達成する。
論文 参考訳(メタデータ) (2025-11-25T02:35:00Z) - HBSplat: Robust Sparse-View Gaussian Reconstruction with Hybrid-Loss Guided Depth and Bidirectional Warping [11.035994094874141]
HBSplatは、堅牢な構造的キュー、仮想ビュー制約、隠蔽された領域補完をシームレスに統合するフレームワークである。
HBSplatは21.13dBのPSNRと0.189LPIPSを達成し、リアルタイム推論を維持している。
論文 参考訳(メタデータ) (2025-09-29T15:03:31Z) - CryoFastAR: Fast Cryo-EM Ab Initio Reconstruction Made Easy [58.86576215228903]
我々はCryo-EMノイズ画像から直接ポーズを予測できる最初の幾何学的基礎モデルであるCryoFastARを紹介した。
CryoFastARは、マルチビュー機能と、大規模シミュレーションされたCryo-EMデータに現実的なノイズとCTF変調を統合することで、ポーズ推定精度と一般化を向上する。
論文 参考訳(メタデータ) (2025-06-06T08:32:32Z) - Decompositional Neural Scene Reconstruction with Generative Diffusion Prior [64.71091831762214]
完全な形状と詳細なテクスチャを持つ3次元シーンの分解的再構成は、下流の応用に興味深い。
近年のアプローチでは、この問題に対処するために意味的あるいは幾何学的正則化が取り入れられているが、制約の少ない領域では著しく劣化している。
本稿では,SDS(Score Distillation Sampling)の形で拡散先行値を用いたDP-Reconを提案し,新しい視点下で個々の物体の神経表現を最適化する。
論文 参考訳(メタデータ) (2025-03-19T02:11:31Z) - PBR-NeRF: Inverse Rendering with Physics-Based Neural Fields [49.6405458373509]
シーン形状,材料,照明を共同で推定できる逆レンダリング(IR)モデルを提案する。
本手法は, 材料推定を必要とする他の逆レンダリングおよび3次元再構成フレームワークに容易に適用可能である。
論文 参考訳(メタデータ) (2024-12-12T19:00:21Z) - FCDM: A Physics-Guided Bidirectional Frequency Aware Convolution and Diffusion-Based Model for Sinogram Inpainting [14.043383277622874]
フルビューのシノグラムは高い放射線線量と長いスキャン時間を必要とする。
スパースビューCTは、この負担を軽減するが、構造的な信号損失を伴う不完全なシノグラムを生じる。
本研究では,Ninogram に適した拡散型フレームワークであるmodelnameを提案する。
論文 参考訳(メタデータ) (2024-08-26T12:31:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。