論文の概要: VSDiffusion: Taming Ill-Posed Shadow Generation via Visibility-Constrained Diffusion
- arxiv url: http://arxiv.org/abs/2603.08020v1
- Date: Mon, 09 Mar 2026 06:52:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:15.610877
- Title: VSDiffusion: Taming Ill-Posed Shadow Generation via Visibility-Constrained Diffusion
- Title(参考訳): VSDiffusion:可視性制約付き拡散によるIll-Posed Shadow生成のモデリング
- Authors: Jing Li, Jing Zhang,
- Abstract要約: 挿入された前景オブジェクトに対してリアルなキャストシャドウを生成するためのVSDiffusionを提案する。
可視性に制約のある2段階のフレームワークは、可視性事前を取り入れることで、ソリューション空間を狭めるように設計されている。
広く使われているDESOBAv2データセットの実験では、提案したVSDiffusionが正確なシャドウを生成することを示した。
- 参考スコア(独自算出の注目度): 10.547624877131122
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generating realistic cast shadows for inserted foreground objects is a crucial yet challenging problem in image composition, where maintaining geometric consistency of shadow and object in complex scenes remains difficult due to the ill-posed nature of shadow formation. To address this issue, we propose VSDiffusion, a visibility-constrained two-stage framework designed to narrow the solution space by incorporating visibility priors. In Stage I, we predict a coarse shadow mask to localize plausible shadow generated regions. And in Stage II, conditional diffusion is performed guided by lighting and depth cues estimated from the composite to generate accurate shadows. In VSDiffusion, we inject visibility priors through two complementary pathways. First, a visibility control branch with shadow-gated cross attention that provides multi-scale structural guidance. Then, a learned soft prior map that reweights training loss in error-prone regions to enhance geometric correction. Additionally, we also introduce high-frequency guided enhancement module to sharpen boundaries and improve texture interaction with the background. Experiments on widely used public DESOBAv2 dataset demonstrated that our proposed VSDiffusion can generate accurate shadow, and establishes new SOTA results across most evaluation metrics.
- Abstract(参考訳): 複雑なシーンにおける影と物体の幾何的整合性を維持することは, 影形成の異常な性質のため困難でありながら, 画像合成において重要な課題である。
この問題に対処するため,視界に制約のある2段階のフレームワークであるVSDiffusionを提案する。
ステージIでは、粗いシャドウマスクを予測して、可塑性シャドウ生成領域をローカライズする。
そして、ステージIIでは、光と奥行きによって条件拡散を誘導し、正確な影を生成する。
VSDiffusionでは2つの相補経路を通して可視性前駆体を注入する。
第一に、マルチスケール構造ガイダンスを提供するシャドーゲートクロスアテンションを備えた可視性制御ブランチである。
次に, 学習ソフト事前マップを用いて, 誤差発生領域におけるトレーニング損失の重み付けを行い, 幾何補正を向上する。
また,背景とのテクスチャ相互作用を改善するために,高周波数ガイド付拡張モジュールも導入した。
広く利用されているDESOBAv2データセットの実験では、提案したVSDiffusionが正確なシャドーを生成し、ほとんどの評価指標で新しいSOTA結果を確立することができた。
関連論文リスト
- Joint Shadow Generation and Relighting via Light-Geometry Interaction Maps [51.82696819319878]
単分子深度から光を識別する新しい表現である光幾何相互作用マップを提案する。
LGIは、オフザシェルフ2.5D深度マップ予測から計算された、確実かつ正確に光と影の相互作用をキャプチャする。
LGIをブリッジマッチングした生成バックボーンに埋め込むことで、曖昧さを低減し、物理的に一貫した光陰性推論を強制する。
論文 参考訳(メタデータ) (2026-02-25T11:47:26Z) - Contrast-Prior Enhanced Duality for Mask-Free Shadow Removal [12.417806583744134]
既存のシャドウ除去法はしばしばシャドウマスクに依存しており、現実のシナリオでは取得が困難である。
局所コントラスト情報などの本質的な画像手がかりの探索は、明示的なマスクがない場合のシャドウ除去を導くための潜在的な代替手段を示す。
本稿では,適応型2分岐注意機構 (AGBA) を提案する。
論文 参考訳(メタデータ) (2025-07-29T16:00:42Z) - Detail-Preserving Latent Diffusion for Stable Shadow Removal [24.18957090960958]
安定かつ効率的なシャドウ除去に安定拡散モデルを適用するための2段階微調整パイプラインを提案する。
実験の結果,提案手法は最先端のシャドウ除去技術より優れていた。
論文 参考訳(メタデータ) (2024-12-23T15:06:46Z) - Test-Time Intensity Consistency Adaptation for Shadow Detection [35.03354405371279]
TICAは、テスト時間適応時の光強度情報を利用して、影検出精度を高める新しいフレームワークである。
基本的なエンコーダ・デコーダモデルは、最初はシャドー検出のためのラベル付きデータセットでトレーニングされる。
テストフェーズでは、一貫した強度予測を行うことで、各テストサンプルに対してネットワークを調整する。
論文 参考訳(メタデータ) (2024-10-10T08:08:32Z) - Cross-Modal Spherical Aggregation for Weakly Supervised Remote Sensing Shadow Removal [22.4845448174729]
本研究では,S2-ShadowNetと呼ばれる球面特徴空間を持つ弱教師付きシャドウ除去ネットワークを提案する。
具体的には、クロスドメインマッピングを学習するために、モーダル変換(可視赤外)モデルを使用し、現実的な赤外線サンプルを生成する。
シャドウマスクを用いた4000個のシャドウ画像を含む,大規模に監督されたシャドウ除去ベンチマークに寄与する。
論文 参考訳(メタデータ) (2024-06-25T11:14:09Z) - SIRe-IR: Inverse Rendering for BRDF Reconstruction with Shadow and
Illumination Removal in High-Illuminance Scenes [51.50157919750782]
本稿では,環境マップ,アルベド,粗さにシーンを分解する暗黙のニューラルレンダリング逆アプローチSIRe-IRを提案する。
間接放射場、通常光、可視光、および直接光を同時に正確にモデル化することにより、影と間接光の両方を除去することができる。
強い照明の存在下でも,影の干渉を伴わずに高品質なアルベドと粗さを回収する。
論文 参考訳(メタデータ) (2023-10-19T10:44:23Z) - SDDNet: Style-guided Dual-layer Disentanglement Network for Shadow Detection [85.16141353762445]
入力シャドウ画像を背景層と影層の合成として扱い、これらの層を独立にモデル化するためのスタイル誘導デュアル層ディスタングルネットワークを設計する。
提案モデルは背景色による有害な効果を効果的に最小化し,32FPSのリアルタイム推論速度を持つ3つの公開データセットに対して優れた性能を示す。
論文 参考訳(メタデータ) (2023-08-17T12:10:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。