論文の概要: DocShaDiffusion: Diffusion Model in Latent Space for Document Image Shadow Removal
- arxiv url: http://arxiv.org/abs/2507.01422v1
- Date: Wed, 02 Jul 2025 07:22:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-03 14:23:00.081044
- Title: DocShaDiffusion: Diffusion Model in Latent Space for Document Image Shadow Removal
- Title(参考訳): DocShaDiffusion:文書画像シャドウ除去のための潜時空間拡散モデル
- Authors: Wenjie Liu, Bingshu Wang, Ze Wang, C. L. Philip Chen,
- Abstract要約: 既存の方法は、一定の色の背景を持つ影を除去し、色影を無視する傾向がある。
本稿では,DocShaDiffusionと呼ばれる文書画像の影除去のための遅延空間での拡散モデルの設計を行う。
カラーシャドウの問題に対処するため、影ソフトマスク生成モジュール(SSGM)を設計する。
影マスク対応拡散モジュール (SMGDM) を提案し, 拡散・復調過程を監督し, 文書画像から影を除去する。
- 参考スコア(独自算出の注目度): 61.375359734723716
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Document shadow removal is a crucial task in the field of document image enhancement. However, existing methods tend to remove shadows with constant color background and ignore color shadows. In this paper, we first design a diffusion model in latent space for document image shadow removal, called DocShaDiffusion. It translates shadow images from pixel space to latent space, enabling the model to more easily capture essential features. To address the issue of color shadows, we design a shadow soft-mask generation module (SSGM). It is able to produce accurate shadow mask and add noise into shadow regions specially. Guided by the shadow mask, a shadow mask-aware guided diffusion module (SMGDM) is proposed to remove shadows from document images by supervising the diffusion and denoising process. We also propose a shadow-robust perceptual feature loss to preserve details and structures in document images. Moreover, we develop a large-scale synthetic document color shadow removal dataset (SDCSRD). It simulates the distribution of realistic color shadows and provides powerful supports for the training of models. Experiments on three public datasets validate the proposed method's superiority over state-of-the-art. Our code and dataset will be publicly available.
- Abstract(参考訳): 文書影除去は文書画像強調の分野において重要な課題である。
しかし、既存の手法では、一定の色の背景を持つ影を除去し、色影を無視する傾向がある。
本稿では,DocShaDiffusionと呼ばれる文書画像の影除去のための遅延空間での拡散モデルの設計を行う。
シャドウ画像をピクセル空間から潜在空間に変換することで、モデルが重要な特徴をより容易に捉えることができる。
カラーシャドウの問題に対処するため,影ソフトマスク生成モジュール (SSGM) を設計した。
シャドウマスクを正確に作り、特にシャドウ領域にノイズを加えることができる。
シャドウマスクによって導かれるシャドウマスク対応拡散モジュール (SMGDM) は, 拡散・復調過程を監督することにより, 文書画像からシャドウを除去する。
また,文書画像の細部や構造を保存するために,シャドウロスの知覚的特徴損失を提案する。
さらに, 大規模合成文書カラーシャドウ除去データセット (SDCSRD) を開発した。
リアルなカラーシャドーの分布をシミュレートし、モデルのトレーニングに強力なサポートを提供する。
3つの公開データセットの実験は、提案手法が最先端よりも優れていることを検証した。
コードとデータセットは公開されます。
関連論文リスト
- Leveraging Contrast Information for Efficient Document Shadow Removal [15.35209972174416]
ドキュメントのシャドーは、デジタル化プロセスにおける大きな障害です。
コントラスト表現による文書のシャドウ除去手法を提案する。
論文 参考訳(メタデータ) (2025-04-01T03:06:20Z) - MetaShadow: Object-Centered Shadow Detection, Removal, and Synthesis [64.00425120075045]
シャドウは画像編集アプリケーションでは過小評価されるか無視されることが多く、編集結果のリアリズムが制限される。
本稿では,自然画像中の影の検出・除去・制御が可能な3-in-one多元性フレームワークであるMetaShadowを紹介する。
論文 参考訳(メタデータ) (2024-12-03T18:04:42Z) - Shadow Removal Refinement via Material-Consistent Shadow Edges [33.8383848078524]
同じ材料で領域を横断する影の縁の両側には、影を適切に取り除けば、原色とテクスチャは同一であるべきである。
画像セグメンテーション基盤モデルであるSAMを微調整し、影不変セグメンテーションを生成し、材料一貫性のあるシャドウエッジを抽出する。
本手法は,より難易度の高い画像に対して,影除去結果の改善に有効であることを示す。
論文 参考訳(メタデータ) (2024-09-10T20:16:28Z) - Structure-Informed Shadow Removal Networks [67.57092870994029]
既存のディープラーニングベースのシャドウ除去手法は、依然として影の残像を持つ画像を生成する。
本稿では,影残差問題に対処するために,画像構造情報を活用する構造インフォームド・シャドウ除去ネットワーク(StructNet)を提案する。
我々の手法は既存のシャドウ除去方法よりも優れており、StructNetは既存の手法と統合してさらに改善することができる。
論文 参考訳(メタデータ) (2023-01-09T06:31:52Z) - ShaDocNet: Learning Spatial-Aware Tokens in Transformer for Document
Shadow Removal [53.01990632289937]
本稿では,文書陰影除去のためのトランスフォーマーモデルを提案する。
シャドウとシャドウフリーの両方の領域で、シャドウコンテキストエンコーディングとデコードを使用する。
論文 参考訳(メタデータ) (2022-11-30T01:46:29Z) - DeS3: Adaptive Attention-driven Self and Soft Shadow Removal using ViT Similarity [54.831083157152136]
本稿では,適応的注意とViT類似性に基づいて,ハード,ソフト,セルフシャドーを除去する手法を提案する。
提案手法はSRD, AISTD, LRSS, USR, UIUCデータセットの最先端手法より優れている。
論文 参考訳(メタデータ) (2022-11-15T12:15:29Z) - Shadow-Aware Dynamic Convolution for Shadow Removal [80.82708225269684]
シャドウ領域と非シャドウ領域間の相互依存を分離するための新しいシャドウ・アウェア・ダイナミック・コンボリューション(SADC)モジュールを提案する。
我々のSADCは、非シャドウ領域の色マッピングが学習しやすいという事実に触発され、軽量な畳み込みモジュールで非シャドウ領域を処理する。
我々は,非シャドウ地域からシャドウ地域への情報フローを強化するために,新しいコンボリューション内蒸留損失を開発した。
論文 参考訳(メタデータ) (2022-05-10T14:00:48Z) - Physics-based Shadow Image Decomposition for Shadow Removal [36.41558227710456]
陰影除去のための新しい深層学習法を提案する。
影形成の物理モデルにインスパイアされ、線形照明変換を用いて画像内の影効果をモデル化する。
最も困難なシャドウ除去データセットでフレームワークをトレーニングし、テストします。
論文 参考訳(メタデータ) (2020-12-23T23:06:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。