論文の概要: DocDeshadower: Frequency-aware Transformer for Document Shadow Removal
- arxiv url: http://arxiv.org/abs/2307.15318v1
- Date: Fri, 28 Jul 2023 05:35:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-31 13:44:16.256048
- Title: DocDeshadower: Frequency-aware Transformer for Document Shadow Removal
- Title(参考訳): docdeshadower: ドキュメントシャドー削除のための周波数対応トランスフォーマー
- Authors: Shenghong Luo, Ruifeng Xu, Xuhang Chen, Zinuo Li, Chi-Man Pun and
Shuqiang Wang
- Abstract要約: DocDeshadowerはラプラシアンピラミッド上に構築された多周波トランスフォーマーベースのモデルである。
ラプラシアンピラミッドを用いて影画像を異なる周波数帯域に分解する。
Attention-Aggregation Networkは、画像の低周波部分の影を取り除くように設計されている。
Gated Multi-scale Fusion Transformerは、その大きな知覚場で全画像をグローバルスケールで洗練する。
- 参考スコア(独自算出の注目度): 49.107557554811144
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The presence of shadows significantly impacts the visual quality of scanned
documents. However, the existing traditional techniques and deep learning
methods used for shadow removal have several limitations. These methods either
rely heavily on heuristics, resulting in suboptimal performance, or require
large datasets to learn shadow-related features. In this study, we propose the
DocDeshadower, a multi-frequency Transformer-based model built on Laplacian
Pyramid. DocDeshadower is designed to remove shadows at different frequencies
in a coarse-to-fine manner. To achieve this, we decompose the shadow image into
different frequency bands using Laplacian Pyramid. In addition, we introduce
two novel components to this model: the Attention-Aggregation Network and the
Gated Multi-scale Fusion Transformer. The Attention-Aggregation Network is
designed to remove shadows in the low-frequency part of the image, whereas the
Gated Multi-scale Fusion Transformer refines the entire image at a global scale
with its large perceptive field. Our extensive experiments demonstrate that
DocDeshadower outperforms the current state-of-the-art methods in both
qualitative and quantitative terms.
- Abstract(参考訳): 影の存在は、スキャンされた文書の視覚的品質に大きな影響を及ぼす。
しかし,従来のシャドー除去技術や深層学習手法にはいくつかの制限がある。
これらの手法はヒューリスティックスに大きく依存しており、結果として最適以下の性能が得られるか、あるいは影に関連した特徴を学習するために大きなデータセットを必要とする。
本研究では,ラプラシアピラミッドを用いた多周波変圧器モデルであるdocdeshadowerを提案する。
DocDeshadowerは粗い方法で異なる周波数の影を取り除くように設計されている。
これを実現するために,ラプラシアンピラミッドを用いて影像を異なる周波数帯域に分解する。
さらに,本モデルに注意集約ネットワークとゲート型マルチスケール核融合トランスという2つの新しいコンポーネントを導入する。
アテンション・アグリゲーション・ネットワークは、画像の低周波部分の影を取り除くように設計されているが、ゲート型マルチスケール・フュージョントランスフォーマは、大きな知覚野で全画像をグローバルスケールで精製する。
DocDeshadowerは定性的・定量的両面で最先端の手法より優れていることを示す。
関連論文リスト
- Single-Image Shadow Removal Using Deep Learning: A Comprehensive Survey [78.84004293081631]
影のパターンは任意で変化しており、しばしば非常に複雑な痕跡構造を持つ。
影による劣化は空間的に不均一であり、照度と影と非陰影領域間の色に矛盾が生じている。
この分野での最近の開発は、主にディープラーニングベースのソリューションによって進められている。
論文 参考訳(メタデータ) (2024-07-11T20:58:38Z) - ShadowRefiner: Towards Mask-free Shadow Removal via Fast Fourier Transformer [41.008740643546226]
影に影響された画像は、しばしば色と照明の空間的な違いが顕著に現れる。
我々はFast Fourier Transformerを介してマスクレスシャドウ除去・精細ネットワーク(ShadowRefiner)を導入する。
本手法は,NTIRE 2024画像シャドウ除去チャレンジのフィデリティトラックにおいて,第2位を達成し,パーセプチュアルトラックのタイトルを獲得した。
論文 参考訳(メタデータ) (2024-04-18T03:53:33Z) - Progressive Recurrent Network for Shadow Removal [99.1928825224358]
シングルイメージのシャドー削除は、まだ解決されていない重要なタスクである。
既存のディープラーニングベースのアプローチのほとんどは、シャドウを直接削除しようとするが、シャドウをうまく扱えない。
本稿では,影を段階的に除去する簡易かつ効果的なプログレッシブ・リカレント・ネットワーク(PRNet)を提案する。
論文 参考訳(メタデータ) (2023-11-01T11:42:45Z) - ShaDocFormer: A Shadow-Attentive Threshold Detector With Cascaded Fusion Refiner for Document Shadow Removal [26.15238399758745]
本稿では,文書陰影除去の問題に対処するために,従来の手法とディープラーニング技術を統合したTransformerベースのアーキテクチャを提案する。
ShaDocFormerアーキテクチャは、Shadow-attentive Threshold Detector (STD)とCascaded Fusion Refiner (CFR)の2つのコンポーネントで構成されている。
論文 参考訳(メタデータ) (2023-09-13T02:15:29Z) - High-Resolution Document Shadow Removal via A Large-Scale Real-World Dataset and A Frequency-Aware Shadow Erasing Net [42.32958776152137]
ドキュメントをカジュアルな機器でキャプチャすると、シャドウが発生することが多い。
自然なシャドウ除去のアルゴリズムとは異なり、文書シャドウ除去のアルゴリズムはフォントや数字の詳細を高精細な入力で保存する必要がある。
より大規模な実世界のデータセットと、慎重に設計された周波数対応ネットワークを介して、高解像度のドキュメントシャドウ除去を処理します。
論文 参考訳(メタデータ) (2023-08-27T22:45:24Z) - ShaDocNet: Learning Spatial-Aware Tokens in Transformer for Document
Shadow Removal [53.01990632289937]
本稿では,文書陰影除去のためのトランスフォーマーモデルを提案する。
シャドウとシャドウフリーの両方の領域で、シャドウコンテキストエンコーディングとデコードを使用する。
論文 参考訳(メタデータ) (2022-11-30T01:46:29Z) - Shadow-Aware Dynamic Convolution for Shadow Removal [80.82708225269684]
シャドウ領域と非シャドウ領域間の相互依存を分離するための新しいシャドウ・アウェア・ダイナミック・コンボリューション(SADC)モジュールを提案する。
我々のSADCは、非シャドウ領域の色マッピングが学習しやすいという事実に触発され、軽量な畳み込みモジュールで非シャドウ領域を処理する。
我々は,非シャドウ地域からシャドウ地域への情報フローを強化するために,新しいコンボリューション内蒸留損失を開発した。
論文 参考訳(メタデータ) (2022-05-10T14:00:48Z) - Learning from Synthetic Shadows for Shadow Detection and Removal [43.53464469097872]
最近のシャドウ除去は、実対のシャドウ/シャドウフリーまたはシャドウ/シャドウ/マスクイメージデータセット上のすべてのトレイン畳み込みニューラルネットワーク(CNN)にアプローチしている。
今回紹介するSynShadowは、新しい大規模合成影/影なし/マット画像トリプレットデータセットと合成パイプラインである。
論文 参考訳(メタデータ) (2021-01-05T18:56:34Z) - Self-Supervised Shadow Removal [130.6657167667636]
条件付きマスクを用いた自己教師付き学習による教師なしシングルイメージシャドウ除去ソリューションを提案する。
既存の文献とは対照的に、一対のシャドウとシャドウのない画像は必要とせず、自己スーパービジョンに頼り、画像にシャドウを取り除いて追加するために深いモデルを共同で学習する。
論文 参考訳(メタデータ) (2020-10-22T11:33:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。