Fugu-MT 論文翻訳(概要): ShaDocFormer: A Shadow-Attentive Threshold Detector With Cascaded Fusion Refiner for Document Shadow Removal

論文の概要: ShaDocFormer: A Shadow-Attentive Threshold Detector With Cascaded Fusion Refiner for Document Shadow Removal

arxiv url: http://arxiv.org/abs/2309.06670v3
Date: Wed, 20 Mar 2024 02:31:16 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-21 22:37:29.187544
Title: ShaDocFormer: A Shadow-Attentive Threshold Detector With Cascaded Fusion Refiner for Document Shadow Removal
Title（参考訳）: ShaDocFormer: ドキュメントシャドウ除去のためのカスケード融合精錬器を備えたシャドウ検出用閾値検出器
Authors: Weiwen Chen, Yingtie Lei, Shenghong Luo, Xuhang Chen, Ziyang Zhou, Mingxian Li, Chi-Man Pun,
Abstract要約: 本稿では,文書陰影除去の問題に対処するために,従来の手法とディープラーニング技術を統合したTransformerベースのアーキテクチャを提案する。 ShaDocFormerアーキテクチャは、Shadow-attentive Threshold Detector (STD)とCascaded Fusion Refiner (CFR)の2つのコンポーネントで構成されている。
参考スコア（独自算出の注目度）: 26.890313067227964
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Document shadow is a common issue that arises when capturing documents using mobile devices, which significantly impacts readability. Current methods encounter various challenges, including inaccurate detection of shadow masks and estimation of illumination. In this paper, we propose ShaDocFormer, a Transformer-based architecture that integrates traditional methodologies and deep learning techniques to tackle the problem of document shadow removal. The ShaDocFormer architecture comprises two components: the Shadow-attentive Threshold Detector (STD) and the Cascaded Fusion Refiner (CFR). The STD module employs a traditional thresholding technique and leverages the attention mechanism of the Transformer to gather global information, thereby enabling precise detection of shadow masks. The cascaded and aggregative structure of the CFR module facilitates a coarse-to-fine restoration process for the entire image. As a result, ShaDocFormer excels in accurately detecting and capturing variations in both shadow and illumination, thereby enabling effective removal of shadows. Extensive experiments demonstrate that ShaDocFormer outperforms current state-of-the-art methods in both qualitative and quantitative measurements.
Abstract（参考訳）: ドキュメントシャドーは、モバイルデバイスを使用してドキュメントをキャプチャするときに発生する一般的な問題であり、可読性に大きな影響を及ぼす。現在の手法では、シャドーマスクの不正確な検出や照明推定など、様々な課題に直面している。本稿では,文書陰影除去問題に対処するために,従来の手法とディープラーニング技術を統合するトランスフォーマーベースのアーキテクチャであるShaDocFormerを提案する。 ShaDocFormerアーキテクチャは、Shadow-attentive Threshold Detector (STD)とCascaded Fusion Refiner (CFR)の2つのコンポーネントで構成されている。 STDモジュールは従来のしきい値設定技術を採用し、Transformerのアテンション機構を利用してグローバル情報を収集し、シャドーマスクの正確な検出を可能にする。 CFRモジュールのカスケード及び凝集構造は、画像全体の粗大な復元プロセスを容易にする。その結果、ShaDocFormerは、シャドウと照明の両方のバリエーションを正確に検出およびキャプチャし、効果的にシャドウを削除することができる。大規模な実験により、ShaDocFormerは定性測定と定量的測定の両方で現在の最先端の手法より優れていることが示された。

関連論文リスト

MatteViT: High-Frequency-Aware Document Shadow Removal with Shadow Matte Guidance [8.823244071737868]
文書のシャドウ除去は、デジタル化された文書の明瞭さを高めるために不可欠である。本稿では,微細な構造を保ちながら影を除去するマット・ビジョン・トランスフォーマ (MatteViT) を提案する。
論文参考訳（メタデータ） (2025-12-09T16:40:10Z)
DocShaDiffusion: Diffusion Model in Latent Space for Document Image Shadow Removal [61.375359734723716]
既存の方法は、一定の色の背景を持つ影を除去し、色影を無視する傾向がある。本稿では,DocShaDiffusionと呼ばれる文書画像の影除去のための遅延空間での拡散モデルの設計を行う。カラーシャドウの問題に対処するため、影ソフトマスク生成モジュール(SSGM)を設計する。影マスク対応拡散モジュール (SMGDM) を提案し, 拡散・復調過程を監督し, 文書画像から影を除去する。
論文参考訳（メタデータ） (2025-07-02T07:22:09Z)
Leveraging Contrast Information for Efficient Document Shadow Removal [15.35209972174416]
ドキュメントのシャドーは、デジタル化プロセスにおける大きな障害です。コントラスト表現による文書のシャドウ除去手法を提案する。
論文参考訳（メタデータ） (2025-04-01T03:06:20Z)
MetaShadow: Object-Centered Shadow Detection, Removal, and Synthesis [64.00425120075045]
シャドウは画像編集アプリケーションでは過小評価されるか無視されることが多く、編集結果のリアリズムが制限される。本稿では,自然画像中の影の検出・除去・制御が可能な3-in-one多元性フレームワークであるMetaShadowを紹介する。
論文参考訳（メタデータ） (2024-12-03T18:04:42Z)
ShadowMamba: State-Space Model with Boundary-Region Selective Scan for Shadow Removal [3.5734732877967392]
シャドーはいくつかの領域で突然の明るさ変化を引き起こし、下流のタスクの精度に影響を与える可能性がある。本研究では,影領域,境界領域,非影領域を別々にスキャンする境界領域選択走査機構を提案する。私たちはShadowMambaと呼ばれる、最初のMambaベースの軽量シャドウ除去モデルを設計した。
論文参考訳（メタデータ） (2024-11-05T16:59:06Z)
SwinShadow: Shifted Window for Ambiguous Adjacent Shadow Detection [90.4751446041017]
スウィンシャドウ(SwinShadow)は、隣接する影を検出するための強力なシフトウインドウ機構をフル活用したトランスフォーマーベースのアーキテクチャである。プロセス全体は、エンコーダ、デコーダ、機能統合の3つの部分に分けられる。 SBU, UCF, ISTDの3つのシャドウ検出ベンチマークデータセットの実験により, ネットワークがバランスエラー率(BER)の点で優れた性能を発揮することが示された。
論文参考訳（メタデータ） (2024-08-07T03:16:33Z)
ShadowMaskFormer: Mask Augmented Patch Embeddings for Shadow Removal [13.983288991595614]
そこで我々はShadowMaskFormerと呼ばれるシャドー除去に適した新しいパッチ埋め込みを備えたトランスフォーマーベースのフレームワークを提案する。具体的には、シャドウ情報を統合し、シャドウ領域の知識獲得にモデルが重点を置くことを促進するための、シンプルで効果的なマスク拡張パッチ埋め込みを提案する。
論文参考訳（メタデータ） (2024-04-29T05:17:33Z)
Towards General Visual-Linguistic Face Forgery Detection [95.73987327101143]
ディープフェイクは現実的な顔操作であり、セキュリティ、プライバシー、信頼に深刻な脅威をもたらす可能性がある。既存の方法は、このタスクを、デジタルラベルまたはマスク信号を使用して検出モデルをトレーニングするバイナリ分類として扱う。本稿では, 微粒な文レベルのプロンプトをアノテーションとして用いた, VLFFD (Visual-Linguistic Face Forgery Detection) という新しいパラダイムを提案する。
論文参考訳（メタデータ） (2023-07-31T10:22:33Z)
DocDeshadower: Frequency-Aware Transformer for Document Shadow Removal [36.182923899021496]
現在のシャドウ除去技術は、さまざまなシャドウインテンシティの扱いやドキュメントの保存において制限に直面している。ラプラシアンピラミッド上に構築された新しい多周波トランスフォーマーモデルDocDeshadowerを提案する。 DocDeshadowerは最先端の手法に比べて優れた性能を示している。
論文参考訳（メタデータ） (2023-07-28T05:35:37Z)
Structure-Informed Shadow Removal Networks [67.57092870994029]
既存のディープラーニングベースのシャドウ除去手法は、依然として影の残像を持つ画像を生成する。本稿では,影残差問題に対処するために,画像構造情報を活用する構造インフォームド・シャドウ除去ネットワーク(StructNet)を提案する。我々の手法は既存のシャドウ除去方法よりも優れており、StructNetは既存の手法と統合してさらに改善することができる。
論文参考訳（メタデータ） (2023-01-09T06:31:52Z)
ShaDocNet: Learning Spatial-Aware Tokens in Transformer for Document Shadow Removal [53.01990632289937]
本稿では,文書陰影除去のためのトランスフォーマーモデルを提案する。シャドウとシャドウフリーの両方の領域で、シャドウコンテキストエンコーディングとデコードを使用する。
論文参考訳（メタデータ） (2022-11-30T01:46:29Z)
SpA-Former: Transformer image shadow detection and removal via spatial attention [8.643096072885909]
シャドウフリー画像を単一の陰影画像から復元するエンド・ツー・エンドのSpA-Formerを提案する。シャドー検出とシャドー除去の2つのステップを必要とする従来の方法とは異なり、SpA-Formerはこれらのステップを1つに統合する。
論文参考訳（メタデータ） (2022-06-22T08:30:22Z)
DocScanner: Robust Document Image Rectification with Progressive Learning [162.03694280524084]
この研究はDocScannerという、文書画像の修正のための新しいディープネットワークアーキテクチャを提示する。 DocScannerは、修正されたイメージの1つの見積を維持し、再帰的なアーキテクチャで徐々に修正される。反復的な改善によりDocScannerは堅牢で優れたパフォーマンスに収束し、軽量なリカレントアーキテクチャにより実行効率が保証される。
論文参考訳（メタデータ） (2021-10-28T09:15:02Z)
R2D: Learning Shadow Removal to Enhance Fine-Context Shadow Detection [64.10636296274168]
現在のシャドウ検出方法は、小さく、不明瞭で、ぼやけたエッジを持つシャドウ領域を検出する際には、性能が良くない。本稿では,深層ニューラルネットワークを修復訓練(シャドウ除去)するRestore to Detect(R2D)という新しい手法を提案する。提案手法は,近年の手法に比べて微妙なコンテキストの検出が可能でありながら,影検出性能の向上を図っている。
論文参考訳（メタデータ） (2021-09-20T15:09:22Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。