論文の概要: Approach for Document Detection by Contours and Contrasts
- arxiv url: http://arxiv.org/abs/2008.02615v2
- Date: Mon, 19 Oct 2020 14:03:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 07:19:54.095281
- Title: Approach for Document Detection by Contours and Contrasts
- Title(参考訳): 輪郭とコントラストによる文書検出へのアプローチ
- Authors: Daniil V. Tropin, Sergey A. Ilyuhin, Dmitry P. Nikolaev and Vladimir
V. Arlazarov
- Abstract要約: 本稿では,モバイル端末上で行う任意の文書検出について考察する。
本研究では,輪郭法を改良し,競合する輪郭位置仮説を境界内と外とのコントラストに応じてランク付けする。
提案手法は,オープンなMIDV-500データセット上での未適合な最先端性能を提供し,SmartDocデータセットの最先端パフォーマンスに匹敵する結果を実証する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper considers arbitrary document detection performed on a mobile
device. The classical contour-based approach often fails in cases featuring
occlusion, complex background, or blur. The region-based approach, which relies
on the contrast between object and background, does not have application
limitations, however, its known implementations are highly resource-consuming.
We propose a modification of the contour-based method, in which the competing
contour location hypotheses are ranked according to the contrast between the
areas inside and outside the border. In the experiments, such modification
allows for the decrease of alternatives ordering errors by 40% and the decrease
of the overall detection errors by 10%. The proposed method provides unmatched
state-of-the-art performance on the open MIDV-500 dataset, and it demonstrates
results comparable with state-of-the-art performance on the SmartDoc dataset.
- Abstract(参考訳): 本稿では,モバイル端末上で行う任意の文書検出について考察する。
古典的な輪郭に基づくアプローチは、しばしば閉塞、複雑な背景、ぼやけを特徴とする場合に失敗する。
オブジェクトとバックグラウンドのコントラストに依存する領域ベースのアプローチは、アプリケーションに制限はないが、その既知の実装は非常にリソースを消費している。
本研究では,境界内と外とのコントラストに応じて,競合する輪郭位置仮説をランク付けする輪郭に基づく方法の修正を提案する。
実験では、このような修正により、代替エラー順序付けの誤差が40%減少し、検出エラー全体の誤差が10%減少する。
提案手法は,open midv-500データセット上での最先端性能と,smartdocデータセットでの最先端性能に匹敵する結果を示す。
関連論文リスト
- COMICS: End-to-end Bi-grained Contrastive Learning for Multi-face Forgery Detection [56.7599217711363]
顔偽造認識法は一度に1つの顔しか処理できない。
ほとんどの顔偽造認識法は一度に1つの顔しか処理できない。
マルチフェイスフォージェリ検出のためのエンドツーエンドフレームワークであるCOMICSを提案する。
論文 参考訳(メタデータ) (2023-08-03T03:37:13Z) - Deep Metric Learning with Soft Orthogonal Proxies [1.823505080809275]
本稿では,プロキシにソフト直交性(SO)制約を導入する新しいアプローチを提案する。
提案手法では,DMLの目的と合わせて,画像からコンテキスト特徴を抽出するエンコーダとして,データ効率の良い画像変換器(DeiT)を利用する。
提案手法が最先端手法よりも有意なマージンで優れていることを示す。
論文 参考訳(メタデータ) (2023-06-22T17:22:15Z) - UDoc-GAN: Unpaired Document Illumination Correction with Background
Light Prior [128.19212716007794]
UDoc-GANは、未確認条件下での文書照明補正の問題に対処する最初のフレームワークである。
文書の環境光の特徴をまず予測する。
そして、周囲光のレベルが異なる特性により、サイクルの一貫性の制約を再定式化する。
現状の手法と比較して,文字誤り率 (CER) と編集距離 (ED) の両面で有望な性能を示す。
論文 参考訳(メタデータ) (2022-10-15T07:19:23Z) - Fake It Till You Make It: Near-Distribution Novelty Detection by
Score-Based Generative Models [54.182955830194445]
既存のモデルは、いわゆる"近く分布"設定で失敗するか、劇的な低下に直面します。
本稿では, スコアに基づく生成モデルを用いて, 合成近分布異常データを生成することを提案する。
本手法は,9つのノベルティ検出ベンチマークにおいて,近分布ノベルティ検出を6%改善し,最先端のノベルティ検出を1%から5%パスする。
論文 参考訳(メタデータ) (2022-05-28T02:02:53Z) - Confidence Score for Unsupervised Foreground Background Separation of
Document Images [5.279475826661642]
このようなアルゴリズムにおける分類の信頼性スコアを計算するための新しい手法を提案する。
提案手法の計算複雑性は、基礎となる二項化アルゴリズムと同じである。
論文 参考訳(メタデータ) (2022-04-03T18:22:11Z) - Self-Supervised Predictive Convolutional Attentive Block for Anomaly
Detection [97.93062818228015]
本稿では,再建に基づく機能を,新たな自己監督型予測アーキテクチャビルディングブロックに統合することを提案する。
我々のブロックは、受容領域におけるマスク領域に対する再構成誤差を最小限に抑える損失を備える。
画像やビデオの異常検出のための最先端フレームワークに組み込むことで,ブロックの汎用性を実証する。
論文 参考訳(メタデータ) (2021-11-17T13:30:31Z) - Advanced Hough-based method for on-device document localization [0.0]
本研究では,文書の内容や内部構造を事前に知ることなく,画像中の文書の位置を考察する。
中心射影モデルの幾何学的不変量を考慮したHough-based法を提案する。
より挑戦的なMIDV-500データセットで評価すると、提案アルゴリズムは公表された手法と比較して最高の精度を保証した。
論文 参考訳(メタデータ) (2021-06-18T08:17:45Z) - Robust Unsupervised Video Anomaly Detection by Multi-Path Frame
Prediction [61.17654438176999]
本稿では,フレーム予測と適切な設計による新規で頑健な非教師付きビデオ異常検出手法を提案する。
提案手法は,CUHK Avenueデータセット上で88.3%のフレームレベルAUROCスコアを得る。
論文 参考訳(メタデータ) (2020-11-05T11:34:12Z) - UC-Net: Uncertainty Inspired RGB-D Saliency Detection via Conditional
Variational Autoencoders [81.5490760424213]
データラベリングプロセスから学習することで、RGB-Dサリエンシ検出に不確実性を利用するための第1のフレームワーク(UCNet)を提案する。
そこで本研究では,サリエンシデータラベリングにヒントを得て,確率的RGB-Dサリエンシ検出ネットワークを提案する。
論文 参考訳(メタデータ) (2020-04-13T04:12:59Z) - Unsupervised Pixel-level Road Defect Detection via Adversarial
Image-to-Frequency Transform [8.644679871804872]
本稿では,AIFT(Adversarial Image-to-Frequency Transform)を用いた道路欠陥検出のための教師なし手法を提案する。
AIFTは、欠陥検出モデルの導出において、教師なしの方法と敵対的な学習を採用するため、道路舗装欠陥に対するアノテーションは不要である。
論文 参考訳(メタデータ) (2020-01-30T04:50:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。