論文の概要: Automatic Detection and Rectification of Paper Receipts on Smartphones
- arxiv url: http://arxiv.org/abs/2303.05763v1
- Date: Fri, 10 Mar 2023 08:04:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-13 15:39:51.824349
- Title: Automatic Detection and Rectification of Paper Receipts on Smartphones
- Title(参考訳): スマートフォン用紙レシートの自動検出と修正
- Authors: Edward Whittaker, Masashi Tanaka and Ikuo Kitagishi
- Abstract要約: リアルタイムのスマートフォンアプリでは、ユーザーはレシート上で携帯電話を「洗濯」することで、新しい方法でレシートをデジタル化することができる。
エッジとコーナー検出のための従来のコンピュータビジョンアルゴリズムは、典型的な紙レシートの非線形エッジとコーナーを堅牢に検出しない。
提案手法は,レシートの4角を頑健に検出し,実世界のデータに対して85.3%のレシート検出精度を与える。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We describe the development of a real-time smartphone app that allows the
user to digitize paper receipts in a novel way by "waving" their phone over the
receipts and letting the app automatically detect and rectify the receipts for
subsequent text recognition.
We show that traditional computer vision algorithms for edge and corner
detection do not robustly detect the non-linear and discontinuous edges and
corners of a typical paper receipt in real-world settings. This is particularly
the case when the colors of the receipt and background are similar, or where
other interfering rectangular objects are present. Inaccurate detection of a
receipt's corner positions then results in distorted images when using an
affine projective transformation to rectify the perspective.
We propose an innovative solution to receipt corner detection by treating
each of the four corners as a unique "object", and training a Single Shot
Detection MobileNet object detection model. We use a small amount of real data
and a large amount of automatically generated synthetic data that is designed
to be similar to real-world imaging scenarios.
We show that our proposed method robustly detects the four corners of a
receipt, giving a receipt detection accuracy of 85.3% on real-world data,
compared to only 36.9% with a traditional edge detection-based approach. Our
method works even when the color of the receipt is virtually indistinguishable
from the background.
Moreover, our method is trained to detect only the corners of the central
target receipt and implicitly learns to ignore other receipts, and other
rectangular objects. Including synthetic data allows us to train an even better
model. These factors are a major advantage over traditional edge
detection-based approaches, allowing us to deliver a much better experience to
the user.
- Abstract(参考訳): リアルタイムスマートフォンアプリの開発において,レシート上で携帯電話を「操作」し,その後のテキスト認識のためのレシートを自動的に検出・修正することにより,ユーザが新たな方法でレシートをデジタル化する方法について述べる。
従来のエッジとコーナー検出のためのコンピュータビジョンアルゴリズムでは,実世界において,従来の紙レシートの非線形かつ不連続なエッジとコーナーを頑健に検出できないことを示す。
これは特にレシートと背景の色が似ている場合や、他の干渉する長方形オブジェクトが存在する場合である。
そして、アフィン射影変換を用いて視点を補正する際に、レシートのコーナー位置の不正確な検出結果が歪み画像となる。
4つのコーナーをそれぞれユニークな"オブジェクト"として扱い,単一ショット検出モバイルネットオブジェクト検出モデルをトレーニングすることにより,受信コーナー検出の革新的なソリューションを提案する。
我々は少量の実データと、実世界の画像シナリオに類似したように設計された大量の自動合成データを使用する。
従来のエッジ検出方式では36.9%であったのに対し,本手法ではレシートの4隅を頑健に検出し,実世界データでは85.3%のレシート検出精度を示した。
本手法は,レシートの色が背景と実質的に区別できない場合でも動作する。
さらに,本手法では,中心対象レシートのコーナーのみを検出し,暗黙的に他のレシートや矩形物体を無視することを学習する。
合成データを含めれば、さらに優れたモデルをトレーニングすることができます。
これらの要因は、従来のエッジ検出ベースのアプローチに対する大きなアドバンテージであり、ユーザに対してはるかに優れたエクスペリエンスを提供することができます。
関連論文リスト
- Fact Checking Beyond Training Set [64.88575826304024]
本稿では,レトリバーリーダが,あるドメインのラベル付きデータに基づいてトレーニングし,別のドメインで使用する場合,性能劣化に悩まされることを示す。
本稿では,レトリバー成分を分散シフトに対して頑健にするための逆アルゴリズムを提案する。
次に、これらのデータセットから8つの事実チェックシナリオを構築し、モデルと強力なベースラインモデルのセットを比較します。
論文 参考訳(メタデータ) (2024-03-27T15:15:14Z) - Fast and Accurate Object Detection on Asymmetrical Receptive Field [0.0]
本稿では,物体検出精度を受容場の変化の観点から改善する手法を提案する。
YOLOv5の頭部の構造は、非対称なプール層を付加することによって改変される。
本稿では, 従来の YOLOv5 モデルと比較し, いくつかのパラメータから解析する。
論文 参考訳(メタデータ) (2023-03-15T23:59:18Z) - Traditional methods in Edge, Corner and Boundary detection [0.0]
エッジ、コーナー、境界検出の多くの実世界の応用がある。
自動運転車のような現代のイノベーションでは、エッジ検出とセグメンテーションが最も重要になっている。
実世界の画像は検出器の性能と限界を検証するために使用される。
論文 参考訳(メタデータ) (2022-08-12T22:26:05Z) - Task-Sensitive Concept Drift Detector with Metric Learning [7.706795195017394]
提案手法は, 実測時に真のラベルにアクセスすることなくドリフトを検出することのできる, タスク依存型ドリフト検出フレームワークである。
ドリフトが分類性能に影響を与える実際のドリフトを検出し、仮想ドリフトを適切に無視することができる。
本稿では, 検出精度, 偽陽性率, 検出遅延の標準指標を1つの値に蓄積する新しい指標を用いて, 提案手法の性能評価を行う。
論文 参考訳(メタデータ) (2021-08-16T09:10:52Z) - CutPaste: Self-Supervised Learning for Anomaly Detection and
Localization [59.719925639875036]
通常のトレーニングデータのみを用いて異常検知器を構築するためのフレームワークを提案する。
まず、自己教師付き深層表現を学習し、学習した表現の上に生成的1クラス分類器を構築する。
MVTec異常検出データセットに関する実証研究は,提案アルゴリズムが実世界の様々な欠陥を検出可能であることを実証している。
論文 参考訳(メタデータ) (2021-04-08T19:04:55Z) - QuickBrowser: A Unified Model to Detect and Read Simple Object in
Real-time [3.098115480186737]
本研究では,多桁認識を1段階物体検出モデルに組み込むことにより,この検出と読み取りの問題を軽量に解決することを目的とする。
アーキテクチャ、損失関数、データ拡張、トレーニングにおけるバックボーンと修正の選択は、このメソッドを堅牢で効率的かつ高速にします。
論文 参考訳(メタデータ) (2021-02-15T05:47:40Z) - Aurora Guard: Reliable Face Anti-Spoofing via Mobile Lighting System [103.5604680001633]
紙写真やデジタルビデオの高解像度レンダリングリプレイに対する反偽造は、未解決の問題だ。
オーロラガード(Aurora Guard, AG)と呼ばれる, シンプルだが効果的な顔保護システムを提案する。
論文 参考訳(メタデータ) (2021-02-01T09:17:18Z) - Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。
古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文 参考訳(メタデータ) (2020-11-17T09:39:42Z) - Line-Circle-Square (LCS): A Multilayered Geometric Filter for Edge-Based
Detection [2.4054377316708964]
提案フィルタは,設定された各専門家に対して,過度に計算せずにシーンを判断するための高レベル情報を抽出するために,検出,追跡,学習を行う。
本実験は,実験と実世界の両方のシナリオにおいて,検出精度と資源使用量の観点から,提案フィルタの有効性を検証した。
論文 参考訳(メタデータ) (2020-08-21T05:28:12Z) - Detection as Regression: Certified Object Detection by Median Smoothing [50.89591634725045]
この研究は、ランダム化平滑化による認定分類の最近の進歩によって動機付けられている。
我々は、$ell$-bounded攻撃に対するオブジェクト検出のための、最初のモデル非依存、トレーニング不要、認定された防御条件を得る。
論文 参考訳(メタデータ) (2020-07-07T18:40:19Z) - DOPS: Learning to Detect 3D Objects and Predict their 3D Shapes [54.239416488865565]
LIDARデータに対する高速な1段3次元物体検出法を提案する。
我々の手法の中核となる新規性は高速かつシングルパスアーキテクチャであり、どちらも3次元の物体を検出し、それらの形状を推定する。
提案手法は,ScanNetシーンのオブジェクト検出で5%,オープンデータセットでは3.4%の精度で結果が得られた。
論文 参考訳(メタデータ) (2020-04-02T17:48:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。