論文の概要: An Automatic Reader of Identity Documents
- arxiv url: http://arxiv.org/abs/2006.14853v1
- Date: Fri, 26 Jun 2020 08:22:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-16 21:22:15.275872
- Title: An Automatic Reader of Identity Documents
- Title(参考訳): ID文書の自動読取装置
- Authors: Filippo Attivissimo, Nicola Giaquinto, Marco Scarpetta, Maurizio
Spadavecchia
- Abstract要約: 本稿では,ID文書の自動読解システムの試作について述べる。
このシステムは、許容できる品質の写真から、主要なイタリアのアイデンティティー文書のデータを抽出すると考えられている。
文書はまず写真内でローカライズされ、次に分類され、最後にテキスト認識が実行される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Identity documents automatic reading and verification is an appealing
technology for nowadays service industry, since this task is still mostly
performed manually, leading to waste of economic and time resources. In this
paper the prototype of a novel automatic reading system of identity documents
is presented. The system has been thought to extract data of the main Italian
identity documents from photographs of acceptable quality, like those usually
required to online subscribers of various services. The document is first
localized inside the photo, and then classified; finally, text recognition is
executed. A synthetic dataset has been used, both for neural networks training,
and for performance evaluation of the system. The synthetic dataset avoided
privacy issues linked to the use of real photos of real documents, which will
be used, instead, for future developments of the system.
- Abstract(参考訳): アイデンティティ文書の自動読み取りと検証は、今日ではサービス産業にとって魅力的な技術である。
本稿では,id文書の自動読み出しシステムの試作について述べる。
このシステムは、様々なサービスのオンラインサブスクライバーに通常必要とされるような、許容できる品質の写真から、主要なイタリアのIDドキュメントのデータを抽出すると考えられている。
文書はまず写真内でローカライズされ、次に分類され、最後にテキスト認識が実行される。
ニューラルネットワークのトレーニングとシステムの性能評価の両方に合成データセットが使用されている。
合成データセットは、実際の文書の実際の写真の使用に関連するプライバシー問題を避け、システムの将来の開発に使用される。
関連論文リスト
- Automatic Recognition of Learning Resource Category in a Digital Library [6.865460045260549]
本稿では,文書画像分類のためのヘテロジニアス学習資源(HLR)データセットを提案する。
このアプローチでは、個々の学習リソースを構成文書イメージ(シート)に分解する。
これらの画像はOCRツールを通じて処理され、テキスト表現を抽出する。
論文 参考訳(メタデータ) (2023-11-28T07:48:18Z) - PHD: Pixel-Based Language Modeling of Historical Documents [55.75201940642297]
実史文書に類似した合成スキャンを生成する新しい手法を提案する。
我々は,1700-1900年代における合成スキャンと実際の歴史新聞を組み合わせて,我々のモデルであるPHDを事前訓練した。
我々は、この領域におけるその有用性を強調しながら、我々のモデルを歴史的QAタスクに適用することに成功しました。
論文 参考訳(メタデータ) (2023-10-22T08:45:48Z) - DocMAE: Document Image Rectification via Self-supervised Representation
Learning [144.44748607192147]
文書画像修正のための新しい自己教師型フレームワークDocMAEを提案する。
まず、背景を除いた文書画像のランダムなパッチをマスクし、欠落したピクセルを再構成する。
このような自己教師型学習手法により、ネットワークは変形文書の本質的な構造を学習することが奨励される。
論文 参考訳(メタデータ) (2023-04-20T14:27:15Z) - Synthetic ID Card Image Generation for Improving Presentation Attack
Detection [12.232059909207578]
本研究は,不正検出ネットワークを訓練しながら,データ量を増やすために,IDカード画像を合成的に生成する3つの手法について検討する。
以上の結果から, PAIS (Print/Scan Presentation Attack Instrument Species) の性能低下や, PAIS (Sing/Scan Presentation Instrument Species) の性能低下を伴わずに, 合成画像でデータベースを補足できることが示唆された。
論文 参考訳(メタデータ) (2022-10-31T19:07:30Z) - Augraphy: A Data Augmentation Library for Document Images [59.457999432618614]
Augraphyはデータ拡張パイプラインを構築するためのPythonライブラリである。
標準的なオフィス操作によって変更されたように見えるクリーンなドキュメントイメージの拡張版を作成するための戦略を提供する。
論文 参考訳(メタデータ) (2022-08-30T22:36:19Z) - Open Set Classification of Untranscribed Handwritten Documents [56.0167902098419]
重要な写本の膨大な量のデジタルページイメージが世界中のアーカイブに保存されている。
ドキュメントのクラスや型付け'はおそらくメタデータに含まれる最も重要なタグです。
技術的問題は文書の自動分類の1つであり、それぞれが書き起こされていない手書きのテキスト画像からなる。
論文 参考訳(メタデータ) (2022-06-20T20:43:50Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z) - Image-based material analysis of ancient historical documents [5.285396202883411]
本研究は、有名な歴史資料集『死海巻』の画像を用いて、写本の資料を分類する新しい方法を提案する。
多数決プロセスの変換を用いた二項分類システムは, この分類作業に有効であることが示されている。
このパイロットスタディは、パーチメントまたはパピルス材料から生成される限られた量の原稿に対して、最大97%の分類成功率を示す。
論文 参考訳(メタデータ) (2022-03-02T11:39:22Z) - MIDV-2020: A Comprehensive Benchmark Dataset for Identity Document
Analysis [48.35030471041193]
MIDV-2020は1000の動画クリップ、2000のスキャン画像、1000のユニークなモックIDドキュメントの写真で構成されている。
72409の注釈付き画像により、提案されたデータセットは公開日までで最大の公開IDドキュメントデータセットである。
論文 参考訳(メタデータ) (2021-07-01T12:14:17Z) - Enhance to Read Better: An Improved Generative Adversarial Network for
Handwritten Document Image Enhancement [1.7491858164568674]
本稿では,GAN(Generative Adversarial Networks)に基づくエンド・ツー・エンドアーキテクチャを提案する。
私たちの知る限りでは、これは手書き文書をバイナライズしながらテキスト情報を使用する最初の作業である。
H-DIBCO 2018の課題では、人工的に劣化したラテン手書き画像でトレーニング済みのモデルを微調整した後、アートの状況よりも優れています。
論文 参考訳(メタデータ) (2021-05-26T17:44:45Z) - Source Printer Identification from Document Images Acquired using
Smartphone [14.889347839830092]
我々は,文字画像とプリンタ固有のノイズ残差の融合から,単一のCNNモデルを学習することを提案する。
提案手法は,5x2クロスバリデーション手法を用いて,文字「e」の画像を用いた98.42%の文書分類精度を実現する。
論文 参考訳(メタデータ) (2020-03-27T18:59:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。