論文の概要: Indonesian ID Card Extractor Using Optical Character Recognition and
Natural Language Post-Processing
- arxiv url: http://arxiv.org/abs/2101.05214v1
- Date: Tue, 15 Dec 2020 11:28:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-08 06:21:57.499058
- Title: Indonesian ID Card Extractor Using Optical Character Recognition and
Natural Language Post-Processing
- Title(参考訳): 光文字認識と自然言語後処理を用いたインドネシアのIDカードエクストラクタ
- Authors: Firhan Maulana Rusli, Kevin Akbar Adhiguna, Hendy Irawan
- Abstract要約: OCR では、インドネシアの ID カードまたは kartu tanda penduduk (KTP) をテキストに抽出できます。
インドネシアのidカード画像50枚で0.78fスコア、idカード1枚あたり4510ミリ秒の抽出が必要。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The development of Information Technology has been increasingly changing the
means of information exchange leading to the need of digitizing print
documents. In the present era, there is a lot of fraud that often occur. To
avoid account fraud there was verification using ID card extraction using OCR
and NLP. Optical Character Recognition (OCR) is technology that used to
generate text from image. With OCR we can extract Indonesian ID card or kartu
tanda penduduk (KTP) into text too. This is using to make easier service
operator to do data entry. To improve the accuracy we made text correction
using Natural language Processing (NLP) method to fixing the text. With 50
Indonesian ID card image we got 0.78 F-score, and we need 4510 milliseconds to
extract per ID card.
- Abstract(参考訳): 情報技術の発展は、印刷文書のデジタル化の必要性につながる情報交換の方法を変えつつある。
現代では、しばしば発生する詐欺が多い。
アカウント不正を避けるため、OCRとNLPを用いたIDカード抽出による検証が行われた。
光文字認識(OCR)は、画像からテキストを生成する技術である。
ocrを使えば、インドネシアのidカードやkartu tanda penduduk(ktp)もテキストに抽出できます。
これは、サービスオペレーターがデータ入力を簡単にするのに役立つ。
精度を向上させるため,自然言語処理(nlp)法を用いてテキストの修正を行った。
インドネシアのidカード画像50枚で0.78fスコア、idカード1枚あたり4510ミリ秒の抽出が必要。
関連論文リスト
- Mero Nagarikta: Advanced Nepali Citizenship Data Extractor with Deep Learning-Powered Text Detection and OCR [0.0]
そこで本研究では,テキストオブジェクトの正確な検出にYOLOv8を用いるロバストシステムと,最適化されたPyTesseractに基づくOCRアルゴリズムを提案する。
モバイルアプリケーションのコンテキスト内で実装されたこのシステムは、重要なテキスト情報の自動抽出を可能にする。
ネパール文字に最適化されたPyTesseractは、柔軟性と精度に関して標準のOCRよりも優れていた。
論文 参考訳(メタデータ) (2024-10-08T06:29:08Z) - Learning Robust Named Entity Recognizers From Noisy Data With Retrieval Augmentation [67.89838237013078]
名前付きエンティティ認識(NER)モデルは、しばしばノイズの多い入力に悩まされる。
ノイズの多いテキストとそのNERラベルのみを利用できる、より現実的な設定を提案する。
我々は、推論中にテキストを取得することなく、堅牢なNERを改善するマルチビュートレーニングフレームワークを採用している。
論文 参考訳(メタデータ) (2024-07-26T07:30:41Z) - Glyph-ByT5: A Customized Text Encoder for Accurate Visual Text Rendering [59.088036977605405]
ビジュアルテキストレンダリングは、テキストから画像生成モデルにとって根本的な課題である。
文字認識のBYT5エンコーダを微調整することで、一連のカスタマイズされたテキストエンコーダ、Glyph-ByT5を作成します。
本稿では,Glyph-ByT5をSDXLに統合する方法を提案する。
論文 参考訳(メタデータ) (2024-03-14T17:55:33Z) - PhotoMaker: Customizing Realistic Human Photos via Stacked ID Embedding [102.07914175196817]
PhotoMakerは、効率的なパーソナライズされたテキスト・ツー・イメージ生成方法である。
任意の数の入力ID画像をスタックID埋め込みに符号化し、ID情報を保存する。
論文 参考訳(メタデータ) (2023-12-07T17:32:29Z) - Handwritten Text Recognition Using Convolutional Neural Network [0.0]
OCR(Optical Character Recognition)は、手書き文字と印刷文字を電子的速度で包括的に認識する技術である。
本論文の目的は,国立科学技術研究所データセットに基づいてトレーニングされた畳み込みニューラルネットワークモデルの結果を示すことである。
論文 参考訳(メタデータ) (2023-07-11T15:57:15Z) - A Novel Pipeline for Improving Optical Character Recognition through
Post-processing Using Natural Language Processing [2.9499386124223257]
自然言語処理(NLP)ツールを用いた後処理手法を提案する。
この研究は、まず手書きまたは印刷されたテキストでOCRを実行し、次にNLPを使用してその精度を向上させるエンドツーエンドパイプラインを示す。
論文 参考訳(メタデータ) (2023-07-09T18:51:17Z) - Bengali Handwritten Digit Recognition using CNN with Explainable AI [0.5156484100374058]
我々は様々な機械学習アルゴリズムとCNNを用いて手書きベンガル数字を認識した。
Grad-CAMは私たちのCNNモデルのXAIメソッドとして使われました。
論文 参考訳(メタデータ) (2022-12-23T04:40:20Z) - Towards an Efficient Semantic Segmentation Method of ID Cards for
Verification Systems [8.820032281861227]
本研究では,IDカードのセマンティックセグメンテーションを用いて背景を除去する手法を提案する。
MobileUNetとDenseNet10をベースとした2つのディープラーニングアプローチが検討された。
提案手法は,モバイル端末上でのリアルタイム操作に利用できるほど軽量である。
論文 参考訳(メタデータ) (2021-11-24T19:54:17Z) - Lexically Aware Semi-Supervised Learning for OCR Post-Correction [90.54336622024299]
世界中の多くの言語における既存の言語データの多くは、非デジタル化された書籍や文書に閉じ込められている。
従来の研究は、あまり良くない言語を認識するためのニューラル・ポスト・コレクション法の有用性を実証してきた。
そこで本研究では,生画像を利用した半教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2021-11-04T04:39:02Z) - Scene Text Image Super-Resolution in the Wild [112.90416737357141]
低解像度のテキスト画像は、携帯電話が捉えた文書のような自然の場面でよく見られる。
従来は、合成低解像度画像に対して、単一の画像超解像法 (SISR) を訓練していた。
実際のシーンテキストSRデータセットであるTextZoomをプロポーズする。
この写真には、野生の焦点距離の異なるカメラが捉えた、実際の低解像度と高解像度の2つの画像が含まれている。
論文 参考訳(メタデータ) (2020-05-07T09:18:59Z) - TextScanner: Reading Characters in Order for Robust Scene Text
Recognition [60.04267660533966]
TextScannerはシーンテキスト認識の代替手法である。
文字クラス、位置、順序に対する画素単位のマルチチャネルセグメンテーションマップを生成する。
また、コンテキストモデリングにRNNを採用し、文字の位置とクラスを並列で予測する。
論文 参考訳(メタデータ) (2019-12-28T07:52:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。