論文の概要: End-to-End Approach for Recognition of Historical Digit Strings
- arxiv url: http://arxiv.org/abs/2104.13666v1
- Date: Wed, 28 Apr 2021 09:39:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-29 18:35:35.965343
- Title: End-to-End Approach for Recognition of Historical Digit Strings
- Title(参考訳): 履歴桁文字列認識のためのエンドツーエンドアプローチ
- Authors: Mengqiao Zhao, Andre G. Hochuli, Abbas Cheddad
- Abstract要約: ARDISデータセット(4桁長弦)に存在する古代の筆跡の難易度に対処するエンドツーエンドのセグメンテーションフリー深層学習手法を提案する。
VGG-16ディープモデルのわずかな変更により、フレームワークは93.2%の認識率を達成でき、メソッド、セグメンテーション、および融合方法のない実現可能なソリューションであることが示されています。
- 参考スコア(独自算出の注目度): 2.0754848504005583
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The plethora of digitalised historical document datasets released in recent
years has rekindled interest in advancing the field of handwriting pattern
recognition. In the same vein, a recently published data set, known as ARDIS,
presents handwritten digits manually cropped from 15.000 scanned documents of
Swedish church books and exhibiting various handwriting styles. To this end, we
propose an end-to-end segmentation-free deep learning approach to handle this
challenging ancient handwriting style of dates present in the ARDIS dataset
(4-digits long strings). We show that with slight modifications in the VGG-16
deep model, the framework can achieve a recognition rate of 93.2%, resulting in
a feasible solution free of heuristic methods, segmentation, and fusion
methods. Moreover, the proposed approach outperforms the well-known CRNN method
(a model widely applied in handwriting recognition tasks).
- Abstract(参考訳): 近年、デジタル化された歴史文書データセットが多数登場し、手書き文字認識の分野への興味が再燃している。
同じ流れの中で、ARDISとして知られる最近発表されたデータセットは、スウェーデンの教会書の15万冊のスキャンされた文書から手書きの数字を抽出し、様々な筆跡を提示している。
そこで本研究では,ardisデータセット (4桁長文字列) に存在する日付の,この難解な手書きスタイルを扱うために,エンドツーエンドのセグメントフリーなディープラーニング手法を提案する。
vgg-16深層モデルにわずかな修正を加えることで、93.2%の認識率を達成でき、その結果、ヒューリスティックな方法、セグメンテーション、融合方法のない実現可能な解が得られることを示した。
さらに,提案手法はCRNN法(手書き認識タスクに広く適用されているモデル)よりも優れている。
関連論文リスト
- Handling Numeric Expressions in Automatic Speech Recognition [56.972851337263755]
数値表現の認識と形式化のためのケースドとエンド・ツー・エンドのアプローチを比較した。
その結果,適応型エンドツーエンドモデルでは,低レイテンシと推論コストの利点を生かして,競争性能が向上することがわかった。
論文 参考訳(メタデータ) (2024-07-18T09:46:19Z) - Retrieval is Accurate Generation [99.24267226311157]
本稿では,支援文書の集合からコンテキスト認識句を選択する新しい手法を提案する。
本モデルでは,検索対象のベースラインの中で,最高の性能と低レイテンシを実現する。
論文 参考訳(メタデータ) (2024-02-27T14:16:19Z) - Efficiently Leveraging Linguistic Priors for Scene Text Spotting [63.22351047545888]
本稿では,大規模テキストコーパスから言語知識を活用する手法を提案する。
シーンテキストデータセットとよく一致したテキスト分布を生成し、ドメイン内の微調整の必要性を取り除く。
実験結果から,本手法は認識精度を向上するだけでなく,単語のより正確な局所化を可能にすることが示された。
論文 参考訳(メタデータ) (2024-02-27T01:57:09Z) - An end-to-end, interactive Deep Learning based Annotation system for
cursive and print English handwritten text [0.0]
我々は、印刷版とカーシブ版の両方で書かれたオフライン手書きの原稿に注釈を付ける、革新的で完全なエンドツーエンドパイプラインを提示する。
本手法は,最先端のテキスト検出モデルに基づいて構築された検出システムと,認識システムのための独自のDeep Learningモデルとのアーキテクチャ結合を含む。
論文 参考訳(メタデータ) (2023-04-18T00:24:07Z) - Recognizing Handwriting Styles in a Historical Scanned Document Using
Unsupervised Fuzzy Clustering [0.0]
特異な手書きスタイルは、文字サイズ、ストローク幅、ループ、ダクト、スラットアングル、カーシブリグチュアなど、いくつかの要素のブレンドで異なってくることがある。
隠れマルコフモデル、サポートベクターマシン、半教師付きリカレントニューラルネットワークによるラベル付きデータの研究は、中程度から高い成功を収めている。
本研究では, ファジィソフトクラスタリングと線形主成分分析を併用して, 歴史写本の手動変化を検知することに成功した。
論文 参考訳(メタデータ) (2022-10-30T09:07:51Z) - Boosting Modern and Historical Handwritten Text Recognition with
Deformable Convolutions [52.250269529057014]
自由進化ページにおける手書き文字認識(HTR)は難しい画像理解課題である。
本稿では,手入力に応じて変形し,テキストの幾何学的変化に適応できる変形可能な畳み込みを導入することを提案する。
論文 参考訳(メタデータ) (2022-08-17T06:55:54Z) - Syntax-Aware Network for Handwritten Mathematical Expression Recognition [53.130826547287626]
手書き数式認識(HMER)は、多くの潜在的な応用が可能な課題である。
HMERの最近の手法はエンコーダ・デコーダアーキテクチャで優れた性能を実現している。
本稿では,構文情報をエンコーダ・デコーダネットワークに組み込んだHMERの簡易かつ効率的な手法を提案する。
論文 参考訳(メタデータ) (2022-03-03T09:57:19Z) - Continuous Offline Handwriting Recognition using Deep Learning Models [0.0]
手書き文字認識は、自動文書画像解析の分野に大きな関心を持つオープンな問題である。
我々は,畳み込みニューラルネットワーク(CNN)とシーケンス・ツー・シーケンス(seq2seq)という,2種類のディープラーニングアーキテクチャの統合に基づく新しい認識モデルを提案する。
提案した新たなモデルでは,他の確立された方法論と競合する結果が得られる。
論文 参考訳(メタデータ) (2021-12-26T07:31:03Z) - Lexically Aware Semi-Supervised Learning for OCR Post-Correction [90.54336622024299]
世界中の多くの言語における既存の言語データの多くは、非デジタル化された書籍や文書に閉じ込められている。
従来の研究は、あまり良くない言語を認識するためのニューラル・ポスト・コレクション法の有用性を実証してきた。
そこで本研究では,生画像を利用した半教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2021-11-04T04:39:02Z) - KOHTD: Kazakh Offline Handwritten Text Dataset [0.0]
広範囲にわたるカザフスタンのオフライン手書きテキストデータセット(KOHTD)を提案する。
KOHTDには3000枚の手書き試験用紙と140335枚以上の分割画像があり、約922010のシンボルがある。
我々は,CTC法や注意法など,単語・行認識に人気の高いテキスト認識手法を多用した。
論文 参考訳(メタデータ) (2021-09-22T16:19:38Z) - Modified Segmentation Algorithm for Recognition of Older Geez Scripts
Written on Vellum [0.0]
手書き文書の認識は、文書イメージを機械で理解できるフォーマットに変換することを目的としている。
手書き文書認識は、パターン認識の分野で最も難しい分野である。
そこで本研究では,古いGeezスクリプトを識別する修正セグメンテーション手法を提案する。
論文 参考訳(メタデータ) (2020-05-31T08:16:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。