論文の概要: DARE: A large-scale handwritten date recognition system
- arxiv url: http://arxiv.org/abs/2210.00503v1
- Date: Sun, 2 Oct 2022 12:47:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-04 15:34:32.628624
- Title: DARE: A large-scale handwritten date recognition system
- Title(参考訳): DARE:大規模手書き日付認識システム
- Authors: Christian M. Dahl, Torben S. D. Johansen, Emil N. S{\o}rensen,
Christian E. Westermann, Simon F. Wittrock
- Abstract要約: 約1000万のトークンを含むデータベースを紹介します。
書字スタイルの多様性が高い手書きテキストの訓練により, 一般的な手書きテキスト認識のための頑健なモデルが得られることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Handwritten text recognition for historical documents is an important task
but it remains difficult due to a lack of sufficient training data in
combination with a large variability of writing styles and degradation of
historical documents. While recurrent neural network architectures are commonly
used for handwritten text recognition, they are often computationally expensive
to train and the benefit of recurrence drastically differs by task. For these
reasons, it is important to consider non-recurrent architectures. In the
context of handwritten date recognition, we propose an architecture based on
the EfficientNetV2 class of models that is fast to train, robust to parameter
choices, and accurately transcribes handwritten dates from a number of sources.
For training, we introduce a database containing almost 10 million tokens,
originating from more than 2.2 million handwritten dates which are segmented
from different historical documents. As dates are some of the most common
information on historical documents, and with historical archives containing
millions of such documents, the efficient and automatic transcription of dates
has the potential to lead to significant cost-savings over manual
transcription. We show that training on handwritten text with high variability
in writing styles result in robust models for general handwritten text
recognition and that transfer learning from the DARE system increases
transcription accuracy substantially, allowing one to obtain high accuracy even
when using a relatively small training sample.
- Abstract(参考訳): 史料に対する手書き文字認識は重要な課題であるが、書風の多様さと史料の劣化を兼ね備えた十分な訓練データが不足しているため、依然として困難である。
リカレントニューラルネットワークアーキテクチャは手書きのテキスト認識に一般的に使用されるが、トレーニングには計算コストがかかることが多く、タスクによって繰り返しの利点は大きく異なる。
これらの理由から、非リカレントアーキテクチャを考えることが重要である。
手書きの日付認識の文脈では,学習が速く,パラメータ選択に頑健で,複数のソースから手書きの日付を正確な書き起こしが可能な,効率の良いnetv2クラスのモデルに基づくアーキテクチャを提案する。
そこで,我々は,約1000万トークンを含むデータベースについて紹介する。このデータベースは220万以上の手書き日付を起源とし,異なる歴史文書から分割したものである。
日付は、歴史文書に関する最も一般的な情報であり、その数百万の文書を含む歴史資料とともに、日付の効率的かつ自動転写は、手動転写よりも大幅なコスト削減につながる可能性がある。
書字スタイルの多様性が高い手書きテキストの訓練は、一般的な手書きテキスト認識のための頑健なモデルとなり、DAREシステムからの転写学習は転写精度を大幅に向上させ、比較的小さなトレーニングサンプルを用いても高い精度が得られることを示す。
関連論文リスト
- Handwriting Recognition in Historical Documents with Multimodal LLM [0.0]
マルチモーダル言語モデルは、ショットプロンプトが少なく、OCRおよびコンピュータビジョンタスクの実行に有効であることを示した。
本稿では,ジェミニが作成した手書き文書の書き起こしの精度を,アートトランスフォーマーに基づく手法の現況に対して評価する。
論文 参考訳(メタデータ) (2024-10-31T15:32:14Z) - Contrastive Entity Coreference and Disambiguation for Historical Texts [2.446672595462589]
既存のエンティティの曖昧さの方法はしばしば、現代の知識ベースに記憶されていない個人を悩ませる歴史文書の正確さに欠ける。
本研究は,文献の文書間照合の解決と曖昧さの解消に3つの重要な貢献をしている。
論文 参考訳(メタデータ) (2024-06-21T18:22:14Z) - How to Choose Pretrained Handwriting Recognition Models for Single
Writer Fine-Tuning [23.274139396706264]
近年のDeep Learning-based Handwriting Text Recognition (HTR) の進歩は、現代の写本や歴史文書に顕著な性能を持つモデルを生み出している。
これらのモデルは、言語、紙の支持、インク、著者の筆跡など、独特の特徴を持つ写本に適用した場合、同じパフォーマンスを得るのに苦労している。
本稿では,手書きテキスト生成モデルを用いて得られた,大規模で実際のベンチマークデータセットと合成データセットについて考察する。
我々は,5行の実際の微調整行数で,原稿を効果的に書き起こし可能なHTRモデルを得るための,そのようなデータの最も関連性の高い特徴を定量的に示す。
論文 参考訳(メタデータ) (2023-05-04T07:00:28Z) - An end-to-end, interactive Deep Learning based Annotation system for
cursive and print English handwritten text [0.0]
我々は、印刷版とカーシブ版の両方で書かれたオフライン手書きの原稿に注釈を付ける、革新的で完全なエンドツーエンドパイプラインを提示する。
本手法は,最先端のテキスト検出モデルに基づいて構築された検出システムと,認識システムのための独自のDeep Learningモデルとのアーキテクチャ結合を含む。
論文 参考訳(メタデータ) (2023-04-18T00:24:07Z) - Uncovering the Handwritten Text in the Margins: End-to-end Handwritten
Text Detection and Recognition [0.840835093659811]
本研究は,手書きペラリアの自動検出と認識のためのエンドツーエンドフレームワークを提案する。
データ拡張と転送学習を使用して、トレーニングデータの不足を克服する。
このフレームワークの有効性はスウェーデンのウプサラ大学図書館で発見された初期の書籍コレクションのデータから実証的に評価されている。
論文 参考訳(メタデータ) (2023-03-10T14:00:53Z) - PART: Pre-trained Authorship Representation Transformer [64.78260098263489]
文書を書く著者は、語彙、レジストリ、句読点、ミススペル、絵文字の使用など、テキスト内での識別情報をインプリントする。
以前の作品では、手作りのフィーチャや分類タスクを使用して著者モデルをトレーニングし、ドメイン外の著者に対するパフォーマンスの低下につながった。
セマンティクスの代わりにtextbfauthorship の埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文 参考訳(メタデータ) (2022-09-30T11:08:39Z) - Boosting Modern and Historical Handwritten Text Recognition with
Deformable Convolutions [52.250269529057014]
自由進化ページにおける手書き文字認識(HTR)は難しい画像理解課題である。
本稿では,手入力に応じて変形し,テキストの幾何学的変化に適応できる変形可能な畳み込みを導入することを提案する。
論文 参考訳(メタデータ) (2022-08-17T06:55:54Z) - Digital Editions as Distant Supervision for Layout Analysis of Printed
Books [76.29918490722902]
本稿では,この意味的マークアップを,レイアウト解析モデルのトレーニングと評価のための遠隔監視として利用する手法について述べる。
DTA(Deutsches Textarchiv)の50万ページにわたるモデルアーキテクチャの実験では、これらの領域レベルの評価手法と画素レベルのメトリクスとワードレベルのメトリクスとの高い相関性を見出した。
自己学習による精度向上の可能性と、DTAで訓練されたモデルが他の歴史書に一般化できる可能性について論じる。
論文 参考訳(メタデータ) (2021-12-23T16:51:53Z) - Lexically Aware Semi-Supervised Learning for OCR Post-Correction [90.54336622024299]
世界中の多くの言語における既存の言語データの多くは、非デジタル化された書籍や文書に閉じ込められている。
従来の研究は、あまり良くない言語を認識するためのニューラル・ポスト・コレクション法の有用性を実証してきた。
そこで本研究では,生画像を利用した半教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2021-11-04T04:39:02Z) - SmartPatch: Improving Handwritten Word Imitation with Patch
Discriminators [67.54204685189255]
本稿では,現在の最先端手法の性能を向上させる新手法であるSmartPatchを提案する。
我々は、よく知られたパッチ損失と、平行訓練された手書きテキスト認識システムから収集された情報を組み合わせる。
これにより、より強化された局所識別器が実現し、より現実的で高品質な手書き文字が生成される。
論文 参考訳(メタデータ) (2021-05-21T18:34:21Z) - Conditioned Text Generation with Transfer for Closed-Domain Dialogue
Systems [65.48663492703557]
条件付き変分オートエンコーダを用いて,意図特化文の生成を最適に学習し,制御する方法を示す。
クエリ転送と呼ばれる新しいプロトコルを導入し、大規模で遅延のないデータセットを活用できるようにします。
論文 参考訳(メタデータ) (2020-11-03T14:06:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。