論文の概要: Impact of Ground Truth Quality on Handwriting Recognition
- arxiv url: http://arxiv.org/abs/2312.09037v1
- Date: Thu, 14 Dec 2023 15:36:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-15 21:27:01.095017
- Title: Impact of Ground Truth Quality on Handwriting Recognition
- Title(参考訳): 筆跡認識における真理品質の影響
- Authors: Michael Jungo, Lars V\"ogtlin, Atefeh Fakhari, Nathan Wegmann, Rolf
Ingold, Andreas Fischer, Anna Scius-Bertrand
- Abstract要約: ブルリンジャーのデータベースには、主に近代以前のドイツ語とラテン語のテキストの1万以上のラベル付きテキストラインイメージが含まれている。
本稿では,そのような誤りがトレーニングや評価に与える影響を調査し,典型的なアライメント誤りを検出し,修正する手段を提案する。
- 参考スコア(独自算出の注目度): 0.5328877196581558
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Handwriting recognition is a key technology for accessing the content of old
manuscripts, helping to preserve cultural heritage. Deep learning shows an
impressive performance in solving this task. However, to achieve its full
potential, it requires a large amount of labeled data, which is difficult to
obtain for ancient languages and scripts. Often, a trade-off has to be made
between ground truth quantity and quality, as is the case for the recently
introduced Bullinger database. It contains an impressive amount of over a
hundred thousand labeled text line images of mostly premodern German and Latin
texts that were obtained by automatically aligning existing page-level
transcriptions with text line images. However, the alignment process introduces
systematic errors, such as wrongly hyphenated words. In this paper, we
investigate the impact of such errors on training and evaluation and suggest
means to detect and correct typical alignment errors.
- Abstract(参考訳): 筆跡認識は古写本のコンテンツにアクセスするための重要な技術であり、文化遺産の保存に役立つ。
ディープラーニングは、この課題の解決において印象的なパフォーマンスを示している。
しかし、その可能性を最大限に発揮するには大量のラベル付きデータが必要であり、古代の言語やスクリプトでは入手が困難である。
多くの場合、最近導入されたbullingerデータベースのように、根拠となる真実の量と品質の間でトレードオフが行われなければならない。
既存のページレベルの書き起こしをテキスト行イメージに自動的に調整することによって得られた、ほとんどが前近代ドイツ語とラテン文字の10万以上のラベル付きテキスト行イメージが含まれている。
しかし、アライメントプロセスは、間違ったハイフン付き単語のような体系的な誤りをもたらす。
本稿では,このような誤りがトレーニングや評価に与える影響を調査し,典型的なアライメント誤りの検出と修正手段を提案する。
関連論文リスト
- Efficiently Leveraging Linguistic Priors for Scene Text Spotting [63.22351047545888]
本稿では,大規模テキストコーパスから言語知識を活用する手法を提案する。
シーンテキストデータセットとよく一致したテキスト分布を生成し、ドメイン内の微調整の必要性を取り除く。
実験結果から,本手法は認識精度を向上するだけでなく,単語のより正確な局所化を可能にすることが示された。
論文 参考訳(メタデータ) (2024-02-27T01:57:09Z) - Persian Typographical Error Type Detection Using Deep Neural Networks on Algorithmically-Generated Misspellings [2.2503811834154104]
タイポグラフィーによるペルシャのエラータイプ検出は比較的調査の少ない地域である。
本稿では,ペルシャ語文の誤字を検出するための説得力のあるアプローチを提案する。
最終手法の結果は競争力が高く、精度は97.62%、精度は98.83%、リコールは98.61%、速度は他を上回った。
論文 参考訳(メタデータ) (2023-05-19T15:05:39Z) - An end-to-end, interactive Deep Learning based Annotation system for
cursive and print English handwritten text [0.0]
我々は、印刷版とカーシブ版の両方で書かれたオフライン手書きの原稿に注釈を付ける、革新的で完全なエンドツーエンドパイプラインを提示する。
本手法は,最先端のテキスト検出モデルに基づいて構築された検出システムと,認識システムのための独自のDeep Learningモデルとのアーキテクチャ結合を含む。
論文 参考訳(メタデータ) (2023-04-18T00:24:07Z) - Rethink about the Word-level Quality Estimation for Machine Translation
from Human Judgement [57.72846454929923]
ベンチマークデータセットであるemphHJQEを作成し、専門家翻訳者が不適切な翻訳語を直接アノテートする。
本稿では,タグリファインメント戦略と木ベースのアノテーション戦略という2つのタグ補正戦略を提案し,TERベースの人工QEコーパスをemphHJQEに近づける。
その結果,提案したデータセットは人間の判断と一致しており,また,提案したタグ補正戦略の有効性も確認できた。
論文 参考訳(メタデータ) (2022-09-13T02:37:12Z) - Content and Style Aware Generation of Text-line Images for Handwriting
Recognition [4.301658883577544]
視覚的外観とテキストコンテンツの両方を条件とした手書きテキストライン画像の生成法を提案する。
本手法では,多彩な手書きスタイルの長いテキストラインサンプルを作成できる。
論文 参考訳(メタデータ) (2022-04-12T05:52:03Z) - UCPhrase: Unsupervised Context-aware Quality Phrase Tagging [63.86606855524567]
UCPhraseは、教師なしの文脈対応のフレーズタグである。
我々は,一貫した単語列から,高品質なフレーズを銀のラベルとして表現する。
我々の設計は、最先端の事前訓練、教師なし、遠隔管理の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-05-28T19:44:24Z) - SmartPatch: Improving Handwritten Word Imitation with Patch
Discriminators [67.54204685189255]
本稿では,現在の最先端手法の性能を向上させる新手法であるSmartPatchを提案する。
我々は、よく知られたパッチ損失と、平行訓練された手書きテキスト認識システムから収集された情報を組み合わせる。
これにより、より強化された局所識別器が実現し、より現実的で高品質な手書き文字が生成される。
論文 参考訳(メタデータ) (2021-05-21T18:34:21Z) - Controlling Hallucinations at Word Level in Data-to-Text Generation [10.59137381324694]
最先端のニューラルモデルには、アウトプットに誤解を招くステートメントが含まれている。
本稿では,単語レベルのラベルを利用して各トレーニングインスタンスの関連部分を学習できるマルチブランチデコーダを提案する。
我々のモデルは、生成したテキストの流布とコヒーレンスを維持しながら、幻覚を減らし制御することができる。
論文 参考訳(メタデータ) (2021-02-04T18:58:28Z) - Adversarial Watermarking Transformer: Towards Tracing Text Provenance
with Data Hiding [80.3811072650087]
自然言語の透かしを防御として研究し,テキストの出所の発見と追跡に役立てる。
本稿では,適応型透かし変換器(AWT)とエンコーダ・デコーダ・デコーダを併用した対向型透かし変換器(AWT)について述べる。
AWTは、テキストにデータを隠蔽する最初のエンドツーエンドモデルである。
論文 参考訳(メタデータ) (2020-09-07T11:01:24Z) - Robust Handwriting Recognition with Limited and Noisy Data [7.617456558732551]
私たちはメンテナンスログから手書き文字を学習することに重点を置いています。
この問題を単語分割と単語認識の2段階に分割し,データ拡張技術を用いて両段階を訓練する。
本システムは誤り率を低くし,ノイズや難解な文書を扱うのに適している。
論文 参考訳(メタデータ) (2020-08-18T20:33:23Z) - Learning to Select Bi-Aspect Information for Document-Scale Text Content
Manipulation [50.01708049531156]
我々は、テキストスタイルの転送とは逆の文書スケールのテキストコンテンツ操作という、新しい実践的なタスクに焦点を当てる。
詳細は、入力は構造化されたレコードと、別のレコードセットを記述するための参照テキストのセットである。
出力は、ソースレコードセットの部分的内容と参照の書き込みスタイルを正確に記述した要約である。
論文 参考訳(メタデータ) (2020-02-24T12:52:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。