論文の概要: StackMix and Blot Augmentations for Handwritten Text Recognition
- arxiv url: http://arxiv.org/abs/2108.11667v1
- Date: Thu, 26 Aug 2021 09:28:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-27 21:34:33.455217
- Title: StackMix and Blot Augmentations for Handwritten Text Recognition
- Title(参考訳): 手書き文字認識のためのStackMixとBlot拡張
- Authors: Alex Shonenkov and Denis Karachev and Maxim Novopoltsev and Mark
Potanin and Denis Dimitrov
- Abstract要約: 本稿では,ニューラルネットワークのアーキテクチャと,列車データ量を増やすための2つの方法について述べる。
StackMixは、印刷されたテキストに基づいて手書きテキストを編集するスタンドアロンタスクにも適用できる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This paper proposes a handwritten text recognition(HTR) system that
outperforms current state-of-the-artmethods. The comparison was carried out on
three of themost frequently used in HTR task datasets, namely Ben-tham, IAM,
and Saint Gall. In addition, the results on tworecently presented datasets,
Peter the Greats manuscriptsand HKR Dataset, are provided.The paper describes
the architecture of the neural net-work and two ways of increasing the volume
of train-ing data: augmentation that simulates strikethrough text(HandWritten
Blots) and a new text generation method(StackMix), which proved to be very
effective in HTR tasks.StackMix can also be applied to the standalone task of
gen-erating handwritten text based on printed text.
- Abstract(参考訳): 本稿では,現在の最先端技術に勝る手書きテキスト認識(htr)システムを提案する。
この比較は、HTRタスクデータセット(Ben-tham、IAM、Saint Gall)で最も頻繁に使用される3つで実施された。
さらに、最近発表された2つのデータセットであるpeter the greats manuscriptsとhkrデータセットについて、ニューラルネットワークのアーキテクチャと、ストライクスルーテキスト(手書きブロット)をシミュレートする拡張と、htrタスクで非常に効果的であることが判明した新しいテキスト生成メソッド(stackmix)について説明する。
関連論文リスト
- Learning Robust Named Entity Recognizers From Noisy Data With Retrieval Augmentation [67.89838237013078]
名前付きエンティティ認識(NER)モデルは、しばしばノイズの多い入力に悩まされる。
ノイズの多いテキストとそのNERラベルのみを利用できる、より現実的な設定を提案する。
我々は、推論中にテキストを取得することなく、堅牢なNERを改善するマルチビュートレーニングフレームワークを採用している。
論文 参考訳(メタデータ) (2024-07-26T07:30:41Z) - Boosting Punctuation Restoration with Data Generation and Reinforcement
Learning [70.26450819702728]
触覚回復は自動音声認識(ASR)における重要な課題である
テキストの句読点とASRテキストとの相違は、ASRテキストの句読点復元システムのトレーニングにおいて、テキストのユーザビリティを制限している。
本稿では,このギャップを埋めるために,話題内テキストを活用した強化学習手法と大規模事前学習型生成言語モデルの最近の進歩を提案する。
論文 参考訳(メタデータ) (2023-07-24T17:22:04Z) - Boosting Modern and Historical Handwritten Text Recognition with
Deformable Convolutions [52.250269529057014]
自由進化ページにおける手書き文字認識(HTR)は難しい画像理解課題である。
本稿では,手入力に応じて変形し,テキストの幾何学的変化に適応できる変形可能な畳み込みを導入することを提案する。
論文 参考訳(メタデータ) (2022-08-17T06:55:54Z) - The LAM Dataset: A Novel Benchmark for Line-Level Handwritten Text
Recognition [40.20527158935902]
手書き文字認識(HTR)は、コンピュータビジョンと自然言語処理の交差点におけるオープンな問題である。
イタリア古写本のラインレベルの大規模なHTRデータセットであるLudocio Antonio Muratoriデータセットを60年以上にわたって1人の著者が編集した。
論文 参考訳(メタデータ) (2022-08-16T11:44:16Z) - A Benchmark Corpus for the Detection of Automatically Generated Text in
Academic Publications [0.02578242050187029]
本稿では,人工的な研究内容からなる2つのデータセットについて述べる。
第1のケースでは、コンテンツはオリジナルの論文から短いプロンプトを抽出した後、GPT-2モデルで完全に生成される。
部分的あるいはハイブリッドなデータセットは、いくつかの抽象文をArxiv-NLPモデルによって生成される文に置き換えることで生成される。
BLEU や ROUGE などの流速指標を用いて,生成したテキストと整列した原文とを比較し,データセットの品質を評価する。
論文 参考訳(メタデータ) (2022-02-04T08:16:56Z) - Handwritten text generation and strikethrough characters augmentation [0.04893345190925178]
本稿では,Resnet-BiLSTM-CTCネットワークを用いて,単語誤り率(WER)と文字誤り率(CER)を大幅に低減する2つのデータ拡張手法を提案する。
印刷テキスト(StackMix)に基づくストライクテキスト(HandWritten Blots)と手書きテキスト生成をシミュレートする新しい拡張手法を適用する。
10個の手書きテキストデータセットの実験では、HandWritten Blots拡張とStackMixがHTRモデルの品質を大幅に改善した。
論文 参考訳(メタデータ) (2021-12-14T13:41:10Z) - SmartPatch: Improving Handwritten Word Imitation with Patch
Discriminators [67.54204685189255]
本稿では,現在の最先端手法の性能を向上させる新手法であるSmartPatchを提案する。
我々は、よく知られたパッチ損失と、平行訓練された手書きテキスト認識システムから収集された情報を組み合わせる。
これにより、より強化された局所識別器が実現し、より現実的で高品質な手書き文字が生成される。
論文 参考訳(メタデータ) (2021-05-21T18:34:21Z) - One-shot Compositional Data Generation for Low Resource Handwritten Text
Recognition [10.473427493876422]
低リソース手書きテキスト認識は、わずかな注釈付きデータと非常に限られた言語情報のために難しい問題です。
本稿では,ベイズプログラム学習に基づくデータ生成手法を用いてこの問題に対処する。
大量の注釈付き画像を必要とする従来型の手法とは対照的に,各記号のサンプルを1つだけ,所望のアルファベットから生成することが可能である。
論文 参考訳(メタデータ) (2021-05-11T18:53:01Z) - EASTER: Efficient and Scalable Text Recognizer [0.0]
本稿では,機械印刷版と手書き版の両方で光学文字認識を行うための高能率かつスケーラブルなTExt認識器(EASTER)を提案する。
このモデルでは1次元畳み込み層を再帰なく利用し,データ量を大幅に削減した並列トレーニングを実現している。
また、オフライン手書きテキスト認識タスクにおいて、現在の最良の結果よりも改善点を示す。
論文 参考訳(メタデータ) (2020-08-18T10:26:03Z) - POINTER: Constrained Progressive Text Generation via Insertion-based
Generative Pre-training [93.79766670391618]
ハードコントラストテキスト生成のための新しい挿入ベースアプローチであるPOINTERを提案する。
提案手法は,既存のトークン間で段階的に新しいトークンを並列に挿入することによって動作する。
結果として生じる粗大な階層構造は、生成プロセスを直感的で解釈可能である。
論文 参考訳(メタデータ) (2020-05-01T18:11:54Z) - Learning to Select Bi-Aspect Information for Document-Scale Text Content
Manipulation [50.01708049531156]
我々は、テキストスタイルの転送とは逆の文書スケールのテキストコンテンツ操作という、新しい実践的なタスクに焦点を当てる。
詳細は、入力は構造化されたレコードと、別のレコードセットを記述するための参照テキストのセットである。
出力は、ソースレコードセットの部分的内容と参照の書き込みスタイルを正確に記述した要約である。
論文 参考訳(メタデータ) (2020-02-24T12:52:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。