論文の概要: TRACE: A Differentiable Approach to Line-level Stroke Recovery for
Offline Handwritten Text
- arxiv url: http://arxiv.org/abs/2105.11559v1
- Date: Mon, 24 May 2021 22:15:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-26 14:26:22.151234
- Title: TRACE: A Differentiable Approach to Line-level Stroke Recovery for
Offline Handwritten Text
- Title(参考訳): TRACE:オフライン手書きテキストのラインレベルストローク回復のための微分可能なアプローチ
- Authors: Taylor Archibald, Mason Poggemann, Aaron Chan, Tony Martinez
- Abstract要約: ストロークオーダーとベロシティは、署名検証、手書き認識、手書き合成の分野で有用な特徴である。
オフラインテキストの長い行から時間的ストローク情報を推測するTRACEと呼ばれる新しいモデルを提案する。
TRACEはおそらく、任意の幅のテキスト行全体に対してエンドツーエンドでトレーニングされた最初のシステムである。
- 参考スコア(独自算出の注目度): 1.559929646151698
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Stroke order and velocity are helpful features in the fields of signature
verification, handwriting recognition, and handwriting synthesis. Recovering
these features from offline handwritten text is a challenging and well-studied
problem. We propose a new model called TRACE (Trajectory Recovery by an
Adaptively-trained Convolutional Encoder). TRACE is a differentiable approach
that uses a convolutional recurrent neural network (CRNN) to infer temporal
stroke information from long lines of offline handwritten text with many
characters and dynamic time warping (DTW) to align predictions and ground truth
points. TRACE is perhaps the first system to be trained end-to-end on entire
lines of text of arbitrary width and does not require the use of dynamic
exemplars. Moreover, the system does not require images to undergo any
pre-processing, nor do the predictions require any post-processing.
Consequently, the recovered trajectory is differentiable and can be used as a
loss function for other tasks, including synthesizing offline handwritten text.
We demonstrate that temporal stroke information recovered by TRACE from
offline data can be used for handwriting synthesis and establish the first
benchmarks for a stroke trajectory recovery system trained on the IAM online
handwriting dataset.
- Abstract(参考訳): ストローク順序と速度は、署名検証、手書き認識、手書き合成の分野において有用な特徴である。
オフラインの手書きテキストからこれらの機能を復元することは、困難でよく検討された問題である。
TRACE (Trajectory Recovery by an Adaptively-trained Convolutional Encoder) と呼ばれる新しいモデルを提案する。
TRACEは、畳み込みリカレントニューラルネットワーク(CRNN)を使用して、多くの文字を持つオフライン手書きテキストの長い行から時間的ストローク情報を推論し、予測と基底真理点を整合させる、微分可能なアプローチである。
TRACEは、任意の幅のテキスト行全体をエンドツーエンドでトレーニングする最初のシステムであり、動的例えの使用を必要としない。
さらに、システムは事前処理を行うイメージを必要とせず、予測も後処理も必要としない。
その結果、回収された軌道は微分可能であり、オフライン手書きテキストの合成を含む他のタスクの損失関数として使用できる。
オフラインデータからのトレースから得られた時間的ストローク情報を手書き合成に利用し,iamオンライン手書きデータセット上で訓練されたストロークストロークリカバリシステムの最初のベンチマークを確立できることを実証する。
関連論文リスト
- Graph Neural Network based Handwritten Trajectories Recognition [4.318047857743103]
この研究は、チェーンコードとグラフニューラルネットワークを併用した手書きトラジェクトリの新たな組み合わせを初めて提示する。
オフライン手書きテキスト用手書きトラジェクトリは描画順序の回復を用いて評価され、オンライン手書きトラジェクトリはチェーンコードで直接使用される。
論文 参考訳(メタデータ) (2024-05-15T11:00:42Z) - Scalable Learning of Latent Language Structure With Logical Offline
Cycle Consistency [71.42261918225773]
概念的には、LOCCOは、トレーニング対象のセマンティクスを使用してラベルなしテキストのアノテーションを生成する、自己学習の一形態と見なすことができる。
追加ボーナスとして、LOCCOによって生成されたアノテーションは、神経テキスト生成モデルをトレーニングするために自明に再利用することができる。
論文 参考訳(メタデータ) (2023-05-31T16:47:20Z) - Look-back Decoding for Open-Ended Text Generation [62.53302138266465]
本研究では,現在の復号化過程と過去の復号化過程の分布距離を追跡する改良された復号化アルゴリズムであるLook-backを提案する。
ルックバックは、潜在的反復句とトピックドリフトを自動的に予測し、障害モードを引き起こす可能性のあるトークンを削除することができる。
文書の継続とストーリー生成に関する復号実験を行い、Look-backがより流動的で一貫性のあるテキストを生成することを実証する。
論文 参考訳(メタデータ) (2023-05-22T20:42:37Z) - Uncovering the Handwritten Text in the Margins: End-to-end Handwritten
Text Detection and Recognition [0.840835093659811]
本研究は,手書きペラリアの自動検出と認識のためのエンドツーエンドフレームワークを提案する。
データ拡張と転送学習を使用して、トレーニングデータの不足を克服する。
このフレームワークの有効性はスウェーデンのウプサラ大学図書館で発見された初期の書籍コレクションのデータから実証的に評価されている。
論文 参考訳(メタデータ) (2023-03-10T14:00:53Z) - Boosting Modern and Historical Handwritten Text Recognition with
Deformable Convolutions [52.250269529057014]
自由進化ページにおける手書き文字認識(HTR)は難しい画像理解課題である。
本稿では,手入力に応じて変形し,テキストの幾何学的変化に適応できる変形可能な畳み込みを導入することを提案する。
論文 参考訳(メタデータ) (2022-08-17T06:55:54Z) - AttentionHTR: Handwritten Text Recognition Based on Attention
Encoder-Decoder Networks [0.0]
本研究は,手書き単語認識のための注目に基づくシーケンス・ツー・シーケンス・モデルを提案する。
シーンテキストイメージに事前トレーニングされたモデルを、手書き認識モデルのカスタマイズに向けた出発点として活用する。
提案したエンドツーエンドHTRシステムの有効性は、新しいマルチライターデータセットで実証的に評価されている。
論文 参考訳(メタデータ) (2022-01-23T22:48:36Z) - SmartPatch: Improving Handwritten Word Imitation with Patch
Discriminators [67.54204685189255]
本稿では,現在の最先端手法の性能を向上させる新手法であるSmartPatchを提案する。
我々は、よく知られたパッチ損失と、平行訓練された手書きテキスト認識システムから収集された情報を組み合わせる。
これにより、より強化された局所識別器が実現し、より現実的で高品質な手書き文字が生成される。
論文 参考訳(メタデータ) (2021-05-21T18:34:21Z) - Label-Synchronous Speech-to-Text Alignment for ASR Using Forward and
Backward Transformers [49.403414751667135]
本稿では,音声認識のための新しいラベル同期音声テキストアライメント手法を提案する。
提案手法はラベル同期テキストマッピング問題として音声からテキストへのアライメントを再定義する。
自発日本語コーパス(CSJ)を用いた実験により,提案手法が正確な発話方向のアライメントを提供することを示した。
論文 参考訳(メタデータ) (2021-04-21T03:05:12Z) - DeepWriteSYN: On-Line Handwriting Synthesis via Deep Short-Term
Representations [14.498981800711302]
DeepWriteSYNは、新しいオンライン手書き方式である。
与えられた人口や被写体内の自然な変動に対応する、与えられた手書き構造の現実的な手書き変化を生成することができる。
論文 参考訳(メタデータ) (2020-09-14T10:17:55Z) - Online trajectory recovery from offline handwritten Japanese kanji
characters [7.057916977441261]
本稿では,大規模なオンライン手書きデータベースを用いて,回復作業を解決するディープニューラルネットワークに基づく手法を提案する。
提案手法の性能を視覚的検証と手書き文字認識の両方を用いて評価する。
論文 参考訳(メタデータ) (2020-09-09T13:05:50Z) - POINTER: Constrained Progressive Text Generation via Insertion-based
Generative Pre-training [93.79766670391618]
ハードコントラストテキスト生成のための新しい挿入ベースアプローチであるPOINTERを提案する。
提案手法は,既存のトークン間で段階的に新しいトークンを並列に挿入することによって動作する。
結果として生じる粗大な階層構造は、生成プロセスを直感的で解釈可能である。
論文 参考訳(メタデータ) (2020-05-01T18:11:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。