論文の概要: Handwritten Stenography Recognition and the LION Dataset
- arxiv url: http://arxiv.org/abs/2308.07799v1
- Date: Tue, 15 Aug 2023 14:25:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-16 12:31:03.410975
- Title: Handwritten Stenography Recognition and the LION Dataset
- Title(参考訳): 手書きステングラフ認識とライオンデータセット
- Authors: Raphaela Heil, Malin Nauwerck
- Abstract要約: Stenographic Domain Knowledgeは、4つの異なるエンコーディング手法を適用することで統合される。
テストエラー率は、ステントグラフィー固有のターゲットシーケンスエンコーディングと事前トレーニングと微調整を組み合わせることで大幅に低減される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Purpose: In this paper, we establish a baseline for handwritten stenography
recognition, using the novel LION dataset, and investigate the impact of
including selected aspects of stenographic theory into the recognition process.
We make the LION dataset publicly available with the aim of encouraging future
research in handwritten stenography recognition.
Methods: A state-of-the-art text recognition model is trained to establish a
baseline. Stenographic domain knowledge is integrated by applying four
different encoding methods that transform the target sequence into
representations, which approximate selected aspects of the writing system.
Results are further improved by integrating a pre-training scheme, based on
synthetic data.
Results: The baseline model achieves an average test character error rate
(CER) of 29.81% and a word error rate (WER) of 55.14%. Test error rates are
reduced significantly by combining stenography-specific target sequence
encodings with pre-training and fine-tuning, yielding CERs in the range of
24.5% - 26% and WERs of 44.8% - 48.2%.
Conclusion: The obtained results demonstrate the challenging nature of
stenography recognition. Integrating stenography-specific knowledge, in
conjunction with pre-training and fine-tuning on synthetic data, yields
considerable improvements. Together with our precursor study on the subject,
this is the first work to apply modern handwritten text recognition to
stenography. The dataset and our code are publicly available via Zenodo.
- Abstract(参考訳): 目的:本論文では,新規なLIONデータセットを用いて手書きステントグラフィー認識のベースラインを構築し,ステントグラフィー理論の選択的側面を認識プロセスに含めることの影響について検討する。
LIONデータセットを公開し、手書きステントグラフィー認識における今後の研究を奨励する。
方法:最先端のテキスト認識モデルをトレーニングしてベースラインを確立する。
対象シーケンスを表現に変換する4つの異なる符号化手法を適用して、ステングラフ領域知識を統合することにより、書き込みシステムの選択された側面を近似する。
合成データに基づく事前学習方式を統合することにより, 結果をさらに改善する。
結果: ベースラインモデルは平均テスト文字誤り率(CER)が29.81%、単語誤り率(WER)が55.14%に達する。
テストエラー率は、ステントグラフィー固有のターゲットシーケンスエンコーディングと事前トレーニングと微調整を組み合わせることで大幅に減少し、24.5%から26%、WERは44.8%から48.2%の範囲でCERが得られる。
結論: 得られた結果は, stenography recognitionの難解な性質を示している。
合成データの事前学習と微調整と合わせて、ステントグラフィー特有の知識を統合することで、かなりの改善がもたらされる。
本研究は,本研究の先行研究とともに,手書き文字認識をステントグラフィに応用する最初の試みである。
データセットとコードはzenodoから公開されています。
関連論文リスト
- Boosting Semi-Supervised Scene Text Recognition via Viewing and Summarizing [71.29488677105127]
既存のシーンテキスト認識(STR)手法は、特に芸術的で歪んだ文字に対して、挑戦的なテキストを認識するのに苦労している。
人的コストを伴わずに、合成データと実際のラベルなしデータを活用して、対照的な学習ベースのSTRフレームワークを提案する。
本手法は,共通ベンチマークとUnion14M-Benchmarkで平均精度94.7%,70.9%のSOTA性能を実現する。
論文 参考訳(メタデータ) (2024-11-23T15:24:47Z) - JSTR: Judgment Improves Scene Text Recognition [0.0]
本稿では,画像とテキストが一致しているかを判断することで,シーンテキスト認識タスクの精度を向上させる手法を提案する。
この方法は、モデルが誤認識しそうなデータに対して明示的なフィードバックを提供することで、テキスト認識の精度を高める。
論文 参考訳(メタデータ) (2024-04-09T02:55:12Z) - Detecting and recognizing characters in Greek papyri with YOLOv8, DeiT
and SimCLR [9.7902367664742]
本稿は、ギリシャ文字の検出・認識に関するICDAR 2023コンペティションへの参加について論じる。
我々は、YOLOv8モデルのアンサンブルを用いて個々の文字を検出し、分類し、2つの異なるアプローチを用いて文字予測を精査した。
平均精度(mAP)は51.4%であり,mAPは42.2%,検出精度(mAP)は51.4%であった。
論文 参考訳(メタデータ) (2024-01-23T06:08:00Z) - Large Language Models Meet Knowledge Graphs to Answer Factoid Questions [57.47634017738877]
本稿では,知識グラフから追加情報に富んだ事前学習されたテキスト・テキスト言語モデルを探索する手法を提案する。
抽出した部分グラフの線形化によりトランスフォーマーモデルで容易に情報を得る。
抽出された情報で回答候補を最終ランク付けすると、事前訓練されたテキスト-テキスト言語モデルのHits@1スコアが4-6%向上する。
論文 参考訳(メタデータ) (2023-10-03T15:57:00Z) - Uncovering the Handwritten Text in the Margins: End-to-end Handwritten
Text Detection and Recognition [0.840835093659811]
本研究は,手書きペラリアの自動検出と認識のためのエンドツーエンドフレームワークを提案する。
データ拡張と転送学習を使用して、トレーニングデータの不足を克服する。
このフレームワークの有効性はスウェーデンのウプサラ大学図書館で発見された初期の書籍コレクションのデータから実証的に評価されている。
論文 参考訳(メタデータ) (2023-03-10T14:00:53Z) - A Study of Augmentation Methods for Handwritten Stenography Recognition [0.0]
我々は22の古典的拡張技法について研究し、そのほとんどは他のスクリプトのHTRによく使われている。
我々は,例えばランダム回転,シフト,スケーリングの範囲を含む拡張群を同定し,ステントグラフィー認識の応用に有用である。
論文 参考訳(メタデータ) (2023-03-05T20:06:19Z) - Reading and Writing: Discriminative and Generative Modeling for
Self-Supervised Text Recognition [101.60244147302197]
テキスト画像の識別と生成を学習するために,コントラスト学習とマスク付き画像モデリングを導入する。
本手法は,不規則なシーンテキスト認識データセットにおいて,従来の自己教師付きテキスト認識手法を10.2%~20.2%向上させる。
提案したテキスト認識器は,11のベンチマークで平均5.3%の精度で従来のテキスト認識手法を上回り,モデルサイズが類似している。
論文 参考訳(メタデータ) (2022-07-01T03:50:26Z) - Lexically Aware Semi-Supervised Learning for OCR Post-Correction [90.54336622024299]
世界中の多くの言語における既存の言語データの多くは、非デジタル化された書籍や文書に閉じ込められている。
従来の研究は、あまり良くない言語を認識するためのニューラル・ポスト・コレクション法の有用性を実証してきた。
そこで本研究では,生画像を利用した半教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2021-11-04T04:39:02Z) - One-shot Compositional Data Generation for Low Resource Handwritten Text
Recognition [10.473427493876422]
低リソース手書きテキスト認識は、わずかな注釈付きデータと非常に限られた言語情報のために難しい問題です。
本稿では,ベイズプログラム学習に基づくデータ生成手法を用いてこの問題に対処する。
大量の注釈付き画像を必要とする従来型の手法とは対照的に,各記号のサンプルを1つだけ,所望のアルファベットから生成することが可能である。
論文 参考訳(メタデータ) (2021-05-11T18:53:01Z) - Near-imperceptible Neural Linguistic Steganography via Self-Adjusting
Arithmetic Coding [88.31226340759892]
本稿では,ニューラルネットワークモデルに基づく自己調整型算術符号を用いた秘密メッセージを符号化する新しい言語ステガノグラフィー手法を提案する。
人間の評価によると、生成されたカバーテキストの51%は、実際に盗聴器を騙すことができる。
論文 参考訳(メタデータ) (2020-10-01T20:40:23Z) - Investigating Pretrained Language Models for Graph-to-Text Generation [55.55151069694146]
Graph-to-text生成は、グラフベースのデータから流動的なテキストを生成することを目的としている。
本稿では,3つのグラフ領域,つまり表現,ウィキペディア知識グラフ(KG),科学的なKGについて検討する。
我々は, PLM の BART と T5 が新たな最先端の成果を達成し, タスク適応型事前学習戦略が性能をさらに向上することを示す。
論文 参考訳(メタデータ) (2020-07-16T16:05:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。