論文の概要: Advancing Offline Handwritten Text Recognition: A Systematic Review of Data Augmentation and Generation Techniques
- arxiv url: http://arxiv.org/abs/2507.06275v1
- Date: Tue, 08 Jul 2025 12:03:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-10 17:37:43.342224
- Title: Advancing Offline Handwritten Text Recognition: A Systematic Review of Data Augmentation and Generation Techniques
- Title(参考訳): オフライン手書き文字認識の高度化:データ拡張と生成手法の体系的レビュー
- Authors: Yassin Hussein Rassul, Aram M. Ahmed, Polla Fattah, Bryar A. Hassan, Arwaa W. Abdulkareem, Tarik A. Rashid, Joan Lu,
- Abstract要約: 本稿では,オフライン手書きデータの拡張と生成技術について調査する。
本稿では,近年のディープラーニングの進歩とともに,従来の拡張手法について検討する。
多様なリアルな筆跡サンプルの作成に関わる課題について検討する。
- 参考スコア(独自算出の注目度): 4.5220419118352915
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Offline Handwritten Text Recognition (HTR) systems play a crucial role in applications such as historical document digitization, automatic form processing, and biometric authentication. However, their performance is often hindered by the limited availability of annotated training data, particularly for low-resource languages and complex scripts. This paper presents a comprehensive survey of offline handwritten data augmentation and generation techniques designed to improve the accuracy and robustness of HTR systems. We systematically examine traditional augmentation methods alongside recent advances in deep learning, including Generative Adversarial Networks (GANs), diffusion models, and transformer-based approaches. Furthermore, we explore the challenges associated with generating diverse and realistic handwriting samples, particularly in preserving script authenticity and addressing data scarcity. This survey follows the PRISMA methodology, ensuring a structured and rigorous selection process. Our analysis began with 1,302 primary studies, which were filtered down to 848 after removing duplicates, drawing from key academic sources such as IEEE Digital Library, Springer Link, Science Direct, and ACM Digital Library. By evaluating existing datasets, assessment metrics, and state-of-the-art methodologies, this survey identifies key research gaps and proposes future directions to advance the field of handwritten text generation across diverse linguistic and stylistic landscapes.
- Abstract(参考訳): オフライン手書き文字認識(HTR)システムは、過去の文書のデジタル化、自動フォーム処理、生体認証などの応用において重要な役割を果たす。
しかし、そのパフォーマンスは、アノテートされたトレーニングデータ、特に低リソース言語や複雑なスクリプトの可用性の制限によって妨げられることが多い。
本稿では、HTRシステムの精度とロバスト性を改善するために、オフライン手書きデータ拡張および生成技術に関する総合的な調査を行う。
本稿では,GAN(Generative Adversarial Networks)や拡散モデル,トランスフォーマーに基づくアプローチなど,近年のディープラーニングの進歩とともに,従来の拡張手法を体系的に検討する。
さらに,多彩で現実的な筆跡サンプルの生成に関わる課題,特にスクリプトの信頼性の維持とデータの不足への対処について検討する。
この調査は、PRISMAの方法論に従い、構造化された厳密な選択プロセスを保証する。
解析は1,302件の一次研究から始まり,重複を除去して848件までフィルタリングし,IEEE Digital Library, Springer Link, Science Direct, ACM Digital Libraryなどの学術資料から抽出した。
本研究は,既存のデータセット,評価指標,最先端手法を評価することにより,重要な研究ギャップを特定し,多種多様な言語的・スタイリスティックな景観にまたがる手書きテキスト生成の分野を前進させるための今後の方向性を提案する。
関連論文リスト
- Handwritten Text Recognition: A Survey [9.121437356699358]
手書き文字認識(HTR)は,パターン認識や機械学習において重要な分野となっている。
HTRの複雑さは、手書きの高可変性にあるため、堅牢な認識システムの開発が困難である。
本研究では、HTRモデルの進化を調査し、初期のアプローチから最新の最先端のニューラルモデルへの進化をトレースする。
論文 参考訳(メタデータ) (2025-02-12T13:59:37Z) - Boosting CNN-based Handwriting Recognition Systems with Learnable Relaxation Labeling [48.78361527873024]
本稿では,2つの異なる手法の強みを組み込んだ手書き文字認識手法を提案する。
本稿では,アルゴリズムの収束を加速し,システム全体の性能を向上させるスペーシフィケーション手法を提案する。
論文 参考訳(メタデータ) (2024-09-09T15:12:28Z) - Towards Unified Multi-granularity Text Detection with Interactive Attention [56.79437272168507]
Detect Any Text"は、シーンテキストの検出、レイアウト分析、ドキュメントページの検出を結合的なエンドツーエンドモデルに統合する高度なパラダイムである。
DATにおける重要なイノベーションは、テキストインスタンスの表現学習を大幅に強化する、粒度横断型アテンションモジュールである。
テストによると、DATは様々なテキスト関連ベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-05-30T07:25:23Z) - Evaluating Generative Ad Hoc Information Retrieval [58.800799175084286]
生成検索システムは、しばしばクエリに対する応答として、接地された生成されたテキストを直接返す。
このような生成的アドホック検索を適切に評価するには,テキスト応答の有用性の定量化が不可欠である。
論文 参考訳(メタデータ) (2023-11-08T14:05:00Z) - Uncovering the Handwritten Text in the Margins: End-to-end Handwritten
Text Detection and Recognition [0.840835093659811]
本研究は,手書きペラリアの自動検出と認識のためのエンドツーエンドフレームワークを提案する。
データ拡張と転送学習を使用して、トレーニングデータの不足を克服する。
このフレームワークの有効性はスウェーデンのウプサラ大学図書館で発見された初期の書籍コレクションのデータから実証的に評価されている。
論文 参考訳(メタデータ) (2023-03-10T14:00:53Z) - Detecting Text Formality: A Study of Text Classification Approaches [78.11745751651708]
本研究は,統計的,ニューラルベース,トランスフォーマーベースの機械学習手法に基づく形式性検出手法の体系的研究を初めて行う。
単言語,多言語,言語横断の3種類の実験を行った。
本研究は,モノリンガルおよび多言語形式分類タスクのためのトランスフォーマーベースモデルに対するChar BiLSTMモデルの克服を示す。
論文 参考訳(メタデータ) (2022-04-19T16:23:07Z) - Continuous Offline Handwriting Recognition using Deep Learning Models [0.0]
手書き文字認識は、自動文書画像解析の分野に大きな関心を持つオープンな問題である。
我々は,畳み込みニューラルネットワーク(CNN)とシーケンス・ツー・シーケンス(seq2seq)という,2種類のディープラーニングアーキテクチャの統合に基づく新しい認識モデルを提案する。
提案した新たなモデルでは,他の確立された方法論と競合する結果が得られる。
論文 参考訳(メタデータ) (2021-12-26T07:31:03Z) - Toward Educator-focused Automated Scoring Systems for Reading and
Writing [0.0]
本稿では,データとラベルの可用性,信頼性と拡張性,ドメインスコアリング,プロンプトとソースの多様性,伝達学習といった課題に対処する。
モデルトレーニングコストを増大させることなく、エッセイの長さを重要な特徴として保持する技術を採用している。
論文 参考訳(メタデータ) (2021-12-22T15:44:30Z) - Lexically Aware Semi-Supervised Learning for OCR Post-Correction [90.54336622024299]
世界中の多くの言語における既存の言語データの多くは、非デジタル化された書籍や文書に閉じ込められている。
従来の研究は、あまり良くない言語を認識するためのニューラル・ポスト・コレクション法の有用性を実証してきた。
そこで本研究では,生画像を利用した半教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2021-11-04T04:39:02Z) - A Survey on Text Classification: From Shallow to Deep Learning [83.47804123133719]
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
論文 参考訳(メタデータ) (2020-08-02T00:09:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。