論文の概要: KOHTD: Kazakh Offline Handwritten Text Dataset
- arxiv url: http://arxiv.org/abs/2110.04075v1
- Date: Wed, 22 Sep 2021 16:19:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-17 23:52:59.625100
- Title: KOHTD: Kazakh Offline Handwritten Text Dataset
- Title(参考訳): KOHTD: Kazakh のオフライン手書きテキストデータセット
- Authors: Nazgul Toiganbayeva, Mahmoud Kasem, Galymzhan Abdimanap, Kairat
Bostanbekov, Abdelrahman Abdallah, Anel Alimova, Daniyar Nurseitov
- Abstract要約: 広範囲にわたるカザフスタンのオフライン手書きテキストデータセット(KOHTD)を提案する。
KOHTDには3000枚の手書き試験用紙と140335枚以上の分割画像があり、約922010のシンボルがある。
我々は,CTC法や注意法など,単語・行認識に人気の高いテキスト認識手法を多用した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite the transition to digital information exchange, many documents, such
as invoices, taxes, memos and questionnaires, historical data, and answers to
exam questions, still require handwritten inputs. In this regard, there is a
need to implement Handwritten Text Recognition (HTR) which is an automatic way
to decrypt records using a computer. Handwriting recognition is challenging
because of the virtually infinite number of ways a person can write the same
message. For this proposal we introduce Kazakh handwritten text recognition
research, a comprehensive dataset of Kazakh handwritten texts is necessary.
This is particularly true given the lack of a dataset for handwritten Kazakh
text. In this paper, we proposed our extensive Kazakh offline Handwritten Text
dataset (KOHTD), which has 3000 handwritten exam papers and more than 140335
segmented images and there are approximately 922010 symbols. It can serve
researchers in the field of handwriting recognition tasks by using deep and
machine learning. We used a variety of popular text recognition methods for
word and line recognition in our studies, including CTC-based and
attention-based methods. The findings demonstrate KOHTD's diversity. Also, we
proposed a Genetic Algorithm (GA) for line and word segmentation based on
random enumeration of a parameter. The dataset and GA code are available at
https://github.com/abdoelsayed2016/KOHTD.
- Abstract(参考訳): デジタル情報交換への移行にもかかわらず、請求書、税金、メモ、アンケート、歴史データ、試験問題に対する回答など多くの文書は手書きの入力を必要とする。
この点において、コンピュータを用いて記録を復号する自動的な方法である手書き文字認識(HTR)を実装する必要がある。
手書き認識は、人間が同じメッセージを書ける方法が事実上無限にあるため、難しい。
本提案では,カザフ語手書きテキストの包括的データセットが必要であるとして,カザフ語手書きテキスト認識研究を紹介する。
手書きのカザフ文字のデータセットがないため、これは特に当てはまります。
本稿では,3000枚の手書き試験用紙と140335枚以上の分割画像と,約922010個のシンボルを持つカザフ語オフライン手書きテキストデータセット(KOHTD)を提案する。
ディープラーニングと機械学習を使うことで、手書き認識タスクの分野で研究者に役立てることができる。
単語と行の認識には,ctcや注意に基づく手法など,さまざまな一般的なテキスト認識手法を用いた。
この結果はKOHTDの多様性を示している。
また,パラメータのランダム列挙に基づく行と単語のセグメンテーションのための遺伝的アルゴリズム(ga)を提案した。
データセットとgaコードはhttps://github.com/abdoelsayed2016/kohtdで入手できる。
関連論文リスト
- Bukva: Russian Sign Language Alphabet [75.42794328290088]
本稿では,ロシア手話(RSL)ダクティルとしても知られる,ロシア語の指先文字の認識について検討する。
ダクティル (Dactyl) は手の動きが書かれた言語の個々の文字を表す手話の構成要素である。
当社は、RSLダクチル認識のための、最初の本格的なオープンソースビデオデータセットであるBakvaを提供している。
論文 参考訳(メタデータ) (2024-10-11T09:59:48Z) - Muharaf: Manuscripts of Handwritten Arabic Dataset for Cursive Text Recognition [5.28595286827031]
Manuscripts of Hand written Arabic(Muharaf)データセットは、1,600以上の歴史的な手書きページイメージからなる機械学習データセットである。
このデータセットは、手書きのテキスト認識において、最先端の技術を前進させるためにコンパイルされた。
論文 参考訳(メタデータ) (2024-06-13T23:40:34Z) - Khayyam Offline Persian Handwriting Dataset [0.0]
Khayyamデータセットは、ペルシア語の要素(単語、文、文字、数字)について、制約のない別の大きな手書きデータセットとして提示する。
カヤムのデータセットには44000語、60000文字、6000桁が含まれている。
データセットの適用性を示すために、数字、文字、単語データに基づいて機械学習アルゴリズムを訓練し、結果を報告する。
論文 参考訳(メタデータ) (2024-06-03T06:17:21Z) - Dataset and Benchmark for Urdu Natural Scenes Text Detection, Recognition and Visual Question Answering [50.52792174648067]
このイニシアチブは、テキストと視覚的理解のギャップを埋めようとしている。
そこで本研究では,1000以上の自然シーン画像からなるマルチタスクUrduシーンテキストデータセットを提案する。
テキストインスタンスの細かいアノテーションを提供し、以前のデータセットの制限に対処します。
論文 参考訳(メタデータ) (2024-05-21T06:48:26Z) - Handwritten and Printed Text Segmentation: A Signature Case Study [0.0]
我々は手書きテキストセグメンテーションの課題に対処するための新しいアプローチを開発する。
我々の目的は、クラス全体からテキストを復元することであり、特に重なり合う部分のセグメンテーション性能を向上させることである。
私たちの最高の設定は、以前の2つの異なるデータセットで17.9%、IoUスコアで7.3%のパフォーマンスを上回っています。
論文 参考訳(メタデータ) (2023-07-15T21:49:22Z) - UIT-HWDB: Using Transferring Method to Construct A Novel Benchmark for
Evaluating Unconstrained Handwriting Image Recognition in Vietnamese [2.8360662552057323]
ベトナム語では、現代のラテン文字以外にアクセントと文字マークがあり、最新式の手書き認識法に混乱をもたらす。
低リソース言語として、ベトナムで手書き認識を研究するためのデータセットは少ない。
最近の研究は,ペンストローク座標を接続して構築したオンライン手書きデータセットの画像を用いてベトナムにおけるオフライン手書き認識手法の評価を行っている。
本稿では,オフライン手書き画像に必要な重要な自然属性を関連付ける手書き画像データセットを構築するための転送手法を提案する。
論文 参考訳(メタデータ) (2022-11-10T08:23:54Z) - Kurdish Handwritten Character Recognition using Deep Learning Techniques [26.23274417985375]
本稿では、深層学習技術を用いてクルド語アルファベットの文字を認識可能なモデルの設計と開発を試みる。
4000万枚以上の画像を含む、手書きのクルド文字のための包括的なデータセットが作成された。
結果,精度は96%,トレーニング精度は97%であった。
論文 参考訳(メタデータ) (2022-10-18T16:48:28Z) - Comprehensive Benchmark Datasets for Amharic Scene Text Detection and
Recognition [56.048783994698425]
Ethiopic/Amharicスクリプトはアフリカ最古の書記システムの一つで、東アフリカで少なくとも23の言語に対応している。
アムハラ語の表記体系である Abugida は282音節、15句の句読点、20の数字を持つ。
HUST-ART, HUST-AST, ABE, Tana という,自然界におけるアムハラ文字の検出と認識のための総合的な公開データセットを提示した。
論文 参考訳(メタデータ) (2022-03-23T03:19:35Z) - Letter-level Online Writer Identification [86.13203975836556]
我々は文字レベルのオンラインライタIDという新たな問題に焦点をあてる。
主な課題は、しばしば異なるスタイルで手紙を書くことである。
我々はこの問題をオンライン書記スタイルのばらつき(Var-O-Styles)と呼ぶ。
論文 参考訳(メタデータ) (2021-12-06T07:21:53Z) - SmartPatch: Improving Handwritten Word Imitation with Patch
Discriminators [67.54204685189255]
本稿では,現在の最先端手法の性能を向上させる新手法であるSmartPatchを提案する。
我々は、よく知られたパッチ損失と、平行訓練された手書きテキスト認識システムから収集された情報を組み合わせる。
これにより、より強化された局所識別器が実現し、より現実的で高品質な手書き文字が生成される。
論文 参考訳(メタデータ) (2021-05-21T18:34:21Z) - TextScanner: Reading Characters in Order for Robust Scene Text
Recognition [60.04267660533966]
TextScannerはシーンテキスト認識の代替手法である。
文字クラス、位置、順序に対する画素単位のマルチチャネルセグメンテーションマップを生成する。
また、コンテキストモデリングにRNNを採用し、文字の位置とクラスを並列で予測する。
論文 参考訳(メタデータ) (2019-12-28T07:52:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。