論文の概要: CENSUS-HWR: a large training dataset for offline handwriting recognition
- arxiv url: http://arxiv.org/abs/2305.16275v1
- Date: Thu, 25 May 2023 17:31:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-26 13:20:31.468747
- Title: CENSUS-HWR: a large training dataset for offline handwriting recognition
- Title(参考訳): CENSUS-HWR:オフライン手書き認識のための大規模なトレーニングデータセット
- Authors: Chetan Joshi and Lawry Sorenson and Ammon Wolfert and Dr. Mark Clement
and Dr. Joseph Price and Dr. Kasey Buckles
- Abstract要約: CENSUS-HWRは、1,812,014のグレースケールの画像で完全な英語の手書き文字からなる新しいデータセットである。
このデータセットは、ディープラーニングアルゴリズムのベンチマークとして手書きモデルを提供することを意図している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Progress in Automated Handwriting Recognition has been hampered by the lack
of large training datasets. Nearly all research uses a set of small datasets
that often cause models to overfit. We present CENSUS-HWR, a new dataset
consisting of full English handwritten words in 1,812,014 gray scale images. A
total of 1,865,134 handwritten texts from a vocabulary of 10,711 words in the
English language are present in this collection. This dataset is intended to
serve handwriting models as a benchmark for deep learning algorithms. This huge
English handwriting recognition dataset has been extracted from the US 1930 and
1940 censuses taken by approximately 70,000 enumerators each year. The dataset
and the trained model with their weights are freely available to download at
https://censustree.org/data.html.
- Abstract(参考訳): 手書き自動認識の進歩は、大規模なトレーニングデータセットの欠如によって妨げられている。
ほぼすべての研究は、モデルに過度に適合させる小さなデータセットを使用する。
CENSUS-HWRは,1,812,014のグレースケール画像中の全英語手書き文字からなる新しいデータセットである。
このコレクションには英語で10,711語の語彙から1,865,134個の手書きテキストが存在している。
このデータセットは、ディープラーニングアルゴリズムのベンチマークとして手書きモデルを提供することを意図している。
この巨大な英語の筆跡認識データセットは、1930年と1940年の国勢調査から毎年70,000人の列挙者によって抽出されている。
データセットとトレーニングされたモデルの重量は、https://censustree.org/data.htmlで無料でダウンロードできる。
関連論文リスト
- Muharaf: Manuscripts of Handwritten Arabic Dataset for Cursive Text Recognition [5.28595286827031]
Manuscripts of Hand written Arabic(Muharaf)データセットは、1,600以上の歴史的な手書きページイメージからなる機械学習データセットである。
このデータセットは、手書きのテキスト認識において、最先端の技術を前進させるためにコンパイルされた。
論文 参考訳(メタデータ) (2024-06-13T23:40:34Z) - OmniCorpus: A Unified Multimodal Corpus of 10 Billion-Level Images Interleaved with Text [112.60163342249682]
我々は100億規模の画像テキストインターリーブデータセットであるOmniCorpusを紹介する。
私たちのデータセットは、優れたデータ品質を維持しながら、15倍のスケールを持っています。
これが将来のマルチモーダルモデル研究に確かなデータ基盤を提供することを期待しています。
論文 参考訳(メタデータ) (2024-06-12T17:01:04Z) - Multilingual Diversity Improves Vision-Language Representations [66.41030381363244]
このデータセットの事前トレーニングは、ImageNet上で英語のみまたは英語が支配するデータセットを使用してパフォーマンスが向上する。
GeoDEのような地理的に多様なタスクでは、アフリカから得られる最大の利益とともに、すべての地域における改善も観察します。
論文 参考訳(メタデータ) (2024-05-27T08:08:51Z) - The First Swahili Language Scene Text Detection and Recognition Dataset [55.83178123785643]
低リソース言語、特にスワヒリ語には大きなギャップがある。
スワヒリ語は東アフリカ諸国で広く話されているが、依然としてシーンテキスト認識において未発見言語である。
本研究では,スワヒリシーンのテキスト画像の包括的データセットを提案し,異なるシーンのテキスト検出および認識モデルに基づくデータセットの評価を行う。
論文 参考訳(メタデータ) (2024-05-19T03:55:02Z) - Slovo: Russian Sign Language Dataset [83.93252084624997]
本稿では,クラウドソーシングプラットフォームを用いたロシア手話(RSL)ビデオデータセットであるSlovoについて述べる。
データセットには20,000のFullHDレコードが含まれており、194人の署名者が受信した1,000の独立したRSLジェスチャーに分割されている。
論文 参考訳(メタデータ) (2023-05-23T21:00:42Z) - ADDSL: Hand Gesture Detection and Sign Language Recognition on Annotated
Danish Sign Language [0.0]
本稿では,デンマーク手話用アノテーションデータセット(ADDSL)について紹介する。
このデータセットを用いて、1段オブジェクト検出モデル(YOLOv5)を訓練し、文字(A-Z)と数字(0-9)を認識する。
5つのモデルは350エポックで訓練され、平均推算時間は1枚あたり9.02ms、最高のアククラックは92%となった。
論文 参考訳(メタデータ) (2023-05-16T18:08:24Z) - Scalable handwritten text recognition system for lexicographic sources
of under-resourced languages and alphabets [1.304892050913381]
17世紀と18世紀のポーランド語辞典という大きな歴史辞典では、インデックスカードは280万枚である。
我々は,(1)最適化された検出モデル,(2)手書きコンテンツを解読する認識モデル,(3)制約付きWord Beam Searchを用いた後処理ステップを含む手書き文字認識ソリューションを適用した。
我々のモデルは単語レベルで0.881の精度を達成し、ベースRCNNモデルよりも優れていた。
論文 参考訳(メタデータ) (2023-03-28T19:06:27Z) - Handwritten Word Recognition using Deep Learning Approach: A Novel Way
of Generating Handwritten Words [14.47529728678643]
本稿では,手書き文字を用いた多様な手書き語画像を生成する手法を提案する。
アプローチ全体は、大きくて多様な手書きの単語データセットを生成する過程を示している。
実験では,手書きの単語データセットが欠けているBangla言語をターゲットにした。
論文 参考訳(メタデータ) (2023-03-13T22:58:34Z) - Improving Accuracy and Explainability of Online Handwriting Recognition [0.9176056742068814]
我々は,OnHW-charsデータセット上で手書き認識モデルを開発し,先行モデルの精度を向上させる。
私たちの結果は公開リポジトリを通じて検証可能で再現可能です。
論文 参考訳(メタデータ) (2022-09-14T21:28:14Z) - ASR2K: Speech Recognition for Around 2000 Languages without Audio [100.41158814934802]
対象言語に音声を必要としない音声認識パイプラインを提案する。
私たちのパイプラインは、音響、発音、言語モデルという3つのコンポーネントで構成されています。
我々は、1909年の言語をCrubadanと組み合わせて、大きな絶滅危惧言語n-gramデータベースを構築した。
論文 参考訳(メタデータ) (2022-09-06T22:48:29Z) - A Large-Scale Chinese Short-Text Conversation Dataset [77.55813366932313]
大規模な中国語会話データセットLCCCについて,基本バージョン(680万対話),大バージョン(1120万対話)について述べる。
データセットの品質は、厳格なデータクリーニングパイプラインによって保証されます。
また,LCCC-baseとLCCC-largeで訓練された事前学習対話モデルもリリースした。
論文 参考訳(メタデータ) (2020-08-10T08:12:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。