論文の概要: CENSUS-HWR: a large training dataset for offline handwriting recognition
- arxiv url: http://arxiv.org/abs/2305.16275v1
- Date: Thu, 25 May 2023 17:31:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-26 13:20:31.468747
- Title: CENSUS-HWR: a large training dataset for offline handwriting recognition
- Title(参考訳): CENSUS-HWR:オフライン手書き認識のための大規模なトレーニングデータセット
- Authors: Chetan Joshi and Lawry Sorenson and Ammon Wolfert and Dr. Mark Clement
and Dr. Joseph Price and Dr. Kasey Buckles
- Abstract要約: CENSUS-HWRは、1,812,014のグレースケールの画像で完全な英語の手書き文字からなる新しいデータセットである。
このデータセットは、ディープラーニングアルゴリズムのベンチマークとして手書きモデルを提供することを意図している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Progress in Automated Handwriting Recognition has been hampered by the lack
of large training datasets. Nearly all research uses a set of small datasets
that often cause models to overfit. We present CENSUS-HWR, a new dataset
consisting of full English handwritten words in 1,812,014 gray scale images. A
total of 1,865,134 handwritten texts from a vocabulary of 10,711 words in the
English language are present in this collection. This dataset is intended to
serve handwriting models as a benchmark for deep learning algorithms. This huge
English handwriting recognition dataset has been extracted from the US 1930 and
1940 censuses taken by approximately 70,000 enumerators each year. The dataset
and the trained model with their weights are freely available to download at
https://censustree.org/data.html.
- Abstract(参考訳): 手書き自動認識の進歩は、大規模なトレーニングデータセットの欠如によって妨げられている。
ほぼすべての研究は、モデルに過度に適合させる小さなデータセットを使用する。
CENSUS-HWRは,1,812,014のグレースケール画像中の全英語手書き文字からなる新しいデータセットである。
このコレクションには英語で10,711語の語彙から1,865,134個の手書きテキストが存在している。
このデータセットは、ディープラーニングアルゴリズムのベンチマークとして手書きモデルを提供することを意図している。
この巨大な英語の筆跡認識データセットは、1930年と1940年の国勢調査から毎年70,000人の列挙者によって抽出されている。
データセットとトレーニングされたモデルの重量は、https://censustree.org/data.htmlで無料でダウンロードできる。
関連論文リスト
- Deepfake audio as a data augmentation technique for training automatic
speech to text transcription models [55.2480439325792]
本稿では,ディープフェイク音声に基づくデータ拡張手法を提案する。
インド人(英語)が生成したデータセットが選択され、単一のアクセントの存在が保証された。
論文 参考訳(メタデータ) (2023-09-22T11:33:03Z) - Slovo: Russian Sign Language Dataset [83.93252084624997]
本稿では,クラウドソーシングプラットフォームを用いたロシア手話(RSL)ビデオデータセットであるSlovoについて述べる。
データセットには20,000のFullHDレコードが含まれており、194人の署名者が受信した1,000の独立したRSLジェスチャーに分割されている。
論文 参考訳(メタデータ) (2023-05-23T21:00:42Z) - ADDSL: Hand Gesture Detection and Sign Language Recognition on Annotated
Danish Sign Language [0.0]
本稿では,デンマーク手話用アノテーションデータセット(ADDSL)について紹介する。
このデータセットを用いて、1段オブジェクト検出モデル(YOLOv5)を訓練し、文字(A-Z)と数字(0-9)を認識する。
5つのモデルは350エポックで訓練され、平均推算時間は1枚あたり9.02ms、最高のアククラックは92%となった。
論文 参考訳(メタデータ) (2023-05-16T18:08:24Z) - Scalable handwritten text recognition system for lexicographic sources
of under-resourced languages and alphabets [1.304892050913381]
17世紀と18世紀のポーランド語辞典という大きな歴史辞典では、インデックスカードは280万枚である。
我々は,(1)最適化された検出モデル,(2)手書きコンテンツを解読する認識モデル,(3)制約付きWord Beam Searchを用いた後処理ステップを含む手書き文字認識ソリューションを適用した。
我々のモデルは単語レベルで0.881の精度を達成し、ベースRCNNモデルよりも優れていた。
論文 参考訳(メタデータ) (2023-03-28T19:06:27Z) - Handwritten Word Recognition using Deep Learning Approach: A Novel Way
of Generating Handwritten Words [14.47529728678643]
本稿では,手書き文字を用いた多様な手書き語画像を生成する手法を提案する。
アプローチ全体は、大きくて多様な手書きの単語データセットを生成する過程を示している。
実験では,手書きの単語データセットが欠けているBangla言語をターゲットにした。
論文 参考訳(メタデータ) (2023-03-13T22:58:34Z) - Kurdish Handwritten Character Recognition using Deep Learning Techniques [26.23274417985375]
本稿では、深層学習技術を用いてクルド語アルファベットの文字を認識可能なモデルの設計と開発を試みる。
4000万枚以上の画像を含む、手書きのクルド文字のための包括的なデータセットが作成された。
結果,精度は96%,トレーニング精度は97%であった。
論文 参考訳(メタデータ) (2022-10-18T16:48:28Z) - Improving Accuracy and Explainability of Online Handwriting Recognition [0.9176056742068814]
我々は,OnHW-charsデータセット上で手書き認識モデルを開発し,先行モデルの精度を向上させる。
私たちの結果は公開リポジトリを通じて検証可能で再現可能です。
論文 参考訳(メタデータ) (2022-09-14T21:28:14Z) - ASR2K: Speech Recognition for Around 2000 Languages without Audio [100.41158814934802]
対象言語に音声を必要としない音声認識パイプラインを提案する。
私たちのパイプラインは、音響、発音、言語モデルという3つのコンポーネントで構成されています。
我々は、1909年の言語をCrubadanと組み合わせて、大きな絶滅危惧言語n-gramデータベースを構築した。
論文 参考訳(メタデータ) (2022-09-06T22:48:29Z) - Lexically Aware Semi-Supervised Learning for OCR Post-Correction [90.54336622024299]
世界中の多くの言語における既存の言語データの多くは、非デジタル化された書籍や文書に閉じ込められている。
従来の研究は、あまり良くない言語を認識するためのニューラル・ポスト・コレクション法の有用性を実証してきた。
そこで本研究では,生画像を利用した半教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2021-11-04T04:39:02Z) - Extracting Training Data from Large Language Models [78.3839333127544]
本論文では,言語モデルに問い合わせることで,学習データ抽出攻撃を実行して個々のトレーニング例を回復できることを実証する。
我々は,公開インターネットのスクレイプ上で訓練された言語モデルgpt-2に対する攻撃を実証し,モデルのトレーニングデータから数百の動詞のテキストシーケンスを抽出することができることを示した。
論文 参考訳(メタデータ) (2020-12-14T18:39:09Z) - A Large-Scale Chinese Short-Text Conversation Dataset [77.55813366932313]
大規模な中国語会話データセットLCCCについて,基本バージョン(680万対話),大バージョン(1120万対話)について述べる。
データセットの品質は、厳格なデータクリーニングパイプラインによって保証されます。
また,LCCC-baseとLCCC-largeで訓練された事前学習対話モデルもリリースした。
論文 参考訳(メタデータ) (2020-08-10T08:12:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。