論文の概要: Embedded Large-Scale Handwritten Chinese Character Recognition
- arxiv url: http://arxiv.org/abs/2004.06209v1
- Date: Mon, 13 Apr 2020 21:21:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-14 00:19:41.839033
- Title: Embedded Large-Scale Handwritten Chinese Character Recognition
- Title(参考訳): 大規模手書き漢字認識の組込み
- Authors: Youssouf Chherawala, Hans J. G. A. Dolfing, Ryan S. Dixon, and Jerome
R. Bellegarda
- Abstract要約: 本稿では,Appleのディープラーニング認識システムが,さまざまなモバイルデバイス上でリアルタイムに動作しながら,最大3万文字を正確に処理する方法について述べる。
我々の実験は、十分な品質と十分な量のトレーニングデータを使用する限り、在庫が増加するにつれて精度が低下することを示している。
- 参考スコア(独自算出の注目度): 5.274304682919005
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As handwriting input becomes more prevalent, the large symbol inventory
required to support Chinese handwriting recognition poses unique challenges.
This paper describes how the Apple deep learning recognition system can
accurately handle up to 30,000 Chinese characters while running in real-time
across a range of mobile devices. To achieve acceptable accuracy, we paid
particular attention to data collection conditions, representativeness of
writing styles, and training regimen. We found that, with proper care, even
larger inventories are within reach. Our experiments show that accuracy only
degrades slowly as the inventory increases, as long as we use training data of
sufficient quality and in sufficient quantity.
- Abstract(参考訳): 手書き入力が普及するにつれて、中国の手書き認識をサポートするのに必要な大きなシンボルインベントリがユニークな課題となる。
本稿では,Appleのディープラーニング認識システムが,さまざまなモバイルデバイス上でリアルタイムに動作しながら,最大3万文字を正確に処理する方法について述べる。
許容できる正確性を達成するため,我々はデータ収集条件,書き方の代表性,訓練体制に特に注意を払った。
適切な注意を払って、より大きな在庫が手元にあることがわかった。
我々の実験は、十分な品質と十分な量のトレーニングデータを使用する限り、在庫が増加するにつれて精度が低下することを示している。
関連論文リスト
- MetaScript: Few-Shot Handwritten Chinese Content Generation via
Generative Adversarial Networks [15.037121719502606]
漢字のデジタル表現における個人的手書きスタイルの存在感の低下に対処する新しいコンテンツ生成システムであるMetaScriptを提案する。
本手法は,個人固有の手書きスタイルを保ち,デジタルタイピングの効率を維持できる漢字を生成するために,数ショット学習の力を利用する。
論文 参考訳(メタデータ) (2023-12-25T17:31:19Z) - Impact of Ground Truth Quality on Handwriting Recognition [0.5328877196581558]
ブルリンジャーのデータベースには、主に近代以前のドイツ語とラテン語のテキストの1万以上のラベル付きテキストラインイメージが含まれている。
本稿では,そのような誤りがトレーニングや評価に与える影響を調査し,典型的なアライメント誤りを検出し,修正する手段を提案する。
論文 参考訳(メタデータ) (2023-12-14T15:36:41Z) - On the Importance of Signer Overlap for Sign Language Detection [65.26091369630547]
我々は,手話検出のための現在のベンチマークデータセットは,一般化が不十分な過度に肯定的な結果であると主張している。
我々は、現在の符号検出ベンチマークデータセットに対するシグナ重なりの影響を詳細に分析することでこれを定量化する。
我々は、重複のない新しいデータセット分割を提案し、より現実的なパフォーマンス評価を可能にします。
論文 参考訳(メタデータ) (2023-03-19T22:15:05Z) - Kurdish Handwritten Character Recognition using Deep Learning Techniques [26.23274417985375]
本稿では、深層学習技術を用いてクルド語アルファベットの文字を認識可能なモデルの設計と開発を試みる。
4000万枚以上の画像を含む、手書きのクルド文字のための包括的なデータセットが作成された。
結果,精度は96%,トレーニング精度は97%であった。
論文 参考訳(メタデータ) (2022-10-18T16:48:28Z) - DARE: A large-scale handwritten date recognition system [0.0]
約1000万のトークンを含むデータベースを紹介します。
書字スタイルの多様性が高い手書きテキストの訓練により, 一般的な手書きテキスト認識のための頑健なモデルが得られることを示す。
論文 参考訳(メタデータ) (2022-10-02T12:47:36Z) - Automatic dense annotation of large-vocabulary sign language videos [85.61513254261523]
自動アノテーションの密度を大幅に高めるための,シンプルでスケーラブルなフレームワークを提案する。
これらのアノテーションは手話研究コミュニティをサポートするために公開されています。
論文 参考訳(メタデータ) (2022-08-04T17:55:09Z) - SHUOWEN-JIEZI: Linguistically Informed Tokenizers For Chinese Language
Model Pretraining [48.880840711568425]
事前学習された言語モデルの中国語トークン化に対する3つの要因の影響について検討する。
本稿では,発音に基づくトークン化システムであるSHUOWEN (Talk Word) と,グリフに基づくトークン化システムであるJIEZI (Solve Character) の3種類のトークン化手法を提案する。
SHUOWENとJIEZIは、一般的に従来のシングル文字トークンよりも優れた性能を持つ。
論文 参考訳(メタデータ) (2021-06-01T11:20:02Z) - SmartPatch: Improving Handwritten Word Imitation with Patch
Discriminators [67.54204685189255]
本稿では,現在の最先端手法の性能を向上させる新手法であるSmartPatchを提案する。
我々は、よく知られたパッチ損失と、平行訓練された手書きテキスト認識システムから収集された情報を組み合わせる。
これにより、より強化された局所識別器が実現し、より現実的で高品質な手書き文字が生成される。
論文 参考訳(メタデータ) (2021-05-21T18:34:21Z) - Read and Attend: Temporal Localisation in Sign Language Videos [84.30262812057994]
我々は,連続署名ストリームを取り込み,一連の文書トークンを出力するトランスフォーマーモデルを訓練する。
入力シーケンス内の符号インスタンスの大規模な語彙に出席する能力を得て,その局所化を可能にすることを示す。
論文 参考訳(メタデータ) (2021-03-30T16:39:53Z) - Interpretable Distance Metric Learning for Handwritten Chinese Character
Recognition [8.233701182710035]
手書き漢字認識のための解釈可能な距離距離距離学習手法を提案する。
ベンチマークデータセットにおける実験結果は,提案手法の効率,正確性,解釈性に優れることを示す。
論文 参考訳(メタデータ) (2021-03-17T15:17:02Z) - Skeleton Based Sign Language Recognition Using Whole-body Keypoints [71.97020373520922]
手話は聴覚障害者や言語障害者のコミュニケーションに使用される。
また,RGB-D法と組み合わせて最先端の性能を実現することで,Skeletonに基づく音声認識が普及しつつある。
近年のボディポーズ推定用citejin 2020wholeの開発に触発されて,全身キーポイントと特徴に基づく手話認識を提案する。
論文 参考訳(メタデータ) (2021-03-16T03:38:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。