論文の概要: Recognition of Handwritten Japanese Characters Using Ensemble of
Convolutional Neural Networks
- arxiv url: http://arxiv.org/abs/2306.03954v1
- Date: Tue, 6 Jun 2023 18:30:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-08 17:39:50.361551
- Title: Recognition of Handwritten Japanese Characters Using Ensemble of
Convolutional Neural Networks
- Title(参考訳): 畳み込みニューラルネットワークを用いた手書き文字認識
- Authors: Angel I. Solis, Justin Zarkovacki, John Ly and Adham Atyabi
- Abstract要約: この研究は、手書き漢字の認識に3つの畳み込みニューラルネットワーク(CNN)のアンサンブルを用いた。
その結果,手書き文字認識のためのCNNアンサンブルアーキテクチャの有効性が示唆された。
- 参考スコア(独自算出の注目度): 0.17646262965516946
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Japanese writing system is complex, with three character types of
Hiragana, Katakana, and Kanji. Kanji consists of thousands of unique
characters, further adding to the complexity of character identification and
literature understanding. Being able to translate handwritten Japanese
characters into digital text is useful for data analysis, translation, learning
and cultural preservation. In this study, a machine learning approach to
analyzing and recognizing handwritten Japanese characters (Kanji) is proposed.
The study used an ensemble of three convolutional neural networks (CNNs) for
recognizing handwritten Kanji characters and utilized four datasets of MNIST,
K-MNIST, Kuzushiji-49 (K49) and the top 150 represented classes in the
Kuzushiji-Kanji (K-Kanji) dataset for its performance evaluation. The results
indicate feasibility of using proposed CNN-ensemble architecture for
recognizing handwritten characters, achieving 99.4%, 96.4%, 95.0% and 96.4%
classification accuracy on MNIST, K-MNIS, K49, and K-Kanji datasets
respectively.
- Abstract(参考訳): 日本の文字体系は複雑で、平仮名・片仮名・漢字の3文字タイプがある。
漢字は数千の独特な文字で構成されており、さらに文字識別や文学理解の複雑さが増している。
手書きの文字をデジタルテキストに翻訳できることは、データ分析、翻訳、学習、文化保存に有用である。
本研究では,手書き文字(漢字)の分析と認識のための機械学習手法を提案する。
本研究は手書き漢字の認識に3つの畳み込みニューラルネットワーク(CNN)を用いており、MNIST, K-MNIST, Kuzushiji-49(K49)の4つのデータセットと、クズシジ漢字データセット(K-Kanji)の上位150のクラスを用いて評価を行った。
その結果,手書き文字の認識にCNNアンサンブルアーキテクチャを用いることで,MNIST,K-MNIS,K49,K-Kanjiの各データセットの分類精度を99.4%,96.4%,95.0%,96.4%とした。
関連論文リスト
- NusaWrites: Constructing High-Quality Corpora for Underrepresented and
Extremely Low-Resource Languages [54.808217147579036]
インドネシアの地方言語について事例研究を行う。
データセット構築におけるオンラインスクラップ,人文翻訳,および母語話者による段落作成の有効性を比較した。
本研究は,母語話者による段落作成によって生成されたデータセットが,語彙的多様性と文化的内容の点で優れた品質を示すことを示す。
論文 参考訳(メタデータ) (2023-09-19T14:42:33Z) - Chinese Text Recognition with A Pre-Trained CLIP-Like Model Through
Image-IDS Aligning [61.34060587461462]
中国語テキスト認識(CTR)のための2段階フレームワークを提案する。
印刷文字画像とIdeographic Description Sequences (IDS) の整列によるCLIP様モデルの事前学習を行う。
この事前学習段階は、漢字を認識する人間をシミュレートし、各文字の標準表現を得る。
学習された表現はCTRモデルを監督するために使用され、従来の単一文字認識はテキストライン認識に改善される。
論文 参考訳(メタデータ) (2023-09-03T05:33:16Z) - Slovo: Russian Sign Language Dataset [83.93252084624997]
本稿では,クラウドソーシングプラットフォームを用いたロシア手話(RSL)ビデオデータセットであるSlovoについて述べる。
データセットには20,000のFullHDレコードが含まれており、194人の署名者が受信した1,000の独立したRSLジェスチャーに分割されている。
論文 参考訳(メタデータ) (2023-05-23T21:00:42Z) - Kurdish Handwritten Character Recognition using Deep Learning Techniques [26.23274417985375]
本稿では、深層学習技術を用いてクルド語アルファベットの文字を認識可能なモデルの設計と開発を試みる。
4000万枚以上の画像を含む、手書きのクルド文字のための包括的なデータセットが作成された。
結果,精度は96%,トレーニング精度は97%であった。
論文 参考訳(メタデータ) (2022-10-18T16:48:28Z) - Kencorpus: A Kenyan Language Corpus of Swahili, Dholuo and Luhya for
Natural Language Processing Tasks [0.0]
Kencorpusプロジェクトは、テキストと音声データの収集と保存によってギャップを埋めようとしている。
ケンコーパスデータセット(Kencorpus dataset)は、ケニアで主に話されている3つの言語(スワヒリ語、ドゥルオ語、ルヒャ語)のテキストと音声コーパスである。
データセットは、モデルトレーニングや翻訳といった下流の機械学習タスクに役立ちます。
論文 参考訳(メタデータ) (2022-08-25T13:27:14Z) - Comprehensive Benchmark Datasets for Amharic Scene Text Detection and
Recognition [56.048783994698425]
Ethiopic/Amharicスクリプトはアフリカ最古の書記システムの一つで、東アフリカで少なくとも23の言語に対応している。
アムハラ語の表記体系である Abugida は282音節、15句の句読点、20の数字を持つ。
HUST-ART, HUST-AST, ABE, Tana という,自然界におけるアムハラ文字の検出と認識のための総合的な公開データセットを提示した。
論文 参考訳(メタデータ) (2022-03-23T03:19:35Z) - Writer Recognition Using Off-line Handwritten Single Block Characters [59.17685450892182]
我々は、生年月日DoBの6桁の個人番号を使用する。
本稿では,方向測定を行う手作り特徴に基づく認識手法と,ResNet50モデルによる深い特徴に基づく認識手法について検討する。
その結果,DoBでは手書き情報に同一性関連情報が6桁程度存在することがわかった。
論文 参考訳(メタデータ) (2022-01-25T23:04:10Z) - Predicting the Ordering of Characters in Japanese Historical Documents [6.82324732276004]
1900年(明治33年)の日本書記制度の変遷により、歴史文書は一般には入手できないものとなった。
キャラクタの逐次順序を予測するタスクに対するいくつかのアプローチについて検討する。
私たちのベストパフォーマンスシステムは98.65%の精度で、データセットの書籍の49%で完璧に正確です。
論文 参考訳(メタデータ) (2021-06-12T14:39:20Z) - SHUOWEN-JIEZI: Linguistically Informed Tokenizers For Chinese Language
Model Pretraining [48.880840711568425]
事前学習された言語モデルの中国語トークン化に対する3つの要因の影響について検討する。
本稿では,発音に基づくトークン化システムであるSHUOWEN (Talk Word) と,グリフに基づくトークン化システムであるJIEZI (Solve Character) の3種類のトークン化手法を提案する。
SHUOWENとJIEZIは、一般的に従来のシングル文字トークンよりも優れた性能を持つ。
論文 参考訳(メタデータ) (2021-06-01T11:20:02Z) - Persian Handwritten Digit, Character and Word Recognition Using Deep
Learning [0.5188841610098436]
本稿では、深層ニューラルネットワークを様々なDensNetアーキテクチャやXceptionを通じて活用する。
我々はペルシャ語の特殊性と対応する筆跡を考慮に入れた光学的文字認識法を考案した。
HODAデータベースでは、数字と文字の認識率は99.72%と89.99%であり、数字、文字、単語の認識率は99.72%、98.32%、98.82%である。
論文 参考訳(メタデータ) (2020-10-24T11:42:28Z) - HKR For Handwritten Kazakh & Russian Database [1.7499351967216341]
オフライン手書き文字認識のための新しいロシア語とカザフ語データベース(ロシア語の95%とカザフ語/文の5%)を提示する。
データベースはキリル文字で書かれており、同じ33文字を共有している。
ディープラーニングと機械学習を使うことで、手書き認識タスクの分野の研究者に役立てることができる。
論文 参考訳(メタデータ) (2020-07-07T15:57:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。