Fugu-MT 論文翻訳(概要): Recognition of Handwritten Japanese Characters Using Ensemble of Convolutional Neural Networks

論文の概要: Recognition of Handwritten Japanese Characters Using Ensemble of Convolutional Neural Networks

arxiv url: http://arxiv.org/abs/2306.03954v1
Date: Tue, 6 Jun 2023 18:30:51 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-08 17:39:50.361551
Title: Recognition of Handwritten Japanese Characters Using Ensemble of Convolutional Neural Networks
Title（参考訳）: 畳み込みニューラルネットワークを用いた手書き文字認識
Authors: Angel I. Solis, Justin Zarkovacki, John Ly and Adham Atyabi
Abstract要約: この研究は、手書き漢字の認識に3つの畳み込みニューラルネットワーク(CNN)のアンサンブルを用いた。その結果,手書き文字認識のためのCNNアンサンブルアーキテクチャの有効性が示唆された。
参考スコア（独自算出の注目度）: 0.17646262965516946
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The Japanese writing system is complex, with three character types of Hiragana, Katakana, and Kanji. Kanji consists of thousands of unique characters, further adding to the complexity of character identification and literature understanding. Being able to translate handwritten Japanese characters into digital text is useful for data analysis, translation, learning and cultural preservation. In this study, a machine learning approach to analyzing and recognizing handwritten Japanese characters (Kanji) is proposed. The study used an ensemble of three convolutional neural networks (CNNs) for recognizing handwritten Kanji characters and utilized four datasets of MNIST, K-MNIST, Kuzushiji-49 (K49) and the top 150 represented classes in the Kuzushiji-Kanji (K-Kanji) dataset for its performance evaluation. The results indicate feasibility of using proposed CNN-ensemble architecture for recognizing handwritten characters, achieving 99.4%, 96.4%, 95.0% and 96.4% classification accuracy on MNIST, K-MNIS, K49, and K-Kanji datasets respectively.
Abstract（参考訳）: 日本の文字体系は複雑で、平仮名・片仮名・漢字の3文字タイプがある。漢字は数千の独特な文字で構成されており、さらに文字識別や文学理解の複雑さが増している。手書きの文字をデジタルテキストに翻訳できることは、データ分析、翻訳、学習、文化保存に有用である。本研究では,手書き文字(漢字)の分析と認識のための機械学習手法を提案する。本研究は手書き漢字の認識に3つの畳み込みニューラルネットワーク(CNN)を用いており、MNIST, K-MNIST, Kuzushiji-49(K49)の4つのデータセットと、クズシジ漢字データセット(K-Kanji)の上位150のクラスを用いて評価を行った。その結果,手書き文字の認識にCNNアンサンブルアーキテクチャを用いることで,MNIST,K-MNIS,K49,K-Kanjiの各データセットの分類精度を99.4%,96.4%,95.0%,96.4%とした。

関連論文リスト

Interpretable Mnemonic Generation for Kanji Learning via Expectation-Maximization [51.26060172682443]
本稿では,共通ルールの集合によって駆動されるメニーモニックな構築過程を明示的にモデル化する生成フレームワークを提案する。提案手法は潜在構造と構成規則を学習し,解釈可能な,系統的な調波生成を可能にする。
論文参考訳（メタデータ） (2025-07-07T15:49:23Z)
Hashigo: A Next Generation Sketch Interactive System for Japanese Kanji [6.45586946263398]
橋郷(はしご)は、人間のインストラクターレベルの批判と視覚構造と筆記技術の両方に対するフィードバックを実現するスケッチ対話システムである。この種の自動的批判とフィードバックにより、学生はスケッチの特定の欠陥を標的にし、修正することができる。
論文参考訳（メタデータ） (2025-04-15T18:37:28Z)
Bukva: Russian Sign Language Alphabet [75.42794328290088]
本稿では,ロシア手話(RSL)ダクティルとしても知られる,ロシア語の指先文字の認識について検討する。ダクティル (Dactyl) は手の動きが書かれた言語の個々の文字を表す手話の構成要素である。当社は、RSLダクチル認識のための、最初の本格的なオープンソースビデオデータセットであるBakvaを提供している。
論文参考訳（メタデータ） (2024-10-11T09:59:48Z)
Multi-Modal Multi-Granularity Tokenizer for Chu Bamboo Slip Scripts [65.10991154918737]
本研究は、古代中国の春・秋・戦国時代(紀元前771-256年)に用いられた中竹の文字に焦点を当てたものである。我々のトークンライザはまず文字検出を採用して文字境界の特定を行い、次に文字レベルとサブキャラクタレベルの両方で文字認識を行う。学術コミュニティを支援するために,100K以上の注釈付き文字イメージスキャンを備えたCBSの最初の大規模データセットも収集した。
論文参考訳（メタデータ） (2024-09-02T07:42:55Z)
Multichannel Attention Networks with Ensembled Transfer Learning to Recognize Bangla Handwritten Charecter [1.5236380958983642]
この研究では、アンサンブルトランスファーラーニングとマルチチャネルアテンションネットワークを備えた畳み込みニューラルネットワーク(CNN)を用いた。我々は、CAMTERdb 3.1.2データセットを用いて提案モデルを評価し、生データセットの92%、前処理データセットの98.00%の精度を達成した。
論文参考訳（メタデータ） (2024-08-20T15:51:01Z)
Tails Tell Tales: Chapter-Wide Manga Transcriptions with Character Names [53.24414727354768]
本論文は,マンガ全章の対話書き起こしを完全自動生成することを目的とする。 i) 言っていることを識別し、各ページのテキストを検出し、それらが本質的か非本質的かに分類する。また、章を通して同じ文字が一貫した名前で呼ばれることも保証している。
論文参考訳（メタデータ） (2024-08-01T05:47:04Z)
Kurdish Handwritten Character Recognition using Deep Learning Techniques [26.23274417985375]
本稿では、深層学習技術を用いてクルド語アルファベットの文字を認識可能なモデルの設計と開発を試みる。 4000万枚以上の画像を含む、手書きのクルド文字のための包括的なデータセットが作成された。結果,精度は96%,トレーニング精度は97%であった。
論文参考訳（メタデータ） (2022-10-18T16:48:28Z)
Kencorpus: A Kenyan Language Corpus of Swahili, Dholuo and Luhya for Natural Language Processing Tasks [0.0]
Kencorpusプロジェクトは、テキストと音声データの収集と保存によってギャップを埋めようとしている。ケンコーパスデータセット(Kencorpus dataset)は、ケニアで主に話されている3つの言語(スワヒリ語、ドゥルオ語、ルヒャ語)のテキストと音声コーパスである。データセットは、モデルトレーニングや翻訳といった下流の機械学習タスクに役立ちます。
論文参考訳（メタデータ） (2022-08-25T13:27:14Z)
Comprehensive Benchmark Datasets for Amharic Scene Text Detection and Recognition [56.048783994698425]
Ethiopic/Amharicスクリプトはアフリカ最古の書記システムの一つで、東アフリカで少なくとも23の言語に対応している。アムハラ語の表記体系である Abugida は282音節、15句の句読点、20の数字を持つ。 HUST-ART, HUST-AST, ABE, Tana という,自然界におけるアムハラ文字の検出と認識のための総合的な公開データセットを提示した。
論文参考訳（メタデータ） (2022-03-23T03:19:35Z)
Writer Recognition Using Off-line Handwritten Single Block Characters [59.17685450892182]
我々は、生年月日DoBの6桁の個人番号を使用する。本稿では,方向測定を行う手作り特徴に基づく認識手法と,ResNet50モデルによる深い特徴に基づく認識手法について検討する。その結果,DoBでは手書き情報に同一性関連情報が6桁程度存在することがわかった。
論文参考訳（メタデータ） (2022-01-25T23:04:10Z)
Predicting the Ordering of Characters in Japanese Historical Documents [6.82324732276004]
1900年(明治33年)の日本書記制度の変遷により、歴史文書は一般には入手できないものとなった。キャラクタの逐次順序を予測するタスクに対するいくつかのアプローチについて検討する。私たちのベストパフォーマンスシステムは98.65%の精度で、データセットの書籍の49%で完璧に正確です。
論文参考訳（メタデータ） (2021-06-12T14:39:20Z)
SHUOWEN-JIEZI: Linguistically Informed Tokenizers For Chinese Language Model Pretraining [48.880840711568425]
事前学習された言語モデルの中国語トークン化に対する3つの要因の影響について検討する。本稿では,発音に基づくトークン化システムであるSHUOWEN (Talk Word) と,グリフに基づくトークン化システムであるJIEZI (Solve Character) の3種類のトークン化手法を提案する。 SHUOWENとJIEZIは、一般的に従来のシングル文字トークンよりも優れた性能を持つ。
論文参考訳（メタデータ） (2021-06-01T11:20:02Z)
HKR For Handwritten Kazakh & Russian Database [1.7499351967216341]
オフライン手書き文字認識のための新しいロシア語とカザフ語データベース(ロシア語の95%とカザフ語/文の5%)を提示する。データベースはキリル文字で書かれており、同じ33文字を共有している。ディープラーニングと機械学習を使うことで、手書き認識タスクの分野の研究者に役立てることができる。
論文参考訳（メタデータ） (2020-07-07T15:57:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。