論文の概要: Handwritten Arabic Character Recognition for Children Writ-ing Using
Convolutional Neural Network and Stroke Identification
- arxiv url: http://arxiv.org/abs/2211.02119v1
- Date: Thu, 3 Nov 2022 19:48:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 16:00:08.891672
- Title: Handwritten Arabic Character Recognition for Children Writ-ing Using
Convolutional Neural Network and Stroke Identification
- Title(参考訳): 畳み込みニューラルネットワークとストローク同定を用いた手書きアラビア語文字認識
- Authors: Mais Alheraki, Rawan Al-Matham and Hend Al-Khalifa
- Abstract要約: 本稿では,ヒジャデータセット上での91%の精度で幼児の手書き認識を行う畳み込みニューラルネットワーク(CNN)モデルを提案する。
キャラクタ内のストローク数に基づいた単一モデルではなく,マルチモデルを用いた新しいアプローチを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatic Arabic handwritten recognition is one of the recently studied
problems in the field of Machine Learning. Unlike Latin languages, Arabic is a
Semitic language that forms a harder challenge, especially with variability of
patterns caused by factors such as writer age. Most of the studies focused on
adults, with only one recent study on children. Moreover, much of the recent
Machine Learning methods focused on using Convolutional Neural Networks, a
powerful class of neural networks that can extract complex features from
images. In this paper we propose a convolutional neural network (CNN) model
that recognizes children handwriting with an accuracy of 91% on the Hijja
dataset, a recent dataset built by collecting images of the Arabic characters
written by children, and 97% on Arabic Handwritten Character Dataset. The
results showed a good improvement over the proposed model from the Hijja
dataset authors, yet it reveals a bigger challenge to solve for children Arabic
handwritten character recognition. Moreover, we proposed a new approach using
multi models instead of single model based on the number of strokes in a
character, and merged Hijja with AHCD which reached an averaged prediction
accuracy of 96%.
- Abstract(参考訳): 自動アラビア文字認識は機械学習の分野で最近研究されている問題の1つである。
ラテン言語とは異なり、アラビア語は、特に作家年齢などの要因によって引き起こされるパターンの多様性において、難しい課題を形成するセム語である。
ほとんどの研究は成人に焦点が当てられ、子供に関する最近の研究は1つに過ぎなかった。
さらに、最近の機械学習手法の多くは、画像から複雑な特徴を抽出できる強力なニューラルネットワークのクラスである畳み込みニューラルネットワークの使用に焦点を当てている。
本稿では,ヒジャーデータセットで91%の精度で手書き文字を認識する畳み込みニューラルネットワーク(CNN)モデルを提案する。
その結果、Hijjaデータセット作成者による提案モデルよりも優れた改善が得られたが、アラビア文字による文字認識の子どもにとって大きな課題が明らかにされた。
さらに,キャラクタ内のストローク数に基づく単一モデルではなく,マルチモデルを用いた新しいアプローチを提案し,平均予測精度96%に達したHijjaとAHCDをマージした。
関連論文リスト
- Retrieval is Accurate Generation [99.24267226311157]
本稿では,支援文書の集合からコンテキスト認識句を選択する新しい手法を提案する。
本モデルでは,検索対象のベースラインの中で,最高の性能と低レイテンシを実現する。
論文 参考訳(メタデータ) (2024-02-27T14:16:19Z) - ArabicMMLU: Assessing Massive Multitask Language Understanding in Arabic [51.922112625469836]
アラビア語における最初のマルチタスク言語理解ベンチマークである、データセット名を提案する。
我々のデータは、現代標準アラビア語(MSA)における40のタスクと14,575のマルチチョイス質問で構成されており、地域の母語話者と協調して慎重に構築されている。
35モデルについて評価した結果,特にオープンソースモデルにおいて,改善の余地がかなり高いことが判明した。
論文 参考訳(メタデータ) (2024-02-20T09:07:41Z) - NusaWrites: Constructing High-Quality Corpora for Underrepresented and
Extremely Low-Resource Languages [54.808217147579036]
インドネシアの地方言語について事例研究を行う。
データセット構築におけるオンラインスクラップ,人文翻訳,および母語話者による段落作成の有効性を比較した。
本研究は,母語話者による段落作成によって生成されたデータセットが,語彙的多様性と文化的内容の点で優れた品質を示すことを示す。
論文 参考訳(メタデータ) (2023-09-19T14:42:33Z) - Huruf: An Application for Arabic Handwritten Character Recognition Using
Deep Learning [0.0]
本稿では、アラビア語の文字と数字を認識するための軽量な畳み込みニューラルネットワークアーキテクチャを提案する。
提案したパイプラインは、畳み込み、プール、バッチ正規化、ドロップアウト、最後にグローバル平均レイヤの4つのレイヤを含む合計18層で構成されている。
提案したモデルはそれぞれ96.93%と99.35%の精度を達成し、これは最先端のエンドレベルアプリケーションに適した解決策となった。
論文 参考訳(メタデータ) (2022-12-16T17:39:32Z) - Graphemic Normalization of the Perso-Arabic Script [47.429213930688086]
本稿では,ペルソ・アラビア語が最良文書言語を超えて提示する課題について述べる。
自然言語処理(NLP)の状況に注目する。
ペルソ・アラビア文字ディアスポラの多言語語族8言語に対する正規化が機械翻訳および統計言語モデリングタスクに及ぼす影響を評価する。
論文 参考訳(メタデータ) (2022-10-21T21:59:44Z) - Kurdish Handwritten Character Recognition using Deep Learning Techniques [26.23274417985375]
本稿では、深層学習技術を用いてクルド語アルファベットの文字を認識可能なモデルの設計と開発を試みる。
4000万枚以上の画像を含む、手書きのクルド文字のための包括的なデータセットが作成された。
結果,精度は96%,トレーニング精度は97%であった。
論文 参考訳(メタデータ) (2022-10-18T16:48:28Z) - Dependency-based Mixture Language Models [53.152011258252315]
依存性に基づく混合言語モデルを紹介する。
より詳しくは、依存関係モデリングの新たな目的により、まずニューラルネットワークモデルを訓練する。
次に、前回の依存性モデリング確率分布と自己意図を混合することにより、次の確率を定式化する。
論文 参考訳(メタデータ) (2022-03-19T06:28:30Z) - VidLanKD: Improving Language Understanding via Video-Distilled Knowledge
Transfer [76.3906723777229]
言語理解を改善するためのビデオ言語知識蒸留法VidLanKDを提案する。
我々は、ビデオテキストデータセット上でマルチモーダル教師モデルを訓練し、その知識をテキストデータセットを用いて学生言語モデルに伝達する。
我々の実験では、VidLanKDはテキストのみの言語モデルや発声モデルよりも一貫した改善を実現している。
論文 参考訳(メタデータ) (2021-07-06T15:41:32Z) - Classification of Handwritten Names of Cities and Handwritten Text
Recognition using Various Deep Learning Models [0.0]
我々は,手書き認識モデルの開発における近年の様々なアプローチと成果について述べる。
最初のモデルは、特徴抽出にディープ畳み込みニューラルネットワーク(CNN)、単語分類に完全に接続された多層パーセプトロンニューラルネットワーク(MLP)を使用する。
2つ目のモデルはSimpleHTRと呼ばれ、CNNとリカレントニューラルネットワーク(RNN)レイヤを使用して画像から情報を取り出す。
論文 参考訳(メタデータ) (2021-02-09T13:34:16Z) - Arabic Handwritten Character Recognition based on Convolution Neural
Networks and Support Vector Machine [0.0]
本稿では,ディープ畳み込みニューラルネットワーク(DCNN)とサポートベクタマシン(SVM)を用いたアラビア文字と文字の認識アルゴリズムを提案する。
本稿では,入力テンプレートと事前記憶テンプレートとの類似性を決定することで,アラビア文字認識の問題に対処する。
本研究は,提案アルゴリズムが入力された手書きアラビア語文字を認識し,識別し,検証する能力を示すものである。
論文 参考訳(メタデータ) (2020-09-28T16:18:52Z) - Neural Computing for Online Arabic Handwriting Character Recognition
using Hard Stroke Features Mining [0.0]
オンラインアラビア文字認識における書字ストローク特徴の垂直方向と水平方向から所望の臨界点を検出する方法を提案する。
バックプロパゲーション学習アルゴリズムと修正シグモイド関数に基づくアクティベーション関数を備えた多層パーセプトロンを用いて、文字の分類のためにこれらのトークンから最小の特徴セットを抽出する。
提案手法は,文字認識技術に匹敵する98.6%の平均精度を実現する。
論文 参考訳(メタデータ) (2020-05-02T23:17:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。