論文の概要: Efficient approach of using CNN based pretrained model in Bangla
handwritten digit recognition
- arxiv url: http://arxiv.org/abs/2209.13005v1
- Date: Mon, 19 Sep 2022 15:58:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-02 23:14:04.117492
- Title: Efficient approach of using CNN based pretrained model in Bangla
handwritten digit recognition
- Title(参考訳): バングラ手書き文字認識におけるCNNに基づく事前学習モデルの有用性
- Authors: Muntarin Islam, Shabbir Ahmed Shuvo, Musarrat Saberin Nipun, Rejwan
Bin Sulaiman, Jannatul Nayeem, Zubaer Haque, Md Mostak Shaikh, Md Sakib Ullah
Sourav
- Abstract要約: 手書き文字認識は、様々な産業において多くの応用に不可欠である。
形状、サイズ、書体スタイルの多様性でベンガル文字を書くのが複雑であるため、研究者はSupervisedの機械学習アルゴリズムを使って精度を向上できなかった。
Inception-v3, EfficientNetB0を含むCNNベースの手書き文字認識モデルを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Due to digitalization in everyday life, the need for automatically
recognizing handwritten digits is increasing. Handwritten digit recognition is
essential for numerous applications in various industries. Bengali ranks the
fifth largest language in the world with 265 million speakers (Native and
non-native combined) and 4 percent of the world population speaks Bengali. Due
to the complexity of Bengali writing in terms of variety in shape, size, and
writing style, researchers did not get better accuracy using Supervised machine
learning algorithms to date. Moreover, fewer studies have been done on Bangla
handwritten digit recognition (BHwDR). In this paper, we proposed a novel
CNN-based pre-trained handwritten digit recognition model which includes
Resnet-50, Inception-v3, and EfficientNetB0 on NumtaDB dataset of 17 thousand
instances with 10 classes.. The Result outperformed the performance of other
models to date with 97% accuracy in the 10-digit classes. Furthermore, we have
evaluated the result or our model with other research studies while suggesting
future study
- Abstract(参考訳): 日常生活におけるデジタル化により,手書き文字の自動認識の必要性が高まっている。
手書き文字認識は、様々な産業において多くの応用に不可欠である。
ベンガル語は世界第5位の言語で、2億2500万人の話者(母国語と非母語の組み合わせ)と世界の人口の4%がベンガル語を話している。
形状、サイズ、書体スタイルの多様性の観点からベンガル文字の複雑さのため、研究者はSupervised Machine Learningアルゴリズムを使用して、これまでは精度が向上しなかった。
さらに、Bangla手書き文字認識(BHwDR)についての研究は少ない。
本稿では,10クラス1万インスタンスのnumtadbデータセット上でresnet-50,inception-v3, efficientnetb0を含む,cnnを用いた手書き文字認識モデルを提案する。
.
その結果、これまでの10桁クラスの97%の精度で他のモデルのパフォーマンスを上回った。
さらに,研究結果やモデルを他の研究と評価し,今後の研究を提案する。
関連論文リスト
- Multichannel Attention Networks with Ensembled Transfer Learning to Recognize Bangla Handwritten Charecter [1.5236380958983642]
この研究では、アンサンブルトランスファーラーニングとマルチチャネルアテンションネットワークを備えた畳み込みニューラルネットワーク(CNN)を用いた。
我々は、CAMTERdb 3.1.2データセットを用いて提案モデルを評価し、生データセットの92%、前処理データセットの98.00%の精度を達成した。
論文 参考訳(メタデータ) (2024-08-20T15:51:01Z) - DocReLM: Mastering Document Retrieval with Language Model [49.847369507694154]
本研究では,大規模言語モデルを利用することで,文書検索システムが高度な意味理解能力を実現することを実証する。
我々のアプローチは、大規模言語モデルによって生成されたドメイン固有データを用いて、検索者と再ランカを訓練することである。
我々は、量子物理学とコンピュータビジョンの分野の研究者によって注釈付けされたテストセットを使用して、システムの性能を評価する。
論文 参考訳(メタデータ) (2024-05-19T06:30:22Z) - Sampling and Ranking for Digital Ink Generation on a tight computational
budget [69.15275423815461]
トレーニングされたデジタルインク生成モデルの出力品質を最大化する方法について検討する。
我々は、デジタルインク領域におけるその種類に関する最初のアブレーション研究において、複数のサンプリングとランキング手法の効果を使用、比較する。
論文 参考訳(メタデータ) (2023-06-02T09:55:15Z) - Bengali Handwritten Digit Recognition using CNN with Explainable AI [0.5156484100374058]
我々は様々な機械学習アルゴリズムとCNNを用いて手書きベンガル数字を認識した。
Grad-CAMは私たちのCNNモデルのXAIメソッドとして使われました。
論文 参考訳(メタデータ) (2022-12-23T04:40:20Z) - Writer Recognition Using Off-line Handwritten Single Block Characters [59.17685450892182]
我々は、生年月日DoBの6桁の個人番号を使用する。
本稿では,方向測定を行う手作り特徴に基づく認識手法と,ResNet50モデルによる深い特徴に基づく認識手法について検討する。
その結果,DoBでは手書き情報に同一性関連情報が6桁程度存在することがわかった。
論文 参考訳(メタデータ) (2022-01-25T23:04:10Z) - Open Vocabulary Electroencephalography-To-Text Decoding and Zero-shot
Sentiment Classification [78.120927891455]
最先端のブレイン・トゥ・テキストシステムは、ニューラルネットワークを使用して脳信号から直接言語を復号することに成功した。
本稿では,自然読解課題における語彙的脳波(EEG)-テキスト列列列復号化とゼロショット文感性分類に問題を拡張する。
脳波-テキストデコーディングで40.1%のBLEU-1スコア、ゼロショット脳波に基づく3次感情分類で55.6%のF1スコアを達成し、教師付きベースラインを著しく上回る結果となった。
論文 参考訳(メタデータ) (2021-12-05T21:57:22Z) - Bengali Handwritten Grapheme Classification: Deep Learning Approach [0.0]
画像中のベンガルグラフの3つの構成要素を分類することが課題となるKaggleコンペティション citek_link に参加する。
我々は,Multi-Layer Perceptron(MLP)やResNet50の現状など,既存のニューラルネットワークモデルの性能について検討する。
そこで我々は,ベンガル語文法分類のための独自の畳み込みニューラルネットワーク(CNN)モデルを提案し,検証根の精度95.32%,母音の精度98.61%,子音の精度98.76%を示した。
論文 参考訳(メタデータ) (2021-11-16T06:14:59Z) - Lexically Aware Semi-Supervised Learning for OCR Post-Correction [90.54336622024299]
世界中の多くの言語における既存の言語データの多くは、非デジタル化された書籍や文書に閉じ込められている。
従来の研究は、あまり良くない言語を認識するためのニューラル・ポスト・コレクション法の有用性を実証してきた。
そこで本研究では,生画像を利用した半教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2021-11-04T04:39:02Z) - Bangla Handwritten Digit Recognition and Generation [0.0]
バングラの手書き数字を生成するために、SGAN(Semi-supvised Generative Adversarial Network)が適用される。
本稿では,bhandデータセット上で99.44%の検証精度を実現するアーキテクチャを実装した。
論文 参考訳(メタデータ) (2021-03-14T12:11:21Z) - AKHCRNet: Bengali Handwritten Character Recognition Using Deep Learning [0.228438857884398]
本稿では,ベンガル文字,複合文字,数値桁に対する手書き文字認識のためのディープ・ニューラル・アーキテクチャ・ソリューションを提案する。
本稿では,ベンガル文字のスクラッチから学習するHCRネットワークを提案する。
論文 参考訳(メタデータ) (2020-08-29T15:22:00Z) - SIGMORPHON 2020 Shared Task 0: Typologically Diverse Morphological
Inflection [81.85463892070085]
形態的回帰に関するSIGMORPHON 2020の課題は、型的に異なる言語にまたがるシステムの一般化能力を調査することを目的としている。
システムは45言語と5つの言語ファミリーのデータを使用して開発され、追加の45言語と10の言語ファミリー(合計13言語)のデータで微調整され、90言語すべてで評価された。
論文 参考訳(メタデータ) (2020-06-20T13:24:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。