論文の概要: Isolated Bangla Handwritten Character Classification using Transfer Learning
- arxiv url: http://arxiv.org/abs/2509.03061v1
- Date: Wed, 03 Sep 2025 06:46:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 21:40:46.439414
- Title: Isolated Bangla Handwritten Character Classification using Transfer Learning
- Title(参考訳): トランスファーラーニングを用いたBangla手書き文字の分離分類
- Authors: Abdul Karim, S M Rafiuddin, Jahidul Islam Razin, Tahira Alam,
- Abstract要約: 本稿では,移動学習を用いて基本的,異質な文字を分類し,Bangla手書き文字を合成する。
ディープニューラルネットワーク技術を用いて、手書き文字のすべての標準生成可能なエンドツーエンドの分類を生成する。
このモデルは、トレーニングデータで99.82%の精度、テストデータで99.46%の精度を達成した。
- 参考スコア(独自算出の注目度): 0.7299729677753102
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Bangla language consists of fifty distinct characters and many compound characters. Several notable studies have been performed to recognize Bangla characters, both handwritten and optical. Our approach uses transfer learning to classify the basic, distinct, as well as compound Bangla handwritten characters while avoiding the vanishing gradient problem. Deep Neural Network techniques such as 3D Convolutional Neural Network (3DCNN), Residual Neural Network (ResNet), and MobileNet are applied to generate an end-to-end classification of all possible standard formations of handwritten characters in the Bangla language. The Bangla Lekha Isolated dataset, which contains 166,105 Bangla character image samples categorized into 84 distinct classes, is used for this classification model. The model achieved 99.82% accuracy on training data and 99.46% accuracy on test data. Comparisons with various state-of-the-art benchmarks of Bangla handwritten character classification show that the proposed model achieves better accuracy in classifying the data.
- Abstract(参考訳): バングラ語は50の異なる文字と多くの複合文字からなる。
バングラ文字を認識するために、手書き文字と光学文字の両方でいくつかの顕著な研究がなされている。
提案手法では,移動学習を用いて基本的,異質な文字の分類を行うとともに,Bangla手書き文字の合成を行う。
3次元畳み込みニューラルネットワーク(DCNN)、Residual Neural Network(ResNet)、MobileNetなどのディープニューラルネットワーク技術を用いて、バングラ語における手書き文字の可能なすべての標準構成をエンドツーエンドに分類する。
166,105個のBangla文字画像を含むBangla Lekha Isolatedデータセットは84の異なるクラスに分類される。
このモデルは、トレーニングデータで99.82%の精度、テストデータで99.46%の精度を達成した。
Bangla手書き文字分類の様々な最先端ベンチマークとの比較により,提案手法がデータ分類の精度向上を図っている。
関連論文リスト
- Performance Analysis of Few-Shot Learning Approaches for Bangla Handwritten Character and Digit Recognition [0.9895793818721335]
本研究は,Bangla手書き文字と数字の認識における数ショット学習手法の性能について検討する。
本稿では,手書き文字と数字の認識精度を向上させるために設計されたハイブリッドネットワークであるSynergiProtoNetを紹介する。
論文 参考訳(メタデータ) (2025-05-31T08:03:10Z) - Bukva: Russian Sign Language Alphabet [75.42794328290088]
本稿では,ロシア手話(RSL)ダクティルとしても知られる,ロシア語の指先文字の認識について検討する。
ダクティル (Dactyl) は手の動きが書かれた言語の個々の文字を表す手話の構成要素である。
当社は、RSLダクチル認識のための、最初の本格的なオープンソースビデオデータセットであるBakvaを提供している。
論文 参考訳(メタデータ) (2024-10-11T09:59:48Z) - Language Models for Text Classification: Is In-Context Learning Enough? [54.869097980761595]
最近の基礎言語モデルでは、ゼロショットや少数ショットの設定で多くのNLPタスクで最先端のパフォーマンスが示されている。
より標準的なアプローチよりもこれらのモデルの利点は、自然言語(prompts)で書かれた命令を理解する能力である。
これにより、アノテーション付きインスタンスが限られているドメインのテキスト分類問題に対処するのに適している。
論文 参考訳(メタデータ) (2024-03-26T12:47:39Z) - BanglaNet: Bangla Handwritten Character Recognition using Ensembling of
Convolutional Neural Network [0.0]
本稿では,複数の畳み込みニューラルネットワーク(CNN)のアンサンブルに基づく分類モデルを提案する。
Inception、ResNet、DenseNetといった最先端CNNモデルのアイデアに基づいた3つの異なるモデルが、拡張入力と非拡張入力の両方でトレーニングされている。
CMATERdb(英語版)、BanglaLekha-Isolated(英語版)、Ekush(英語版)の3つのベンチマークによる厳密な実験は、かなりの認識精度を示した。
論文 参考訳(メタデータ) (2024-01-16T01:08:19Z) - BN-DRISHTI: Bangla Document Recognition through Instance-level
Segmentation of Handwritten Text Images [0.0]
本稿では,ハフ変換とアフィン変換を併用した深層学習に基づくオブジェクト検出フレームワーク(YOLO)を提案する。
BN-HTRdデータセットの拡張版として、786個の全ページ手書きBangla文書画像を示す。
Fスコアは行数99.97%,単語セグメンテーション98%であった。
論文 参考訳(メタデータ) (2023-05-31T04:08:57Z) - On Evaluation of Bangla Word Analogies [0.8658596218544772]
本稿では,Bangla単語の埋め込み品質を評価するための高品質なデータセットを提案する。
世界で7番目に普及した言語であるにもかかわらず、Banglaは低リソース言語であり、人気のあるNLPモデルはうまく機能しない。
論文 参考訳(メタデータ) (2023-04-10T14:27:35Z) - Sentiment analysis in tweets: an assessment study from classical to
modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。
非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。
本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文 参考訳(メタデータ) (2021-05-29T21:05:28Z) - Leveraging Adversarial Training in Self-Learning for Cross-Lingual Text
Classification [52.69730591919885]
本稿では,ラベル保存型入力摂動の最大損失を最小限に抑える半教師付き対向学習法を提案する。
多様な言語群に対する文書分類と意図分類において,有効性が著しく向上するのを観察する。
論文 参考訳(メタデータ) (2020-07-29T19:38:35Z) - Separating Content from Style Using Adversarial Learning for Recognizing
Text in the Wild [103.51604161298512]
画像中の複数の文字の生成と認識のための逆学習フレームワークを提案する。
我々のフレームワークは、新しい最先端の認識精度を達成するために、最近の認識手法に統合することができる。
論文 参考訳(メタデータ) (2020-01-13T12:41:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。