論文の概要: Bangla Handwritten Digit Recognition and Generation
- arxiv url: http://arxiv.org/abs/2103.07905v1
- Date: Sun, 14 Mar 2021 12:11:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-17 05:24:11.927716
- Title: Bangla Handwritten Digit Recognition and Generation
- Title(参考訳): バングラ手書き文字認識と生成
- Authors: Md Fahim Sikder
- Abstract要約: バングラの手書き数字を生成するために、SGAN(Semi-supvised Generative Adversarial Network)が適用される。
本稿では,bhandデータセット上で99.44%の検証精度を実現するアーキテクチャを実装した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Handwritten digit or numeral recognition is one of the classical issues in
the area of pattern recognition and has seen tremendous advancement because of
the recent wide availability of computing resources. Plentiful works have
already done on English, Arabic, Chinese, Japanese handwritten script. Some
work on Bangla also have been done but there is space for development. From
that angle, in this paper, an architecture has been implemented which achieved
the validation accuracy of 99.44% on BHAND dataset and outperforms Alexnet and
Inception V3 architecture. Beside digit recognition, digit generation is
another field which has recently caught the attention of the researchers though
not many works have been done in this field especially on Bangla. In this
paper, a Semi-Supervised Generative Adversarial Network or SGAN has been
applied to generate Bangla handwritten numerals and it successfully generated
Bangla digits.
- Abstract(参考訳): 手書き数字や数値認識は、パターン認識の分野では古典的な問題の一つであり、近年のコンピュータリソースの幅広い可用性のために、大きな進歩を遂げています。
英語、アラビア語、中国語、日本語手書きのスクリプトですでに豊富な作品が行われています。
バングラでの作業もいくつか行われたが、開発の余地がある。
そこで本論文では,BHANDデータセット上で99.44%の検証精度を達成し,AlexnetとInception V3アーキテクチャを上回ったアーキテクチャを実装した。
数値認識以外にも、デジタル生成は研究者の注目を集めている分野でもあるが、特にバングラについての研究はあまり行われていない。
本論文では,Bangla手書き数字を生成するためにSemi-supvised Generative Adversarial Network(SGAN)を適用し,Bangla桁の生成に成功した。
関連論文リスト
- An open dataset for oracle bone script recognition and decipherment [68.33464571563293]
Oracle Bone Script (OBS) は、3000年前にさかのぼる上海王朝の人文と地理に関する貴重な洞察を持っている。
時間の経過はそれらの意味の多くを曖昧にしており、これらの古代のテキストを解読する上で重要な課題が提示されている。
このデータセットは1,588個の解読されたスクリプトの77,064個の画像と9,411個の未解読文字の62,989個の画像を含んでいる。
論文 参考訳(メタデータ) (2024-01-27T09:54:16Z) - BanglaNet: Bangla Handwritten Character Recognition using Ensembling of
Convolutional Neural Network [0.0]
本稿では,複数の畳み込みニューラルネットワーク(CNN)のアンサンブルに基づく分類モデルを提案する。
Inception、ResNet、DenseNetといった最先端CNNモデルのアイデアに基づいた3つの異なるモデルが、拡張入力と非拡張入力の両方でトレーニングされている。
CMATERdb(英語版)、BanglaLekha-Isolated(英語版)、Ekush(英語版)の3つのベンチマークによる厳密な実験は、かなりの認識精度を示した。
論文 参考訳(メタデータ) (2024-01-16T01:08:19Z) - NusaWrites: Constructing High-Quality Corpora for Underrepresented and
Extremely Low-Resource Languages [54.808217147579036]
インドネシアの地方言語について事例研究を行う。
データセット構築におけるオンラインスクラップ,人文翻訳,および母語話者による段落作成の有効性を比較した。
本研究は,母語話者による段落作成によって生成されたデータセットが,語彙的多様性と文化的内容の点で優れた品質を示すことを示す。
論文 参考訳(メタデータ) (2023-09-19T14:42:33Z) - Sampling and Ranking for Digital Ink Generation on a tight computational
budget [69.15275423815461]
トレーニングされたデジタルインク生成モデルの出力品質を最大化する方法について検討する。
我々は、デジタルインク領域におけるその種類に関する最初のアブレーション研究において、複数のサンプリングとランキング手法の効果を使用、比較する。
論文 参考訳(メタデータ) (2023-06-02T09:55:15Z) - Huruf: An Application for Arabic Handwritten Character Recognition Using
Deep Learning [0.0]
本稿では、アラビア語の文字と数字を認識するための軽量な畳み込みニューラルネットワークアーキテクチャを提案する。
提案したパイプラインは、畳み込み、プール、バッチ正規化、ドロップアウト、最後にグローバル平均レイヤの4つのレイヤを含む合計18層で構成されている。
提案したモデルはそれぞれ96.93%と99.35%の精度を達成し、これは最先端のエンドレベルアプリケーションに適した解決策となった。
論文 参考訳(メタデータ) (2022-12-16T17:39:32Z) - Efficient approach of using CNN based pretrained model in Bangla
handwritten digit recognition [0.0]
手書き文字認識は、様々な産業において多くの応用に不可欠である。
形状、サイズ、書体スタイルの多様性でベンガル文字を書くのが複雑であるため、研究者はSupervisedの機械学習アルゴリズムを使って精度を向上できなかった。
Inception-v3, EfficientNetB0を含むCNNベースの手書き文字認識モデルを提案する。
論文 参考訳(メタデータ) (2022-09-19T15:58:53Z) - Number Entity Recognition [65.80137628972312]
番号は他のワードトークンと同様に、自然言語処理(NLP)モデルを構築し、デプロイするテキストの必須コンポーネントである。
本研究では、最先端のNLPモデルの可能性を活用し、関連するタスクにおける性能向上能力の伝達を試みる。
提案した数値をエンティティに分類することで,手作りのFill-In-The-Blank (FITB)タスクや,関節埋め込みを用いた質問応答など,NLPモデルの性能が向上する。
論文 参考訳(メタデータ) (2022-05-07T05:22:43Z) - A Classical Approach to Handcrafted Feature Extraction Techniques for
Bangla Handwritten Digit Recognition [0.0]
我々は、Bangla Handwritten Digitを認識するために、厳格な4つの分類器をベンチマークした。
NumtaDB、CMARTdb、Ekush、BDRWのデータセットにおけるHOG+SVM法の認識精度はそれぞれ93.32%、98.08%、95.68%、89.68%に達した。
論文 参考訳(メタデータ) (2022-01-25T05:27:57Z) - Skeleton Based Sign Language Recognition Using Whole-body Keypoints [71.97020373520922]
手話は聴覚障害者や言語障害者のコミュニケーションに使用される。
また,RGB-D法と組み合わせて最先端の性能を実現することで,Skeletonに基づく音声認識が普及しつつある。
近年のボディポーズ推定用citejin 2020wholeの開発に触発されて,全身キーポイントと特徴に基づく手話認識を提案する。
論文 参考訳(メタデータ) (2021-03-16T03:38:17Z) - Soft Gazetteers for Low-Resource Named Entity Recognition [78.00856159473393]
本稿では、英語知識ベースからユビキタスに利用可能な情報をニューラル名付きエンティティ認識モデルに組み込む「ソフトガゼッタ」を提案する。
4つの低リソース言語に対する実験により,F1得点の4点の平均的改善が示された。
論文 参考訳(メタデータ) (2020-05-04T21:58:02Z) - MatriVasha: A Multipurpose Comprehensive Database for Bangla Handwritten
Compound Characters [0.0]
MatrriVashaは、Banglaを認識でき、複数の複合文字を手書きするプロジェクトである。
提案したデータセットは、現在までにバングラ複合文字の最も広範なデータセットである。
論文 参考訳(メタデータ) (2020-04-29T06:38:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。