論文の概要: Bengali Handwritten Grapheme Classification: Deep Learning Approach
- arxiv url: http://arxiv.org/abs/2111.08249v1
- Date: Tue, 16 Nov 2021 06:14:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-18 02:25:30.979743
- Title: Bengali Handwritten Grapheme Classification: Deep Learning Approach
- Title(参考訳): Bengaliの手書きGrapheme分類:ディープラーニングアプローチ
- Authors: Tarun Roy, Hasib Hasan, Kowsar Hossain, Masuma Akter Rumi
- Abstract要約: 画像中のベンガルグラフの3つの構成要素を分類することが課題となるKaggleコンペティション citek_link に参加する。
我々は,Multi-Layer Perceptron(MLP)やResNet50の現状など,既存のニューラルネットワークモデルの性能について検討する。
そこで我々は,ベンガル語文法分類のための独自の畳み込みニューラルネットワーク(CNN)モデルを提案し,検証根の精度95.32%,母音の精度98.61%,子音の精度98.76%を示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite being one of the most spoken languages in the world ($6^{th}$ based
on population), research regarding Bengali handwritten grapheme (smallest
functional unit of a writing system) classification has not been explored
widely compared to other prominent languages. Moreover, the large number of
combinations of graphemes in the Bengali language makes this classification
task very challenging. With an effort to contribute to this research problem,
we participate in a Kaggle competition \cite{kaggle_link} where the challenge
is to separately classify three constituent elements of a Bengali grapheme in
the image: grapheme root, vowel diacritics, and consonant diacritics. We
explore the performances of some existing neural network models such as
Multi-Layer Perceptron (MLP) and state of the art ResNet50. To further improve
the performance we propose our own convolution neural network (CNN) model for
Bengali grapheme classification with validation root accuracy 95.32\%, vowel
accuracy 98.61\%, and consonant accuracy 98.76\%. We also explore Region
Proposal Network (RPN) using VGGNet with a limited setting that can be a
potential future direction to improve the performance.
- Abstract(参考訳): 世界有数の言語(人口ベースで6^{th}$)であるにもかかわらず、ベンガルの手書きグラフ(手書き文字体系の最も小さな機能単位)分類に関する調査は、他の著名な言語と比較して広く行われていない。
さらに、ベンガル語のgraphemesの組み合わせが多ければ多いほど、この分類作業は非常に困難である。
この研究に貢献するために、我々はKaggle competition \cite{kaggle_link} に参加し、その課題は、画像中のベンガルグラフの3つの構成要素を別々に分類することである。
我々は,Multi-Layer Perceptron(MLP)やResNet50の現状など,既存のニューラルネットワークモデルの性能について検討する。
さらに性能向上のために,検証ルート精度95.32\%,母音精度98.61\%,子音精度98.76\%のベンガルグラフ分類のための独自の畳み込みニューラルネットワーク(CNN)モデルを提案する。
また,vggnet を用いた地域提案ネットワーク (rpn) についても検討し,性能向上に向けた今後の方向性について検討した。
関連論文リスト
- Multichannel Attention Networks with Ensembled Transfer Learning to Recognize Bangla Handwritten Charecter [1.5236380958983642]
この研究では、アンサンブルトランスファーラーニングとマルチチャネルアテンションネットワークを備えた畳み込みニューラルネットワーク(CNN)を用いた。
我々は、CAMTERdb 3.1.2データセットを用いて提案モデルを評価し、生データセットの92%、前処理データセットの98.00%の精度を達成した。
論文 参考訳(メタデータ) (2024-08-20T15:51:01Z) - FewShotTextGCN: K-hop neighborhood regularization for few-shot learning
on graphs [25.88292419660444]
FewShotTextGCNは、低リソース環境での学習を改善するために、ワード文書グラフの特性を効果的に活用するために設計されている。
Kホップ近傍正規化(K-hop Neighbourhood Regularization)は、不均一グラフの正規化であり、少数のトレーニングサンプルが利用可能であれば、学習を安定させ、改善することを示す。
論文 参考訳(メタデータ) (2023-01-25T09:30:32Z) - ABINet++: Autonomous, Bidirectional and Iterative Language Modeling for
Scene Text Spotting [121.11880210592497]
言語モデルの限られた能力は,1)暗黙的な言語モデリング,2)一方向の特徴表現,3)雑音入力を伴う言語モデルから生じる。
シーンテキストスポッティングのための自律的で双方向かつ反復的なABINet++を提案する。
論文 参考訳(メタデータ) (2022-11-19T03:50:33Z) - Efficient approach of using CNN based pretrained model in Bangla
handwritten digit recognition [0.0]
手書き文字認識は、様々な産業において多くの応用に不可欠である。
形状、サイズ、書体スタイルの多様性でベンガル文字を書くのが複雑であるため、研究者はSupervisedの機械学習アルゴリズムを使って精度を向上できなかった。
Inception-v3, EfficientNetB0を含むCNNベースの手書き文字認識モデルを提案する。
論文 参考訳(メタデータ) (2022-09-19T15:58:53Z) - Harnessing Cross-lingual Features to Improve Cognate Detection for
Low-resource Languages [50.82410844837726]
言語間単語埋め込みを用いた14言語間のコニャートの検出を実証する。
インドの12言語からなる挑戦的データセットを用いて,コニャート検出手法の評価を行った。
我々は,コグネート検出のためのFスコアで最大18%の改善点を観察した。
論文 参考訳(メタデータ) (2021-12-16T11:17:58Z) - Towards Zero-shot Language Modeling [90.80124496312274]
人間の言語学習に誘導的に偏りを持つニューラルモデルを構築した。
類型的に多様な訓練言語のサンプルからこの分布を推測する。
我々は、保留言語に対する遠隔監視として、追加の言語固有の側情報を利用する。
論文 参考訳(メタデータ) (2021-08-06T23:49:18Z) - Graph Neural Networks for Natural Language Processing: A Survey [64.36633422999905]
本稿では,自然言語処理のためのグラフニューラルネットワーク(GNN)について概観する。
我々は,グラフ構築,グラフ表現学習,グラフベースエンコーダ・デコーダモデルという3つの軸に沿って,NLP用GNNの既存の研究を組織する,NLP用GNNの新しい分類法を提案する。
論文 参考訳(メタデータ) (2021-06-10T23:59:26Z) - Graph Convolutional Network for Swahili News Classification [78.6363825307044]
この研究は、半教師付きスワヒリニュース分類のタスクにおいて、テキストグラフ畳み込みネットワーク(Text GCN)が従来の自然言語処理ベンチマークより優れていることを実証的に示す。
論文 参考訳(メタデータ) (2021-03-16T21:03:47Z) - Read Like Humans: Autonomous, Bidirectional and Iterative Language
Modeling for Scene Text Recognition [80.446770909975]
言語知識はシーンのテキスト認識に非常に有益である。
エンドツーエンドのディープネットワークで言語規則を効果的にモデル化する方法はまだ研究の課題です。
シーンテキスト認識のための自律的双方向反復型ABINetを提案する。
論文 参考訳(メタデータ) (2021-03-11T06:47:45Z) - An Attention Ensemble Approach for Efficient Text Classification of
Indian Languages [0.0]
本稿では,インド・デヴァナガリ文字を母語とするマラーティー語における短文文書の細かな技術領域識別について述べる。
畳み込みニューラルネットワークが生成する中間文表現と双方向の長期記憶とを合体させ,効率的なテキスト分類を実現するcnn-bilstm注意アンサンブルモデルを提案する。
実験結果から,提案モデルが与えられたタスクにおける各種ベースライン機械学習および深層学習モデルより優れ,89.57%,f1スコア0.8875の検証精度が得られた。
論文 参考訳(メタデータ) (2021-02-20T07:31:38Z) - A Large Multi-Target Dataset of Common Bengali Handwritten Graphemes [1.009810782568186]
そこで本稿では, 単語を線形に分割するラベリング手法を提案する。
データセットには、1295のユニークなベンガルグラフエムの411kのキュレートされたサンプルが含まれている。
このデータセットは、Kaggleの公開手書きグラフ分類チャレンジの一部として、オープンソースとして公開されている。
論文 参考訳(メタデータ) (2020-10-01T01:51:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。