論文の概要: A Classifier Using Global Character Level and Local Sub-unit Level
Features for Hindi Online Handwritten Character Recognition
- arxiv url: http://arxiv.org/abs/2310.17138v1
- Date: Thu, 26 Oct 2023 04:20:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-27 22:13:04.187091
- Title: A Classifier Using Global Character Level and Local Sub-unit Level
Features for Hindi Online Handwritten Character Recognition
- Title(参考訳): Hindiオンライン文字認識のためのグローバル文字レベルと局所サブユニットレベル特徴を用いた分類器
- Authors: Anand Sharma (MIET, Meerut), A. G. Ramakrishnan (IISc, Bengaluru)
- Abstract要約: Hindiのオンライン手書き文字をモデル化するために,グローバル文字特徴,サブユニット数,ローカルサブユニット特徴の同時分布を定義する分類器を開発した。
開発した分類器は、同じトレーニングセットから抽出された異なる特徴に基づいて訓練された分類器と比較して、テストセットで93.5%の精度を持つ。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: A classifier is developed that defines a joint distribution of global
character features, number of sub-units and local sub-unit features to model
Hindi online handwritten characters. The classifier uses latent variables to
model the structure of sub-units. The classifier uses histograms of points,
orientations, and dynamics of orientations (HPOD) features to represent
characters at global character level and local sub-unit level and is
independent of character stroke order and stroke direction variations. The
parameters of the classifier is estimated using maximum likelihood method.
Different classifiers and features used in other studies are considered in this
study for classification performance comparison with the developed classifier.
The classifiers considered are Second Order Statistics (SOS), Sub-space (SS),
Fisher Discriminant (FD), Feedforward Neural Network (FFN) and Support Vector
Machines (SVM) and the features considered are Spatio Temporal (ST), Discrete
Fourier Transform (DFT), Discrete Cosine Transform (SCT), Discrete Wavelet
Transform (DWT), Spatial (SP) and Histograms of Oriented Gradients (HOG). Hindi
character datasets used for training and testing the developed classifier
consist of samples of handwritten characters from 96 different character
classes. There are 12832 samples with an average of 133 samples per character
class in the training set and 2821 samples with an average of 29 samples per
character class in the testing set. The developed classifier has the highest
accuracy of 93.5\% on the testing set compared to that of the classifiers
trained on different features extracted from the same training set and
evaluated on the same testing set considered in this study.
- Abstract(参考訳): Hindiのオンライン手書き文字をモデル化するために,グローバル文字特徴,サブユニット数,ローカルサブユニット特徴の同時分布を定義する分類器を開発した。
分類器は潜在変数を使ってサブユニットの構造をモデル化する。
この分類器は、大域的な文字レベルと局所的なサブユニットレベルの文字を表現するために、点、向き、向きの動態のヒストグラムを用いており、文字のストローク順序やストローク方向のバリエーションとは無関係である。
分類器のパラメータは最大帰納法を用いて推定される。
本研究は, 異なる分類器と他の研究で用いられる特徴を分類器と比較するために検討する。
第2次統計量(SOS)、サブスペース(SS)、フィッシャー判別量(FD)、フィードフォワードニューラルネットワーク(FFN)、サポートベクトルマシン(SVM)、そして、考慮される特徴は、時空間(ST)、離散フーリエ変換(DFT)、離散コサイン変換(SCT)、離散ウェーブレット変換(DWT)、空間(SP)、東洋のヒストグラム(HOG)である。
開発した分類器のトレーニングとテストに使用されるヒンズー文字データセットは96の異なる文字クラスの手書き文字のサンプルで構成されている。
トレーニングセットには、平均133のキャラクタクラスを持つ12832のサンプルと、テストセット内のキャラクタクラス毎に平均29のサンプルがある2821のサンプルがある。
開発した分類器は,同じトレーニングセットから抽出した異なる特徴に基づいて訓練し,同じテストセットで評価した分類器と比較して,テストセット上で93.5\%の精度を有する。
関連論文リスト
- Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。
DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。
10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-07-20T01:34:13Z) - Novel Deep Neural Network Classifier Characterization Metrics with Applications to Dataless Evaluation [1.6574413179773757]
本研究では、サンプルデータセットを使わずに、ディープニューラルネットワーク(DNN)分類器のトレーニング品質を評価する。
CAFIR10およびCAFIR100データセットを用いて学習したResNet18の手法に関する実証的研究により、DNN分類器のデータレス評価が実際に可能であることを確認した。
論文 参考訳(メタデータ) (2024-07-17T20:40:46Z) - Structural analysis of Hindi online handwritten characters for character
recognition [0.0]
オンラインストロークの方向特性は、同種領域やサブストロークの観点から解析するために用いられる。
これらの性質と幾何はヒンディー語のオンライン手書き文字からサブユニットを抽出するために用いられる。
点ストローク、時計回りのカーブストローク、反時計回りのカーブストローク、ループストロークセグメントをサブユニットとして抽出する手法を開発した。
論文 参考訳(メタデータ) (2023-10-12T11:14:27Z) - Histograms of Points, Orientations, and Dynamics of Orientations
Features for Hindi Online Handwritten Character Recognition [0.0]
オンライン手書き文字認識において,文字ストローク方向と順序変化とは無関係な特徴セットを提案する。
提案された機能は、比較のために考慮された他の機能よりも、キャラクタの非ネイティブ性が高い。
論文 参考訳(メタデータ) (2023-09-05T09:11:18Z) - Enhancing Pashto Text Classification using Language Processing
Techniques for Single And Multi-Label Analysis [0.0]
本研究では,Pashtoテキストの自動分類システムの構築を目的とする。
平均テスト精度は94%だった。
DistilBERTのような事前訓練された言語表現モデルの使用は、有望な結果を示した。
論文 参考訳(メタデータ) (2023-05-04T23:11:31Z) - Explaining Cross-Domain Recognition with Interpretable Deep Classifier [100.63114424262234]
解釈可能なDeep(IDC)は、ターゲットサンプルの最も近いソースサンプルを、分類器が決定を下す証拠として学習する。
我々のIDCは、精度の劣化がほとんどなく、最適なリジェクションオプションの分類を効果的に調整する、より説明可能なモデルに導かれる。
論文 参考訳(メタデータ) (2022-11-15T15:58:56Z) - Detecting Handwritten Mathematical Terms with Sensor Based Data [71.84852429039881]
本稿では,手書きの数学的用語を自動分類する,スタビロによるUbiComp 2021チャレンジの解を提案する。
入力データセットには異なるライターのデータが含まれており、ラベル文字列は合計15の異なる文字から構成されている。
論文 参考訳(メタデータ) (2021-09-12T19:33:34Z) - No Fear of Heterogeneity: Classifier Calibration for Federated Learning
with Non-IID Data [78.69828864672978]
実世界のフェデレーションシステムにおける分類モデルのトレーニングにおける中心的な課題は、非IIDデータによる学習である。
このアルゴリズムは, 近似されたssian混合モデルからサンプリングした仮想表現を用いて分類器を調整する。
実験の結果,CIFAR-10,CIFAR-100,CINIC-10など,一般的なフェデレーション学習ベンチマークにおけるCCVRの現状が示された。
論文 参考訳(メタデータ) (2021-06-09T12:02:29Z) - Latent Embedding Feedback and Discriminative Features for Zero-Shot
Classification [139.44681304276]
ゼロショット学習は、トレーニング中にデータが利用できない、見えないカテゴリを分類することを目的としている。
Generative Adrial Networksは、クラス固有のセマンティック埋め込みを利用して、目に見えないクラス機能を合成する。
我々は,ゼロショット学習のすべての段階において,意味的一貫性を強制することを提案する。
論文 参考訳(メタデータ) (2020-03-17T17:34:16Z) - Learning Class Regularized Features for Action Recognition [68.90994813947405]
本稿では,階層活性化のクラスベース正規化を行うクラス正規化手法を提案する。
動作認識に最先端CNNアーキテクチャのクラス正規化ブロックを用いることで,Kineetics,UCF-101,HMDB-51データセットにおいて,それぞれ1.8%,1.2%,1.4%の体系的改善が得られた。
論文 参考訳(メタデータ) (2020-02-07T07:27:49Z) - Text Complexity Classification Based on Linguistic Information:
Application to Intelligent Tutoring of ESL [0.0]
本研究の目的は、英語を第二言語(ESL)学習者として教える文脈の中で、テキストの複雑さを識別できる分類器を構築することである。
ESLの専門家によって既に3つの難易度に分類されていた6171テキストのコーパスを用いて、5つの機械学習アルゴリズムを用いて異なる実験を行った。
その結果, 言語学的特徴は, 総合的な分類性能に優れていた。
論文 参考訳(メタデータ) (2020-01-07T02:42:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。