論文の概要: Structural analysis of Hindi online handwritten characters for character
recognition
- arxiv url: http://arxiv.org/abs/2310.08222v1
- Date: Thu, 12 Oct 2023 11:14:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-14 11:51:50.158480
- Title: Structural analysis of Hindi online handwritten characters for character
recognition
- Title(参考訳): 文字認識のためのヒンディー語オンライン手書き文字の構造解析
- Authors: Anand Sharma (MIET, Meerut), A. G. Ramakrishnan (IISc, Bengaluru)
- Abstract要約: オンラインストロークの方向特性は、同種領域やサブストロークの観点から解析するために用いられる。
これらの性質と幾何はヒンディー語のオンライン手書き文字からサブユニットを抽出するために用いられる。
点ストローク、時計回りのカーブストローク、反時計回りのカーブストローク、ループストロークセグメントをサブユニットとして抽出する手法を開発した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Direction properties of online strokes are used to analyze them in terms of
homogeneous regions or sub-strokes with points satisfying common geometric
properties. Such sub-strokes are called sub-units. These properties are used to
extract sub-units from Hindi ideal online characters. These properties along
with some heuristics are used to extract sub-units from Hindi online
handwritten characters.\\ A method is developed to extract point stroke,
clockwise curve stroke, counter-clockwise curve stroke and loop stroke segments
as sub-units from Hindi online handwritten characters. These extracted
sub-units are close in structure to the sub-units of the corresponding Hindi
online ideal characters.\\ Importance of local representation of online
handwritten characters in terms of sub-units is assessed by training a
classifier with sub-unit level local and character level global features
extracted from characters for character recognition. The classifier has the
recognition accuracy of 93.5\% on the testing set. This accuracy is the highest
when compared with that of the classifiers trained only with global features
extracted from characters in the same training set and evaluated on the same
testing set.\\ Sub-unit extraction algorithm and the sub-unit based character
classifier are tested on Hindi online handwritten character dataset. This
dataset consists of samples from 96 different characters. There are 12832 and
2821 samples in the training and testing sets, respectively.
- Abstract(参考訳): オンラインストロークの方向特性は、共通幾何学的性質を満たす点を持つ等質領域やサブストロークの観点から解析するために用いられる。
このようなサブストロークはサブユニットと呼ばれる。
これらの性質はヒンディー語理想のオンライン文字からサブユニットを抽出するために用いられる。
これらの特性といくつかのヒューリスティックはヒンディー語のオンライン手書き文字からサブユニットを抽出するのに使われる。
点ストローク,時計回り曲線ストローク,反時計回り曲線ストローク,ループストロークセグメントをヒンディー語オンライン手書き文字からサブユニットとして抽出する手法を開発した。
これらの抽出されたサブユニットは、対応するヒンディー語オンライン理想文字のサブユニットに近い構造である。
サブユニット単位でのオンライン手書き文字の局所表現の重要性を,文字認識用文字から抽出したサブユニットレベルのローカルおよび文字レベルのグローバル特徴を持つ分類器の訓練により評価する。
分類器は、テストセット上で93.5\%の認識精度を有する。
この精度は、同じトレーニングセットの文字から抽出され、同じテストセットで評価されるグローバル特徴のみで訓練された分類器と比較して最も高い。
ヒンディー語オンライン手書き文字データセット上で, サブユニット抽出アルゴリズムとサブユニットベース文字分類器をテストする。
このデータセットは96の異なる文字のサンプルで構成されている。
トレーニングセットとテストセットには,それぞれ12832と2821のサンプルがある。
関連論文リスト
- A Classifier Using Global Character Level and Local Sub-unit Level
Features for Hindi Online Handwritten Character Recognition [0.0]
Hindiのオンライン手書き文字をモデル化するために,グローバル文字特徴,サブユニット数,ローカルサブユニット特徴の同時分布を定義する分類器を開発した。
開発した分類器は、同じトレーニングセットから抽出された異なる特徴に基づいて訓練された分類器と比較して、テストセットで93.5%の精度を持つ。
論文 参考訳(メタデータ) (2023-10-26T04:20:39Z) - PART: Pre-trained Authorship Representation Transformer [64.78260098263489]
文書を書く著者は、語彙、レジストリ、句読点、ミススペル、絵文字の使用など、テキスト内での識別情報をインプリントする。
以前の作品では、手作りのフィーチャや分類タスクを使用して著者モデルをトレーニングし、ドメイン外の著者に対するパフォーマンスの低下につながった。
セマンティクスの代わりにtextbfauthorship の埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文 参考訳(メタデータ) (2022-09-30T11:08:39Z) - Detecting Handwritten Mathematical Terms with Sensor Based Data [71.84852429039881]
本稿では,手書きの数学的用語を自動分類する,スタビロによるUbiComp 2021チャレンジの解を提案する。
入力データセットには異なるライターのデータが含まれており、ラベル文字列は合計15の異なる文字から構成されている。
論文 参考訳(メタデータ) (2021-09-12T19:33:34Z) - Charformer: Fast Character Transformers via Gradient-based Subword
Tokenization [50.16128796194463]
モデルの一部としてサブワードトークン化をエンドツーエンドに学習する新しいモデル帰納バイアスを提案する。
文字から潜在単語表現を自動的に学習する,ソフトグラデーションベースのサブワードトークンモジュール(GBST)を導入する。
また、GBSTを統合し、バイトレベルで動作する深層トランスフォーマーモデルであるCharformerを紹介する。
論文 参考訳(メタデータ) (2021-06-23T22:24:14Z) - A complete character recognition and transliteration technique for
Devanagari script [12.208787849155048]
本稿では,文字認識を用いたデバナガリ文字の自動翻訳手法を提案する。
構成文字を分離するための最初のタスクの1つはセグメンテーションである。
デヴァナガリ文字は対応するローマ字にマッピングされ、その結果のローマ字は原文字と類似の発音を持つ。
論文 参考訳(メタデータ) (2020-09-28T16:43:18Z) - Arabic Handwritten Character Recognition based on Convolution Neural
Networks and Support Vector Machine [0.0]
本稿では,ディープ畳み込みニューラルネットワーク(DCNN)とサポートベクタマシン(SVM)を用いたアラビア文字と文字の認識アルゴリズムを提案する。
本稿では,入力テンプレートと事前記憶テンプレートとの類似性を決定することで,アラビア文字認識の問題に対処する。
本研究は,提案アルゴリズムが入力された手書きアラビア語文字を認識し,識別し,検証する能力を示すものである。
論文 参考訳(メタデータ) (2020-09-28T16:18:52Z) - A Comparative Study on Structural and Semantic Properties of Sentence
Embeddings [77.34726150561087]
本稿では,関係抽出に広く利用されている大規模データセットを用いた実験セットを提案する。
異なる埋め込み空間は、構造的および意味的特性に対して異なる強度を持つことを示す。
これらの結果は,埋め込み型関係抽出法の開発に有用な情報を提供する。
論文 参考訳(メタデータ) (2020-09-23T15:45:32Z) - Text-independent writer identification using convolutional neural
network [8.526559246026162]
テキストに依存しない著者識別のためのエンドツーエンドのディープラーニング手法を提案する。
我々の手法は作家を分類するために91.81%以上の精度を達成した。
論文 参考訳(メタデータ) (2020-09-10T14:18:03Z) - 2kenize: Tying Subword Sequences for Chinese Script Conversion [54.33749520569979]
本稿では,2つのスクリプト間のマッピングと変換をあいまいにできるモデルを提案する。
提案手法は,従来の漢字変換手法よりも精度が6ポイント向上した。
論文 参考訳(メタデータ) (2020-05-07T10:53:05Z) - Neural Computing for Online Arabic Handwriting Character Recognition
using Hard Stroke Features Mining [0.0]
オンラインアラビア文字認識における書字ストローク特徴の垂直方向と水平方向から所望の臨界点を検出する方法を提案する。
バックプロパゲーション学習アルゴリズムと修正シグモイド関数に基づくアクティベーション関数を備えた多層パーセプトロンを用いて、文字の分類のためにこれらのトークンから最小の特徴セットを抽出する。
提案手法は,文字認識技術に匹敵する98.6%の平均精度を実現する。
論文 参考訳(メタデータ) (2020-05-02T23:17:08Z) - TextScanner: Reading Characters in Order for Robust Scene Text
Recognition [60.04267660533966]
TextScannerはシーンテキスト認識の代替手法である。
文字クラス、位置、順序に対する画素単位のマルチチャネルセグメンテーションマップを生成する。
また、コンテキストモデリングにRNNを採用し、文字の位置とクラスを並列で予測する。
論文 参考訳(メタデータ) (2019-12-28T07:52:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。