論文の概要: Structural analysis of Hindi online handwritten characters for character
recognition
- arxiv url: http://arxiv.org/abs/2310.08222v1
- Date: Thu, 12 Oct 2023 11:14:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-14 11:51:50.158480
- Title: Structural analysis of Hindi online handwritten characters for character
recognition
- Title(参考訳): 文字認識のためのヒンディー語オンライン手書き文字の構造解析
- Authors: Anand Sharma (MIET, Meerut), A. G. Ramakrishnan (IISc, Bengaluru)
- Abstract要約: オンラインストロークの方向特性は、同種領域やサブストロークの観点から解析するために用いられる。
これらの性質と幾何はヒンディー語のオンライン手書き文字からサブユニットを抽出するために用いられる。
点ストローク、時計回りのカーブストローク、反時計回りのカーブストローク、ループストロークセグメントをサブユニットとして抽出する手法を開発した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Direction properties of online strokes are used to analyze them in terms of
homogeneous regions or sub-strokes with points satisfying common geometric
properties. Such sub-strokes are called sub-units. These properties are used to
extract sub-units from Hindi ideal online characters. These properties along
with some heuristics are used to extract sub-units from Hindi online
handwritten characters.\\ A method is developed to extract point stroke,
clockwise curve stroke, counter-clockwise curve stroke and loop stroke segments
as sub-units from Hindi online handwritten characters. These extracted
sub-units are close in structure to the sub-units of the corresponding Hindi
online ideal characters.\\ Importance of local representation of online
handwritten characters in terms of sub-units is assessed by training a
classifier with sub-unit level local and character level global features
extracted from characters for character recognition. The classifier has the
recognition accuracy of 93.5\% on the testing set. This accuracy is the highest
when compared with that of the classifiers trained only with global features
extracted from characters in the same training set and evaluated on the same
testing set.\\ Sub-unit extraction algorithm and the sub-unit based character
classifier are tested on Hindi online handwritten character dataset. This
dataset consists of samples from 96 different characters. There are 12832 and
2821 samples in the training and testing sets, respectively.
- Abstract(参考訳): オンラインストロークの方向特性は、共通幾何学的性質を満たす点を持つ等質領域やサブストロークの観点から解析するために用いられる。
このようなサブストロークはサブユニットと呼ばれる。
これらの性質はヒンディー語理想のオンライン文字からサブユニットを抽出するために用いられる。
これらの特性といくつかのヒューリスティックはヒンディー語のオンライン手書き文字からサブユニットを抽出するのに使われる。
点ストローク,時計回り曲線ストローク,反時計回り曲線ストローク,ループストロークセグメントをヒンディー語オンライン手書き文字からサブユニットとして抽出する手法を開発した。
これらの抽出されたサブユニットは、対応するヒンディー語オンライン理想文字のサブユニットに近い構造である。
サブユニット単位でのオンライン手書き文字の局所表現の重要性を,文字認識用文字から抽出したサブユニットレベルのローカルおよび文字レベルのグローバル特徴を持つ分類器の訓練により評価する。
分類器は、テストセット上で93.5\%の認識精度を有する。
この精度は、同じトレーニングセットの文字から抽出され、同じテストセットで評価されるグローバル特徴のみで訓練された分類器と比較して最も高い。
ヒンディー語オンライン手書き文字データセット上で, サブユニット抽出アルゴリズムとサブユニットベース文字分類器をテストする。
このデータセットは96の異なる文字のサンプルで構成されている。
トレーニングセットとテストセットには,それぞれ12832と2821のサンプルがある。
関連論文リスト
- Bukva: Russian Sign Language Alphabet [75.42794328290088]
本稿では,ロシア手話(RSL)ダクティルとしても知られる,ロシア語の指先文字の認識について検討する。
ダクティル (Dactyl) は手の動きが書かれた言語の個々の文字を表す手話の構成要素である。
当社は、RSLダクチル認識のための、最初の本格的なオープンソースビデオデータセットであるBakvaを提供している。
論文 参考訳(メタデータ) (2024-10-11T09:59:48Z) - Multi-Modal Multi-Granularity Tokenizer for Chu Bamboo Slip Scripts [65.10991154918737]
本研究は、古代中国の春・秋・戦国時代(紀元前771-256年)に用いられた中竹の文字に焦点を当てたものである。
我々のトークンライザはまず文字検出を採用して文字境界の特定を行い、次に文字レベルとサブキャラクタレベルの両方で文字認識を行う。
学術コミュニティを支援するために,100K以上の注釈付き文字イメージスキャンを備えたCBSの最初の大規模データセットも収集した。
論文 参考訳(メタデータ) (2024-09-02T07:42:55Z) - A Classifier Using Global Character Level and Local Sub-unit Level
Features for Hindi Online Handwritten Character Recognition [0.0]
Hindiのオンライン手書き文字をモデル化するために,グローバル文字特徴,サブユニット数,ローカルサブユニット特徴の同時分布を定義する分類器を開発した。
開発した分類器は、同じトレーニングセットから抽出された異なる特徴に基づいて訓練された分類器と比較して、テストセットで93.5%の精度を持つ。
論文 参考訳(メタデータ) (2023-10-26T04:20:39Z) - PART: Pre-trained Authorship Representation Transformer [64.78260098263489]
文書を書く著者は、語彙、レジストリ、句読点、ミススペル、絵文字の使用など、テキスト内での識別情報をインプリントする。
以前の作品では、手作りのフィーチャや分類タスクを使用して著者モデルをトレーニングし、ドメイン外の著者に対するパフォーマンスの低下につながった。
セマンティクスの代わりにtextbfauthorship の埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文 参考訳(メタデータ) (2022-09-30T11:08:39Z) - Charformer: Fast Character Transformers via Gradient-based Subword
Tokenization [50.16128796194463]
モデルの一部としてサブワードトークン化をエンドツーエンドに学習する新しいモデル帰納バイアスを提案する。
文字から潜在単語表現を自動的に学習する,ソフトグラデーションベースのサブワードトークンモジュール(GBST)を導入する。
また、GBSTを統合し、バイトレベルで動作する深層トランスフォーマーモデルであるCharformerを紹介する。
論文 参考訳(メタデータ) (2021-06-23T22:24:14Z) - A complete character recognition and transliteration technique for
Devanagari script [12.208787849155048]
本稿では,文字認識を用いたデバナガリ文字の自動翻訳手法を提案する。
構成文字を分離するための最初のタスクの1つはセグメンテーションである。
デヴァナガリ文字は対応するローマ字にマッピングされ、その結果のローマ字は原文字と類似の発音を持つ。
論文 参考訳(メタデータ) (2020-09-28T16:43:18Z) - Arabic Handwritten Character Recognition based on Convolution Neural
Networks and Support Vector Machine [0.0]
本稿では,ディープ畳み込みニューラルネットワーク(DCNN)とサポートベクタマシン(SVM)を用いたアラビア文字と文字の認識アルゴリズムを提案する。
本稿では,入力テンプレートと事前記憶テンプレートとの類似性を決定することで,アラビア文字認識の問題に対処する。
本研究は,提案アルゴリズムが入力された手書きアラビア語文字を認識し,識別し,検証する能力を示すものである。
論文 参考訳(メタデータ) (2020-09-28T16:18:52Z) - Text-independent writer identification using convolutional neural
network [8.526559246026162]
テキストに依存しない著者識別のためのエンドツーエンドのディープラーニング手法を提案する。
我々の手法は作家を分類するために91.81%以上の精度を達成した。
論文 参考訳(メタデータ) (2020-09-10T14:18:03Z) - 2kenize: Tying Subword Sequences for Chinese Script Conversion [54.33749520569979]
本稿では,2つのスクリプト間のマッピングと変換をあいまいにできるモデルを提案する。
提案手法は,従来の漢字変換手法よりも精度が6ポイント向上した。
論文 参考訳(メタデータ) (2020-05-07T10:53:05Z) - Neural Computing for Online Arabic Handwriting Character Recognition
using Hard Stroke Features Mining [0.0]
オンラインアラビア文字認識における書字ストローク特徴の垂直方向と水平方向から所望の臨界点を検出する方法を提案する。
バックプロパゲーション学習アルゴリズムと修正シグモイド関数に基づくアクティベーション関数を備えた多層パーセプトロンを用いて、文字の分類のためにこれらのトークンから最小の特徴セットを抽出する。
提案手法は,文字認識技術に匹敵する98.6%の平均精度を実現する。
論文 参考訳(メタデータ) (2020-05-02T23:17:08Z) - TextScanner: Reading Characters in Order for Robust Scene Text
Recognition [60.04267660533966]
TextScannerはシーンテキスト認識の代替手法である。
文字クラス、位置、順序に対する画素単位のマルチチャネルセグメンテーションマップを生成する。
また、コンテキストモデリングにRNNを採用し、文字の位置とクラスを並列で予測する。
論文 参考訳(メタデータ) (2019-12-28T07:52:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。