Fugu-MT 論文翻訳(概要): Structural analysis of Hindi online handwritten characters for character recognition

論文の概要: Structural analysis of Hindi online handwritten characters for character recognition

arxiv url: http://arxiv.org/abs/2310.08222v1
Date: Thu, 12 Oct 2023 11:14:27 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-14 11:51:50.158480
Title: Structural analysis of Hindi online handwritten characters for character recognition
Title（参考訳）: 文字認識のためのヒンディー語オンライン手書き文字の構造解析
Authors: Anand Sharma (MIET, Meerut), A. G. Ramakrishnan (IISc, Bengaluru)
Abstract要約: オンラインストロークの方向特性は、同種領域やサブストロークの観点から解析するために用いられる。これらの性質と幾何はヒンディー語のオンライン手書き文字からサブユニットを抽出するために用いられる。点ストローク、時計回りのカーブストローク、反時計回りのカーブストローク、ループストロークセグメントをサブユニットとして抽出する手法を開発した。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Direction properties of online strokes are used to analyze them in terms of homogeneous regions or sub-strokes with points satisfying common geometric properties. Such sub-strokes are called sub-units. These properties are used to extract sub-units from Hindi ideal online characters. These properties along with some heuristics are used to extract sub-units from Hindi online handwritten characters.\\ A method is developed to extract point stroke, clockwise curve stroke, counter-clockwise curve stroke and loop stroke segments as sub-units from Hindi online handwritten characters. These extracted sub-units are close in structure to the sub-units of the corresponding Hindi online ideal characters.\\ Importance of local representation of online handwritten characters in terms of sub-units is assessed by training a classifier with sub-unit level local and character level global features extracted from characters for character recognition. The classifier has the recognition accuracy of 93.5\% on the testing set. This accuracy is the highest when compared with that of the classifiers trained only with global features extracted from characters in the same training set and evaluated on the same testing set.\\ Sub-unit extraction algorithm and the sub-unit based character classifier are tested on Hindi online handwritten character dataset. This dataset consists of samples from 96 different characters. There are 12832 and 2821 samples in the training and testing sets, respectively.
Abstract（参考訳）: オンラインストロークの方向特性は、共通幾何学的性質を満たす点を持つ等質領域やサブストロークの観点から解析するために用いられる。このようなサブストロークはサブユニットと呼ばれる。これらの性質はヒンディー語理想のオンライン文字からサブユニットを抽出するために用いられる。これらの特性といくつかのヒューリスティックはヒンディー語のオンライン手書き文字からサブユニットを抽出するのに使われる。点ストローク,時計回り曲線ストローク,反時計回り曲線ストローク,ループストロークセグメントをヒンディー語オンライン手書き文字からサブユニットとして抽出する手法を開発した。これらの抽出されたサブユニットは、対応するヒンディー語オンライン理想文字のサブユニットに近い構造である。サブユニット単位でのオンライン手書き文字の局所表現の重要性を,文字認識用文字から抽出したサブユニットレベルのローカルおよび文字レベルのグローバル特徴を持つ分類器の訓練により評価する。分類器は、テストセット上で93.5\%の認識精度を有する。この精度は、同じトレーニングセットの文字から抽出され、同じテストセットで評価されるグローバル特徴のみで訓練された分類器と比較して最も高い。ヒンディー語オンライン手書き文字データセット上で, サブユニット抽出アルゴリズムとサブユニットベース文字分類器をテストする。このデータセットは96の異なる文字のサンプルで構成されている。トレーニングセットとテストセットには,それぞれ12832と2821のサンプルがある。

関連論文リスト

Online Writer Retrieval with Chinese Handwritten Phrases: A Synergistic Temporal-Frequency Representation Learning Approach [53.189911918976655]
DOLPHINは,相乗的時間周波数解析による手書き表現の向上を目的とした新しい検索モデルである。 OLIWER(OLIWER)は,1,731人から670,000以上の中国語の字句を含む大規模オンライン作家検索データセットである。本研究は,手書き表現の質向上における点サンプリング周波数と圧力特性の重要性を強調した。
論文参考訳（メタデータ） (2024-12-16T11:19:22Z)
From Language Models over Tokens to Language Models over Characters [54.123846188068384]
現代の言語モデルは、内部的、数学的には、エンファラクタ文字列ではなくトークン文字列上の分布である。本稿では,トークンレベル言語モデルから文字レベル言語への変換アルゴリズムを提案する。
論文参考訳（メタデータ） (2024-12-04T21:19:20Z)
Bukva: Russian Sign Language Alphabet [75.42794328290088]
本稿では,ロシア手話(RSL)ダクティルとしても知られる,ロシア語の指先文字の認識について検討する。ダクティル (Dactyl) は手の動きが書かれた言語の個々の文字を表す手話の構成要素である。当社は、RSLダクチル認識のための、最初の本格的なオープンソースビデオデータセットであるBakvaを提供している。
論文参考訳（メタデータ） (2024-10-11T09:59:48Z)
Multi-Modal Multi-Granularity Tokenizer for Chu Bamboo Slip Scripts [65.10991154918737]
本研究は、古代中国の春・秋・戦国時代(紀元前771-256年)に用いられた中竹の文字に焦点を当てたものである。我々のトークンライザはまず文字検出を採用して文字境界の特定を行い、次に文字レベルとサブキャラクタレベルの両方で文字認識を行う。学術コミュニティを支援するために,100K以上の注釈付き文字イメージスキャンを備えたCBSの最初の大規模データセットも収集した。
論文参考訳（メタデータ） (2024-09-02T07:42:55Z)
A Classifier Using Global Character Level and Local Sub-unit Level Features for Hindi Online Handwritten Character Recognition [0.0]
Hindiのオンライン手書き文字をモデル化するために,グローバル文字特徴,サブユニット数,ローカルサブユニット特徴の同時分布を定義する分類器を開発した。開発した分類器は、同じトレーニングセットから抽出された異なる特徴に基づいて訓練された分類器と比較して、テストセットで93.5%の精度を持つ。
論文参考訳（メタデータ） (2023-10-26T04:20:39Z)
PART: Pre-trained Authorship Representation Transformer [64.78260098263489]
文書を書く著者は、語彙、レジストリ、句読点、ミススペル、絵文字の使用など、テキスト内での識別情報をインプリントする。以前の作品では、手作りのフィーチャや分類タスクを使用して著者モデルをトレーニングし、ドメイン外の著者に対するパフォーマンスの低下につながった。セマンティクスの代わりにtextbfauthorship の埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文参考訳（メタデータ） (2022-09-30T11:08:39Z)
Detecting Handwritten Mathematical Terms with Sensor Based Data [71.84852429039881]
本稿では,手書きの数学的用語を自動分類する,スタビロによるUbiComp 2021チャレンジの解を提案する。入力データセットには異なるライターのデータが含まれており、ラベル文字列は合計15の異なる文字から構成されている。
論文参考訳（メタデータ） (2021-09-12T19:33:34Z)
Charformer: Fast Character Transformers via Gradient-based Subword Tokenization [50.16128796194463]
モデルの一部としてサブワードトークン化をエンドツーエンドに学習する新しいモデル帰納バイアスを提案する。文字から潜在単語表現を自動的に学習する,ソフトグラデーションベースのサブワードトークンモジュール(GBST)を導入する。また、GBSTを統合し、バイトレベルで動作する深層トランスフォーマーモデルであるCharformerを紹介する。
論文参考訳（メタデータ） (2021-06-23T22:24:14Z)
A complete character recognition and transliteration technique for Devanagari script [12.208787849155048]
本稿では,文字認識を用いたデバナガリ文字の自動翻訳手法を提案する。構成文字を分離するための最初のタスクの1つはセグメンテーションである。デヴァナガリ文字は対応するローマ字にマッピングされ、その結果のローマ字は原文字と類似の発音を持つ。
論文参考訳（メタデータ） (2020-09-28T16:43:18Z)
Arabic Handwritten Character Recognition based on Convolution Neural Networks and Support Vector Machine [0.0]
本稿では,ディープ畳み込みニューラルネットワーク(DCNN)とサポートベクタマシン(SVM)を用いたアラビア文字と文字の認識アルゴリズムを提案する。本稿では,入力テンプレートと事前記憶テンプレートとの類似性を決定することで,アラビア文字認識の問題に対処する。本研究は,提案アルゴリズムが入力された手書きアラビア語文字を認識し,識別し,検証する能力を示すものである。
論文参考訳（メタデータ） (2020-09-28T16:18:52Z)
Text-independent writer identification using convolutional neural network [8.526559246026162]
テキストに依存しない著者識別のためのエンドツーエンドのディープラーニング手法を提案する。我々の手法は作家を分類するために91.81%以上の精度を達成した。
論文参考訳（メタデータ） (2020-09-10T14:18:03Z)
2kenize: Tying Subword Sequences for Chinese Script Conversion [54.33749520569979]
本稿では,2つのスクリプト間のマッピングと変換をあいまいにできるモデルを提案する。提案手法は,従来の漢字変換手法よりも精度が6ポイント向上した。
論文参考訳（メタデータ） (2020-05-07T10:53:05Z)
Neural Computing for Online Arabic Handwriting Character Recognition using Hard Stroke Features Mining [0.0]
オンラインアラビア文字認識における書字ストローク特徴の垂直方向と水平方向から所望の臨界点を検出する方法を提案する。バックプロパゲーション学習アルゴリズムと修正シグモイド関数に基づくアクティベーション関数を備えた多層パーセプトロンを用いて、文字の分類のためにこれらのトークンから最小の特徴セットを抽出する。提案手法は,文字認識技術に匹敵する98.6%の平均精度を実現する。
論文参考訳（メタデータ） (2020-05-02T23:17:08Z)
TextScanner: Reading Characters in Order for Robust Scene Text Recognition [60.04267660533966]
TextScannerはシーンテキスト認識の代替手法である。文字クラス、位置、順序に対する画素単位のマルチチャネルセグメンテーションマップを生成する。また、コンテキストモデリングにRNNを採用し、文字の位置とクラスを並列で予測する。
論文参考訳（メタデータ） (2019-12-28T07:52:00Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。