論文の概要: Classification of Handwritten Names of Cities and Handwritten Text
Recognition using Various Deep Learning Models
- arxiv url: http://arxiv.org/abs/2102.04816v1
- Date: Tue, 9 Feb 2021 13:34:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-10 21:34:18.924364
- Title: Classification of Handwritten Names of Cities and Handwritten Text
Recognition using Various Deep Learning Models
- Title(参考訳): 各種深層学習モデルを用いた都市名と手書きテキスト認識の分類
- Authors: Daniyar Nurseitov, Kairat Bostanbekov, Maksat Kanatov, Anel Alimova,
Abdelrahman Abdallah, Galymzhan Abdimanap
- Abstract要約: 我々は,手書き認識モデルの開発における近年の様々なアプローチと成果について述べる。
最初のモデルは、特徴抽出にディープ畳み込みニューラルネットワーク(CNN)、単語分類に完全に接続された多層パーセプトロンニューラルネットワーク(MLP)を使用する。
2つ目のモデルはSimpleHTRと呼ばれ、CNNとリカレントニューラルネットワーク(RNN)レイヤを使用して画像から情報を取り出す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This article discusses the problem of handwriting recognition in Kazakh and
Russian languages. This area is poorly studied since in the literature there
are almost no works in this direction. We have tried to describe various
approaches and achievements of recent years in the development of handwritten
recognition models in relation to Cyrillic graphics. The first model uses deep
convolutional neural networks (CNNs) for feature extraction and a fully
connected multilayer perceptron neural network (MLP) for word classification.
The second model, called SimpleHTR, uses CNN and recurrent neural network (RNN)
layers to extract information from images. We also proposed the Bluechet and
Puchserver models to compare the results. Due to the lack of available open
datasets in Russian and Kazakh languages, we carried out work to collect data
that included handwritten names of countries and cities from 42 different
Cyrillic words, written more than 500 times in different handwriting. We also
used a handwritten database of Kazakh and Russian languages (HKR). This is a
new database of Cyrillic words (not only countries and cities) for the Russian
and Kazakh languages, created by the authors of this work.
- Abstract(参考訳): 本稿では,カザフ語とロシア語における手書き文字認識の問題について論じる。
文学では、この方面にはほとんど作品がないため、この領域は研究が進んでいない。
近年,キリルグラフィックスに関連した手書き認識モデルの開発において,様々なアプローチと成果について述べることを試みた。
最初のモデルは、特徴抽出にはdeep convolutional neural network (cnns)、単語分類にはfull connected multilayer perceptron neural network (mlp)を用いる。
2番目のモデルはSimpleHTRと呼ばれ、CNNとrecurrent neural Network (RNN)レイヤーを使用して画像から情報を抽出します。
結果を比較するためにBluechetとPuchserverモデルも提案しました。
ロシア語とカザフ語で利用可能なオープンデータセットが不足しているため、異なる手書きで500回以上書かれた42のキリル文字から、国や都市の手書き名を含むデータを集めました。
また、カザフ語とロシア語(HKR)の手書きデータベースも使用しました。
これは、この作品の著者によって作成されたロシア語とカザフ語のためのキリル語(国や都市だけでなく)の新しいデータベースです。
関連論文リスト
- Bukva: Russian Sign Language Alphabet [75.42794328290088]
本稿では,ロシア手話(RSL)ダクティルとしても知られる,ロシア語の指先文字の認識について検討する。
ダクティル (Dactyl) は手の動きが書かれた言語の個々の文字を表す手話の構成要素である。
当社は、RSLダクチル認識のための、最初の本格的なオープンソースビデオデータセットであるBakvaを提供している。
論文 参考訳(メタデータ) (2024-10-11T09:59:48Z) - Multichannel Attention Networks with Ensembled Transfer Learning to Recognize Bangla Handwritten Charecter [1.5236380958983642]
この研究では、アンサンブルトランスファーラーニングとマルチチャネルアテンションネットワークを備えた畳み込みニューラルネットワーク(CNN)を用いた。
我々は、CAMTERdb 3.1.2データセットを用いて提案モデルを評価し、生データセットの92%、前処理データセットの98.00%の精度を達成した。
論文 参考訳(メタデータ) (2024-08-20T15:51:01Z) - A Novel Cartography-Based Curriculum Learning Method Applied on RoNLI: The First Romanian Natural Language Inference Corpus [71.77214818319054]
自然言語推論は自然言語理解のプロキシである。
ルーマニア語のNLIコーパスは公開されていない。
58Kの訓練文対からなるルーマニア初のNLIコーパス(RoNLI)を紹介する。
論文 参考訳(メタデータ) (2024-05-20T08:41:15Z) - NusaWrites: Constructing High-Quality Corpora for Underrepresented and
Extremely Low-Resource Languages [54.808217147579036]
インドネシアの地方言語について事例研究を行う。
データセット構築におけるオンラインスクラップ,人文翻訳,および母語話者による段落作成の有効性を比較した。
本研究は,母語話者による段落作成によって生成されたデータセットが,語彙的多様性と文化的内容の点で優れた品質を示すことを示す。
論文 参考訳(メタデータ) (2023-09-19T14:42:33Z) - New Results for the Text Recognition of Arabic Maghrib{\=i} Manuscripts
-- Managing an Under-resourced Script [0.0]
アラビア文字Maghrib=iスクリプト専用のHTRモデル開発および微調整のための新しいモードオペラーディを導入・評価する。
いくつかの最先端のHTRモデルの比較は、アラビア語に特化した単語ベースのニューラルアプローチの関連性を示している。
その結果、アラビア文字処理のための新しい視点が開かれ、より一般的には、貧弱な言語処理のためのものである。
論文 参考訳(メタデータ) (2022-11-29T12:21:41Z) - Kurdish Handwritten Character Recognition using Deep Learning Techniques [26.23274417985375]
本稿では、深層学習技術を用いてクルド語アルファベットの文字を認識可能なモデルの設計と開発を試みる。
4000万枚以上の画像を含む、手書きのクルド文字のための包括的なデータセットが作成された。
結果,精度は96%,トレーニング精度は97%であった。
論文 参考訳(メタデータ) (2022-10-18T16:48:28Z) - RuMedBench: A Russian Medical Language Understanding Benchmark [58.99199480170909]
本稿では,複数のタスクタイプをカバーするオープンなロシア語医療言語理解ベンチマークについて述べる。
我々は、新しいタスクのための統一されたフォーマットラベリング、データ分割、評価メトリクスを作成します。
シングルナンバーメトリックは、ベンチマークに対処するモデルの能力を表す。
論文 参考訳(メタデータ) (2022-01-17T16:23:33Z) - Learning Contextualised Cross-lingual Word Embeddings and Alignments for
Extremely Low-Resource Languages Using Parallel Corpora [63.5286019659504]
そこで本稿では,小さな並列コーパスに基づく文脈型言語間単語埋め込み学習手法を提案する。
本手法は,入力文の翻訳と再構成を同時に行うLSTMエンコーダデコーダモデルを用いて単語埋め込みを実現する。
論文 参考訳(メタデータ) (2020-10-27T22:24:01Z) - Attention-based Fully Gated CNN-BGRU for Russian Handwritten Text [0.5371337604556311]
本研究は、カザフ語とロシア語で訓練されたアテンションエンコーダ・デコーダネットワークを用いた手書きテキストのタスクにアプローチする。
我々は,複数の双方向GRUと注意機構をサポートした,完全ゲートCNNに基づく新しいディープニューラルネットワークモデルを開発した。
我々の研究は、HKRデータセットに関する最初の研究であり、既存のほとんどのモデルに最先端の結果を示す。
論文 参考訳(メタデータ) (2020-08-12T15:14:47Z) - Soft Gazetteers for Low-Resource Named Entity Recognition [78.00856159473393]
本稿では、英語知識ベースからユビキタスに利用可能な情報をニューラル名付きエンティティ認識モデルに組み込む「ソフトガゼッタ」を提案する。
4つの低リソース言語に対する実験により,F1得点の4点の平均的改善が示された。
論文 参考訳(メタデータ) (2020-05-04T21:58:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。