論文の概要: UIT-HWDB: Using Transferring Method to Construct A Novel Benchmark for
Evaluating Unconstrained Handwriting Image Recognition in Vietnamese
- arxiv url: http://arxiv.org/abs/2211.05407v1
- Date: Thu, 10 Nov 2022 08:23:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-11 14:29:55.156917
- Title: UIT-HWDB: Using Transferring Method to Construct A Novel Benchmark for
Evaluating Unconstrained Handwriting Image Recognition in Vietnamese
- Title(参考訳): UIT-HWDB:ベトナムにおける非拘束手書き画像認識評価のための新しいベンチマーク構築のための転送手法
- Authors: Nghia Hieu Nguyen, Duong T.D. Vo, Kiet Van Nguyen
- Abstract要約: ベトナム語では、現代のラテン文字以外にアクセントと文字マークがあり、最新式の手書き認識法に混乱をもたらす。
低リソース言語として、ベトナムで手書き認識を研究するためのデータセットは少ない。
最近の研究は,ペンストローク座標を接続して構築したオンライン手書きデータセットの画像を用いてベトナムにおけるオフライン手書き認識手法の評価を行っている。
本稿では,オフライン手書き画像に必要な重要な自然属性を関連付ける手書き画像データセットを構築するための転送手法を提案する。
- 参考スコア(独自算出の注目度): 2.8360662552057323
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recognizing handwriting images is challenging due to the vast variation in
writing style across many people and distinct linguistic aspects of writing
languages. In Vietnamese, besides the modern Latin characters, there are accent
and letter marks together with characters that draw confusion to
state-of-the-art handwriting recognition methods. Moreover, as a low-resource
language, there are not many datasets for researching handwriting recognition
in Vietnamese, which makes handwriting recognition in this language have a
barrier for researchers to approach. Recent works evaluated offline handwriting
recognition methods in Vietnamese using images from an online handwriting
dataset constructed by connecting pen stroke coordinates without further
processing. This approach obviously can not measure the ability of recognition
methods effectively, as it is trivial and may be lack of features that are
essential in offline handwriting images. Therefore, in this paper, we propose
the Transferring method to construct a handwriting image dataset that
associates crucial natural attributes required for offline handwriting images.
Using our method, we provide a first high-quality synthetic dataset which is
complex and natural for efficiently evaluating handwriting recognition methods.
In addition, we conduct experiments with various state-of-the-art methods to
figure out the challenge to reach the solution for handwriting recognition in
Vietnamese.
- Abstract(参考訳): 筆跡画像の認識は、多言語にわたる筆跡の多様さと言語的側面の相違により困難である。
ベトナム語では、現代ラテン文字の他に、アクセントと文字の記号と、最先端の手書き認識法に混乱をもたらす文字がある。
さらに、低リソース言語として、ベトナム語で手書き認識を研究するためのデータセットは少ないため、この言語での手書き認識は研究者がアプローチする障壁となる。
最近の研究は,ペンストローク座標を接続して構築したオンライン手書きデータセットの画像を用いてベトナムにおけるオフライン手書き認識手法の評価を行っている。
このアプローチは、簡単でオフラインの手書き画像に不可欠な機能が欠如しているため、認識メソッドの能力を効果的に測定できないことは明らかです。
そこで本稿では,オフライン手書き画像に必要な重要な自然属性を関連付ける手書き画像データセットを構築するための転送手法を提案する。
本手法を用いて,手書き認識手法を効率よく評価するために,複雑で自然な第1の高品質な合成データセットを提供する。
さらに,ベトナムにおける手書き文字認識の課題を解明するために,様々な最先端手法による実験を行った。
関連論文リスト
- Efficiently Leveraging Linguistic Priors for Scene Text Spotting [63.22351047545888]
本稿では,大規模テキストコーパスから言語知識を活用する手法を提案する。
シーンテキストデータセットとよく一致したテキスト分布を生成し、ドメイン内の微調整の必要性を取り除く。
実験結果から,本手法は認識精度を向上するだけでなく,単語のより正確な局所化を可能にすることが示された。
論文 参考訳(メタデータ) (2024-02-27T01:57:09Z) - Representing Online Handwriting for Recognition in Large Vision-Language
Models [8.344510330567495]
本稿では,テキストとして,画像として,時間順のストローク列を含む新しいデジタルインク(オンライン手書き)のトークン化表現を提案する。
この表現は、最先端のオンライン筆跡認識器に匹敵する結果が得られることを示す。
論文 参考訳(メタデータ) (2024-02-23T13:11:10Z) - MetaScript: Few-Shot Handwritten Chinese Content Generation via
Generative Adversarial Networks [15.037121719502606]
漢字のデジタル表現における個人的手書きスタイルの存在感の低下に対処する新しいコンテンツ生成システムであるMetaScriptを提案する。
本手法は,個人固有の手書きスタイルを保ち,デジタルタイピングの効率を維持できる漢字を生成するために,数ショット学習の力を利用する。
論文 参考訳(メタデータ) (2023-12-25T17:31:19Z) - Orientation-Independent Chinese Text Recognition in Scene Images [61.34060587461462]
本研究は,テキスト画像のコンテンツと方向情報を切り離すことにより,向きに依存しない視覚特徴を抽出する試みである。
具体的には,不整合コンテンツと向き情報を用いて対応する文字イメージを復元する文字画像再構成ネットワーク(CIRN)を提案する。
論文 参考訳(メタデータ) (2023-09-03T05:30:21Z) - Kurdish Handwritten Character Recognition using Deep Learning Techniques [26.23274417985375]
本稿では、深層学習技術を用いてクルド語アルファベットの文字を認識可能なモデルの設計と開発を試みる。
4000万枚以上の画像を含む、手書きのクルド文字のための包括的なデータセットが作成された。
結果,精度は96%,トレーニング精度は97%であった。
論文 参考訳(メタデータ) (2022-10-18T16:48:28Z) - Boosting Modern and Historical Handwritten Text Recognition with
Deformable Convolutions [52.250269529057014]
自由進化ページにおける手書き文字認識(HTR)は難しい画像理解課題である。
本稿では,手入力に応じて変形し,テキストの幾何学的変化に適応できる変形可能な畳み込みを導入することを提案する。
論文 参考訳(メタデータ) (2022-08-17T06:55:54Z) - Reading and Writing: Discriminative and Generative Modeling for
Self-Supervised Text Recognition [101.60244147302197]
テキスト画像の識別と生成を学習するために,コントラスト学習とマスク付き画像モデリングを導入する。
本手法は,不規則なシーンテキスト認識データセットにおいて,従来の自己教師付きテキスト認識手法を10.2%~20.2%向上させる。
提案したテキスト認識器は,11のベンチマークで平均5.3%の精度で従来のテキスト認識手法を上回り,モデルサイズが類似している。
論文 参考訳(メタデータ) (2022-07-01T03:50:26Z) - Content and Style Aware Generation of Text-line Images for Handwriting
Recognition [4.301658883577544]
視覚的外観とテキストコンテンツの両方を条件とした手書きテキストライン画像の生成法を提案する。
本手法では,多彩な手書きスタイルの長いテキストラインサンプルを作成できる。
論文 参考訳(メタデータ) (2022-04-12T05:52:03Z) - Letter-level Online Writer Identification [86.13203975836556]
我々は文字レベルのオンラインライタIDという新たな問題に焦点をあてる。
主な課題は、しばしば異なるスタイルで手紙を書くことである。
我々はこの問題をオンライン書記スタイルのばらつき(Var-O-Styles)と呼ぶ。
論文 参考訳(メタデータ) (2021-12-06T07:21:53Z) - SmartPatch: Improving Handwritten Word Imitation with Patch
Discriminators [67.54204685189255]
本稿では,現在の最先端手法の性能を向上させる新手法であるSmartPatchを提案する。
我々は、よく知られたパッチ損失と、平行訓練された手書きテキスト認識システムから収集された情報を組み合わせる。
これにより、より強化された局所識別器が実現し、より現実的で高品質な手書き文字が生成される。
論文 参考訳(メタデータ) (2021-05-21T18:34:21Z) - Spectral Graph-based Features for Recognition of Handwritten Characters:
A Case Study on Handwritten Devanagari Numerals [0.0]
本稿では,手書き文字を表現するために,頑健なグラフ表現とスペクトルグラフ埋め込みの概念を利用する手法を提案する。
提案手法の有効性の検証のために,インド統計研究所コルカタデータセットの標準手書き数値視覚パターン認識について広範な実験を行った。
論文 参考訳(メタデータ) (2020-07-07T08:40:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。