論文の概要: REZCR: A Zero-shot Character Recognition Method via Radical Extraction
- arxiv url: http://arxiv.org/abs/2207.05842v1
- Date: Tue, 12 Jul 2022 21:12:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-14 15:10:37.689486
- Title: REZCR: A Zero-shot Character Recognition Method via Radical Extraction
- Title(参考訳): REZCR:ラジカル抽出によるゼロショット文字認識法
- Authors: Xiaolei Diao, Daqian Shi, Hao Tang, Lei Wu, Yanzeng Li, Hao Xu
- Abstract要約: 本稿では,ラディカル抽出,すなわちREZCRによるゼロショット文字認識フレームワークを提案する。
我々は、文字のグラフィカルな単位であるラジカルに関する情報を利用して、正書法に従って文字を分解・再構成する。
結果はKGRに入力され、事前に設計された文字知識グラフで推論してターゲット文字を認識する。
- 参考スコア(独自算出の注目度): 15.327884004673718
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The long-tail effect is a common issue that limits the performance of deep
learning models on real-world datasets. Character image dataset development is
also affected by such unbalanced data distribution due to differences in
character usage frequency. Thus, current character recognition methods are
limited when applying to real-world datasets, in particular to the character
categories in the tail which are lacking training samples, e.g., uncommon
characters, or characters from historical documents. In this paper, we propose
a zero-shot character recognition framework via radical extraction, i.e.,
REZCR, to improve the recognition performance of few-sample character
categories, in which we exploit information on radicals, the graphical units of
characters, by decomposing and reconstructing characters following orthography.
REZCR consists of an attention-based radical information extractor (RIE) and a
knowledge graph-based character reasoner (KGR). The RIE aims to recognize
candidate radicals and their possible structural relations from character
images. The results will be fed into KGR to recognize the target character by
reasoning with a pre-designed character knowledge graph. We validate our method
on multiple datasets, REZCR shows promising experimental results, especially
for few-sample character datasets.
- Abstract(参考訳): ロングテール効果は、現実世界のデータセットにおけるディープラーニングモデルのパフォーマンスを制限する一般的な問題である。
文字画像データセットの開発は、文字使用頻度の違いによる不均衡なデータ分布にも影響される。
これにより、実世界のデータセット、特にトレーニングサンプルが不足している尾の文字カテゴリ、例えば、稀な文字や歴史文書の文字に適用する場合、現在の文字認識方法が制限される。
本稿では,ラディカル抽出,すなわちrezcrを用いたゼロショット文字認識フレームワークを提案する。
REZCRは、注意に基づく急進情報抽出器(RIE)と知識グラフに基づく文字推論器(KGR)から構成される。
RIEは、文字画像から候補ラジカルとその構造的関係を認識することを目的としている。
結果はKGRに入力され、事前に設計された文字知識グラフで推論してターゲット文字を認識する。
提案手法を複数のデータセット上で検証し,REZCRが有望な実験結果を示す。
関連論文リスト
- Boosting Semi-Supervised Scene Text Recognition via Viewing and Summarizing [71.29488677105127]
既存のシーンテキスト認識(STR)手法は、特に芸術的で歪んだ文字に対して、挑戦的なテキストを認識するのに苦労している。
人的コストを伴わずに、合成データと実際のラベルなしデータを活用して、対照的な学習ベースのSTRフレームワークを提案する。
本手法は,共通ベンチマークとUnion14M-Benchmarkで平均精度94.7%,70.9%のSOTA性能を実現する。
論文 参考訳(メタデータ) (2024-11-23T15:24:47Z) - CHIRON: Rich Character Representations in Long-Form Narratives [98.273323001781]
文字のテキスト情報を整理・フィルタリングする新しい文字シートの表現であるCHIRONを提案する。
実験の結果,CHIRONは類似の要約に基づくベースラインよりも優れ,柔軟であることが判明した。
CHIRONから派生したメトリクスは、ストーリーのキャラクター中心性を自動的に推測するために使用することができ、これらのメトリクスは人間の判断と一致している。
論文 参考訳(メタデータ) (2024-06-14T17:23:57Z) - Deep Learning-Driven Approach for Handwritten Chinese Character Classification [0.0]
手書き文字認識は、機械学習研究者にとって難しい問題である。
多数のユニークな文字クラスが存在するため、ロジカルスクリプトや中韓文字シーケンスのようなデータによっては、HCR問題に新たな複雑さをもたらす。
本稿では、モデルアーキテクチャ、データ前処理ステップ、設計手順のテストを導入し、詳細な文字画像分類のための高度にスケーラブルなアプローチを提案する。
論文 参考訳(メタデータ) (2024-01-30T15:29:32Z) - Graph-level Protein Representation Learning by Structure Knowledge
Refinement [50.775264276189695]
本稿では、教師なしの方法でグラフ全体の表現を学習することに焦点を当てる。
本稿では、データ構造を用いて、ペアが正か負かの確率を決定する構造知識精製(Structure Knowledge Refinement, SKR)という新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-05T09:05:33Z) - Toward Zero-shot Character Recognition: A Gold Standard Dataset with
Radical-level Annotations [5.761679637905164]
本稿では,ラジカルレベルのアノテーションと文字レベルのアノテーションの両方を含む古代中国語の文字画像データセットを構築する。
ACCIDの適応性を高めるため,トレーニングサンプルを増強するスプライシングベースの合成文字アルゴリズムを提案し,画像の画質向上のために画像デノナイズ手法を適用した。
論文 参考訳(メタデータ) (2023-08-01T16:41:30Z) - Improving Scene Text Recognition for Character-Level Long-Tailed
Distribution [35.14058653707104]
本稿では,2つの専門家を用いた新しい文脈認識フリーエキスパートネットワーク(CAFE-Net)を提案する。
CAFE-Netは多数の文字を含む言語でのSTR性能を改善する。
論文 参考訳(メタデータ) (2023-03-31T06:11:33Z) - Improving GANs for Long-Tailed Data through Group Spectral
Regularization [51.58250647277375]
本稿では, スペクトル爆発によるモード崩壊を防止する新しいグループスペクトル正規化器 (gSR) を提案する。
我々は,gSRが既存の拡張および正規化技術と効果的に組み合わせることで,長期化データ上での最先端の画像生成性能が向上することを発見した。
論文 参考訳(メタデータ) (2022-08-21T17:51:05Z) - Let Invariant Rationale Discovery Inspire Graph Contrastive Learning [98.10268114789775]
ハイパフォーマンスな拡張は、インスタンス識別に関するアンカーグラフの健全な意味を保存すべきである。
新たなフレームワーク Rationale-aware Graph Contrastive Learning (RGCL) を提案する。
RGCLは有理数生成器を使用して、グラフのインスタンス識別に関する健全な特徴を論理として明らかにし、対照的な学習のための有理数認識ビューを生成する。
論文 参考訳(メタデータ) (2022-06-16T01:28:40Z) - Separating Content from Style Using Adversarial Learning for Recognizing
Text in the Wild [103.51604161298512]
画像中の複数の文字の生成と認識のための逆学習フレームワークを提案する。
我々のフレームワークは、新しい最先端の認識精度を達成するために、最近の認識手法に統合することができる。
論文 参考訳(メタデータ) (2020-01-13T12:41:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。