論文の概要: Improving Structured Text Recognition with Regular Expression Biasing
- arxiv url: http://arxiv.org/abs/2111.06738v1
- Date: Wed, 10 Nov 2021 23:12:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-16 01:20:20.561063
- Title: Improving Structured Text Recognition with Regular Expression Biasing
- Title(参考訳): 正規表現バイアスによる構造化テキスト認識の改善
- Authors: Baoguang Shi, Wenfeng Cheng, Yijuan Lu, Cha Zhang, Dinei Florencio
- Abstract要約: 本研究では,ある形式に従う構造化テキストの認識の問題について検討する。
偏見の正規表現 (regexes) を指定することにより, 構造化テキストの認識精度を向上させることを提案する。
- 参考スコア(独自算出の注目度): 13.801707647700727
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study the problem of recognizing structured text, i.e. text that follows
certain formats, and propose to improve the recognition accuracy of structured
text by specifying regular expressions (regexes) for biasing. A biased
recognizer recognizes text that matches the specified regexes with
significantly improved accuracy, at the cost of a generally small degradation
on other text. The biasing is realized by modeling regexes as a Weighted
Finite-State Transducer (WFST) and injecting it into the decoder via dynamic
replacement. A single hyperparameter controls the biasing strength. The method
is useful for recognizing text lines with known formats or containing words
from a domain vocabulary. Examples include driver license numbers, drug names
in prescriptions, etc. We demonstrate the efficacy of regex biasing on datasets
of printed and handwritten structured text and measures its side effects.
- Abstract(参考訳): 本研究では,ある形式に従うテキストの認識の問題について検討し,偏見の正規表現(辞書)を指定することにより,構造化テキストの認識精度を向上させることを提案する。
バイアス付き認識器は、指定されたレジェクツにマッチするテキストを、他のテキストに対する一般的に小さな劣化のコストで、大幅に精度を向上する。
バイアスは、RegexをWFST(Weighted Finite-State Transducer)としてモデル化し、動的置換によってデコーダに注入することで実現される。
単一のハイパーパラメータがバイアス強度を制御する。
この方法は、既知のフォーマットやドメイン語彙からの単語を含むテキスト行を認識するのに有用である。
例えば、運転免許証番号、処方薬中の薬物名などである。
印刷および手書き構造化テキストのデータセットに対するレゲックスバイアスの有効性を実証し,その副作用を測定する。
関連論文リスト
- Leveraging Structure Knowledge and Deep Models for the Detection of Abnormal Handwritten Text [19.05500901000957]
構造知識と手書きテキストの深層モデルを組み合わせた2段階検出アルゴリズムを提案する。
新たな半教師付きコントラストトレーニング戦略によって訓練された形状回帰ネットワークを導入し、文字間の位置関係を十分に活用する。
2つの手書きテキストデータセットを用いた実験により,提案手法は検出性能を大幅に向上できることが示された。
論文 参考訳(メタデータ) (2024-10-15T14:57:10Z) - Out of Length Text Recognition with Sub-String Matching [54.63761108308825]
本稿では,このタスクをOOL(Out of Length)テキスト認識と呼ぶ。
サブ文字列マッチング(SMTR)を用いたOOLテキスト認識手法を提案する。
SMTRは2つのクロスアテンションベースのモジュールから構成される: 1つは複数の文字を含むサブストリングを次のクエリと前のクエリにエンコードし、もう1つは画像の特徴に対応するためにクエリを使用する。
論文 参考訳(メタデータ) (2024-07-17T05:02:17Z) - Efficiently Leveraging Linguistic Priors for Scene Text Spotting [63.22351047545888]
本稿では,大規模テキストコーパスから言語知識を活用する手法を提案する。
シーンテキストデータセットとよく一致したテキスト分布を生成し、ドメイン内の微調整の必要性を取り除く。
実験結果から,本手法は認識精度を向上するだけでなく,単語のより正確な局所化を可能にすることが示された。
論文 参考訳(メタデータ) (2024-02-27T01:57:09Z) - SwinTextSpotter v2: Towards Better Synergy for Scene Text Spotting [126.01629300244001]
我々はSwinTextSpotter v2と呼ばれる新しいエンドツーエンドのシーンテキストスポッティングフレームワークを提案する。
我々は,新しい認識変換モジュールと認識アライメントモジュールを用いて,2つのタスク間の関係を強化する。
SwinTextSpotter v2は、様々な多言語(英語、中国語、ベトナム語)のベンチマークで最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2024-01-15T12:33:00Z) - DEER: Detection-agnostic End-to-End Recognizer for Scene Text Spotting [11.705454066278898]
本稿では,新しい検出非依存のエンド・ツー・エンド認識フレームワークDEERを提案する。
提案手法は,検出モジュールと認識モジュール間の密接な依存関係を低減する。
通常のテキストスポッティングベンチマークと任意の形のテキストスポッティングベンチマークで競合する結果を得る。
論文 参考訳(メタデータ) (2022-03-10T02:41:05Z) - CORE-Text: Improving Scene Text Detection with Contrastive Relational
Reasoning [65.57338873921168]
自然界におけるテキストインスタンスのローカライズは、コンピュータビジョンにおける根本的な課題であると考えられている。
本研究では,サブテキスト問題を定量的に解析し,シンプルで効果的な設計であるContrastive Relation(CORE)モジュールを提案する。
我々は、COREモジュールをMask R-CNNの2段階テキスト検出器に統合し、テキスト検出器CORE-Textを考案する。
論文 参考訳(メタデータ) (2021-12-14T16:22:25Z) - Text Perceptron: Towards End-to-End Arbitrary-Shaped Text Spotting [49.768327669098674]
テキストパーセプトロン(Text Perceptron)という,エンドツーエンドのトレーニング可能なテキストスポッティング手法を提案する。
まず、テキスト読解順序と境界情報を学ぶ効率的なセグメンテーションベースのテキスト検出器を用いる。
次に、検出された特徴領域を正規形態に変換するために、新しい形状変換モジュール(STM)を設計する。
論文 参考訳(メタデータ) (2020-02-17T08:07:19Z) - TextScanner: Reading Characters in Order for Robust Scene Text
Recognition [60.04267660533966]
TextScannerはシーンテキスト認識の代替手法である。
文字クラス、位置、順序に対する画素単位のマルチチャネルセグメンテーションマップを生成する。
また、コンテキストモデリングにRNNを採用し、文字の位置とクラスを並列で予測する。
論文 参考訳(メタデータ) (2019-12-28T07:52:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。