論文の概要: Efficient and Accurate Scene Text Detection with Low-Rank Approximation
Network
- arxiv url: http://arxiv.org/abs/2306.15142v1
- Date: Tue, 27 Jun 2023 02:03:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-28 15:09:59.463593
- Title: Efficient and Accurate Scene Text Detection with Low-Rank Approximation
Network
- Title(参考訳): 低ランク近似ネットワークによる効率よく正確なシーンテキスト検出
- Authors: Yuchen Su
- Abstract要約: テキストのローカライズのためのパラメータ曲線を予測する回帰ベースの手法は、シーンテキスト検出で人気がある。
本稿では,スパースマッチング方式により推論速度を高速化する正サンプルの二重マッチング方式を提案する。
そこで我々は,低ランク近似に基づく新しいテキスト輪郭表現法を提案する。
我々は、LRANetという、効率的で正確な任意の形状のテキスト検出器を実装した。
- 参考スコア(独自算出の注目度): 1.218340575383456
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, regression-based methods, which predict parameter curves for
localizing texts, are popular in scene text detection. However, these methods
struggle to balance concise structure and fast post-processing, and the
existing parameter curves are still not ideal for modeling arbitrary-shaped
texts, leading to a challenge in balancing speed and accuracy. To tackle these
challenges, we firstly propose a dual matching scheme for positive samples,
which accelerates inference speed through sparse matching scheme and
accelerates model convergence through dense matching scheme. Then, we propose a
novel text contour representation method based on low-rank approximation by
exploiting the shape correlation between different text contours, which is
complete, compact, simplicity and robustness. Based on these designs, we
implement an efficient and accurate arbitrary-shaped text detector, named
LRANet. Extensive experiments are conducted on three challenging datasets,
which demonstrate the accuracy and efficiency of our LRANet over
state-of-the-art methods. The code will be released soon.
- Abstract(参考訳): 近年,テキストのローカライズのためのパラメータ曲線を推定する回帰型手法が,テキスト検出に人気を博している。
しかし、これらの手法は、簡潔な構造と高速な後処理のバランスをとるのに苦労しており、既存のパラメータ曲線は、任意の形のテキストをモデリングするのにはまだ理想的ではない。
これらの課題に対処するために、まず、スパースマッチングスキームにより推論速度を加速し、密マッチングスキームによりモデル収束を加速する正のサンプルの二重マッチングスキームを提案する。
そこで本研究では,異なるテキストの輪郭間の形状相関を利用して,低ランク近似に基づく新しいテキスト輪郭表現法を提案する。
これらの設計に基づき、LRANetという、効率的で正確な任意の形状のテキスト検出器を実装した。
LRANetの最先端手法に対する精度と効率を実証する3つの挑戦的なデータセットに対して、大規模な実験を行った。
コードはまもなくリリースされる。
関連論文リスト
- Text Revision by On-the-Fly Representation Optimization [76.11035270753757]
現在の最先端手法は、これらのタスクをシーケンスからシーケンスまでの学習問題として定式化している。
並列データを必要としないテキストリビジョンのための反復的なインプレース編集手法を提案する。
テキストの単純化に関する最先端の教師付き手法よりも、競争力があり、パフォーマンスも向上する。
論文 参考訳(メタデータ) (2022-04-15T07:38:08Z) - Which and Where to Focus: A Simple yet Accurate Framework for
Arbitrary-Shaped Nearby Text Detection in Scene Images [8.180563824325086]
そこで本研究では,任意の形状の近接するシーンテキスト検出のための簡易かつ効果的な手法を提案する。
OMTS(One-to-Many Training Scheme)は、混乱を排除し、提案がより適切な基盤構造を学べるように設計されている。
また,提案提案に対してより効果的な機能を利用するために,提案機能注意モジュール(PFAM)を提案する。
論文 参考訳(メタデータ) (2021-09-08T06:25:37Z) - CentripetalText: An Efficient Text Instance Representation for Scene
Text Detection [19.69057252363207]
我々はCentripetalText (CT) という名前の効率的なテキストインスタンス表現を提案する。
CTはテキストインスタンスをテキストカーネルと中心シフトの組み合わせに分解する。
シーンテキスト検出の課題に対して,本手法は既存の手法に比べて優れた,あるいは競合的な性能を発揮する。
論文 参考訳(メタデータ) (2021-07-13T09:34:18Z) - ABCNet v2: Adaptive Bezier-Curve Network for Real-time End-to-end Text
Spotting [108.93803186429017]
エンドツーエンドのテキストスポッティングは、統一されたフレームワークで検出と認識を統合することを目指している。
本稿では、Adaptive Bezier Curve Network v2 (ABCNet v2) を提示することで、エンドツーエンドテキストスポッティングに取り組む。
1) 任意の形状のテキストをパラメータ化されたベジアー曲線で適応的に適合させ, セグメンテーション法と比較すると, 構造的な出力だけでなく, 制御可能な表現も提供できる。
様々なバイリンガル(英語と中国語)ベンチマークデータセットで実施された総合的な実験は、ABCNet v2が現状を達成することを実証している。
論文 参考訳(メタデータ) (2021-05-08T07:46:55Z) - ContourNet: Taking a Further Step toward Accurate Arbitrary-shaped Scene
Text Detection [147.10751375922035]
本研究では,シーンテキストの偽陽性と大規模分散を効果的に処理するContourNetを提案する。
本手法は,両方向の応答値の高い予測を出力するだけで,これらの偽陽性を効果的に抑制する。
論文 参考訳(メタデータ) (2020-04-10T08:15:23Z) - ABCNet: Real-time Scene Text Spotting with Adaptive Bezier-Curve Network [108.07304516679103]
本稿では,シーンテキストの検出と認識のための適応ベジエ・サーブネットワーク(ABCNet)を提案する。
まず,パラメータ化ベジエ曲線を用いて任意の形状のテキストに適応的に適合する。
標準的なバウンディングボックス検出と比較して、ベジエ曲線検出は無視可能なオーバーヘッドを導入し、効率と精度の両方において本手法の優位性をもたらす。
論文 参考訳(メタデータ) (2020-02-24T12:27:31Z) - Text Perceptron: Towards End-to-End Arbitrary-Shaped Text Spotting [49.768327669098674]
テキストパーセプトロン(Text Perceptron)という,エンドツーエンドのトレーニング可能なテキストスポッティング手法を提案する。
まず、テキスト読解順序と境界情報を学ぶ効率的なセグメンテーションベースのテキスト検出器を用いる。
次に、検出された特徴領域を正規形態に変換するために、新しい形状変換モジュール(STM)を設計する。
論文 参考訳(メタデータ) (2020-02-17T08:07:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。