論文の概要: ABCNet: Real-time Scene Text Spotting with Adaptive Bezier-Curve Network
- arxiv url: http://arxiv.org/abs/2002.10200v2
- Date: Tue, 25 Feb 2020 08:02:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-29 04:04:51.405114
- Title: ABCNet: Real-time Scene Text Spotting with Adaptive Bezier-Curve Network
- Title(参考訳): ABCNet:Adaptive Bezier-Curve Networkによるリアルタイムシーンテキストスポッティング
- Authors: Yuliang Liu, Hao Chen, Chunhua Shen, Tong He, Lianwen Jin, Liangwei
Wang
- Abstract要約: 本稿では,シーンテキストの検出と認識のための適応ベジエ・サーブネットワーク(ABCNet)を提案する。
まず,パラメータ化ベジエ曲線を用いて任意の形状のテキストに適応的に適合する。
標準的なバウンディングボックス検出と比較して、ベジエ曲線検出は無視可能なオーバーヘッドを導入し、効率と精度の両方において本手法の優位性をもたらす。
- 参考スコア(独自算出の注目度): 108.07304516679103
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Scene text detection and recognition has received increasing research
attention. Existing methods can be roughly categorized into two groups:
character-based and segmentation-based. These methods either are costly for
character annotation or need to maintain a complex pipeline, which is often not
suitable for real-time applications. Here we address the problem by proposing
the Adaptive Bezier-Curve Network (ABCNet). Our contributions are three-fold:
1) For the first time, we adaptively fit arbitrarily-shaped text by a
parameterized Bezier curve. 2) We design a novel BezierAlign layer for
extracting accurate convolution features of a text instance with arbitrary
shapes, significantly improving the precision compared with previous methods.
3) Compared with standard bounding box detection, our Bezier curve detection
introduces negligible computation overhead, resulting in superiority of our
method in both efficiency and accuracy. Experiments on arbitrarily-shaped
benchmark datasets, namely Total-Text and CTW1500, demonstrate that ABCNet
achieves state-of-the-art accuracy, meanwhile significantly improving the
speed. In particular, on Total-Text, our realtime version is over 10 times
faster than recent state-of-the-art methods with a competitive recognition
accuracy. Code is available at https://tinyurl.com/AdelaiDet
- Abstract(参考訳): シーンテキストの検出と認識は研究の注目を集めている。
既存の手法はキャラクタベースとセグメンテーションベースという2つのグループに大まかに分類できる。
これらのメソッドは文字アノテーションにコストがかかるか、複雑なパイプラインを維持する必要があるが、リアルタイムアプリケーションには適さないことが多い。
本稿では,ABCNet(Adaptive Bezier-Curve Network)を提案する。
私たちの貢献は3倍です。
1) パラメータ化ベジエ曲線を用いて任意の形状のテキストに適応的に適合する。
2) 任意の形状のテキストインスタンスの正確な畳み込み特徴を抽出する新しいBezierAlign層を設計し, 従来の手法と比較して精度を著しく向上する。
3) 標準バウンディングボックス検出と比較して, ベジエ曲線検出では計算オーバーヘッドが無視できるため, 効率と精度が優れている。
任意の形状のベンチマークデータセット、すなわちTotal-TextとCTW1500の実験は、ABCNetが最先端の精度を達成し、同時に速度を大幅に向上することを示した。
特に、トータルテキストでは、リアルタイムバージョンは、競合認識精度の高い最新の最先端メソッドの10倍以上高速です。
コードはhttps://tinyurl.com/AdelaiDetで入手できる。
関連論文リスト
- LRANet: Towards Accurate and Efficient Scene Text Detection with
Low-Rank Approximation Network [63.554061288184165]
低ランク近似に基づく新しいパラメータ化テキスト形状法を提案する。
異なるテキストの輪郭間の形状相関を探索することにより, 形状表現における一貫性, コンパクト性, 単純性, 頑健性を実現する。
我々はLRANetという名前の正確で効率的な任意の形状のテキスト検出器を実装した。
論文 参考訳(メタデータ) (2023-06-27T02:03:46Z) - DPText-DETR: Towards Better Scene Text Detection with Dynamic Points in
Transformer [94.35116535588332]
ポリゴン点やベジエ曲線制御点を予測してテキストをローカライズするトランスフォーマーベースの手法は、シーンテキストの検出で非常に人気がある。
しかし、使用点ラベル形式は、トランスフォーマーモデルの堅牢性に影響を与える人間の読み順を意味する。
本稿では,DPText-DETRを提案する。これはクエリとしてポイント座標を直接使用し,デコーダ層間で動的に更新する。
論文 参考訳(メタデータ) (2022-07-10T15:45:16Z) - CentripetalText: An Efficient Text Instance Representation for Scene
Text Detection [19.69057252363207]
我々はCentripetalText (CT) という名前の効率的なテキストインスタンス表現を提案する。
CTはテキストインスタンスをテキストカーネルと中心シフトの組み合わせに分解する。
シーンテキスト検出の課題に対して,本手法は既存の手法に比べて優れた,あるいは競合的な性能を発揮する。
論文 参考訳(メタデータ) (2021-07-13T09:34:18Z) - RSCA: Real-time Segmentation-based Context-Aware Scene Text Detection [14.125634725954848]
任意のシーンテキスト検出のためのリアルタイムコンテキスト認識モデル RSCA を提案する。
これらの戦略に基づいて、RSCAは複雑なラベルの割り当てや繰り返しの機能集約なしに、スピードと精度の両方で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-05-26T18:43:17Z) - ABCNet v2: Adaptive Bezier-Curve Network for Real-time End-to-end Text
Spotting [108.93803186429017]
エンドツーエンドのテキストスポッティングは、統一されたフレームワークで検出と認識を統合することを目指している。
本稿では、Adaptive Bezier Curve Network v2 (ABCNet v2) を提示することで、エンドツーエンドテキストスポッティングに取り組む。
1) 任意の形状のテキストをパラメータ化されたベジアー曲線で適応的に適合させ, セグメンテーション法と比較すると, 構造的な出力だけでなく, 制御可能な表現も提供できる。
様々なバイリンガル(英語と中国語)ベンチマークデータセットで実施された総合的な実験は、ABCNet v2が現状を達成することを実証している。
論文 参考訳(メタデータ) (2021-05-08T07:46:55Z) - PGNet: Real-time Arbitrarily-Shaped Text Spotting with Point Gathering
Network [54.03560668182197]
任意形状のテキストをリアルタイムで読み取るための,完全畳み込み点収集ネットワーク(PGNet)を提案する。
PG-CTCデコーダを用いて2次元空間から高レベル文字分類ベクトルを収集し,NMSやRoI操作を使わずにテキストシンボルに復号する。
実験により,提案手法は競争精度が向上し,走行速度が著しく向上することが確認された。
論文 参考訳(メタデータ) (2021-04-12T13:27:34Z) - ContourNet: Taking a Further Step toward Accurate Arbitrary-shaped Scene
Text Detection [147.10751375922035]
本研究では,シーンテキストの偽陽性と大規模分散を効果的に処理するContourNetを提案する。
本手法は,両方向の応答値の高い予測を出力するだけで,これらの偽陽性を効果的に抑制する。
論文 参考訳(メタデータ) (2020-04-10T08:15:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。