論文の概要: Scene Text Detection with Selected Anchor
- arxiv url: http://arxiv.org/abs/2008.08523v1
- Date: Wed, 19 Aug 2020 16:03:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 09:16:21.510650
- Title: Scene Text Detection with Selected Anchor
- Title(参考訳): 選択アンカーによるシーンテキスト検出
- Authors: Anna Zhu, Hang Du, Shengwu Xiong
- Abstract要約: シーンテキスト検出のための密集型アンカー方式を用いたオブジェクト提案手法を頻繁に適用し,高いリコールを実現する。
本研究では,高密度アンカーの代わりに有効なアンカーを用いたアンカー選択型領域提案ネットワーク(AS-RPN)を提案する。
- 参考スコア(独自算出の注目度): 16.27975694546667
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object proposal technique with dense anchoring scheme for scene text
detection were applied frequently to achieve high recall. It results in the
significant improvement in accuracy but waste of computational searching,
regression and classification. In this paper, we propose an anchor
selection-based region proposal network (AS-RPN) using effective selected
anchors instead of dense anchors to extract text proposals. The center, scales,
aspect ratios and orientations of anchors are learnable instead of fixing,
which leads to high recall and greatly reduced numbers of anchors. By replacing
the anchor-based RPN in Faster RCNN, the AS-RPN-based Faster RCNN can achieve
comparable performance with previous state-of-the-art text detecting approaches
on standard benchmarks, including COCO-Text, ICDAR2013, ICDAR2015 and
MSRA-TD500 when using single-scale and single model (ResNet50) testing only.
- Abstract(参考訳): シーンテキスト検出のための密アンカー方式を用いたオブジェクト提案手法を頻繁に適用し,高いリコールを実現する。
その結果、精度は大幅に向上するが、計算検索、回帰、分類に費やされる。
本稿では,高密度アンカーの代わりに有効なアンカーを用いたアンカー選択型領域提案ネットワーク(AS-RPN)を提案する。
アンカーの中心、スケール、アスペクト比、配向は固定の代わりに学習可能であり、高いリコールとアンカー数の大幅な削減につながる。
Faster RCNN のアンカーベース RPN を置き換えることで、AS-RPN ベースの Faster RCNN は、COCO-Text, ICDAR2013, ICDAR2015, MSRA-TD500 など、従来の最先端のテキスト検出アプローチと同等のパフォーマンスを達成できる。
関連論文リスト
- Efficient k-NN Search with Cross-Encoders using Adaptive Multi-Round CUR
Decomposition [77.4863142882136]
クロスエンコーダモデルは、直接k-nearest neighbor(k-NN)サーチには不当に高価である。
本稿では,現実的に重要なトップk近傍の近似誤差を適応的に,反復的に,効率的に最小化するADACURを提案する。
論文 参考訳(メタデータ) (2023-05-04T17:01:17Z) - Group R-CNN for Weakly Semi-supervised Object Detection with Points [18.720915213798623]
本稿では,グループR-CNNの効率的なポイントツーボックス回帰器を提案する。
グループR-CNNはまず、各ポイントアノテーションに対する提案のグループを生成するために、インスタンスレベルの提案グループを使用する。
我々は,グループR-CNNが先行手法であるポイントDETRの3.9mAPと5%の良好なラベル付き画像より有意に優れていたことを示す。
論文 参考訳(メタデータ) (2022-05-12T07:17:54Z) - Local Citation Recommendation with Hierarchical-Attention Text Encoder
and SciBERT-based Reranking [6.456347800676685]
BM25はプレフェッチの難しいアプローチであることが判明した。
本稿では,階層型アテンションネットワークによって構築されたテキスト埋め込みの近傍探索によるプレフェッチについて検討する。
SciBERTリランカと組み合わせて、局所的な引用推薦タスクを微調整すると、階層的アテンションエンコーダ(Hatten)は、与えられた候補がリランクされる前に、高いプレフェッチリコールを行う。
論文 参考訳(メタデータ) (2021-12-02T13:20:26Z) - On Addressing Practical Challenges for RNN-Transduce [72.72132048437751]
オーディオデータを収集することなく、よく訓練されたRNN-Tモデルを新しいドメインに適応します。
復号時に計算された複数の特徴を利用して単語レベルの信頼度を求める。
提案手法では,平均で50ms以下の単語のタイミング差が得られる。
論文 参考訳(メタデータ) (2021-04-27T23:31:43Z) - Dense Label Encoding for Boundary Discontinuity Free Rotation Detection [69.75559390700887]
本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-19T05:42:02Z) - Collaborative Training between Region Proposal Localization and
Classification for Domain Adaptive Object Detection [121.28769542994664]
オブジェクト検出のためのドメイン適応は、ラベル付きデータセットからラベル付きデータセットへの検出を適応させようとする。
本稿では,地域提案ネットワーク (RPN) と地域提案分類器 (RPC) が,大きなドメインギャップに直面した場合の転送可能性が大きく異なることを初めて明らかにする。
論文 参考訳(メタデータ) (2020-09-17T07:39:52Z) - Semi-Anchored Detector for One-Stage Object Detection [24.42034747738174]
標準の1段検出器は、分類と回帰の2つのタスクで構成されている。
ResNet-101をバックボーンとし、提案されたセミアンコール検出器はCOCOデータセット上で43.6%のmAPを達成する。
論文 参考訳(メタデータ) (2020-09-10T16:57:09Z) - Mask TextSpotter v3: Segmentation Proposal Network for Robust Scene Text
Spotting [71.6244869235243]
ほとんどの任意形状のシーンテキストスポッターは、地域提案ネットワーク(RPN)を使用して提案を作成する。
Mask TextSpotter v3は、極端なアスペクト比や不規則な形状のテキストインスタンスを処理できます。
論文 参考訳(メタデータ) (2020-07-18T17:25:50Z) - Scope Head for Accurate Localization in Object Detection [135.9979405835606]
本研究では,各位置のアンカーを相互依存関係としてモデル化したScopeNetと呼ばれる新しい検出器を提案する。
我々の簡潔で効果的な設計により、提案したScopeNetはCOCOの最先端の成果を達成する。
論文 参考訳(メタデータ) (2020-05-11T04:00:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。