論文の概要: RRPN++: Guidance Towards More Accurate Scene Text Detection
- arxiv url: http://arxiv.org/abs/2009.13118v1
- Date: Mon, 28 Sep 2020 08:00:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 22:08:17.536126
- Title: RRPN++: Guidance Towards More Accurate Scene Text Detection
- Title(参考訳): RRPN++: より正確なシーンテキスト検出へのガイダンス
- Authors: Jianqi Ma
- Abstract要約: 本稿では, RRPN ベースのモデルの可能性を活用するために RRPN++ を提案する。
RRPNに基づいて、第1段階の提案を生成するために、アンカーフリーピラミッド提案ネットワーク(APPN)を提案する。
第2段階では、検出部と認識部の両方を組み込んでマルチタスク学習を行う。
- 参考スコア(独自算出の注目度): 0.30458514384586394
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: RRPN is among the outstanding scene text detection approaches, but the
manually-designed anchor and coarse proposal refinement make the performance
still far from perfection. In this paper, we propose RRPN++ to exploit the
potential of RRPN-based model by several improvements. Based on RRPN, we
propose the Anchor-free Pyramid Proposal Networks (APPN) to generate
first-stage proposals, which adopts the anchor-free design to reduce proposal
number and accelerate the inference speed. In our second stage, both the
detection branch and the recognition branch are incorporated to perform
multi-task learning. In inference stage, the detection branch outputs the
proposal refinement and the recognition branch predicts the transcript of the
refined text region. Further, the recognition branch also helps rescore the
proposals and eliminate the false positive proposals by the jointing filtering
strategy. With these enhancements, we boost the detection results by $6\%$ of
F-measure in ICDAR2015 compared to RRPN. Experiments conducted on other
benchmarks also illustrate the superior performance and efficiency of our
model.
- Abstract(参考訳): RRPNは優れたシーンテキスト検出手法の1つであるが、手動で設計したアンカーと粗い提案の改良により、まだ性能は完璧には程遠い。
本稿では, RRPN ベースのモデルの可能性を活用するために RRPN++ を提案する。
RRPNに基づいて、アンカーフリーなピラミッド提案ネットワーク(APPN)を提案し、アンカーフリーな設計を採用して提案数を削減し、推論速度を高速化する。
第2段階では、検出ブランチと認識ブランチの両方を組み込んでマルチタスク学習を行う。
推測段階では、検出部は提案の洗練を出力し、認識部は精製されたテキスト領域の転写を予測する。
さらに、認識ブランチは、提案の再調整や、結合フィルタリング戦略による偽陽性提案の排除にも役立っている。
これらの拡張により,IRPNと比較してICDAR2015のF値が6.5%向上した。
他のベンチマークで行った実験では、モデルの優れた性能と効率が示されている。
関連論文リスト
- PETDet: Proposal Enhancement for Two-Stage Fine-Grained Object Detection [26.843891792018447]
PETDet (Proposal Enhancement for Two-stage fine-fine object detection) は, 2段階FGOD法において, サブタスクをよりよく扱うために提案される。
動的ラベル割り当てと注意に基づく分解により, アンカーフリー品質指向提案ネットワーク(QOPN)を提案する。
A novel Adaptive Recognition Loss (ARL)は、R-CNNの責任者が高品質な提案に焦点を合わせるためのガイダンスを提供する。
論文 参考訳(メタデータ) (2023-12-16T18:04:56Z) - Rank-DETR for High Quality Object Detection [52.82810762221516]
高性能なオブジェクト検出器は、バウンディングボックス予測の正確なランキングを必要とする。
本研究では, 簡易かつ高性能なDETR型物体検出器について, 一連のランク指向設計を提案して紹介する。
論文 参考訳(メタデータ) (2023-10-13T04:48:32Z) - Label-Efficient Object Detection via Region Proposal Network
Pre-Training [58.50615557874024]
地域提案ネットワーク(RPN)に効果的な事前学習を提供するための簡単な事前学習タスクを提案する。
RPN事前学習のないマルチステージ検出器と比較して,本手法はダウンストリームタスク性能を継続的に改善することができる。
論文 参考訳(メタデータ) (2022-11-16T16:28:18Z) - A New High-Performance Approach to Approximate Pattern-Matching for
Plagiarism Detection in Blockchain-Based Non-Fungible Tokens (NFTs) [0.0]
NDFAに基づく手法を用いて, プラジャリズム検出のためのパターンマッチングを高速かつ革新的に行う手法を提案する。
ブロックチェーンベースのNFT(Non-fungible tokens)という文脈で、私たちのアプローチの利点を概説する。
論文 参考訳(メタデータ) (2022-05-28T17:53:20Z) - Adaptive Proposal Generation Network for Temporal Sentence Localization
in Videos [58.83440885457272]
ビデオ(TSLV)における時間文ローカライゼーションの問題に対処する。
従来のメソッドは、事前に定義されたセグメントの提案でターゲットセグメントをローカライズするトップダウンフレームワークに従っている。
本稿では,効率を向上しつつセグメントレベルの相互作用を維持するための適応提案生成ネットワーク(APGN)を提案する。
論文 参考訳(メタデータ) (2021-09-14T02:02:36Z) - Augmenting Proposals by the Detector Itself [16.059480514515506]
本稿では,検出器自体による提案を増強し,高品質な提案を生成できるAPDIという新しいトレーニング手法を設計する。
COCOデータセットの実験により,本手法は様々なバックボーンを持つ高速R-CNNに対して,少なくとも2.7APの改善をもたらすことが示された。
GA-RPNやカスケードRPNといった先進的なRPNと協力し、余分な利得を得ることができる。
論文 参考訳(メタデータ) (2021-01-28T02:48:00Z) - MRDet: A Multi-Head Network for Accurate Oriented Object Detection in
Aerial Images [51.227489316673484]
水平アンカーから変換された指向性提案を生成するために、任意指向領域提案ネットワーク(AO-RPN)を提案する。
正確なバウンディングボックスを得るために,検出タスクを複数のサブタスクに分離し,マルチヘッドネットワークを提案する。
各ヘッドは、対応するタスクに最適な特徴を学習するために特別に設計されており、ネットワークがオブジェクトを正確に検出することができる。
論文 参考訳(メタデータ) (2020-12-24T06:36:48Z) - PPGN: Phrase-Guided Proposal Generation Network For Referring Expression
Comprehension [31.39505099600821]
新規な句誘導提案生成ネットワーク(PPGN)を提案する。
PPGNの主な実装原理は、テキストで視覚的特徴を洗練し、回帰を通じて提案を生成することである。
ベンチマークデータセットにおいて,本手法が有効であることを示す実験を行った。
論文 参考訳(メタデータ) (2020-12-20T11:21:06Z) - CRACT: Cascaded Regression-Align-Classification for Robust Visual
Tracking [97.84109669027225]
改良された提案改良モジュールCascaded Regression-Align- Classification (CRAC)を導入する。
CRACは多くのベンチマークで最先端のパフォーマンスを得る。
OTB-2015、UAV123、NfS、VOT-2018、TrackingNet、GOT-10k、LaSOTを含む7つのベンチマークの実験において、我々のCRACTは最先端の競合他社と比較して非常に有望な結果を示している。
論文 参考訳(メタデータ) (2020-11-25T02:18:33Z) - Collaborative Training between Region Proposal Localization and
Classification for Domain Adaptive Object Detection [121.28769542994664]
オブジェクト検出のためのドメイン適応は、ラベル付きデータセットからラベル付きデータセットへの検出を適応させようとする。
本稿では,地域提案ネットワーク (RPN) と地域提案分類器 (RPC) が,大きなドメインギャップに直面した場合の転送可能性が大きく異なることを初めて明らかにする。
論文 参考訳(メタデータ) (2020-09-17T07:39:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。