論文の概要: Representation Sharing for Fast Object Detector Search and Beyond
- arxiv url: http://arxiv.org/abs/2007.12075v4
- Date: Fri, 23 Oct 2020 07:55:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 12:50:35.604300
- Title: Representation Sharing for Fast Object Detector Search and Beyond
- Title(参考訳): 高速物体検出器探索のための表現共有
- Authors: Yujie Zhong, Zelu Deng, Sheng Guo, Matthew R. Scott, Weilin Huang
- Abstract要約: 本研究では,1段検出器のサブネットワークにおける受容場と畳み込み型の最適構成について,Fast And Diverse (FAD) を提案する。
FADは、様々なバックボーンを持つ2種類の1段検出器において顕著な改善を実現している。
- 参考スコア(独自算出の注目度): 38.18583590914755
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Region Proposal Network (RPN) provides strong support for handling the scale
variation of objects in two-stage object detection. For one-stage detectors
which do not have RPN, it is more demanding to have powerful sub-networks
capable of directly capturing objects of unknown sizes. To enhance such
capability, we propose an extremely efficient neural architecture search
method, named Fast And Diverse (FAD), to better explore the optimal
configuration of receptive fields and convolution types in the sub-networks for
one-stage detectors. FAD consists of a designed search space and an efficient
architecture search algorithm. The search space contains a rich set of diverse
transformations designed specifically for object detection. To cope with the
designed search space, a novel search algorithm termed Representation Sharing
(RepShare) is proposed to effectively identify the best combinations of the
defined transformations. In our experiments, FAD obtains prominent improvements
on two types of one-stage detectors with various backbones. In particular, our
FAD detector achieves 46.4 AP on MS-COCO (under single-scale testing),
outperforming the state-of-the-art detectors, including the most recent
NAS-based detectors, Auto-FPN (searched for 16 GPU-days) and NAS-FCOS (28
GPU-days), while significantly reduces the search cost to 0.6 GPU-days. Beyond
object detection, we further demonstrate the generality of FAD on the more
challenging instance segmentation, and expect it to benefit more tasks.
- Abstract(参考訳): 領域提案ネットワーク(RPN)は、2段階のオブジェクト検出においてオブジェクトのスケール変動を処理するための強力なサポートを提供する。
RPNを持たない一段検出器では、未知の大きさの物体を直接捕捉できる強力なサブネットワークが要求される。
そこで本研究では,1段検出器のサブネットワークにおける受容場と畳み込み型の最適構成を,より効率的に探索する,Fast And Diverse (FAD) という極めて効率的なニューラルネットワーク探索手法を提案する。
FADは設計された検索空間と効率的なアーキテクチャ探索アルゴリズムから構成される。
検索空間には、オブジェクト検出専用に設計された多様な変換の豊富なセットが含まれている。
設計した検索空間に対処するために,Representation Sharing (RepShare) と呼ばれる新しい検索アルゴリズムを提案し,定義した変換の最適な組み合わせを効果的に同定する。
我々の実験では、FADは様々なバックボーンを持つ2種類の1段検出器の顕著な改善を得た。
特に、当社のFAD検出器は、MS-COCO上で46.4 AP(シングルスケールテスト)を達成し、最新のNASベースの検出器、Auto-FPN(GPU日16日)、NAS-FCOS(GPU日28日)など、最先端の検出器よりも優れています。
オブジェクト検出以外にも、より困難なインスタンスセグメンテーションにおけるFADの汎用性をさらに実証し、より多くのタスクに利益をもたらすことを期待しています。
関連論文リスト
- Renormalized Connection for Scale-preferred Object Detection in Satellite Imagery [51.83786195178233]
我々は、効率的な特徴抽出の観点から再正規化群理論を実装するために、知識発見ネットワーク(KDN)を設計する。
KDN上の再正規化接続(RC)は、マルチスケール特徴の「相乗的焦点」を可能にする。
RCはFPNベースの検出器のマルチレベル特徴の分割・対数機構を幅広いスケールで予測されたタスクに拡張する。
論文 参考訳(メタデータ) (2024-09-09T13:56:22Z) - Multi-Objective Evolutionary for Object Detection Mobile Architectures
Search [21.14296703753317]
NASシナリオの非支配的ソートに基づく移動体検出バックボーンネットワークアーキテクチャ探索アルゴリズムを提案する。
提案手法は,重みマッピング手法を用いて,異なる深さ,幅,拡張サイズでバックボーンネットワークを探索することができる。
類似の計算複雑性の下では、検索したバックボーンネットワークアーキテクチャの精度は、MobileDetよりも2.0% mAP高い。
論文 参考訳(メタデータ) (2022-11-05T00:28:49Z) - Searching a High-Performance Feature Extractor for Text Recognition
Network [92.12492627169108]
優れた特徴抽出器を持つための原理を探求し,ドメイン固有の検索空間を設計する。
空間は巨大で複雑な構造であるため、既存のNASアルゴリズムを適用することはできない。
本研究では,空間内を効率的に探索する2段階のアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-09-27T03:49:04Z) - EAutoDet: Efficient Architecture Search for Object Detection [110.99532343155073]
EAutoDetフレームワークは、1.4GPU日でオブジェクト検出のための実用的なバックボーンとFPNアーキテクチャを検出できる。
本稿では,一方のエッジ上での候補演算の重みを共有し,それらを一つの畳み込みに集約することでカーネル再利用手法を提案する。
特に、発見されたアーキテクチャは最先端のオブジェクト検出NAS法を超越し、120 FPSで40.1 mAP、49.2 mAP、41.3 FPSをCOCOテストデブセットで達成している。
論文 参考訳(メタデータ) (2022-03-21T05:56:12Z) - MRDet: A Multi-Head Network for Accurate Oriented Object Detection in
Aerial Images [51.227489316673484]
水平アンカーから変換された指向性提案を生成するために、任意指向領域提案ネットワーク(AO-RPN)を提案する。
正確なバウンディングボックスを得るために,検出タスクを複数のサブタスクに分離し,マルチヘッドネットワークを提案する。
各ヘッドは、対応するタスクに最適な特徴を学習するために特別に設計されており、ネットワークがオブジェクトを正確に検出することができる。
論文 参考訳(メタデータ) (2020-12-24T06:36:48Z) - AFD-Net: Adaptive Fully-Dual Network for Few-Shot Object Detection [8.39479809973967]
Few-shot Object Detection (FSOD) は、未確認の物体に迅速に適応できる検出器の学習を目的としている。
既存の方法では、共有コンポーネントを用いて分類と局所化のサブタスクを実行することで、この問題を解決している。
本稿では,2つのサブタスクの明示的な分解を考慮し,両者の情報を活用して特徴表現の強化を図ることを提案する。
論文 参考訳(メタデータ) (2020-11-30T10:21:32Z) - Hit-Detector: Hierarchical Trinity Architecture Search for Object
Detection [67.84976857449263]
本稿では,オブジェクト検出器のすべてのコンポーネントに対して,効率的なアーキテクチャを同時に発見するための階層型三元探索フレームワークを提案する。
そこで我々は,各コンポーネントのエンドツーエンド検索を効率的に行うために,異なるコンポーネントに対して異なるサブ検索空間を自動的にスクリーニングする新しい手法を採用した。
検索したアーキテクチャ、すなわちhit-Detectorは、27Mパラメータを持つCOCOミニバルセット上で41.4%のmAPを達成する。
論文 参考訳(メタデータ) (2020-03-26T10:20:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。