論文の概要: Hit-Detector: Hierarchical Trinity Architecture Search for Object
Detection
- arxiv url: http://arxiv.org/abs/2003.11818v1
- Date: Thu, 26 Mar 2020 10:20:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-19 21:49:40.266134
- Title: Hit-Detector: Hierarchical Trinity Architecture Search for Object
Detection
- Title(参考訳): Hit-Detector: オブジェクト検出のための階層型トリニティアーキテクチャ検索
- Authors: Jianyuan Guo, Kai Han, Yunhe Wang, Chao Zhang, Zhaohui Yang, Han Wu,
Xinghao Chen and Chang Xu
- Abstract要約: 本稿では,オブジェクト検出器のすべてのコンポーネントに対して,効率的なアーキテクチャを同時に発見するための階層型三元探索フレームワークを提案する。
そこで我々は,各コンポーネントのエンドツーエンド検索を効率的に行うために,異なるコンポーネントに対して異なるサブ検索空間を自動的にスクリーニングする新しい手法を採用した。
検索したアーキテクチャ、すなわちhit-Detectorは、27Mパラメータを持つCOCOミニバルセット上で41.4%のmAPを達成する。
- 参考スコア(独自算出の注目度): 67.84976857449263
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Neural Architecture Search (NAS) has achieved great success in image
classification task. Some recent works have managed to explore the automatic
design of efficient backbone or feature fusion layer for object detection.
However, these methods focus on searching only one certain component of object
detector while leaving others manually designed. We identify the inconsistency
between searched component and manually designed ones would withhold the
detector of stronger performance. To this end, we propose a hierarchical
trinity search framework to simultaneously discover efficient architectures for
all components (i.e. backbone, neck, and head) of object detector in an
end-to-end manner. In addition, we empirically reveal that different parts of
the detector prefer different operators. Motivated by this, we employ a novel
scheme to automatically screen different sub search spaces for different
components so as to perform the end-to-end search for each component on the
corresponding sub search space efficiently. Without bells and whistles, our
searched architecture, namely Hit-Detector, achieves 41.4\% mAP on COCO minival
set with 27M parameters. Our implementation is available at
https://github.com/ggjy/HitDet.pytorch.
- Abstract(参考訳): neural architecture search (nas)は画像分類タスクで大きな成功を収めた。
いくつかの最近の研究は、効率的なバックボーンやオブジェクト検出のための機能融合層の自動設計を調査している。
しかし、これらの手法は対象検出器の特定のコンポーネントのみを探索することに集中し、他のコンポーネントは手動で設計する。
探索されたコンポーネントと手動で設計したコンポーネントの矛盾は、より強い性能の検知を控えることになる。
この目的のために,対象検出器のすべてのコンポーネント(バックボーン,ネック,ヘッド)の効率的なアーキテクチャをエンドツーエンドで同時に発見する階層的トリニティ探索フレームワークを提案する。
さらに,検出器の異なる部分が異なる操作者を好むことを実証的に明らかにする。
そこで本研究では,異なるコンポーネントに対して異なるサブ検索空間を自動的に表示し,それに対応するサブ検索空間上で各コンポーネントのエンドツーエンド検索を効率的に行う手法を提案する。
ベルやホイッスルがなければ、我々は27mのパラメータを持つcocoミニバルセットで41.4\%のマップを検索した。
実装はhttps://github.com/ggjy/hitdet.pytorchで利用可能です。
関連論文リスト
- The Impact of Different Backbone Architecture on Autonomous Vehicle
Dataset [120.08736654413637]
バックボーンアーキテクチャによって抽出された特徴の質は、全体的な検出性能に大きな影響を与える可能性がある。
本研究は,KITTI,NuScenes,BDDの3つの自律走行車データセットを評価し,対象検出タスクにおける異なるバックボーンアーキテクチャの性能を比較した。
論文 参考訳(メタデータ) (2023-09-15T17:32:15Z) - RTMDet: An Empirical Study of Designing Real-Time Object Detectors [13.09100888887757]
我々は、YOLO級数を超え、多くのオブジェクト認識タスクに容易に対応できる効率的なリアルタイム物体検出装置を開発した。
より良いトレーニング技術とともに、得られたオブジェクト検出器はRTMDetと呼ばれ、COCOでは52.8%AP、NVIDIA 3090 GPUでは300以上のFPSを達成している。
実験結果によって、多くの物体認識タスクのための汎用的リアルタイム物体検出器の設計に関する新たな洞察が得られればと願っている。
論文 参考訳(メタデータ) (2022-12-14T18:50:20Z) - Multi-Objective Evolutionary for Object Detection Mobile Architectures
Search [21.14296703753317]
NASシナリオの非支配的ソートに基づく移動体検出バックボーンネットワークアーキテクチャ探索アルゴリズムを提案する。
提案手法は,重みマッピング手法を用いて,異なる深さ,幅,拡張サイズでバックボーンネットワークを探索することができる。
類似の計算複雑性の下では、検索したバックボーンネットワークアーキテクチャの精度は、MobileDetよりも2.0% mAP高い。
論文 参考訳(メタデータ) (2022-11-05T00:28:49Z) - Searching a High-Performance Feature Extractor for Text Recognition
Network [92.12492627169108]
優れた特徴抽出器を持つための原理を探求し,ドメイン固有の検索空間を設計する。
空間は巨大で複雑な構造であるため、既存のNASアルゴリズムを適用することはできない。
本研究では,空間内を効率的に探索する2段階のアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-09-27T03:49:04Z) - A Unified Transformer Framework for Group-based Segmentation:
Co-Segmentation, Co-Saliency Detection and Video Salient Object Detection [59.21990697929617]
人間は、ダイナミックな世界に住んでいるので、画像のグループやビデオのフレームから学ぶことによってオブジェクトをマイニングする傾向があります。
従来のアプローチでは、類似したタスクで異なるネットワークを個別に設計するが、互いに適用するのは困難である。
UFO(UnifiedObject Framework for Co-Object Framework)という,これらの問題に対処するための統一フレームワークを導入する。
論文 参考訳(メタデータ) (2022-03-09T13:35:19Z) - Auto-Panoptic: Cooperative Multi-Component Architecture Search for
Panoptic Segmentation [144.50154657257605]
本稿では、バックボーン、セグメンテーションブランチ、フィーチャーフュージョンモジュールを含むすべての主要コンポーネントを同時に検索する効率的なフレームワークを提案する。
検索したアーキテクチャ、すなわちAuto-Panopticは、挑戦的なCOCOとADE20Kベンチマークに関する新しい最先端技術を実現します。
論文 参考訳(メタデータ) (2020-10-30T08:34:35Z) - Representation Sharing for Fast Object Detector Search and Beyond [38.18583590914755]
本研究では,1段検出器のサブネットワークにおける受容場と畳み込み型の最適構成について,Fast And Diverse (FAD) を提案する。
FADは、様々なバックボーンを持つ2種類の1段検出器において顕著な改善を実現している。
論文 参考訳(メタデータ) (2020-07-23T15:39:44Z) - AutoSTR: Efficient Backbone Search for Scene Text Recognition [80.7290173000068]
テキストインスタンスの多様性とシーンの複雑さのため、シーンテキスト認識(STR)は非常に難しい。
テキスト認識性能を向上させるために,データ依存のバックボーンを検索するための自動STR(AutoSTR)を提案する。
実験によると、データ依存のバックボーンを検索することで、AutoSTRは標準ベンチマークにおける最先端のアプローチより優れている。
論文 参考訳(メタデータ) (2020-03-14T06:51:04Z) - Pixel-Semantic Revise of Position Learning A One-Stage Object Detector
with A Shared Encoder-Decoder [5.371825910267909]
異なる手法がオブジェクトを適応的に検出することを分析する。
いくつかの最先端検出器は、異なる特徴ピラミッドと多レベルセマンティック情報を強化するための多くのメカニズムを組み合わせている。
この研究は、注意機構を持つ共有エンコーダデコーダを持つアンカーフリー検出器によって対処される。
論文 参考訳(メタデータ) (2020-01-04T08:55:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。