Fugu-MT 論文翻訳(概要): Hit-Detector: Hierarchical Trinity Architecture Search for Object Detection

論文の概要: Hit-Detector: Hierarchical Trinity Architecture Search for Object Detection

arxiv url: http://arxiv.org/abs/2003.11818v1
Date: Thu, 26 Mar 2020 10:20:52 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-19 21:49:40.266134
Title: Hit-Detector: Hierarchical Trinity Architecture Search for Object Detection
Title（参考訳）: Hit-Detector: オブジェクト検出のための階層型トリニティアーキテクチャ検索
Authors: Jianyuan Guo, Kai Han, Yunhe Wang, Chao Zhang, Zhaohui Yang, Han Wu, Xinghao Chen and Chang Xu
Abstract要約: 本稿では,オブジェクト検出器のすべてのコンポーネントに対して,効率的なアーキテクチャを同時に発見するための階層型三元探索フレームワークを提案する。そこで我々は,各コンポーネントのエンドツーエンド検索を効率的に行うために,異なるコンポーネントに対して異なるサブ検索空間を自動的にスクリーニングする新しい手法を採用した。検索したアーキテクチャ、すなわちhit-Detectorは、27Mパラメータを持つCOCOミニバルセット上で41.4%のmAPを達成する。
参考スコア（独自算出の注目度）: 67.84976857449263
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Neural Architecture Search (NAS) has achieved great success in image classification task. Some recent works have managed to explore the automatic design of efficient backbone or feature fusion layer for object detection. However, these methods focus on searching only one certain component of object detector while leaving others manually designed. We identify the inconsistency between searched component and manually designed ones would withhold the detector of stronger performance. To this end, we propose a hierarchical trinity search framework to simultaneously discover efficient architectures for all components (i.e. backbone, neck, and head) of object detector in an end-to-end manner. In addition, we empirically reveal that different parts of the detector prefer different operators. Motivated by this, we employ a novel scheme to automatically screen different sub search spaces for different components so as to perform the end-to-end search for each component on the corresponding sub search space efficiently. Without bells and whistles, our searched architecture, namely Hit-Detector, achieves 41.4\% mAP on COCO minival set with 27M parameters. Our implementation is available at https://github.com/ggjy/HitDet.pytorch.
Abstract（参考訳）: neural architecture search (nas)は画像分類タスクで大きな成功を収めた。いくつかの最近の研究は、効率的なバックボーンやオブジェクト検出のための機能融合層の自動設計を調査している。しかし、これらの手法は対象検出器の特定のコンポーネントのみを探索することに集中し、他のコンポーネントは手動で設計する。探索されたコンポーネントと手動で設計したコンポーネントの矛盾は、より強い性能の検知を控えることになる。この目的のために,対象検出器のすべてのコンポーネント(バックボーン,ネック,ヘッド)の効率的なアーキテクチャをエンドツーエンドで同時に発見する階層的トリニティ探索フレームワークを提案する。さらに,検出器の異なる部分が異なる操作者を好むことを実証的に明らかにする。そこで本研究では,異なるコンポーネントに対して異なるサブ検索空間を自動的に表示し,それに対応するサブ検索空間上で各コンポーネントのエンドツーエンド検索を効率的に行う手法を提案する。ベルやホイッスルがなければ、我々は27mのパラメータを持つcocoミニバルセットで41.4\%のマップを検索した。実装はhttps://github.com/ggjy/hitdet.pytorchで利用可能です。

関連論文リスト

Toward Realistic Camouflaged Object Detection: Benchmarks and Method [11.279532701331647]
カモフラージュされたオブジェクト検出(COD)は、主にセマンティックまたはインスタンスセグメンテーション手法に依存している。カモフラージュ検出のためのCAFR(camouflage-aware feature refinement)戦略を提案する。 CAFRは、大型モデルの以前の知識の中で、現在の物体の明確な認識を十分に利用し、背景と前景の区別を深く理解する検出器を支援する。
論文参考訳（メタデータ） (2025-01-13T13:04:00Z)
The Impact of Different Backbone Architecture on Autonomous Vehicle Dataset [120.08736654413637]
バックボーンアーキテクチャによって抽出された特徴の質は、全体的な検出性能に大きな影響を与える可能性がある。本研究は,KITTI,NuScenes,BDDの3つの自律走行車データセットを評価し,対象検出タスクにおける異なるバックボーンアーキテクチャの性能を比較した。
論文参考訳（メタデータ） (2023-09-15T17:32:15Z)
RTMDet: An Empirical Study of Designing Real-Time Object Detectors [13.09100888887757]
我々は、YOLO級数を超え、多くのオブジェクト認識タスクに容易に対応できる効率的なリアルタイム物体検出装置を開発した。より良いトレーニング技術とともに、得られたオブジェクト検出器はRTMDetと呼ばれ、COCOでは52.8%AP、NVIDIA 3090 GPUでは300以上のFPSを達成している。実験結果によって、多くの物体認識タスクのための汎用的リアルタイム物体検出器の設計に関する新たな洞察が得られればと願っている。
論文参考訳（メタデータ） (2022-12-14T18:50:20Z)
Multi-Objective Evolutionary for Object Detection Mobile Architectures Search [21.14296703753317]
NASシナリオの非支配的ソートに基づく移動体検出バックボーンネットワークアーキテクチャ探索アルゴリズムを提案する。提案手法は,重みマッピング手法を用いて,異なる深さ,幅,拡張サイズでバックボーンネットワークを探索することができる。類似の計算複雑性の下では、検索したバックボーンネットワークアーキテクチャの精度は、MobileDetよりも2.0% mAP高い。
論文参考訳（メタデータ） (2022-11-05T00:28:49Z)
Searching a High-Performance Feature Extractor for Text Recognition Network [92.12492627169108]
優れた特徴抽出器を持つための原理を探求し,ドメイン固有の検索空間を設計する。空間は巨大で複雑な構造であるため、既存のNASアルゴリズムを適用することはできない。本研究では,空間内を効率的に探索する2段階のアルゴリズムを提案する。
論文参考訳（メタデータ） (2022-09-27T03:49:04Z)
A Unified Transformer Framework for Group-based Segmentation: Co-Segmentation, Co-Saliency Detection and Video Salient Object Detection [59.21990697929617]
人間は、ダイナミックな世界に住んでいるので、画像のグループやビデオのフレームから学ぶことによってオブジェクトをマイニングする傾向があります。従来のアプローチでは、類似したタスクで異なるネットワークを個別に設計するが、互いに適用するのは困難である。 UFO(UnifiedObject Framework for Co-Object Framework)という,これらの問題に対処するための統一フレームワークを導入する。
論文参考訳（メタデータ） (2022-03-09T13:35:19Z)
Auto-Panoptic: Cooperative Multi-Component Architecture Search for Panoptic Segmentation [144.50154657257605]
本稿では、バックボーン、セグメンテーションブランチ、フィーチャーフュージョンモジュールを含むすべての主要コンポーネントを同時に検索する効率的なフレームワークを提案する。検索したアーキテクチャ、すなわちAuto-Panopticは、挑戦的なCOCOとADE20Kベンチマークに関する新しい最先端技術を実現します。
論文参考訳（メタデータ） (2020-10-30T08:34:35Z)
Representation Sharing for Fast Object Detector Search and Beyond [38.18583590914755]
本研究では,1段検出器のサブネットワークにおける受容場と畳み込み型の最適構成について,Fast And Diverse (FAD) を提案する。 FADは、様々なバックボーンを持つ2種類の1段検出器において顕著な改善を実現している。
論文参考訳（メタデータ） (2020-07-23T15:39:44Z)
AutoSTR: Efficient Backbone Search for Scene Text Recognition [80.7290173000068]
テキストインスタンスの多様性とシーンの複雑さのため、シーンテキスト認識(STR)は非常に難しい。テキスト認識性能を向上させるために,データ依存のバックボーンを検索するための自動STR(AutoSTR)を提案する。実験によると、データ依存のバックボーンを検索することで、AutoSTRは標準ベンチマークにおける最先端のアプローチより優れている。
論文参考訳（メタデータ） (2020-03-14T06:51:04Z)
Pixel-Semantic Revise of Position Learning A One-Stage Object Detector with A Shared Encoder-Decoder [5.371825910267909]
異なる手法がオブジェクトを適応的に検出することを分析する。いくつかの最先端検出器は、異なる特徴ピラミッドと多レベルセマンティック情報を強化するための多くのメカニズムを組み合わせている。この研究は、注意機構を持つ共有エンコーダデコーダを持つアンカーフリー検出器によって対処される。
論文参考訳（メタデータ） (2020-01-04T08:55:00Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。