論文の概要: Neural Architecture Adaptation for Object Detection by Searching Channel
Dimensions and Mapping Pre-trained Parameters
- arxiv url: http://arxiv.org/abs/2206.08509v1
- Date: Fri, 17 Jun 2022 02:01:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-20 13:03:20.368140
- Title: Neural Architecture Adaptation for Object Detection by Searching Channel
Dimensions and Mapping Pre-trained Parameters
- Title(参考訳): チャネル次元の探索と事前学習パラメータのマッピングによる物体検出のためのニューラルアーキテクチャ適応
- Authors: Harim Jung, Myeong-Seok Oh, Cheoljong Yang, Seong-Whan Lee
- Abstract要約: ほとんどのオブジェクト検出フレームワークは、元来画像分類用に設計されたバックボーンアーキテクチャを使用する。
最近のニューラルアーキテクチャサーチ(NAS)研究は、オブジェクト検出に特化したバックボーンの自動設計が全体的な精度を向上させることを実証している。
本稿では,検出目的のために与えられたバックボーンを最適化するニューラルアーキテクチャ適応手法を提案する。
- 参考スコア(独自算出の注目度): 17.090405682103167
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most object detection frameworks use backbone architectures originally
designed for image classification, conventionally with pre-trained parameters
on ImageNet. However, image classification and object detection are essentially
different tasks and there is no guarantee that the optimal backbone for
classification is also optimal for object detection. Recent neural architecture
search (NAS) research has demonstrated that automatically designing a backbone
specifically for object detection helps improve the overall accuracy. In this
paper, we introduce a neural architecture adaptation method that can optimize
the given backbone for detection purposes, while still allowing the use of
pre-trained parameters. We propose to adapt both the micro- and
macro-architecture by searching for specific operations and the number of
layers, in addition to the output channel dimensions of each block. It is
important to find the optimal channel depth, as it greatly affects the feature
representation capability and computation cost. We conduct experiments with our
searched backbone for object detection and demonstrate that our backbone
outperforms both manually designed and searched state-of-the-art backbones on
the COCO dataset.
- Abstract(参考訳): ほとんどのオブジェクト検出フレームワークは、元来画像分類用に設計されたバックボーンアーキテクチャを使用する。
しかし、画像分類とオブジェクト検出は本質的に異なるタスクであり、分類のための最適なバックボーンがオブジェクト検出にも最適である保証はない。
最近のニューラルアーキテクチャサーチ(NAS)研究は、オブジェクト検出に特化したバックボーンの自動設計が全体的な精度を向上させることを実証している。
本稿では,与えられたバックボーンを検出目的に最適化し,事前学習パラメータの使用を可能としたニューラルアーキテクチャ適応手法を提案する。
本稿では,各ブロックの出力チャネル次元に加えて,特定の操作とレイヤ数を求めることで,マイクロアーキテクチャとマクロアーキテクチャの両方を適用することを提案する。
特徴表現能力と計算コストに大きな影響を与えるため、最適なチャネル深さを見つけることが重要である。
対象検出のために検索したバックボーンを用いて実験を行い、我々のバックボーンがCOCOデータセット上で手動設計および検索された最先端のバックボーンよりも優れていることを示す。
関連論文リスト
- The Impact of Different Backbone Architecture on Autonomous Vehicle
Dataset [120.08736654413637]
バックボーンアーキテクチャによって抽出された特徴の質は、全体的な検出性能に大きな影響を与える可能性がある。
本研究は,KITTI,NuScenes,BDDの3つの自律走行車データセットを評価し,対象検出タスクにおける異なるバックボーンアーキテクチャの性能を比較した。
論文 参考訳(メタデータ) (2023-09-15T17:32:15Z) - Rethinking the backbone architecture for tiny object detection [0.0]
既存の小さなオブジェクト検出方法は、標準的なディープニューラルネットワークをバックボーンアーキテクチャとして使用しています。
このようなバックボーンは、大きなオブジェクトの分類のために設計されたため、小さなオブジェクトを検出するには不適切であり、小さなターゲットを特定するための空間分解能を持っていない、と我々は主張する。
我々は、全体的な計算負荷を伴わずに、高解像度の機能を処理するためにより多くのリソースを割り当てる「ボトムヘビー」バージョンのバックボーンを設計する。
論文 参考訳(メタデータ) (2023-03-20T16:50:29Z) - Adaptive Rotated Convolution for Rotated Object Detection [96.94590550217718]
本稿では、回転物体検出問題に対処するために、適応回転変換(ARC)モジュールを提案する。
ARCモジュールでは、コンボリューションカーネルが適応的に回転し、異なる画像に異なる向きのオブジェクト特徴を抽出する。
提案手法は,81.77%mAPのDOTAデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-03-14T11:53:12Z) - Multi-Objective Evolutionary for Object Detection Mobile Architectures
Search [21.14296703753317]
NASシナリオの非支配的ソートに基づく移動体検出バックボーンネットワークアーキテクチャ探索アルゴリズムを提案する。
提案手法は,重みマッピング手法を用いて,異なる深さ,幅,拡張サイズでバックボーンネットワークを探索することができる。
類似の計算複雑性の下では、検索したバックボーンネットワークアーキテクチャの精度は、MobileDetよりも2.0% mAP高い。
論文 参考訳(メタデータ) (2022-11-05T00:28:49Z) - Simple Open-Vocabulary Object Detection with Vision Transformers [51.57562920090721]
本稿では,画像テキストモデルをオープン語彙オブジェクト検出に転送するための強力なレシピを提案する。
我々は、最小限の修正、コントラスト的な画像テキスト事前学習、エンドツーエンド検出細調整を備えた標準のVision Transformerアーキテクチャを使用する。
我々は、ゼロショットテキスト条件とワンショット画像条件オブジェクト検出において、非常に強力な性能を達成するために必要な適応戦略と正規化を提供する。
論文 参考訳(メタデータ) (2022-05-12T17:20:36Z) - GiraffeDet: A Heavy-Neck Paradigm for Object Detection [13.476168814994862]
本稿では,高速物体検出のための新しいヘビーネックパラダイムであるGiraffeDetを提案する。
GiraffeDetは、非常に軽量なバックボーンと、非常に深くて大きなネックモジュールを使っている。
GiraffeDetは、リソース制約の幅広い範囲で、従来のSOTAモデルより一貫して優れている。
論文 参考訳(メタデータ) (2022-02-09T03:23:49Z) - Joint Learning of Neural Transfer and Architecture Adaptation for Image
Recognition [77.95361323613147]
現在の最先端の視覚認識システムは、大規模データセット上でニューラルネットワークを事前トレーニングし、より小さなデータセットでネットワーク重みを微調整することに依存している。
本稿では,各ドメインタスクに適応したネットワークアーキテクチャの動的適応と,効率と効率の両面で重みの微調整の利点を実証する。
本手法は,ソースドメインタスクでスーパーネットトレーニングを自己教師付き学習に置き換え,下流タスクで線形評価を行うことにより,教師なしパラダイムに容易に一般化することができる。
論文 参考訳(メタデータ) (2021-03-31T08:15:17Z) - CFC-Net: A Critical Feature Capturing Network for Arbitrary-Oriented
Object Detection in Remote Sensing Images [0.9462808515258465]
本稿では,物体検出における識別的特徴の役割について論じる。
次に,検出精度を向上させるために,cfc-net (critical feature capture network) を提案する。
本手法は多くの最先端手法と比較して優れた検出性能が得られることを示す。
論文 参考訳(メタデータ) (2021-01-18T02:31:09Z) - Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。
古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文 参考訳(メタデータ) (2020-11-17T09:39:42Z) - Adaptive Linear Span Network for Object Skeleton Detection [56.78705071830965]
本研究では,適応線形スパンネットワーク(AdaLSN)を提案する。
AdaLSNは、精度とレイテンシのトレードオフを著しく高めることで、その汎用性を裏付ける。
また、エッジ検出や道路抽出といったイメージ・ツー・マスクのタスクに適用可能であることも示している。
論文 参考訳(メタデータ) (2020-11-08T12:51:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。