論文の概要: GiraffeDet: A Heavy-Neck Paradigm for Object Detection
- arxiv url: http://arxiv.org/abs/2202.04256v1
- Date: Wed, 9 Feb 2022 03:23:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-11 00:39:58.411599
- Title: GiraffeDet: A Heavy-Neck Paradigm for Object Detection
- Title(参考訳): GiraffeDet:オブジェクト検出のためのヘビーネックパラダイム
- Authors: Yiqi Jiang, Zhiyu Tan, Junyan Wang, Xiuyu Sun, Ming Lin, Hao Li
- Abstract要約: 本稿では,高速物体検出のための新しいヘビーネックパラダイムであるGiraffeDetを提案する。
GiraffeDetは、非常に軽量なバックボーンと、非常に深くて大きなネックモジュールを使っている。
GiraffeDetは、リソース制約の幅広い範囲で、従来のSOTAモデルより一貫して優れている。
- 参考スコア(独自算出の注目度): 13.476168814994862
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In conventional object detection frameworks, a backbone body inherited from
image recognition models extracts deep latent features and then a neck module
fuses these latent features to capture information at different scales. As the
resolution in object detection is much larger than in image recognition, the
computational cost of the backbone often dominates the total inference cost.
This heavy-backbone design paradigm is mostly due to the historical legacy when
transferring image recognition models to object detection rather than an
end-to-end optimized design for object detection. In this work, we show that
such paradigm indeed leads to sub-optimal object detection models. To this end,
we propose a novel heavy-neck paradigm, GiraffeDet, a giraffe-like network for
efficient object detection. The GiraffeDet uses an extremely lightweight
backbone and a very deep and large neck module which encourages dense
information exchange among different spatial scales as well as different levels
of latent semantics simultaneously. This design paradigm allows detectors to
process the high-level semantic information and low-level spatial information
at the same priority even in the early stage of the network, making it more
effective in detection tasks. Numerical evaluations on multiple popular object
detection benchmarks show that GiraffeDet consistently outperforms previous
SOTA models across a wide spectrum of resource constraints.
- Abstract(参考訳): 従来のオブジェクト検出フレームワークでは、画像認識モデルから継承されたバックボーン本体が深い潜伏特徴を抽出し、ネックモジュールがこれらの潜伏特徴を融合して異なるスケールで情報をキャプチャする。
物体検出の解像度は画像認識よりもはるかに大きいため、バックボーンの計算コストが総推論コストを支配することがしばしばある。
このヘビーバックボーン設計パラダイムは、画像認識モデルをエンドツーエンドのオブジェクト検出に最適化された設計ではなく、オブジェクト検出に転送する歴史的レガシーに起因する。
そこで本研究では,そのようなパラダイムが,オブジェクト検出の準最適モデルにつながることを示す。
そこで本研究では,高速物体検出のためのキリン様ネットワークであるGiraffeDetを提案する。
GiraffeDetは、非常に軽量なバックボーンと非常に深くて大きなネックモジュールを使用し、異なる空間スケール間の密な情報交換と、異なる遅延セマンティクスのレベルを同時に促進する。
この設計パラダイムにより、検出器はネットワークの初期段階でも、高レベル意味情報と低レベル空間情報を同時に優先的に処理することができ、検出タスクにおいてより効果的になる。
複数の人気オブジェクト検出ベンチマークの数値評価により、GiraffeDetはリソース制約の幅広い範囲にわたって、従来のSOTAモデルよりも一貫して優れていることが示されている。
関連論文リスト
- Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Unveiling Camouflage: A Learnable Fourier-based Augmentation for
Camouflaged Object Detection and Instance Segmentation [27.41886911999097]
本稿では,camouflaged object detection (COD) とcamouflaged instance segmentation (CIS) の学習可能な拡張法を提案する。
提案手法は,カモフラージュされた対象検出器とカモフラーグされたインスタンスセグメンタの性能を大きなマージンで向上させる。
論文 参考訳(メタデータ) (2023-08-29T22:43:46Z) - Frequency Perception Network for Camouflaged Object Detection [51.26386921922031]
周波数領域のセマンティック階層によって駆動される新しい学習可能かつ分離可能な周波数知覚機構を提案する。
ネットワーク全体では、周波数誘導粗い局所化ステージと細部保存の微細局在化ステージを含む2段階モデルを採用している。
提案手法は,既存のモデルと比較して,3つのベンチマークデータセットにおいて競合性能を実現する。
論文 参考訳(メタデータ) (2023-08-17T11:30:46Z) - Fast and Accurate Object Detection on Asymmetrical Receptive Field [0.0]
本稿では,物体検出精度を受容場の変化の観点から改善する手法を提案する。
YOLOv5の頭部の構造は、非対称なプール層を付加することによって改変される。
本稿では, 従来の YOLOv5 モデルと比較し, いくつかのパラメータから解析する。
論文 参考訳(メタデータ) (2023-03-15T23:59:18Z) - Adaptive Rotated Convolution for Rotated Object Detection [96.94590550217718]
本稿では、回転物体検出問題に対処するために、適応回転変換(ARC)モジュールを提案する。
ARCモジュールでは、コンボリューションカーネルが適応的に回転し、異なる画像に異なる向きのオブジェクト特徴を抽出する。
提案手法は,81.77%mAPのDOTAデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-03-14T11:53:12Z) - Rethinking the Detection Head Configuration for Traffic Object Detection [11.526701794026641]
本稿では,検出ヘッドとオブジェクト分布のマッチングに基づいて,軽量なトラフィックオブジェクト検出ネットワークを提案する。
提案したモデルでは,BDD100Kデータセットと提案したETFOD-v2データセットの他のモデルよりも,より競争力のあるパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-10-08T02:23:57Z) - High-resolution Iterative Feedback Network for Camouflaged Object
Detection [128.893782016078]
カモフラージュされたオブジェクトを背景に視覚的に同化させることは、オブジェクト検出アルゴリズムにとって難しい。
エッジやバウンダリのぼやけた視界を生じさせる細部劣化を避けるために,高分解能テクスチャの詳細を抽出することを目的としている。
我々は,高解像度特徴量による低解像度表現を反復的フィードバック方式で洗練する新しいHitNetを提案する。
論文 参考訳(メタデータ) (2022-03-22T11:20:21Z) - Pretrained equivariant features improve unsupervised landmark discovery [69.02115180674885]
我々は、この課題を克服する2段階の教師なしアプローチを、強力なピクセルベースの特徴を初めて学習することによって定式化する。
本手法は,いくつかの難解なランドマーク検出データセットにおいて最先端の結果を生成する。
論文 参考訳(メタデータ) (2021-04-07T05:42:11Z) - Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。
古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文 参考訳(メタデータ) (2020-11-17T09:39:42Z) - Few-shot Object Detection on Remote Sensing Images [11.40135025181393]
リモートセンシング画像におけるオブジェクト検出のための数ショットの学習手法を提案する。
我々は、YOLOv3アーキテクチャに基づいて、少数ショットオブジェクト検出モデルを構築し、マルチスケールオブジェクト検出フレームワークを開発する。
論文 参考訳(メタデータ) (2020-06-14T07:18:10Z) - Real Time Multi-Class Object Detection and Recognition Using Vision
Augmentation Algorithm [0.0]
学習課題における畳み込みレベルが異なるマルチスケール特徴を抽出するために,アップサンプリングとスキップ接続を用いた新しいリアルタイム検出アルゴリズムを提案する。
モデルの検出精度は、最先端モデルよりも高く、高速であることが示されている。
論文 参考訳(メタデータ) (2020-03-17T01:08:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。