論文の概要: Rethinking the Detection Head Configuration for Traffic Object Detection
- arxiv url: http://arxiv.org/abs/2210.03883v1
- Date: Sat, 8 Oct 2022 02:23:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-11 19:07:46.198827
- Title: Rethinking the Detection Head Configuration for Traffic Object Detection
- Title(参考訳): トラヒック物体検出のための検出ヘッド構成の再考
- Authors: Yi Shi, Jiang Wu, Shixuan Zhao, Gangyao Gao, Tao Deng and Hongmei Yan
- Abstract要約: 本稿では,検出ヘッドとオブジェクト分布のマッチングに基づいて,軽量なトラフィックオブジェクト検出ネットワークを提案する。
提案したモデルでは,BDD100Kデータセットと提案したETFOD-v2データセットの他のモデルよりも,より競争力のあるパフォーマンスを実現している。
- 参考スコア(独自算出の注目度): 11.526701794026641
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-scale detection plays an important role in object detection models.
However, researchers usually feel blank on how to reasonably configure
detection heads combining multi-scale features at different input resolutions.
We find that there are different matching relationships between the object
distribution and the detection head at different input resolutions. Based on
the instructive findings, we propose a lightweight traffic object detection
network based on matching between detection head and object distribution,
termed as MHD-Net. It consists of three main parts. The first is the detection
head and object distribution matching strategy, which guides the rational
configuration of detection head, so as to leverage multi-scale features to
effectively detect objects at vastly different scales. The second is the
cross-scale detection head configuration guideline, which instructs to replace
multiple detection heads with only two detection heads possessing of rich
feature representations to achieve an excellent balance between detection
accuracy, model parameters, FLOPs and detection speed. The third is the
receptive field enlargement method, which combines the dilated convolution
module with shallow features of backbone to further improve the detection
accuracy at the cost of increasing model parameters very slightly. The proposed
model achieves more competitive performance than other models on BDD100K
dataset and our proposed ETFOD-v2 dataset. The code will be available.
- Abstract(参考訳): オブジェクト検出モデルでは,マルチスケール検出が重要な役割を果たす。
しかし、研究者は通常、異なる入力解像度のマルチスケール特徴を組み合わせた検出ヘッドを合理的に設定する方法について空白を感じている。
オブジェクト分布と検出ヘッドの間に異なる一致関係が、異なる入力解像度で存在することがわかった。
そこで本研究では,MHD-Netと呼ばれる検出ヘッドとオブジェクト分布のマッチングに基づく,軽量なトラフィックオブジェクト検出ネットワークを提案する。
主に3つの部分からなる。
ひとつは検出ヘッドとオブジェクト分散マッチング戦略で、検出ヘッドの合理的な構成を導くことで、マルチスケール機能を活用して、非常に異なるスケールでオブジェクトを効果的に検出する。
2つ目は、複数の検出ヘッドをリッチな特徴表現を持つ2つの検出ヘッドのみに置き換えて、検出精度、モデルパラメータ、FLOP、検出速度のバランスを良くするクロススケール検出ヘッド構成ガイドラインである。
3つ目はレセプティブ・フィールド拡大法であり、拡張畳み込みモジュールとbackboneの浅い特徴を組み合わせることで、モデルパラメータを非常にわずかに増加させるコストで検出精度をさらに向上させる。
提案したモデルでは,BDD100Kデータセットと提案したETFOD-v2データセットの他のモデルよりも高い競争性能を実現している。
コードは利用可能だ。
関連論文リスト
- Boosting 3D Object Detection with Semantic-Aware Multi-Branch Framework [44.44329455757931]
自律走行では、LiDARセンサーは3Dポイントの雲の取得に不可欠であり、信頼できる幾何学的情報を提供する。
そこで本研究では,Semantic-aware Multi-branch Sampling (SMS)モジュールを用いたマルチブランチ2次元オブジェクト検出フレームワークを提案する。
KITTI 3Dオブジェクト検出ベンチマークによる実験結果から,本手法は種々のバックボーンに対して優れた検出性能向上を実現することが示された。
論文 参考訳(メタデータ) (2024-07-08T09:25:45Z) - S$^3$-MonoDETR: Supervised Shape&Scale-perceptive Deformable Transformer
for Monocular 3D Object Detection [22.424834025925076]
モノクロ3Dオブジェクト検出のためのSupervised Shape&Scale-perceptive Deformable Attention (S$3$-DA)モジュール。
本稿では,モノクロ3次元物体検出のための"Supervised Shape&Scale-perceptive Deformable Attention" (S$3$-DA) モジュールを提案する。
論文 参考訳(メタデータ) (2023-09-02T12:36:38Z) - Multi-level and multi-modal feature fusion for accurate 3D object
detection in Connected and Automated Vehicles [0.8701566919381223]
本稿では,3段階特徴抽出器を用いたディープニューラルネットワークを用いた3次元物体検出モデルを提案する。
提案した特徴抽出器は、2つの入力感覚モーダルから高次特徴を抽出し、畳み込み過程に捨てられた重要な特徴を回収する。
新たな融合方式は、感覚のモダリティと畳み込み層を効果的に融合させ、最も優れたグローバルな特徴を見出す。
論文 参考訳(メタデータ) (2022-12-15T00:25:05Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - R(Det)^2: Randomized Decision Routing for Object Detection [64.48369663018376]
本稿では,決定木とディープニューラルネットワークをエンドツーエンドの学習方法で組み合わせたオブジェクト検出手法を提案する。
効率的な学習を容易にするために,ノード選択型および連想型損失を伴うランダム化決定経路を提案する。
このアプローチをオブジェクト検出のためのランダム化決定ルーティングとして、R(Det)$2$と略す。
論文 参考訳(メタデータ) (2022-04-02T07:54:58Z) - A More Compact Object Detector Head Network with Feature Enhancement and
Relational Reasoning [4.171249457570931]
よりコンパクトなオブジェクト検出器ヘッドネットワーク(CODH)を提案する。
提案手法では,ヘッドネットワークのパラメータは最先端のカスケードR-CNNより0.6倍小さいが,COCOテストデブでは1.3%向上する。
論文 参考訳(メタデータ) (2021-06-28T08:38:57Z) - M3DSSD: Monocular 3D Single Stage Object Detector [82.25793227026443]
特徴アライメントと非対称非局所的注意を有するモノクロ3次元単段物体検出器(M3DSSD)を提案する。
提案したM3DSSDは,KITTIデータセット上のモノラルな3Dオブジェクト検出手法よりも大幅に性能が向上する。
論文 参考訳(メタデータ) (2021-03-24T13:09:11Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - Condensing Two-stage Detection with Automatic Object Key Part Discovery [87.1034745775229]
2段階の物体検出器は通常、高い精度を達成するために、検出ヘッドのために過度に大きなモデルを必要とする。
そこで本研究では,2段階検出ヘッドのモデルパラメータを,対象キー部分に集中させることで縮合・縮小できることを示す。
提案手法は、一般的な2段検出ヘッドのモデルパラメータの約50%を放棄しながら、元の性能を一貫して維持する。
論文 参考訳(メタデータ) (2020-06-10T01:20:47Z) - FairMOT: On the Fairness of Detection and Re-Identification in Multiple
Object Tracking [92.48078680697311]
マルチオブジェクトトラッキング(MOT)はコンピュータビジョンにおいて重要な問題である。
本稿では,FairMOTと呼ばれる,アンカーフリーなオブジェクト検出アーキテクチャCenterNetをベースとした,シンプルかつ効果的なアプローチを提案する。
このアプローチは、検出と追跡の両方において高い精度を達成する。
論文 参考訳(メタデータ) (2020-04-04T08:18:00Z) - Pixel-Semantic Revise of Position Learning A One-Stage Object Detector
with A Shared Encoder-Decoder [5.371825910267909]
異なる手法がオブジェクトを適応的に検出することを分析する。
いくつかの最先端検出器は、異なる特徴ピラミッドと多レベルセマンティック情報を強化するための多くのメカニズムを組み合わせている。
この研究は、注意機構を持つ共有エンコーダデコーダを持つアンカーフリー検出器によって対処される。
論文 参考訳(メタデータ) (2020-01-04T08:55:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。