論文の概要: Rethinking the Detection Head Configuration for Traffic Object Detection
- arxiv url: http://arxiv.org/abs/2210.03883v1
- Date: Sat, 8 Oct 2022 02:23:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-11 19:07:46.198827
- Title: Rethinking the Detection Head Configuration for Traffic Object Detection
- Title(参考訳): トラヒック物体検出のための検出ヘッド構成の再考
- Authors: Yi Shi, Jiang Wu, Shixuan Zhao, Gangyao Gao, Tao Deng and Hongmei Yan
- Abstract要約: 本稿では,検出ヘッドとオブジェクト分布のマッチングに基づいて,軽量なトラフィックオブジェクト検出ネットワークを提案する。
提案したモデルでは,BDD100Kデータセットと提案したETFOD-v2データセットの他のモデルよりも,より競争力のあるパフォーマンスを実現している。
- 参考スコア(独自算出の注目度): 11.526701794026641
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-scale detection plays an important role in object detection models.
However, researchers usually feel blank on how to reasonably configure
detection heads combining multi-scale features at different input resolutions.
We find that there are different matching relationships between the object
distribution and the detection head at different input resolutions. Based on
the instructive findings, we propose a lightweight traffic object detection
network based on matching between detection head and object distribution,
termed as MHD-Net. It consists of three main parts. The first is the detection
head and object distribution matching strategy, which guides the rational
configuration of detection head, so as to leverage multi-scale features to
effectively detect objects at vastly different scales. The second is the
cross-scale detection head configuration guideline, which instructs to replace
multiple detection heads with only two detection heads possessing of rich
feature representations to achieve an excellent balance between detection
accuracy, model parameters, FLOPs and detection speed. The third is the
receptive field enlargement method, which combines the dilated convolution
module with shallow features of backbone to further improve the detection
accuracy at the cost of increasing model parameters very slightly. The proposed
model achieves more competitive performance than other models on BDD100K
dataset and our proposed ETFOD-v2 dataset. The code will be available.
- Abstract(参考訳): オブジェクト検出モデルでは,マルチスケール検出が重要な役割を果たす。
しかし、研究者は通常、異なる入力解像度のマルチスケール特徴を組み合わせた検出ヘッドを合理的に設定する方法について空白を感じている。
オブジェクト分布と検出ヘッドの間に異なる一致関係が、異なる入力解像度で存在することがわかった。
そこで本研究では,MHD-Netと呼ばれる検出ヘッドとオブジェクト分布のマッチングに基づく,軽量なトラフィックオブジェクト検出ネットワークを提案する。
主に3つの部分からなる。
ひとつは検出ヘッドとオブジェクト分散マッチング戦略で、検出ヘッドの合理的な構成を導くことで、マルチスケール機能を活用して、非常に異なるスケールでオブジェクトを効果的に検出する。
2つ目は、複数の検出ヘッドをリッチな特徴表現を持つ2つの検出ヘッドのみに置き換えて、検出精度、モデルパラメータ、FLOP、検出速度のバランスを良くするクロススケール検出ヘッド構成ガイドラインである。
3つ目はレセプティブ・フィールド拡大法であり、拡張畳み込みモジュールとbackboneの浅い特徴を組み合わせることで、モデルパラメータを非常にわずかに増加させるコストで検出精度をさらに向上させる。
提案したモデルでは,BDD100Kデータセットと提案したETFOD-v2データセットの他のモデルよりも高い競争性能を実現している。
コードは利用可能だ。
関連論文リスト
- Boosting 3D Object Detection with Semantic-Aware Multi-Branch Framework [44.44329455757931]
自律走行では、LiDARセンサーは3Dポイントの雲の取得に不可欠であり、信頼できる幾何学的情報を提供する。
従来の前処理のサンプリング手法は意味的特徴を無視することが多く、詳細な損失や接地点干渉を引き起こす。
本稿では,Semantic-aware Multi-branch Smpling (SMS)モジュールとマルチビュー制約を用いたマルチブランチ2次元オブジェクト検出フレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-08T09:25:45Z) - Towards Unified 3D Object Detection via Algorithm and Data Unification [70.27631528933482]
我々は、最初の統一型マルチモーダル3Dオブジェクト検出ベンチマークMM-Omni3Dを構築し、上記のモノクロ検出器をマルチモーダルバージョンに拡張する。
設計した単分子・多モード検出器をそれぞれUniMODEとMM-UniMODEと命名した。
論文 参考訳(メタデータ) (2024-02-28T18:59:31Z) - S$^3$-MonoDETR: Supervised Shape&Scale-perceptive Deformable Transformer for Monocular 3D Object Detection [21.96072831561483]
本稿では,モノクロ3次元物体検出のためのSupervised Shape&Scale-perceptive Deformable Attention' (S$3$-DA) モジュールを提案する。
これにより、S$3$-DAは、任意のカテゴリに属するクエリポイントに対する受容的フィールドを効果的に推定し、堅牢なクエリ機能を生成することができる。
KITTIとOpenデータセットの実験では、S$3$-DAが検出精度を大幅に向上することが示された。
論文 参考訳(メタデータ) (2023-09-02T12:36:38Z) - Multi-level and multi-modal feature fusion for accurate 3D object
detection in Connected and Automated Vehicles [0.8701566919381223]
本稿では,3段階特徴抽出器を用いたディープニューラルネットワークを用いた3次元物体検出モデルを提案する。
提案した特徴抽出器は、2つの入力感覚モーダルから高次特徴を抽出し、畳み込み過程に捨てられた重要な特徴を回収する。
新たな融合方式は、感覚のモダリティと畳み込み層を効果的に融合させ、最も優れたグローバルな特徴を見出す。
論文 参考訳(メタデータ) (2022-12-15T00:25:05Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - R(Det)^2: Randomized Decision Routing for Object Detection [64.48369663018376]
本稿では,決定木とディープニューラルネットワークをエンドツーエンドの学習方法で組み合わせたオブジェクト検出手法を提案する。
効率的な学習を容易にするために,ノード選択型および連想型損失を伴うランダム化決定経路を提案する。
このアプローチをオブジェクト検出のためのランダム化決定ルーティングとして、R(Det)$2$と略す。
論文 参考訳(メタデータ) (2022-04-02T07:54:58Z) - A More Compact Object Detector Head Network with Feature Enhancement and
Relational Reasoning [4.171249457570931]
よりコンパクトなオブジェクト検出器ヘッドネットワーク(CODH)を提案する。
提案手法では,ヘッドネットワークのパラメータは最先端のカスケードR-CNNより0.6倍小さいが,COCOテストデブでは1.3%向上する。
論文 参考訳(メタデータ) (2021-06-28T08:38:57Z) - M3DSSD: Monocular 3D Single Stage Object Detector [82.25793227026443]
特徴アライメントと非対称非局所的注意を有するモノクロ3次元単段物体検出器(M3DSSD)を提案する。
提案したM3DSSDは,KITTIデータセット上のモノラルな3Dオブジェクト検出手法よりも大幅に性能が向上する。
論文 参考訳(メタデータ) (2021-03-24T13:09:11Z) - Condensing Two-stage Detection with Automatic Object Key Part Discovery [87.1034745775229]
2段階の物体検出器は通常、高い精度を達成するために、検出ヘッドのために過度に大きなモデルを必要とする。
そこで本研究では,2段階検出ヘッドのモデルパラメータを,対象キー部分に集中させることで縮合・縮小できることを示す。
提案手法は、一般的な2段検出ヘッドのモデルパラメータの約50%を放棄しながら、元の性能を一貫して維持する。
論文 参考訳(メタデータ) (2020-06-10T01:20:47Z) - FairMOT: On the Fairness of Detection and Re-Identification in Multiple
Object Tracking [92.48078680697311]
マルチオブジェクトトラッキング(MOT)はコンピュータビジョンにおいて重要な問題である。
本稿では,FairMOTと呼ばれる,アンカーフリーなオブジェクト検出アーキテクチャCenterNetをベースとした,シンプルかつ効果的なアプローチを提案する。
このアプローチは、検出と追跡の両方において高い精度を達成する。
論文 参考訳(メタデータ) (2020-04-04T08:18:00Z) - Pixel-Semantic Revise of Position Learning A One-Stage Object Detector
with A Shared Encoder-Decoder [5.371825910267909]
異なる手法がオブジェクトを適応的に検出することを分析する。
いくつかの最先端検出器は、異なる特徴ピラミッドと多レベルセマンティック情報を強化するための多くのメカニズムを組み合わせている。
この研究は、注意機構を持つ共有エンコーダデコーダを持つアンカーフリー検出器によって対処される。
論文 参考訳(メタデータ) (2020-01-04T08:55:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。