論文の概要: The Impact of Different Backbone Architecture on Autonomous Vehicle
Dataset
- arxiv url: http://arxiv.org/abs/2309.08564v1
- Date: Fri, 15 Sep 2023 17:32:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-18 13:29:13.268396
- Title: The Impact of Different Backbone Architecture on Autonomous Vehicle
Dataset
- Title(参考訳): 異なるバックボーンアーキテクチャが自動運転車データセットに与える影響
- Authors: Ning Ding, Azim Eskandarian
- Abstract要約: バックボーンアーキテクチャによって抽出された特徴の質は、全体的な検出性能に大きな影響を与える可能性がある。
本研究は,KITTI,NuScenes,BDDの3つの自律走行車データセットを評価し,対象検出タスクにおける異なるバックボーンアーキテクチャの性能を比較した。
- 参考スコア(独自算出の注目度): 120.08736654413637
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object detection is a crucial component of autonomous driving, and many
detection applications have been developed to address this task. These
applications often rely on backbone architectures, which extract representation
features from inputs to perform the object detection task. The quality of the
features extracted by the backbone architecture can have a significant impact
on the overall detection performance. Many researchers have focused on
developing new and improved backbone architectures to enhance the efficiency
and accuracy of object detection applications. While these backbone
architectures have shown state-of-the-art performance on generic object
detection datasets like MS-COCO and PASCAL-VOC, evaluating their performance
under an autonomous driving environment has not been previously explored. To
address this, our study evaluates three well-known autonomous vehicle datasets,
namely KITTI, NuScenes, and BDD, to compare the performance of different
backbone architectures on object detection tasks.
- Abstract(参考訳): 物体検出は自動運転の重要な要素であり、この課題に対処するために多くの検出アプリケーションが開発されている。
これらのアプリケーションは、しばしばbackboneアーキテクチャに依存しており、オブジェクト検出タスクを実行するために入力から表現機能を抽出する。
バックボーンアーキテクチャによって抽出された特徴の品質は、全体的な検出性能に大きな影響を与える可能性がある。
多くの研究者は、オブジェクト検出アプリケーションの効率と正確性を高めるために、新しく改良されたバックボーンアーキテクチャの開発に注力している。
これらのバックボーンアーキテクチャはMS-COCOやPASCAL-VOCのような汎用オブジェクト検出データセット上での最先端のパフォーマンスを示しているが、自律運転環境下でのパフォーマンスの評価は従来検討されていない。
そこで本研究では,KITTI,NuScenes,BDDの3つの自律走行車データセットを評価し,対象検出タスクにおける異なるバックボーンアーキテクチャの性能を比較した。
関連論文リスト
- Correlation of Object Detection Performance with Visual Saliency and Depth Estimation [0.09208007322096533]
本稿では,物体検出精度と,深度予測と視覚塩分率予測の2つの基本的な視覚的課題の相関について検討する。
分析の結果,これらの相関は対象のカテゴリ間で有意な変化を示し,相関値がより小さいオブジェクトの最大3倍も大きいことが判明した。
これらの結果から, 物体検出アーキテクチャに視覚的サリエンシ機能を組み込むことは, 深度情報よりも有益であることが示唆された。
論文 参考訳(メタデータ) (2024-11-05T06:34:19Z) - RTMDet: An Empirical Study of Designing Real-Time Object Detectors [13.09100888887757]
我々は、YOLO級数を超え、多くのオブジェクト認識タスクに容易に対応できる効率的なリアルタイム物体検出装置を開発した。
より良いトレーニング技術とともに、得られたオブジェクト検出器はRTMDetと呼ばれ、COCOでは52.8%AP、NVIDIA 3090 GPUでは300以上のFPSを達成している。
実験結果によって、多くの物体認識タスクのための汎用的リアルタイム物体検出器の設計に関する新たな洞察が得られればと願っている。
論文 参考訳(メタデータ) (2022-12-14T18:50:20Z) - Neural Architecture Adaptation for Object Detection by Searching Channel
Dimensions and Mapping Pre-trained Parameters [17.090405682103167]
ほとんどのオブジェクト検出フレームワークは、元来画像分類用に設計されたバックボーンアーキテクチャを使用する。
最近のニューラルアーキテクチャサーチ(NAS)研究は、オブジェクト検出に特化したバックボーンの自動設計が全体的な精度を向上させることを実証している。
本稿では,検出目的のために与えられたバックボーンを最適化するニューラルアーキテクチャ適応手法を提案する。
論文 参考訳(メタデータ) (2022-06-17T02:01:56Z) - Complex-Valued Autoencoders for Object Discovery [62.26260974933819]
本稿では,オブジェクト中心表現に対する分散アプローチとして,複合オートエンコーダを提案する。
このシンプルで効率的なアプローチは、単純なマルチオブジェクトデータセット上の等価な実数値オートエンコーダよりも、より良い再構成性能を実現することを示す。
また、2つのデータセット上のSlotAttentionモデルと競合しないオブジェクト発見性能を実現し、SlotAttentionが失敗する第3のデータセットでオブジェクトをアンタングルする。
論文 参考訳(メタデータ) (2022-04-05T09:25:28Z) - Contrastive Object Detection Using Knowledge Graph Embeddings [72.17159795485915]
一つのホットアプローチで学習したクラス埋め込みの誤差統計と、自然言語処理や知識グラフから意味的に構造化された埋め込みを比較した。
本稿では,キーポイントベースおよびトランスフォーマーベースオブジェクト検出アーキテクチャの知識埋め込み設計を提案する。
論文 参考訳(メタデータ) (2021-12-21T17:10:21Z) - Robust Object Detection via Instance-Level Temporal Cycle Confusion [89.1027433760578]
物体検出器の分布外一般化を改善するための補助的自己監視タスクの有効性を検討する。
最大エントロピーの原理に触発されて,新しい自己監督タスクであるインスタンスレベル時間サイクル混乱(cycconf)を導入する。
それぞれのオブジェクトに対して、タスクは、ビデオ内の隣接するフレームで最も異なるオブジェクトの提案を見つけ、自己スーパービジョンのために自分自身にサイクルバックすることです。
論文 参考訳(メタデータ) (2021-04-16T21:35:08Z) - A Multisensory Learning Architecture for Rotation-invariant Object
Recognition [0.0]
本研究では,iCubロボットを用いて構築した新しいデータセットを用いて,物体認識のための多感覚機械学習アーキテクチャを提案する。
提案アーキテクチャでは、畳み込みニューラルネットワークを用いて、グレースケールカラー画像の表現(すなわち特徴)と深度データを処理するための多層パーセプトロンアルゴリズムを組み合わせる。
論文 参考訳(メタデータ) (2020-09-14T09:39:48Z) - Towards Automated Neural Interaction Discovery for Click-Through Rate
Prediction [64.03526633651218]
CTR(Click-Through Rate)予測は、レコメンダシステムにおいて最も重要な機械学習タスクの1つである。
本稿では,AutoCTR と呼ばれる CTR 予測のための自動インタラクションアーキテクチャ探索フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-29T04:33:01Z) - Look-into-Object: Self-supervised Structure Modeling for Object
Recognition [71.68524003173219]
我々は,自己スーパービジョンを取り入れた「対象」(具体的かつ内在的に対象構造をモデル化する)を提案する。
認識バックボーンは、より堅牢な表現学習のために大幅に拡張可能であることを示す。
提案手法は汎用オブジェクト認識(ImageNet)や細粒度オブジェクト認識タスク(CUB, Cars, Aircraft)など,多数のベンチマークにおいて大きなパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2020-03-31T12:22:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。