論文の概要: Generalized Few-Shot 3D Object Detection of LiDAR Point Cloud for
Autonomous Driving
- arxiv url: http://arxiv.org/abs/2302.03914v1
- Date: Wed, 8 Feb 2023 07:11:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-09 17:05:33.699436
- Title: Generalized Few-Shot 3D Object Detection of LiDAR Point Cloud for
Autonomous Driving
- Title(参考訳): 自律走行用LiDAR点雲の一般ショット3次元物体検出
- Authors: Jiawei Liu and Xingping Dong and Sanyuan Zhao and Jianbing Shen
- Abstract要約: 我々は,一般的な(ベース)オブジェクトに対して大量のトレーニングデータを持つが,レア(ノーベル)クラスに対してはごく少数のデータしか持たない,一般化された数発の3Dオブジェクト検出という新しいタスクを提案する。
具体的には、画像と点雲の奥行きの違いを分析し、3D LiDARデータセットにおける少数ショット設定の実践的原理を示す。
この課題を解決するために,既存の3次元検出モデルを拡張し,一般的なオブジェクトと稀なオブジェクトの両方を認識するためのインクリメンタルな微調整手法を提案する。
- 参考スコア(独自算出の注目度): 91.39625612027386
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent years have witnessed huge successes in 3D object detection to
recognize common objects for autonomous driving (e.g., vehicles and
pedestrians). However, most methods rely heavily on a large amount of
well-labeled training data. This limits their capability of detecting rare
fine-grained objects (e.g., police cars and ambulances), which is important for
special cases, such as emergency rescue, and so on. To achieve simultaneous
detection for both common and rare objects, we propose a novel task, called
generalized few-shot 3D object detection, where we have a large amount of
training data for common (base) objects, but only a few data for rare (novel)
classes. Specifically, we analyze in-depth differences between images and point
clouds, and then present a practical principle for the few-shot setting in the
3D LiDAR dataset. To solve this task, we propose a simple and effective
detection framework, including (1) an incremental fine-tuning method to extend
existing 3D detection models to recognize both common and rare objects, and (2)
a sample adaptive balance loss to alleviate the issue of long-tailed data
distribution in autonomous driving scenarios. On the nuScenes dataset, we
conduct sufficient experiments to demonstrate that our approach can
successfully detect the rare (novel) classes that contain only a few training
data, while also maintaining the detection accuracy of common objects.
- Abstract(参考訳): 近年では、自動運転車(例えば、車や歩行者)の共通物体を認識する3dオブジェクト検出が大きな成功を収めている。
しかし、ほとんどの手法は十分なラベル付きトレーニングデータに大きく依存している。
これにより、緊急救助などの特殊事件において重要なまれな細粒度物体(例えば、警察車や救急車)を検出する能力が制限される。
共通オブジェクトとレアオブジェクトの同時検出を実現するために,共通オブジェクト(ベース)用のトレーニングデータが多いが,レアオブジェクト(ノベル)クラスのデータが少ないという,一般化されたマイズショット3dオブジェクト検出という新しいタスクを提案する。
具体的には、画像と点雲の奥行きの違いを分析し、3D LiDARデータセットにおける少数ショット設定の実践的原理を示す。
そこで本研究では,(1)一般物体とレア物体の両方を認識するために,既存の3次元検出モデルを拡張するインクリメンタルな微調整法,(2)自動運転シナリオにおけるロングテールデータ分布の問題を緩和するためのサンプル適応バランス損失法など,簡便で効果的な検出フレームワークを提案する。
nuScenesデータセットでは,いくつかのトレーニングデータのみを含む希少な(ノベルな)クラスを,一般的なオブジェクトの検出精度を維持しながら検出できることを実証するために十分な実験を行う。
関連論文リスト
- STONE: A Submodular Optimization Framework for Active 3D Object Detection [20.54906045954377]
正確な3Dオブジェクト検出器をトレーニングするための鍵となる要件は、大量のLiDARベースのポイントクラウドデータが利用できることである。
本稿では,3次元物体検出装置のトレーニングにおけるラベル付けコストを大幅に削減する,統合されたアクティブな3次元物体検出フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-04T20:45:33Z) - Approaching Outside: Scaling Unsupervised 3D Object Detection from 2D Scene [22.297964850282177]
教師なし3次元検出のためのLiDAR-2D Self-paced Learning (LiSe)を提案する。
RGB画像は、正確な2Dローカライゼーションキューを提供するLiDARデータの貴重な補完となる。
本フレームワークでは,適応型サンプリングと弱いモデルアグリゲーション戦略を組み込んだ自己評価学習パイプラインを考案する。
論文 参考訳(メタデータ) (2024-07-11T14:58:49Z) - Shelf-Supervised Cross-Modal Pre-Training for 3D Object Detection [52.66283064389691]
最先端の3Dオブジェクト検出器は、しばしば大量のラベル付きデータセットで訓練される。
近年の研究では、ラベル付きデータによる自己教師付き事前学習が、ラベル付きラベルによる検出精度を向上させることが示されている。
組合わせRGBとLiDARデータからゼロショット3Dバウンディングボックスを生成するためのシェルフ制御手法を提案する。
論文 参考訳(メタデータ) (2024-06-14T15:21:57Z) - Unsupervised Domain Adaptation for Self-Driving from Past Traversal
Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。
提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。
実世界のデータセットの実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-09-21T15:00:31Z) - View-to-Label: Multi-View Consistency for Self-Supervised 3D Object
Detection [46.077668660248534]
本稿では,RGBシーケンスのみから,自己監督型3Dオブジェクト検出を行う手法を提案する。
KITTI 3Dデータセットを用いた実験では,最先端の自己管理手法と同等の性能を示した。
論文 参考訳(メタデータ) (2023-05-29T09:30:39Z) - DR-WLC: Dimensionality Reduction cognition for object detection and pose
estimation by Watching, Learning and Checking [30.58114448119465]
既存の物体検出法とポーズ推定法は、主に訓練に同次元のデータを用いる。
次元減少認知モデルであるDR-WLCは、物体検出と推定タスクを同時に行うことができる。
論文 参考訳(メタデータ) (2023-01-17T15:08:32Z) - Weakly Supervised Training of Monocular 3D Object Detectors Using Wide
Baseline Multi-view Traffic Camera Data [19.63193201107591]
交差点における車両の7DoF予測は,道路利用者間の潜在的な衝突を評価する上で重要な課題である。
交通監視カメラ用3次元物体検出装置の微調整を弱教師付きで行う手法を開発した。
提案手法は,自動運転車のデータセット上で最上位のモノクル3Dオブジェクト検出器と同等の精度で車両の7DoFの予測精度を推定する。
論文 参考訳(メタデータ) (2021-10-21T08:26:48Z) - Anomaly Detection in Video via Self-Supervised and Multi-Task Learning [113.81927544121625]
ビデオにおける異常検出は、コンピュータビジョンの問題である。
本稿では,オブジェクトレベルでの自己教師型およびマルチタスク学習を通じて,ビデオ中の異常事象検出にアプローチする。
論文 参考訳(メタデータ) (2020-11-15T10:21:28Z) - Train in Germany, Test in The USA: Making 3D Object Detectors Generalize [59.455225176042404]
ディープラーニングにより、LiDARやステレオカメラデータなどの3Dオブジェクト検出精度が大幅に向上した。
自動運転のためのほとんどのデータセットは、1つの国内の都市の狭い部分で収集される。
本稿では,あるデータセットから別のデータセットに3Dオブジェクト検出器を適応させる作業について考察する。
論文 参考訳(メタデータ) (2020-05-17T00:56:18Z) - SESS: Self-Ensembling Semi-Supervised 3D Object Detection [138.80825169240302]
具体的には、ラベルのない新しい未知のデータに基づくネットワークの一般化を促進するための、徹底的な摂動スキームを設計する。
我々のSESSは、50%のラベル付きデータを用いて、最先端の完全教師付き手法と比較して、競争性能を達成している。
論文 参考訳(メタデータ) (2019-12-26T08:48:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。