論文の概要: Generalized Few-Shot 3D Object Detection of LiDAR Point Cloud for
Autonomous Driving
- arxiv url: http://arxiv.org/abs/2302.03914v1
- Date: Wed, 8 Feb 2023 07:11:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-09 17:05:33.699436
- Title: Generalized Few-Shot 3D Object Detection of LiDAR Point Cloud for
Autonomous Driving
- Title(参考訳): 自律走行用LiDAR点雲の一般ショット3次元物体検出
- Authors: Jiawei Liu and Xingping Dong and Sanyuan Zhao and Jianbing Shen
- Abstract要約: 我々は,一般的な(ベース)オブジェクトに対して大量のトレーニングデータを持つが,レア(ノーベル)クラスに対してはごく少数のデータしか持たない,一般化された数発の3Dオブジェクト検出という新しいタスクを提案する。
具体的には、画像と点雲の奥行きの違いを分析し、3D LiDARデータセットにおける少数ショット設定の実践的原理を示す。
この課題を解決するために,既存の3次元検出モデルを拡張し,一般的なオブジェクトと稀なオブジェクトの両方を認識するためのインクリメンタルな微調整手法を提案する。
- 参考スコア(独自算出の注目度): 91.39625612027386
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent years have witnessed huge successes in 3D object detection to
recognize common objects for autonomous driving (e.g., vehicles and
pedestrians). However, most methods rely heavily on a large amount of
well-labeled training data. This limits their capability of detecting rare
fine-grained objects (e.g., police cars and ambulances), which is important for
special cases, such as emergency rescue, and so on. To achieve simultaneous
detection for both common and rare objects, we propose a novel task, called
generalized few-shot 3D object detection, where we have a large amount of
training data for common (base) objects, but only a few data for rare (novel)
classes. Specifically, we analyze in-depth differences between images and point
clouds, and then present a practical principle for the few-shot setting in the
3D LiDAR dataset. To solve this task, we propose a simple and effective
detection framework, including (1) an incremental fine-tuning method to extend
existing 3D detection models to recognize both common and rare objects, and (2)
a sample adaptive balance loss to alleviate the issue of long-tailed data
distribution in autonomous driving scenarios. On the nuScenes dataset, we
conduct sufficient experiments to demonstrate that our approach can
successfully detect the rare (novel) classes that contain only a few training
data, while also maintaining the detection accuracy of common objects.
- Abstract(参考訳): 近年では、自動運転車(例えば、車や歩行者)の共通物体を認識する3dオブジェクト検出が大きな成功を収めている。
しかし、ほとんどの手法は十分なラベル付きトレーニングデータに大きく依存している。
これにより、緊急救助などの特殊事件において重要なまれな細粒度物体(例えば、警察車や救急車)を検出する能力が制限される。
共通オブジェクトとレアオブジェクトの同時検出を実現するために,共通オブジェクト(ベース)用のトレーニングデータが多いが,レアオブジェクト(ノベル)クラスのデータが少ないという,一般化されたマイズショット3dオブジェクト検出という新しいタスクを提案する。
具体的には、画像と点雲の奥行きの違いを分析し、3D LiDARデータセットにおける少数ショット設定の実践的原理を示す。
そこで本研究では,(1)一般物体とレア物体の両方を認識するために,既存の3次元検出モデルを拡張するインクリメンタルな微調整法,(2)自動運転シナリオにおけるロングテールデータ分布の問題を緩和するためのサンプル適応バランス損失法など,簡便で効果的な検出フレームワークを提案する。
nuScenesデータセットでは,いくつかのトレーニングデータのみを含む希少な(ノベルな)クラスを,一般的なオブジェクトの検出精度を維持しながら検出できることを実証するために十分な実験を行う。
関連論文リスト
- Unsupervised Domain Adaptation for Self-Driving from Past Traversal
Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。
提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。
実世界のデータセットの実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-09-21T15:00:31Z) - 3D Adversarial Augmentations for Robust Out-of-Domain Predictions [115.74319739738571]
ドメイン外データへの一般化の改善に注力する。
対象を逆向きに変形させるベクトルの集合を学習する。
本研究では,学習したサンプル非依存ベクトルをモデルトレーニング時に利用可能なオブジェクトに適用することにより,対数拡大を行う。
論文 参考訳(メタデータ) (2023-08-29T17:58:55Z) - PatchContrast: Self-Supervised Pre-training for 3D Object Detection [14.603858163158625]
PatchContrastは、3Dオブジェクト検出のための新しい自己教師付きポイントクラウド事前学習フレームワークである。
提案手法は,3つの一般的な3次元検出データセットにおいて,既存の最先端モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-08-14T07:45:54Z) - View-to-Label: Multi-View Consistency for Self-Supervised 3D Object
Detection [46.077668660248534]
本稿では,RGBシーケンスのみから,自己監督型3Dオブジェクト検出を行う手法を提案する。
KITTI 3Dデータセットを用いた実験では,最先端の自己管理手法と同等の性能を示した。
論文 参考訳(メタデータ) (2023-05-29T09:30:39Z) - DR-WLC: Dimensionality Reduction cognition for object detection and pose
estimation by Watching, Learning and Checking [30.58114448119465]
既存の物体検出法とポーズ推定法は、主に訓練に同次元のデータを用いる。
次元減少認知モデルであるDR-WLCは、物体検出と推定タスクを同時に行うことができる。
論文 参考訳(メタデータ) (2023-01-17T15:08:32Z) - Improving the Intra-class Long-tail in 3D Detection via Rare Example
Mining [29.699694480757472]
最高のパフォーマンスモデルでさえ、まれな例では最も単純なミスに悩まされます。
データサポートの欠如によるレアネスが3次元検出器におけるデータ中心の改善の鍵であることを示す。
本稿では,特徴空間における密度推定に基づいて,物体の希少性を同定する汎用的かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2022-10-15T20:52:07Z) - Weakly Supervised Training of Monocular 3D Object Detectors Using Wide
Baseline Multi-view Traffic Camera Data [19.63193201107591]
交差点における車両の7DoF予測は,道路利用者間の潜在的な衝突を評価する上で重要な課題である。
交通監視カメラ用3次元物体検出装置の微調整を弱教師付きで行う手法を開発した。
提案手法は,自動運転車のデータセット上で最上位のモノクル3Dオブジェクト検出器と同等の精度で車両の7DoFの予測精度を推定する。
論文 参考訳(メタデータ) (2021-10-21T08:26:48Z) - Anomaly Detection in Video via Self-Supervised and Multi-Task Learning [113.81927544121625]
ビデオにおける異常検出は、コンピュータビジョンの問題である。
本稿では,オブジェクトレベルでの自己教師型およびマルチタスク学習を通じて,ビデオ中の異常事象検出にアプローチする。
論文 参考訳(メタデータ) (2020-11-15T10:21:28Z) - Train in Germany, Test in The USA: Making 3D Object Detectors Generalize [59.455225176042404]
ディープラーニングにより、LiDARやステレオカメラデータなどの3Dオブジェクト検出精度が大幅に向上した。
自動運転のためのほとんどのデータセットは、1つの国内の都市の狭い部分で収集される。
本稿では,あるデータセットから別のデータセットに3Dオブジェクト検出器を適応させる作業について考察する。
論文 参考訳(メタデータ) (2020-05-17T00:56:18Z) - SESS: Self-Ensembling Semi-Supervised 3D Object Detection [138.80825169240302]
具体的には、ラベルのない新しい未知のデータに基づくネットワークの一般化を促進するための、徹底的な摂動スキームを設計する。
我々のSESSは、50%のラベル付きデータを用いて、最先端の完全教師付き手法と比較して、競争性能を達成している。
論文 参考訳(メタデータ) (2019-12-26T08:48:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。