Fugu-MT 論文翻訳(概要): Generalized Few-Shot 3D Object Detection of LiDAR Point Cloud for Autonomous Driving

論文の概要: Generalized Few-Shot 3D Object Detection of LiDAR Point Cloud for Autonomous Driving

arxiv url: http://arxiv.org/abs/2302.03914v1
Date: Wed, 8 Feb 2023 07:11:36 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-09 17:05:33.699436
Title: Generalized Few-Shot 3D Object Detection of LiDAR Point Cloud for Autonomous Driving
Title（参考訳）: 自律走行用LiDAR点雲の一般ショット3次元物体検出
Authors: Jiawei Liu and Xingping Dong and Sanyuan Zhao and Jianbing Shen
Abstract要約: 我々は,一般的な(ベース)オブジェクトに対して大量のトレーニングデータを持つが,レア(ノーベル)クラスに対してはごく少数のデータしか持たない,一般化された数発の3Dオブジェクト検出という新しいタスクを提案する。具体的には、画像と点雲の奥行きの違いを分析し、3D LiDARデータセットにおける少数ショット設定の実践的原理を示す。この課題を解決するために,既存の3次元検出モデルを拡張し,一般的なオブジェクトと稀なオブジェクトの両方を認識するためのインクリメンタルな微調整手法を提案する。
参考スコア（独自算出の注目度）: 91.39625612027386
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Recent years have witnessed huge successes in 3D object detection to recognize common objects for autonomous driving (e.g., vehicles and pedestrians). However, most methods rely heavily on a large amount of well-labeled training data. This limits their capability of detecting rare fine-grained objects (e.g., police cars and ambulances), which is important for special cases, such as emergency rescue, and so on. To achieve simultaneous detection for both common and rare objects, we propose a novel task, called generalized few-shot 3D object detection, where we have a large amount of training data for common (base) objects, but only a few data for rare (novel) classes. Specifically, we analyze in-depth differences between images and point clouds, and then present a practical principle for the few-shot setting in the 3D LiDAR dataset. To solve this task, we propose a simple and effective detection framework, including (1) an incremental fine-tuning method to extend existing 3D detection models to recognize both common and rare objects, and (2) a sample adaptive balance loss to alleviate the issue of long-tailed data distribution in autonomous driving scenarios. On the nuScenes dataset, we conduct sufficient experiments to demonstrate that our approach can successfully detect the rare (novel) classes that contain only a few training data, while also maintaining the detection accuracy of common objects.
Abstract（参考訳）: 近年では、自動運転車(例えば、車や歩行者)の共通物体を認識する3dオブジェクト検出が大きな成功を収めている。しかし、ほとんどの手法は十分なラベル付きトレーニングデータに大きく依存している。これにより、緊急救助などの特殊事件において重要なまれな細粒度物体(例えば、警察車や救急車)を検出する能力が制限される。共通オブジェクトとレアオブジェクトの同時検出を実現するために,共通オブジェクト(ベース)用のトレーニングデータが多いが,レアオブジェクト(ノベル)クラスのデータが少ないという,一般化されたマイズショット3dオブジェクト検出という新しいタスクを提案する。具体的には、画像と点雲の奥行きの違いを分析し、3D LiDARデータセットにおける少数ショット設定の実践的原理を示す。そこで本研究では,(1)一般物体とレア物体の両方を認識するために,既存の3次元検出モデルを拡張するインクリメンタルな微調整法,(2)自動運転シナリオにおけるロングテールデータ分布の問題を緩和するためのサンプル適応バランス損失法など,簡便で効果的な検出フレームワークを提案する。 nuScenesデータセットでは,いくつかのトレーニングデータのみを含む希少な(ノベルな)クラスを,一般的なオブジェクトの検出精度を維持しながら検出できることを実証するために十分な実験を行う。

関連論文リスト

Concept-based Explainable Data Mining with VLM for 3D Detection [0.0]
本稿では、2次元視覚言語モデルを利用して、運転シーンからレアな物体を識別・マイニングする新しいクロスモーダルフレームワークを提案する。提案手法は,オブジェクト検出,意味的特徴抽出,次元減少,多面外乱検出などの相補的手法を合成する。 nuScenesデータセットの実験では、この概念に基づくデータマイニング戦略により、3Dオブジェクト検出モデルの性能が向上することが示された。
論文参考訳（メタデータ） (2025-12-05T07:18:45Z)
PLOT: Pseudo-Labeling via Video Object Tracking for Scalable Monocular 3D Object Detection [35.524943073010675]
モノクロ3Dオブジェクト検出(M3OD)は、高アノテーションコストと固有の2Dから3Dの曖昧さに起因するデータの不足により、長年にわたって課題に直面してきた。ビデオデータのみを使用し、マルチビュー設定、追加センサー、カメラポーズ、ドメイン固有のトレーニングを必要とせず、より堅牢な疑似ラベルフレームワークを提案する。
論文参考訳（メタデータ） (2025-07-03T07:46:39Z)
Spotting the Unexpected (STU): A 3D LiDAR Dataset for Anomaly Segmentation in Autonomous Driving [14.403130104985557]
本稿では,運転シナリオにおける異常セグメンテーションのための新しいデータセットを提案する。これは、密集した3Dセマンティックラベリングによる道路異常セグメンテーションに焦点を当てた初めての公開データセットである。データセットと評価コードは公開され、さまざまなアプローチのテストとパフォーマンスの比較が容易になります。
論文参考訳（メタデータ） (2025-05-04T15:15:35Z)
MonoSOWA: Scalable monocular 3D Object detector Without human Annotations [0.0]
本稿では,ドメイン固有のアノテーションを使わずに,単一のRGBカメラから3Dオブジェクト検出器をトレーニングする方法を提案する。この手法は3つの公開データセットで評価され、人間のラベルを使わずに、先行研究よりもかなりの差で性能が向上する。
論文参考訳（メタデータ） (2025-01-16T11:35:22Z)
STONE: A Submodular Optimization Framework for Active 3D Object Detection [20.54906045954377]
正確な3Dオブジェクト検出器をトレーニングするための鍵となる要件は、大量のLiDARベースのポイントクラウドデータが利用できることである。本稿では,3次元物体検出装置のトレーニングにおけるラベル付けコストを大幅に削減する,統合されたアクティブな3次元物体検出フレームワークを提案する。
論文参考訳（メタデータ） (2024-10-04T20:45:33Z)
Approaching Outside: Scaling Unsupervised 3D Object Detection from 2D Scene [22.297964850282177]
教師なし3次元検出のためのLiDAR-2D Self-paced Learning (LiSe)を提案する。 RGB画像は、正確な2Dローカライゼーションキューを提供するLiDARデータの貴重な補完となる。本フレームワークでは,適応型サンプリングと弱いモデルアグリゲーション戦略を組み込んだ自己評価学習パイプラインを考案する。
論文参考訳（メタデータ） (2024-07-11T14:58:49Z)
Shelf-Supervised Cross-Modal Pre-Training for 3D Object Detection [52.66283064389691]
最先端の3Dオブジェクト検出器は、しばしば大量のラベル付きデータセットで訓練される。近年の研究では、ラベル付きデータによる自己教師付き事前学習が、ラベル付きラベルによる検出精度を向上させることが示されている。組合わせRGBとLiDARデータからゼロショット3Dバウンディングボックスを生成するためのシェルフ制御手法を提案する。
論文参考訳（メタデータ） (2024-06-14T15:21:57Z)
Find n' Propagate: Open-Vocabulary 3D Object Detection in Urban Environments [67.83787474506073]
我々は,現在のLiDARに基づく3Dオブジェクト検出システムの限界に対処する。本稿では,3次元OVタスクに対する汎用textscFind n' Propagate アプローチを提案する。我々は、新しいオブジェクトクラスに対する平均精度(AP)を最大3.97倍に向上させる。
論文参考訳（メタデータ） (2024-03-20T12:51:30Z)
Unsupervised Domain Adaptation for Self-Driving from Past Traversal Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。実世界のデータセットの実験では、大幅な改善が示されている。
論文参考訳（メタデータ） (2023-09-21T15:00:31Z)
View-to-Label: Multi-View Consistency for Self-Supervised 3D Object Detection [46.077668660248534]
本稿では,RGBシーケンスのみから,自己監督型3Dオブジェクト検出を行う手法を提案する。 KITTI 3Dデータセットを用いた実験では,最先端の自己管理手法と同等の性能を示した。
論文参考訳（メタデータ） (2023-05-29T09:30:39Z)
DR-WLC: Dimensionality Reduction cognition for object detection and pose estimation by Watching, Learning and Checking [30.58114448119465]
既存の物体検出法とポーズ推定法は、主に訓練に同次元のデータを用いる。次元減少認知モデルであるDR-WLCは、物体検出と推定タスクを同時に行うことができる。
論文参考訳（メタデータ） (2023-01-17T15:08:32Z)
Weakly Supervised Training of Monocular 3D Object Detectors Using Wide Baseline Multi-view Traffic Camera Data [19.63193201107591]
交差点における車両の7DoF予測は,道路利用者間の潜在的な衝突を評価する上で重要な課題である。交通監視カメラ用3次元物体検出装置の微調整を弱教師付きで行う手法を開発した。提案手法は,自動運転車のデータセット上で最上位のモノクル3Dオブジェクト検出器と同等の精度で車両の7DoFの予測精度を推定する。
論文参考訳（メタデータ） (2021-10-21T08:26:48Z)
Anomaly Detection in Video via Self-Supervised and Multi-Task Learning [113.81927544121625]
ビデオにおける異常検出は、コンピュータビジョンの問題である。本稿では,オブジェクトレベルでの自己教師型およびマルチタスク学習を通じて,ビデオ中の異常事象検出にアプローチする。
論文参考訳（メタデータ） (2020-11-15T10:21:28Z)
Train in Germany, Test in The USA: Making 3D Object Detectors Generalize [59.455225176042404]
ディープラーニングにより、LiDARやステレオカメラデータなどの3Dオブジェクト検出精度が大幅に向上した。自動運転のためのほとんどのデータセットは、1つの国内の都市の狭い部分で収集される。本稿では,あるデータセットから別のデータセットに3Dオブジェクト検出器を適応させる作業について考察する。
論文参考訳（メタデータ） (2020-05-17T00:56:18Z)
SESS: Self-Ensembling Semi-Supervised 3D Object Detection [138.80825169240302]
具体的には、ラベルのない新しい未知のデータに基づくネットワークの一般化を促進するための、徹底的な摂動スキームを設計する。我々のSESSは、50%のラベル付きデータを用いて、最先端の完全教師付き手法と比較して、競争性能を達成している。
論文参考訳（メタデータ） (2019-12-26T08:48:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。