論文の概要: MS3D++: Ensemble of Experts for Multi-Source Unsupervised Domain
Adaptation in 3D Object Detection
- arxiv url: http://arxiv.org/abs/2308.05988v2
- Date: Mon, 4 Sep 2023 05:33:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-07 03:35:45.938579
- Title: MS3D++: Ensemble of Experts for Multi-Source Unsupervised Domain
Adaptation in 3D Object Detection
- Title(参考訳): MS3D++:3Dオブジェクト検出におけるマルチソース非教師付きドメイン適応の専門家の集まり
- Authors: Darren Tsai, Julie Stephany Berrio, Mao Shan, Eduardo Nebot and
Stewart Worrall
- Abstract要約: 未知の領域に3D検出器を配置すると、検出率が70-90%低下することが示されている。
我々は,MS3D++を紹介した。MS3D++は3Dオブジェクト検出において,マルチソースな教師なしドメイン適応のための自己学習フレームワークである。
MS3D++は高品質な擬似ラベルを生成し、3D検出器は様々なライダータイプで高い性能を達成できる。
- 参考スコア(独自算出の注目度): 12.005805403222354
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deploying 3D detectors in unfamiliar domains has been demonstrated to result
in a significant 70-90% drop in detection rate due to variations in lidar,
geography, or weather from their training dataset. This domain gap leads to
missing detections for densely observed objects, misaligned confidence scores,
and increased high-confidence false positives, rendering the detector highly
unreliable. To address this, we introduce MS3D++, a self-training framework for
multi-source unsupervised domain adaptation in 3D object detection. MS3D++
generates high-quality pseudo-labels, allowing 3D detectors to achieve high
performance on a range of lidar types, regardless of their density. Our
approach effectively fuses predictions of an ensemble of multi-frame
pre-trained detectors from different source domains to improve domain
generalization. We subsequently refine predictions temporally to ensure
temporal consistency in box localization and object classification.
Furthermore, we present an in-depth study into the performance and
idiosyncrasies of various 3D detector components in a cross-domain context,
providing valuable insights for improved cross-domain detector ensembling.
Experimental results on Waymo, nuScenes and Lyft demonstrate that detectors
trained with MS3D++ pseudo-labels achieve state-of-the-art performance,
comparable to training with human-annotated labels in Bird's Eye View (BEV)
evaluation for both low and high density lidar. Code is available at
https://github.com/darrenjkt/MS3D
- Abstract(参考訳): 未知の領域に3D検出器を配置すると、トレーニングデータセットからライダー、地理、天候の変化により、検出率が70-90%低下することが示されている。
この領域ギャップは、密集した観測対象の発見の欠如、不一致の信頼スコア、高信頼の偽陽性の増加、検出器の信頼性の低下につながる。
そこで我々は,マルチソース非教師なしドメイン適応のための3dオブジェクト検出のための自己学習フレームワークms3d++を紹介する。
MS3D++は高品質な擬似ラベルを生成し、3D検出器はその密度に関係なく、様々なライダータイプで高い性能を達成できる。
提案手法は,異なるソース領域からの複数フレーム事前学習検出器のアンサンブルの予測を効果的に融合し,ドメインの一般化を改善する。
その後,ボックスの局所化とオブジェクト分類における時間的一貫性を確保するために,予測を時間的に洗練する。
さらに、クロスドメインコンテキストにおける様々な3D検出器部品の性能と慣用性について詳細な研究を行い、クロスドメイン検出器アンサンブルの改善に有用な知見を提供する。
Waymo、nuScenes、Lyftの実験結果によると、MS3D++の擬似ラベルでトレーニングされた検出器は、低密度ライダーと高密度ライダーの両方に対するBird's Eye View (BEV)評価において、人間の注釈付きラベルによるトレーニングに匹敵する、最先端のパフォーマンスを実現している。
コードはhttps://github.com/darrenjkt/MS3Dで入手できる。
関連論文リスト
- 3D Adversarial Augmentations for Robust Out-of-Domain Predictions [115.74319739738571]
ドメイン外データへの一般化の改善に注力する。
対象を逆向きに変形させるベクトルの集合を学習する。
本研究では,学習したサンプル非依存ベクトルをモデルトレーニング時に利用可能なオブジェクトに適用することにより,対数拡大を行う。
論文 参考訳(メタデータ) (2023-08-29T17:58:55Z) - SOGDet: Semantic-Occupancy Guided Multi-view 3D Object Detection [19.75965521357068]
本稿では,SOGDet(Semantic-Occupancy Guided Multi-view Object Detection)と呼ばれる新しい手法を提案する。
以上の結果から,SOGDet は nuScenes Detection Score (NDS) と平均平均精度 (mAP) の3つのベースライン法の性能を一貫して向上させることがわかった。
これは、3Dオブジェクト検出と3Dセマンティック占有の組み合わせが、3D環境をより包括的に認識し、より堅牢な自律運転システムの構築を支援することを示唆している。
論文 参考訳(メタデータ) (2023-08-26T07:38:21Z) - FocalFormer3D : Focusing on Hard Instance for 3D Object Detection [97.56185033488168]
3次元物体検出における偽陰性(False negatives, FN)は、自動運転において潜在的に危険な状況を引き起こす可能性がある。
本研究では,マルチステージ方式でtextitFN を識別する汎用パイプラインである Hard Instance Probing (HIP) を提案する。
この手法をFocalFormer3Dとしてインスタンス化する。
論文 参考訳(メタデータ) (2023-08-08T20:06:12Z) - Density-Insensitive Unsupervised Domain Adaption on 3D Object Detection [19.703181080679176]
ポイントクラウドからの3Dオブジェクト検出は、安全クリティカルな自動運転において不可欠である。
本稿では,密度依存性ドメインギャップに対処する密度依存性ドメイン適応フレームワークを提案する。
3つの広く採用されている3次元オブジェクト検出データセットの実験結果から,提案手法が最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2023-04-19T06:33:07Z) - MS3D: Leveraging Multiple Detectors for Unsupervised Domain Adaptation
in 3D Object Detection [7.489722641968593]
マルチソース3D(MS3D)は、3Dオブジェクト検出における教師なしドメイン適応のための新しい自己学習パイプラインである。
提案するKernel-Density Estimation (KDE) Box Fusion法は,複数のドメインからのボックス提案を融合して擬似ラベルを得る。
MS3Dはドメインシフトに対してより堅牢性を示し、より大きな距離で正確な擬似ラベルを生成する。
論文 参考訳(メタデータ) (2023-04-05T13:29:21Z) - SSDA3D: Semi-supervised Domain Adaptation for 3D Object Detection from
Point Cloud [125.9472454212909]
本稿では,3次元物体検出(SSDA3D)のための半改良型領域適応法を提案する。
SSDA3Dはドメイン間適応ステージとドメイン内一般化ステージを含む。
実験の結果,10%のラベル付きターゲットデータしか持たないSSDA3Dは,100%のターゲットラベルを持つ完全教師付きオラクルモデルを上回ることができることがわかった。
論文 参考訳(メタデータ) (2022-12-06T09:32:44Z) - Homography Loss for Monocular 3D Object Detection [54.04870007473932]
ホログラフィーロス(Homography Loss)と呼ばれる,2次元情報と3次元情報の両方を利用する識別可能なロス関数を提案する。
提案手法は,KITTI 3Dデータセットにおいて,他の最先端技術と比較して高い性能を示す。
論文 参考訳(メタデータ) (2022-04-02T03:48:03Z) - ST3D++: Denoised Self-training for Unsupervised Domain Adaptation on 3D
Object Detection [78.71826145162092]
本稿では,ST3D++という名前の自己学習手法を提案する。
擬似ラベル生成プロセスにハイブリット品質を意識した三重項メモリを組み込むことにより、生成された擬似ラベルの品質と安定性を向上させる。
モデルトレーニングの段階では、ソースデータ支援トレーニング戦略とカリキュラムデータ拡張ポリシーを提案する。
論文 参考訳(メタデータ) (2021-08-15T07:49:06Z) - ST3D: Self-training for Unsupervised Domain Adaptation on 3D
ObjectDetection [78.71826145162092]
点雲からの3次元物体検出における教師なし領域適応のための新しい領域適応型自己学習パイプラインST3Dを提案する。
当社のST3Dは、評価されたすべてのデータセットで最先端のパフォーマンスを達成し、KITTI 3Dオブジェクト検出ベンチマークで完全に監視された結果を超えます。
論文 参考訳(メタデータ) (2021-03-09T10:51:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。