論文の概要: DALI: Domain Adaptive LiDAR Object Detection via Distribution-level and Instance-level Pseudo Label Denoising
- arxiv url: http://arxiv.org/abs/2412.08806v1
- Date: Wed, 11 Dec 2024 22:43:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-13 13:32:47.200749
- Title: DALI: Domain Adaptive LiDAR Object Detection via Distribution-level and Instance-level Pseudo Label Denoising
- Title(参考訳): DALI: 分散レベルおよびインスタンスレベルの擬似ラベルによるドメイン適応LiDARオブジェクト検出
- Authors: Xiaohu Lu, Hayder Radha,
- Abstract要約: 本稿では、分散レベルとインスタンスレベルのノイズに対処するDomain Adaptive LIdar(DALI)フレームワークについて紹介する。
DALIは最先端の結果を達成し、ほとんどのドメイン適応タスクにおいて主要なアプローチよりも優れています。
- 参考スコア(独自算出の注目度): 5.478764356647439
- License:
- Abstract: Object detection using LiDAR point clouds relies on a large amount of human-annotated samples when training the underlying detectors' deep neural networks. However, generating 3D bounding box annotation for a large-scale dataset could be costly and time-consuming. Alternatively, unsupervised domain adaptation (UDA) enables a given object detector to operate on a novel new data, with unlabeled training dataset, by transferring the knowledge learned from training labeled \textit{source domain} data to the new unlabeled \textit{target domain}. Pseudo label strategies, which involve training the 3D object detector using target-domain predicted bounding boxes from a pre-trained model, are commonly used in UDA. However, these pseudo labels often introduce noise, impacting performance. In this paper, we introduce the Domain Adaptive LIdar (DALI) object detection framework to address noise at both distribution and instance levels. Firstly, a post-training size normalization (PTSN) strategy is developed to mitigate bias in pseudo label size distribution by identifying an unbiased scale after network training. To address instance-level noise between pseudo labels and corresponding point clouds, two pseudo point clouds generation (PPCG) strategies, ray-constrained and constraint-free, are developed to generate pseudo point clouds for each instance, ensuring the consistency between pseudo labels and pseudo points during training. We demonstrate the effectiveness of our method on the publicly available and popular datasets KITTI, Waymo, and nuScenes. We show that the proposed DALI framework achieves state-of-the-art results and outperforms leading approaches on most of the domain adaptation tasks. Our code is available at \href{https://github.com/xiaohulugo/T-RO2024-DALI}{https://github.com/xiaohulugo/T-RO2024-DALI}.
- Abstract(参考訳): LiDARポイントクラウドを用いたオブジェクト検出は、下層の検出器のディープニューラルネットワークをトレーニングする際、大量の人手によるサンプルに依存している。
しかし、大規模なデータセットのための3Dバウンディングボックスアノテーションを生成するのは、コストと時間を要する可能性がある。
あるいは、教師なしドメイン適応(UDA)は、ラベル付き‘textit{source domain}データから学習した知識を新しい‘textit{target domain}’に転送することで、与えられたオブジェクト検出器が、ラベル付きトレーニングデータセットで新しいデータを操作することを可能にする。
プリトレーニング済みモデルからターゲット領域予測境界ボックスを用いた3Dオブジェクト検出器のトレーニングを含む擬似ラベル戦略は、一般的にUDAで使用される。
しかし、これらの擬似ラベルは、しばしばノイズを導入し、性能に影響を及ぼす。
本稿では,分散レベルとインスタンスレベルのノイズに対処するDALI(Domain Adaptive LIdar)オブジェクト検出フレームワークを提案する。
まず,学習後サイズ正規化(PTSN)戦略を開発し,ネットワークトレーニング後の非バイアス尺度を特定することにより,擬似ラベルサイズ分布のバイアスを軽減する。
擬似ラベルと対応する点群間のインスタンスレベルのノイズに対処するため,2つの擬似点群生成(PPCG)戦略が開発され,各インスタンスに対して擬似点群を生成し,擬似ラベルと擬似点との整合性を確保する。
提案手法がKITTI, Waymo, nuScenesの公開および普及したデータセットに対して有効であることを示す。
提案したDALIフレームワークは、最先端の成果を達成し、ドメイン適応タスクのほとんどにおいて、主要なアプローチよりも優れていることを示す。
我々のコードは \href{https://github.com/xiaohulugo/T-RO2024-DALI}{https://github.com/xiaohulugo/T-RO2024-DALI} で公開されている。
関連論文リスト
- Revisiting Domain-Adaptive 3D Object Detection by Reliable, Diverse and
Class-balanced Pseudo-Labeling [38.07637524378327]
ドメイン適応型3Dオブジェクト検出において,疑似ラベリング技術を用いた教師なしドメイン適応(DA)が重要なアプローチとして浮上している。
既存のDAメソッドは、マルチクラスのトレーニング環境に適用した場合、パフォーマンスが大幅に低下する。
本稿では,すべてのクラスを一度に検出する学習に適した新しいReDBフレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-16T04:34:11Z) - All Points Matter: Entropy-Regularized Distribution Alignment for
Weakly-supervised 3D Segmentation [67.30502812804271]
擬似ラベルは、弱い教師付き3Dセグメンテーションタスクに広く使われており、学習に使えるのはスパース・グラウンド・トラス・ラベルのみである。
本稿では,生成した擬似ラベルを正規化し,擬似ラベルとモデル予測とのギャップを効果的に狭めるための新しい学習戦略を提案する。
論文 参考訳(メタデータ) (2023-05-25T08:19:31Z) - SSDA3D: Semi-supervised Domain Adaptation for 3D Object Detection from
Point Cloud [125.9472454212909]
本稿では,3次元物体検出(SSDA3D)のための半改良型領域適応法を提案する。
SSDA3Dはドメイン間適応ステージとドメイン内一般化ステージを含む。
実験の結果,10%のラベル付きターゲットデータしか持たないSSDA3Dは,100%のターゲットラベルを持つ完全教師付きオラクルモデルを上回ることができることがわかった。
論文 参考訳(メタデータ) (2022-12-06T09:32:44Z) - Robust Target Training for Multi-Source Domain Adaptation [110.77704026569499]
両レベル最適化に基づく新しいMSDAのためのロバスト目標訓練法(BORT$2$)を提案する。
提案手法は,大規模なDomainNetデータセットを含む3つのMSDAベンチマークにおいて,アートパフォーマンスの状態を達成している。
論文 参考訳(メタデータ) (2022-10-04T15:20:01Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z) - ST3D++: Denoised Self-training for Unsupervised Domain Adaptation on 3D
Object Detection [78.71826145162092]
本稿では,ST3D++という名前の自己学習手法を提案する。
擬似ラベル生成プロセスにハイブリット品質を意識した三重項メモリを組み込むことにより、生成された擬似ラベルの品質と安定性を向上させる。
モデルトレーニングの段階では、ソースデータ支援トレーニング戦略とカリキュラムデータ拡張ポリシーを提案する。
論文 参考訳(メタデータ) (2021-08-15T07:49:06Z) - Semi-Supervised Domain Adaptation with Prototypical Alignment and
Consistency Learning [86.6929930921905]
本稿では,いくつかの対象サンプルがラベル付けされていれば,ドメインシフトに対処するのにどの程度役立つか検討する。
ランドマークの可能性を最大限に追求するために、ランドマークから各クラスのターゲットプロトタイプを計算するプロトタイプアライメント(PA)モジュールを組み込んでいます。
具体的には,ラベル付き画像に深刻な摂動を生じさせ,PAを非自明にし,モデル一般化性を促進する。
論文 参考訳(メタデータ) (2021-04-19T08:46:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。