論文の概要: Unsupervised Domain Adaptation for Monocular 3D Object Detection via
Self-Training
- arxiv url: http://arxiv.org/abs/2204.11590v2
- Date: Wed, 27 Apr 2022 02:08:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-28 12:17:32.389297
- Title: Unsupervised Domain Adaptation for Monocular 3D Object Detection via
Self-Training
- Title(参考訳): 自己学習による単眼3次元物体検出のための教師なし領域適応
- Authors: Zhenyu Li, Zehui Chen, Ang Li, Liangji Fang, Qinhong Jiang, Xianming
Liu, Junjun Jiang
- Abstract要約: 我々は、Mono3D上での教師なしドメイン適応のための新しい自己学習フレームワークSTMono3Dを提案する。
対象ドメイン上で適応的な擬似ラベルを生成するための教師学生パラダイムを開発する。
STMono3Dは、評価されたすべてのデータセットで顕著なパフォーマンスを達成し、KITTI 3Dオブジェクト検出データセットの完全な教師付き結果を超えています。
- 参考スコア(独自算出の注目度): 57.25828870799331
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Monocular 3D object detection (Mono3D) has achieved unprecedented success
with the advent of deep learning techniques and emerging large-scale autonomous
driving datasets. However, drastic performance degradation remains an
unwell-studied challenge for practical cross-domain deployment as the lack of
labels on the target domain. In this paper, we first comprehensively
investigate the significant underlying factor of the domain gap in Mono3D,
where the critical observation is a depth-shift issue caused by the geometric
misalignment of domains. Then, we propose STMono3D, a new self-teaching
framework for unsupervised domain adaptation on Mono3D. To mitigate the
depth-shift, we introduce the geometry-aligned multi-scale training strategy to
disentangle the camera parameters and guarantee the geometry consistency of
domains. Based on this, we develop a teacher-student paradigm to generate
adaptive pseudo labels on the target domain. Benefiting from the end-to-end
framework that provides richer information of the pseudo labels, we propose the
quality-aware supervision strategy to take instance-level pseudo confidences
into account and improve the effectiveness of the target-domain training
process. Moreover, the positive focusing training strategy and dynamic
threshold are proposed to handle tremendous FN and FP pseudo samples. STMono3D
achieves remarkable performance on all evaluated datasets and even surpasses
fully supervised results on the KITTI 3D object detection dataset. To the best
of our knowledge, this is the first study to explore effective UDA methods for
Mono3D.
- Abstract(参考訳): モノクロ3Dオブジェクト検出(Monocular 3D)は、ディープラーニング技術と大規模自動運転データセットの出現によって、前例のない成功を収めた。
しかしながら、ターゲットドメインにラベルがないため、パフォーマンスの大幅な低下は、実践的なクロスドメインデプロイメントの未熟な課題である。
本稿では、まず、ドメインの幾何的不一致に起因する深さシフト問題であるmono3dにおけるドメイン間隙の重要要因を包括的に検討する。
次に,mono3d 上の教師なしドメイン適応のための新しい自己学習フレームワーク stmono3d を提案する。
深度シフトを緩和するために,カメラパラメータの絡み合いを解消し,領域の幾何一貫性を保証する幾何アライメントアライメント多スケールトレーニング戦略を導入する。
そこで本研究では,対象ドメイン上で適応的な擬似ラベルを生成するための教師学生パラダイムを開発した。
擬似ラベルのリッチな情報を提供するエンド・ツー・エンドのフレームワークの恩恵を受け、インスタンスレベルの疑似自信を考慮して、ターゲットドメインのトレーニングプロセスの有効性を向上させるための品質対応の監督戦略を提案する。
さらに、FNおよびFP擬似サンプルを扱うために、ポジティブフォーカストレーニング戦略とダイナミックしきい値を提案する。
STMono3Dは、評価されたすべてのデータセットで顕著なパフォーマンスを達成し、KITTI 3Dオブジェクト検出データセットの完全な教師付き結果を超えています。
われわれの知る限りでは、これはMono3Dの効果的なUDA手法を探求する最初の研究である。
関連論文リスト
- CMDA: Cross-Modal and Domain Adversarial Adaptation for LiDAR-Based 3D
Object Detection [14.063365469339812]
LiDARベースの3Dオブジェクト検出法は、ソース(またはトレーニング)データ配布の外部のターゲットドメインにうまく一般化しないことが多い。
画像のモダリティから視覚的セマンティックキューを活用する,CMDA (unsupervised domain adaptation) と呼ばれる新しい手法を提案する。
また、自己学習に基づく学習戦略を導入し、モデルが逆向きに訓練され、ドメイン不変の機能を生成する。
論文 参考訳(メタデータ) (2024-03-06T14:12:38Z) - Domain Generalization of 3D Object Detection by Density-Resampling [14.510085711178217]
ポイントクラウドベースの3Dオブジェクト検出は、新しいドメインギャップを持つデータに遭遇する際のパフォーマンス劣化に悩まされる。
対象領域に対する3次元物体検出の一般化性を向上させるためのSDG法を提案する。
本研究では,新しいデータ拡張手法を導入し,その方法論に新しいマルチタスク学習戦略を貢献する。
論文 参考訳(メタデータ) (2023-11-17T20:01:29Z) - 3D Adversarial Augmentations for Robust Out-of-Domain Predictions [115.74319739738571]
ドメイン外データへの一般化の改善に注力する。
対象を逆向きに変形させるベクトルの集合を学習する。
本研究では,学習したサンプル非依存ベクトルをモデルトレーニング時に利用可能なオブジェクトに適用することにより,対数拡大を行う。
論文 参考訳(メタデータ) (2023-08-29T17:58:55Z) - SSDA3D: Semi-supervised Domain Adaptation for 3D Object Detection from
Point Cloud [125.9472454212909]
本稿では,3次元物体検出(SSDA3D)のための半改良型領域適応法を提案する。
SSDA3Dはドメイン間適応ステージとドメイン内一般化ステージを含む。
実験の結果,10%のラベル付きターゲットデータしか持たないSSDA3Dは,100%のターゲットラベルを持つ完全教師付きオラクルモデルを上回ることができることがわかった。
論文 参考訳(メタデータ) (2022-12-06T09:32:44Z) - Towards Model Generalization for Monocular 3D Object Detection [57.25828870799331]
我々は,Mono3Dオブジェクト検出に有効な統合カメラ一般化パラダイム(CGP)を提案する。
また,インスタンスレベルの拡張によりギャップを埋める2D-3D幾何一貫性オブジェクトスケーリング戦略(GCOS)を提案する。
DGMono3Dと呼ばれる手法は、評価された全てのデータセットに対して顕著な性能を達成し、SoTAの教師なしドメイン適応スキームを上回ります。
論文 参考訳(メタデータ) (2022-05-23T23:05:07Z) - Unsupervised Domain Adaptive 3D Detection with Multi-Level Consistency [90.71745178767203]
ディープラーニングに基づく3Dオブジェクト検出は、大規模な自律走行データセットの出現によって、前例のない成功を収めた。
既存の3Dドメイン適応検出手法は、しばしばターゲットのドメインアノテーションへの事前アクセスを前提とします。
我々は、ソースドメインアノテーションのみを利用する、より現実的な、教師なしの3Dドメイン適応検出について研究する。
論文 参考訳(メタデータ) (2021-07-23T17:19:23Z) - ST3D: Self-training for Unsupervised Domain Adaptation on 3D
ObjectDetection [78.71826145162092]
点雲からの3次元物体検出における教師なし領域適応のための新しい領域適応型自己学習パイプラインST3Dを提案する。
当社のST3Dは、評価されたすべてのデータセットで最先端のパフォーマンスを達成し、KITTI 3Dオブジェクト検出ベンチマークで完全に監視された結果を超えます。
論文 参考訳(メタデータ) (2021-03-09T10:51:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。