論文の概要: Domain Generalization of 3D Object Detection by Density-Resampling
- arxiv url: http://arxiv.org/abs/2311.10845v2
- Date: Wed, 28 Feb 2024 01:05:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-29 18:21:49.136936
- Title: Domain Generalization of 3D Object Detection by Density-Resampling
- Title(参考訳): 密度サンプリングによる3次元物体検出の領域一般化
- Authors: Shuangzhi Li, Lei Ma, and Xingyu Li
- Abstract要約: ポイントクラウドベースの3Dオブジェクト検出は、新しいドメインギャップを持つデータに遭遇する際のパフォーマンス劣化に悩まされる。
対象領域に対する3次元物体検出の一般化性を向上させるためのSDG法を提案する。
本研究では,新しいデータ拡張手法を導入し,その方法論に新しいマルチタスク学習戦略を貢献する。
- 参考スコア(独自算出の注目度): 14.510085711178217
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Point-cloud-based 3D object detection suffers from performance degradation
when encountering data with novel domain gaps. To tackle it, the single-domain
generalization (SDG) aims to generalize the detection model trained in a
limited single source domain to perform robustly on unexplored domains. In this
paper, we propose an SDG method to improve the generalizability of 3D object
detection to unseen target domains. Unlike prior SDG works for 3D object
detection solely focusing on data augmentation, our work introduces a novel
data augmentation method and contributes a new multi-task learning strategy in
the methodology. Specifically, from the perspective of data augmentation, we
design a universal physical-aware density-based data augmentation (PDDA) method
to mitigate the performance loss stemming from diverse point densities. From
the learning methodology viewpoint, we develop a multi-task learning for 3D
object detection: during source training, besides the main standard detection
task, we leverage an auxiliary self-supervised 3D scene restoration task to
enhance the comprehension of the encoder on background and foreground details
for better recognition and detection of objects. Furthermore, based on the
auxiliary self-supervised task, we propose the first test-time adaptation
method for domain generalization of 3D object detection, which efficiently
adjusts the encoder's parameters to adapt to unseen target domains during
testing time, to further bridge domain gaps. Extensive cross-dataset
experiments covering "Car", "Pedestrian", and "Cyclist" detections, demonstrate
our method outperforms state-of-the-art SDG methods and even overpass
unsupervised domain adaptation methods under some circumstances.
- Abstract(参考訳): ポイントクラウドベースの3Dオブジェクト検出は、新しいドメインギャップを持つデータに遭遇する際のパフォーマンス劣化に悩まされる。
これに対処するため、sdg(single-domain generalization)は、限定された単一ソースドメインでトレーニングされた検出モデルを一般化し、未探索領域で堅牢に実行することを目的としている。
本稿では,3次元物体検出のターゲット領域への一般化性を向上させるためのSDG手法を提案する。
データ拡張にのみ焦点をあてた3Dオブジェクト検出のための従来のSDG処理とは異なり、本研究では新しいデータ拡張手法を導入し、方法論に新しいマルチタスク学習戦略を貢献する。
具体的には,データ拡張の観点から,多種多様な点密度から生じる性能損失を軽減するため,汎用的な物理認識密度ベースデータ拡張法(pdda)を考案する。
学習方法論の観点から、3Dオブジェクト検出のためのマルチタスク学習を開発する。ソーストレーニング中は、メインの標準検出タスクに加えて、補助的な自己監督型3Dシーン復元タスクを活用し、背景および前景におけるエンコーダの理解を高め、オブジェクトの認識と検出を改善する。
さらに,補助的な自己監視タスクに基づいて,エンコーダのパラメータを効率的に調整して被検出領域に適応させ,さらに領域ギャップを橋渡しする3次元物体検出の領域一般化のためのテスト時間適応法を提案する。
カー」,「ペデストリアン」,「サイクリスト」検出を網羅した大規模なクロスデータセット実験により,我々の手法は最先端のSDG法よりも優れており,場合によっては教師なしドメイン適応法を超越することもある。
関連論文リスト
- CMDA: Cross-Modal and Domain Adversarial Adaptation for LiDAR-Based 3D
Object Detection [14.063365469339812]
LiDARベースの3Dオブジェクト検出法は、ソース(またはトレーニング)データ配布の外部のターゲットドメインにうまく一般化しないことが多い。
画像のモダリティから視覚的セマンティックキューを活用する,CMDA (unsupervised domain adaptation) と呼ばれる新しい手法を提案する。
また、自己学習に基づく学習戦略を導入し、モデルが逆向きに訓練され、ドメイン不変の機能を生成する。
論文 参考訳(メタデータ) (2024-03-06T14:12:38Z) - Towards Domain Generalization for Multi-view 3D Object Detection in
Bird-Eye-View [11.958753088613637]
まず,MV3D-Detタスクにおける領域ギャップの原因を解析する。
頑健な深度予測を得るために,カメラの内在パラメータから深度推定を分離する手法を提案する。
焦点長の値を変更して複数の擬似ドメインを作成し、敵の訓練損失を発生させ、特徴表現をよりドメインに依存しないものにするよう促す。
論文 参考訳(メタデータ) (2023-03-03T02:59:13Z) - CLIP the Gap: A Single Domain Generalization Approach for Object
Detection [60.20931827772482]
単一ドメインの一般化(Single Domain Generalization)は、単一のソースドメイン上でモデルをトレーニングすることで、目に見えないターゲットドメインに一般化する問題に取り組む。
本稿では、事前学習された視覚言語モデルを用いて、テキストプロンプトを介して意味領域の概念を導入することを提案する。
本手法は,検出器のバックボーンから抽出した特徴に作用する意味的拡張戦略と,テキストに基づく分類損失によって実現される。
論文 参考訳(メタデータ) (2023-01-13T12:01:18Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - Towards Model Generalization for Monocular 3D Object Detection [57.25828870799331]
我々は,Mono3Dオブジェクト検出に有効な統合カメラ一般化パラダイム(CGP)を提案する。
また,インスタンスレベルの拡張によりギャップを埋める2D-3D幾何一貫性オブジェクトスケーリング戦略(GCOS)を提案する。
DGMono3Dと呼ばれる手法は、評価された全てのデータセットに対して顕著な性能を達成し、SoTAの教師なしドメイン適応スキームを上回ります。
論文 参考訳(メタデータ) (2022-05-23T23:05:07Z) - Unsupervised Domain Adaptation for Monocular 3D Object Detection via
Self-Training [57.25828870799331]
我々は、Mono3D上での教師なしドメイン適応のための新しい自己学習フレームワークSTMono3Dを提案する。
対象ドメイン上で適応的な擬似ラベルを生成するための教師学生パラダイムを開発する。
STMono3Dは、評価されたすべてのデータセットで顕著なパフォーマンスを達成し、KITTI 3Dオブジェクト検出データセットの完全な教師付き結果を超えています。
論文 参考訳(メタデータ) (2022-04-25T12:23:07Z) - Unsupervised Domain Adaptive 3D Detection with Multi-Level Consistency [90.71745178767203]
ディープラーニングに基づく3Dオブジェクト検出は、大規模な自律走行データセットの出現によって、前例のない成功を収めた。
既存の3Dドメイン適応検出手法は、しばしばターゲットのドメインアノテーションへの事前アクセスを前提とします。
我々は、ソースドメインアノテーションのみを利用する、より現実的な、教師なしの3Dドメイン適応検出について研究する。
論文 参考訳(メタデータ) (2021-07-23T17:19:23Z) - ST3D: Self-training for Unsupervised Domain Adaptation on 3D
ObjectDetection [78.71826145162092]
点雲からの3次元物体検出における教師なし領域適応のための新しい領域適応型自己学習パイプラインST3Dを提案する。
当社のST3Dは、評価されたすべてのデータセットで最先端のパフォーマンスを達成し、KITTI 3Dオブジェクト検出ベンチマークで完全に監視された結果を超えます。
論文 参考訳(メタデータ) (2021-03-09T10:51:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。