論文の概要: Syn-to-Real Unsupervised Domain Adaptation for Indoor 3D Object Detection
- arxiv url: http://arxiv.org/abs/2406.11311v2
- Date: Mon, 26 Aug 2024 08:47:00 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-27 23:07:37.715921
- Title: Syn-to-Real Unsupervised Domain Adaptation for Indoor 3D Object Detection
- Title(参考訳): 屋内3次元物体検出のための非教師なし領域適応
- Authors: Yunsong Wang, Na Zhao, Gim Hee Lee,
- Abstract要約: 室内3次元物体検出における非教師なし領域適応のための新しいフレームワークを提案する。
合成データセット3D-FRONTから実世界のデータセットScanNetV2とSUN RGB-Dへの適応結果は、ソースオンリーベースラインよりも9.7%、9.1%のmAP25が顕著に改善されていることを示している。
- 参考スコア(独自算出の注目度): 50.448520056844885
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The use of synthetic data in indoor 3D object detection offers the potential of greatly reducing the manual labor involved in 3D annotations and training effective zero-shot detectors. However, the complicated domain shifts across syn-to-real indoor datasets remains underexplored. In this paper, we propose a novel Object-wise Hierarchical Domain Alignment (OHDA) framework for syn-to-real unsupervised domain adaptation in indoor 3D object detection. Our approach includes an object-aware augmentation strategy to effectively diversify the source domain data, and we introduce a two-branch adaptation framework consisting of an adversarial training branch and a pseudo labeling branch, in order to simultaneously reach holistic-level and class-level domain alignment. The pseudo labeling is further refined through two proposed schemes specifically designed for indoor UDA. Our adaptation results from synthetic dataset 3D-FRONT to real-world datasets ScanNetV2 and SUN RGB-D demonstrate remarkable mAP25 improvements of 9.7% and 9.1% over Source-Only baselines, respectively, and consistently outperform the methods adapted from 2D and 3D outdoor scenarios. The code will be publicly available upon paper acceptance.
- Abstract(参考訳): 室内3Dオブジェクト検出における合成データの利用は、3Dアノテーションと効果的なゼロショット検出器の訓練に関わる手作業を大幅に削減する可能性を秘めている。
しかし、シン・トゥ・リアル屋内データセット間の複雑なドメインシフトはいまだに未調査である。
本稿では,室内3次元物体検出における非教師なし領域適応のための新しいオブジェクト指向階層型ドメインアライメント(OHDA)フレームワークを提案する。
提案手法は,ソースドメインデータを効果的に多様化するためのオブジェクト認識拡張戦略を含む。また,汎用レベルとクラスレベルのドメインアライメントを同時に達成するために,逆トレーニングブランチと擬ラベリングブランチからなる2ブランチ適応フレームワークを導入する。
擬似ラベリングは、室内UDA用に特別に設計された2つのスキームによってさらに洗練されている。
合成データセット3D-FRONTから実世界のデータセットScanNetV2とSUN RGB-Dへの適応結果は、それぞれソースオンリーベースラインよりも9.7%と9.1%のmAP25の改善を示し、2Dおよび3D屋外シナリオから適用した手法を一貫して上回っている。
コードは、論文の受理時に公開される。
関連論文リスト
- SSDA3D: Semi-supervised Domain Adaptation for 3D Object Detection from
Point Cloud [125.9472454212909]
本稿では,3次元物体検出(SSDA3D)のための半改良型領域適応法を提案する。
SSDA3Dはドメイン間適応ステージとドメイン内一般化ステージを含む。
実験の結果,10%のラベル付きターゲットデータしか持たないSSDA3Dは,100%のターゲットラベルを持つ完全教師付きオラクルモデルを上回ることができることがわかった。
論文 参考訳(メタデータ) (2022-12-06T09:32:44Z) - Geometry-Aware Network for Domain Adaptive Semantic Segmentation [64.00345743710653]
本稿では,ドメイン間のギャップを小さくするために,ドメイン適応のための幾何学的ネットワーク(GANDA)を提案する。
我々は、RGB-D画像から生成された点雲上の3Dトポロジを利用して、対象領域における座標色歪みと擬似ラベルの微細化を行う。
我々のモデルは,GTA5->CityscapesとSynTHIA->Cityscapesの最先端技術より優れている。
論文 参考訳(メタデータ) (2022-12-02T00:48:44Z) - 3D-PL: Domain Adaptive Depth Estimation with 3D-aware Pseudo-Labeling [37.315964084413174]
我々は,実際のデータから信頼された疑似基底真理を生成して,直接の監視を行うドメイン適応フレームワークを開発する。
具体的には,(1)画像が同一内容の異なるスタイルのときの深度予測の一貫性を計測し,(2)3次元空間における深度値の完備化を学習するポイントクラウドコンプリートネットワークを介して,擬似ラベルを認識させることにより,擬似ラベルの2つのメカニズムを提案する。
論文 参考訳(メタデータ) (2022-09-19T17:54:17Z) - Unsupervised Domain Adaptation for Monocular 3D Object Detection via
Self-Training [57.25828870799331]
我々は、Mono3D上での教師なしドメイン適応のための新しい自己学習フレームワークSTMono3Dを提案する。
対象ドメイン上で適応的な擬似ラベルを生成するための教師学生パラダイムを開発する。
STMono3Dは、評価されたすべてのデータセットで顕著なパフォーマンスを達成し、KITTI 3Dオブジェクト検出データセットの完全な教師付き結果を超えています。
論文 参考訳(メタデータ) (2022-04-25T12:23:07Z) - DODA: Data-oriented Sim-to-Real Domain Adaptation for 3D Indoor Semantic
Segmentation [36.37396175140793]
パターンとコンテキストギャップを軽減するために,データ指向ドメイン適応(DODA)フレームワークを提案する。
我々のDODAは、仮想スキャンシミュレーションにより、現実世界の点雲パターンを模倣し、内部のコンテキストギャップを軽減するために、テール・アウェア・キューブを混合する。
我々のDODAは3D-FRONT $rightarrow$ScanNetと3D-FRONT $rightarrow$S3DISの両方で既存のUDAアプローチを13%以上上回る。
論文 参考訳(メタデータ) (2022-04-04T15:52:55Z) - Unsupervised Domain Adaptive 3D Detection with Multi-Level Consistency [90.71745178767203]
ディープラーニングに基づく3Dオブジェクト検出は、大規模な自律走行データセットの出現によって、前例のない成功を収めた。
既存の3Dドメイン適応検出手法は、しばしばターゲットのドメインアノテーションへの事前アクセスを前提とします。
我々は、ソースドメインアノテーションのみを利用する、より現実的な、教師なしの3Dドメイン適応検出について研究する。
論文 参考訳(メタデータ) (2021-07-23T17:19:23Z) - ST3D: Self-training for Unsupervised Domain Adaptation on 3D
ObjectDetection [78.71826145162092]
点雲からの3次元物体検出における教師なし領域適応のための新しい領域適応型自己学習パイプラインST3Dを提案する。
当社のST3Dは、評価されたすべてのデータセットで最先端のパフォーマンスを達成し、KITTI 3Dオブジェクト検出ベンチマークで完全に監視された結果を超えます。
論文 参考訳(メタデータ) (2021-03-09T10:51:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。