論文の概要: PanDA: Unsupervised Domain Adaptation for Multimodal 3D Panoptic Segmentation in Autonomous Driving
- arxiv url: http://arxiv.org/abs/2604.19379v1
- Date: Tue, 21 Apr 2026 12:01:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.753148
- Title: PanDA: Unsupervised Domain Adaptation for Multimodal 3D Panoptic Segmentation in Autonomous Driving
- Title(参考訳): PanDA: 自律運転におけるマルチモーダル3次元パノプティックセグメンテーションのための教師なしドメイン適応
- Authors: Yining Pan, Shijie Li, Yuchen Wu, Xulei Yang, Na Zhao,
- Abstract要約: UDAは、現実の自律運転でよく見られる領域シフトの下での一般化を改善することを目的としている。
既存の教師付きmm-3DPS法は、LiDARとRGB入力の強い相互補完性に大きく依存している。
マルチモーダル3次元パノプティクスセグメンテーション用に設計された最初のUDAフレームワークであるPanDAを提案する。
- 参考スコア(独自算出の注目度): 25.00498014106047
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents the first study on Unsupervised Domain Adaptation (UDA) for multimodal 3D panoptic segmentation (mm-3DPS), aiming to improve generalization under domain shifts commonly encountered in real-world autonomous driving. A straightforward solution is to employ a pseudo-labeling strategy, which is widely used in UDA to generate supervision for unlabeled target data, combined with an mm-3DPS backbone. However, existing supervised mm-3DPS methods rely heavily on strong cross-modal complementarity between LiDAR and RGB inputs, making them fragile under domain shifts where one modality degrades (e.g., poor lighting or adverse weather). Moreover, conventional pseudo-labeling typically retains only high-confidence regions, leading to fragmented masks and incomplete object supervision, which are issues particularly detrimental to panoptic segmentation. To address these challenges, we propose PanDA, the first UDA framework specifically designed for multimodal 3D panoptic segmentation. To improve robustness against single-sensor degradation, we introduce an asymmetric multimodal augmentation that selectively drops regions to simulate domain shifts and improve robust representation learning. To enhance pseudo-label completeness and reliability, we further develop a dual-expert pseudo-label refinement module that extracts domain-invariant priors from both 2D and 3D modalities. Extensive experiments across diverse domain shifts, spanning time, weather, location, and sensor variations, significantly surpass state-of-the-art UDA baselines for 3D semantic segmentation.
- Abstract(参考訳): 本稿では,マルチモーダル3次元パノプティックセグメンテーション(mm-3DPS)のためのUnsupervised Domain Adaptation (UDA) の最初の研究について述べる。
単純な解決策は、UDAで広く使われている擬似ラベル方式を採用して、mm-3DPSバックボーンと組み合わせて、ラベルのないターゲットデータの監視を生成することである。
しかし、既存の監視されたmm-3DPS法は、LiDARとRGB入力の強い相互相補性に依存しており、1つのモードが劣化する領域シフト(例えば、照明の悪さや悪天候)下では脆弱である。
さらに、従来の擬似ラベルは一般的に高信頼領域のみを保持しており、断片化されたマスクや不完全なオブジェクトの監視に繋がる。
これらの課題に対処するため,マルチモーダル3Dパノプティクスセグメンテーションに特化して設計された最初のUDAフレームワークであるPanDAを提案する。
単一センサの劣化に対するロバスト性を改善するため、領域を選択的にドロップしてドメインシフトをシミュレートし、ロバストな表現学習を改善する非対称なマルチモーダル拡張を導入する。
疑似ラベルの完全性と信頼性を高めるため,2次元および3次元の両モードからドメイン不変の先行情報を抽出するデュアルエキスパートな擬似ラベル改良モジュールを開発した。
3Dセマンティックセグメンテーションのための最先端のUDAベースラインをはるかに上回っている。
関連論文リスト
- CCF: Complementary Collaborative Fusion for Domain Generalized Multi-Modal 3D Object Detection [10.131066023908023]
マルチモーダル融合は正確な3次元物体検出のための有望なパラダイムとして登場してきた。
しかし、トレーニングとは異なるターゲットドメインにデプロイされた場合、パフォーマンスは大幅に低下する。
本研究では、堅牢なクロスドメイン一般化を制限する2つの要因を同定する。
これらの課題に対処するための3つのコンポーネントを提案する。
論文 参考訳(メタデータ) (2026-03-24T14:39:51Z) - Unsupervised Domain Adaptation for 3D LiDAR Semantic Segmentation Using Contrastive Learning and Multi-Model Pseudo Labeling [0.7373617024876725]
セグメントレベルでの教師なしのコントラスト学習は、バックボーンネットワークを事前訓練するために使用される。
多様な最先端アーキテクチャのアンサンブルを利用して、マルチモデル擬似ラベル戦略を導入する。
Semantic KITTIからラベルのないターゲットデータセットに適応する実験は、セグメンテーション精度を大幅に改善したことを示している。
論文 参考訳(メタデータ) (2025-07-24T08:21:43Z) - Decoupled Pseudo-labeling for Semi-Supervised Monocular 3D Object Detection [108.672972439282]
SSM3ODに対するDPL(decoupled pseudo-labeling)アプローチを提案する。
提案手法は,擬似ラベルを効率的に生成するためのDPGモジュールを特徴とする。
また,擬似ラベルの雑音深度監視による最適化競合を軽減するために,DGPモジュールを提案する。
論文 参考訳(メタデータ) (2024-03-26T05:12:18Z) - Visual Foundation Models Boost Cross-Modal Unsupervised Domain Adaptation for 3D Semantic Segmentation [17.875516787157018]
本研究では,2次元視覚基礎モデルから得られた知識を活用して,ラベルのない対象ドメインのより正確なラベルを生成する方法について検討する。
本手法は, 各種自律走行データセットを用いて評価し, 3次元セグメンテーションタスクにおいて有意な改善が得られた。
論文 参考訳(メタデータ) (2024-03-15T03:58:17Z) - Learning to Adapt SAM for Segmenting Cross-domain Point Clouds [25.66755977728181]
3Dセグメンテーションタスクにおける教師なしドメイン適応(UDA)は、非常に難しい課題である。
本稿では,3次元特徴空間とSAMの特徴空間との整合性を大幅に向上させる,革新的なハイブリッド機能拡張手法を提案する。
提案手法は,広く認識されている多くのデータセットで評価され,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-10-13T02:28:40Z) - SSDA3D: Semi-supervised Domain Adaptation for 3D Object Detection from
Point Cloud [125.9472454212909]
本稿では,3次元物体検出(SSDA3D)のための半改良型領域適応法を提案する。
SSDA3Dはドメイン間適応ステージとドメイン内一般化ステージを含む。
実験の結果,10%のラベル付きターゲットデータしか持たないSSDA3Dは,100%のターゲットラベルを持つ完全教師付きオラクルモデルを上回ることができることがわかった。
論文 参考訳(メタデータ) (2022-12-06T09:32:44Z) - Unsupervised Domain Adaptation for Monocular 3D Object Detection via
Self-Training [57.25828870799331]
我々は、Mono3D上での教師なしドメイン適応のための新しい自己学習フレームワークSTMono3Dを提案する。
対象ドメイン上で適応的な擬似ラベルを生成するための教師学生パラダイムを開発する。
STMono3Dは、評価されたすべてのデータセットで顕著なパフォーマンスを達成し、KITTI 3Dオブジェクト検出データセットの完全な教師付き結果を超えています。
論文 参考訳(メタデータ) (2022-04-25T12:23:07Z) - Unsupervised Domain Adaptive 3D Detection with Multi-Level Consistency [90.71745178767203]
ディープラーニングに基づく3Dオブジェクト検出は、大規模な自律走行データセットの出現によって、前例のない成功を収めた。
既存の3Dドメイン適応検出手法は、しばしばターゲットのドメインアノテーションへの事前アクセスを前提とします。
我々は、ソースドメインアノテーションのみを利用する、より現実的な、教師なしの3Dドメイン適応検出について研究する。
論文 参考訳(メタデータ) (2021-07-23T17:19:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。