論文の概要: Improving Multimodal Distillation for 3D Semantic Segmentation under Domain Shift
- arxiv url: http://arxiv.org/abs/2511.17455v1
- Date: Fri, 21 Nov 2025 17:57:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-24 18:08:19.15554
- Title: Improving Multimodal Distillation for 3D Semantic Segmentation under Domain Shift
- Title(参考訳): ドメインシフト下における3次元セマンティックセグメンテーションのためのマルチモーダル蒸留の改良
- Authors: Björn Michele, Alexandre Boulch, Gilles Puy, Tuan-Hung Vu, Renaud Marlet, Nicolas Courty,
- Abstract要約: 我々は,ライダーポイント雲のセマンティックセグメンテーションのための教師なし領域適応において,視覚基盤モデル(VFM)を利用したレシピの同定を行う。
その結果、パイプラインは4つの広く認識され、困難な設定で、最先端の結果を達成する。
- 参考スコア(独自算出の注目度): 62.50795372173394
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic segmentation networks trained under full supervision for one type of lidar fail to generalize to unseen lidars without intervention. To reduce the performance gap under domain shifts, a recent trend is to leverage vision foundation models (VFMs) providing robust features across domains. In this work, we conduct an exhaustive study to identify recipes for exploiting VFMs in unsupervised domain adaptation for semantic segmentation of lidar point clouds. Building upon unsupervised image-to-lidar knowledge distillation, our study reveals that: (1) the architecture of the lidar backbone is key to maximize the generalization performance on a target domain; (2) it is possible to pretrain a single backbone once and for all, and use it to address many domain shifts; (3) best results are obtained by keeping the pretrained backbone frozen and training an MLP head for semantic segmentation. The resulting pipeline achieves state-of-the-art results in four widely-recognized and challenging settings. The code will be available at: https://github.com/valeoai/muddos.
- Abstract(参考訳): セマンティックセグメンテーションネットワークは、ある種類のライダーの完全な監督の下で訓練されたが、干渉することなく、目に見えないライダーに一般化することができなかった。
ドメインシフトによるパフォーマンスギャップを低減するため、近年のトレンドは、ドメイン間で堅牢な機能を提供するビジョンファウンデーションモデル(VFM)を活用することである。
本研究では,ライダー点雲のセマンティックセグメンテーションのための教師なし領域適応において,VFMを利用するためのレシピを特定するための徹底的な研究を行う。
その結果,(1)ライダーバックボーンのアーキテクチャは,対象ドメインにおける一般化性能を最大化するための鍵であり,(2)単一バックボーンの事前訓練が可能であり,(3)事前学習したバックボーンを凍結させ,MDPヘッドをセマンティックセグメンテーションのために訓練することで,多くのドメインシフトに対処できることがわかった。
その結果、パイプラインは4つの広く認識され、困難な設定で、最先端の結果を達成する。
コードは、https://github.com/valeoai/muddos.comで入手できる。
関連論文リスト
- Rein++: Efficient Generalization and Adaptation for Semantic Segmentation with Vision Foundation Models [47.66611300605174]
Rein++は効率的なVFMベースのセグメンテーションフレームワークである。
これは限られたデータからの優れた一般化を示す。
多様な未ラベルシナリオへの効果的な適応を可能にする。
論文 参考訳(メタデータ) (2025-08-03T08:53:30Z) - Visual Foundation Models Boost Cross-Modal Unsupervised Domain Adaptation for 3D Semantic Segmentation [17.875516787157018]
本研究では,2次元視覚基礎モデルから得られた知識を活用して,ラベルのない対象ドメインのより正確なラベルを生成する方法について検討する。
本手法は, 各種自律走行データセットを用いて評価し, 3次元セグメンテーションタスクにおいて有意な改善が得られた。
論文 参考訳(メタデータ) (2024-03-15T03:58:17Z) - Compositional Semantic Mix for Domain Adaptation in Point Cloud
Segmentation [65.78246406460305]
合成意味混合は、ポイントクラウドセグメンテーションのための最初の教師なし領域適応技術である。
本稿では、ソースドメイン(例えば合成)からの点雲とターゲットドメイン(例えば実世界)からの点雲を同時に処理できる2分岐対称ネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-08-28T14:43:36Z) - Walking Your LiDOG: A Journey Through Multiple Domains for LiDAR
Semantic Segmentation [16.857861952638498]
We study domain generalization for LiDAR semantic segmentation (DG-LSS)。
その結果,メソッド間の大きなギャップが確認され,ドメイン間設定で評価された。
そこで本研究では,DG-LSSに特化して設計された最初の手法を提案する。
論文 参考訳(メタデータ) (2023-04-23T17:43:29Z) - Stagewise Unsupervised Domain Adaptation with Adversarial Self-Training
for Road Segmentation of Remote Sensing Images [93.50240389540252]
リモートセンシング画像からの道路セグメンテーションは、幅広い応用可能性を持つ課題である。
本稿では,この領域における領域シフト(DS)問題に対処するため,RoadDAと呼ばれる新たな段階的ドメイン適応モデルを提案する。
2つのベンチマーク実験の結果、RoadDAはドメインギャップを効率的に減らし、最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-08-28T09:29:14Z) - Domain Adaptation for Semantic Segmentation via Patch-Wise Contrastive
Learning [62.7588467386166]
ドメイン間で構造的に類似するラベルパッチの機能を調整することで、ドメインギャップを埋めるためにコントラスト学習を利用する。
私たちのアプローチは、常に2つの困難なドメイン適応セグメンテーションタスクにおいて、最先端の非監視および半監督メソッドを上回ります。
論文 参考訳(メタデータ) (2021-04-22T13:39:12Z) - Towards Adaptive Semantic Segmentation by Progressive Feature Refinement [16.40758125170239]
セグメンテーションネットワークの転送可能性を高めるために,ドメイン逆学習とともに,革新的なプログレッシブな特徴改善フレームワークを提案する。
その結果、ソース・ドメイン・イメージで訓練されたセグメンテーション・モデルは、大幅な性能劣化を伴わずにターゲット・ドメインに転送できる。
論文 参考訳(メタデータ) (2020-09-30T04:17:48Z) - Alleviating Semantic-level Shift: A Semi-supervised Domain Adaptation
Method for Semantic Segmentation [97.8552697905657]
このタスクの重要な課題は、ソースとターゲットドメイン間のデータ分散の相違を緩和する方法である。
本稿では,グローバルな視点とローカルな視点の両方から分布の整合性を促進できるASS(Alleviating Semantic-level Shift)を提案する。
GTA5、Cityscapes、Synthia、Cityscapesの2つのドメイン適応タスクにASSを適用します。
論文 参考訳(メタデータ) (2020-04-02T03:25:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。