論文の概要: Instance-Guided Unsupervised Domain Adaptation for Robotic Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2602.01389v2
- Date: Sun, 15 Feb 2026 00:08:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.069181
- Title: Instance-Guided Unsupervised Domain Adaptation for Robotic Semantic Segmentation
- Title(参考訳): ロボットセマンティックセマンティックセグメンテーションのためのインスタンス誘導型教師なしドメイン適応
- Authors: Michele Antonazzi, Lorenzo Signorelli, Matteo Luperto, Nicola Basilico,
- Abstract要約: 教師なしドメイン適応(Unsupervised Domain Adaptation, UDA)は、外部の監視なしにロボットのターゲット環境にネットワークを適応させる。
本稿では,3次元地図から始まる多視点一貫した擬似ラベルを生成する手法を提案する。
ファウンデーションモデルのゼロショットインスタンスセグメンテーション機能を用いて、これらのラベルを洗練し、インスタンスレベルのコヒーレンスを強制する。
- 参考スコア(独自算出の注目度): 4.556831252263135
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semantic segmentation networks, which are essential for robotic perception, often suffer from performance degradation when the visual distribution of the deployment environment differs from that of the source dataset on which they were trained. Unsupervised Domain Adaptation (UDA) addresses this challenge by adapting the network to the robot's target environment without external supervision, leveraging the large amounts of data a robot might naturally collect during long-term operation. In such settings, UDA methods can exploit multi-view consistency across the environment's map to fine-tune the model in an unsupervised fashion and mitigate domain shift. However, these approaches remain sensitive to cross-view instance-level inconsistencies. In this work, we propose a method that starts from a volumetric 3D map to generate multi-view consistent pseudo-labels. We then refine these labels using the zero-shot instance segmentation capabilities of a foundation model, enforcing instance-level coherence. The refined annotations serve as supervision for self-supervised fine-tuning, enabling the robot to adapt its perception system at deployment time. Experiments on real-world data demonstrate that our approach consistently improves performance over state-of-the-art UDA baselines based on multi-view consistency, without requiring any ground-truth labels in the target domain.
- Abstract(参考訳): ロボット知覚に不可欠なセグメンテーションネットワークは、デプロイ環境の視覚的分布がトレーニングされたソースデータセットと異なる場合、しばしば性能劣化に悩まされる。
教師なしドメイン適応(Unsupervised Domain Adaptation, UDA)は、ロボットが長期操作中に自然に収集する大量のデータを活用することにより、ロボットのターゲット環境にネットワークを適応させることによって、この課題に対処する。
このような設定では、UDAメソッドは環境マップ全体にわたるマルチビュー一貫性を利用して、教師なしの方法でモデルを微調整し、ドメインシフトを軽減することができる。
しかしながら、これらのアプローチは、クロスビューのインスタンスレベルの矛盾に敏感なままである。
本研究では,ボリューム3Dマップから始まる多視点一貫した擬似ラベルを生成する手法を提案する。
次に、ファウンデーションモデルのゼロショットインスタンスセグメンテーション機能を使用して、これらのラベルを洗練し、インスタンスレベルのコヒーレンスを強制する。
洗練されたアノテーションは、自己監督された微調整の監督として機能し、ロボットが展開時に認識システムに適応できるようにする。
実世界のデータを用いた実験により,本手法は,対象領域に基盤トラストラベルを必要とせず,多視点整合性に基づいて,最先端のUDAベースラインよりも一貫して性能を向上することを示した。
関連論文リスト
- Bridging the Synthetic-Real Gap: Supervised Domain Adaptation for Robust Spacecraft 6-DoF Pose Estimation [13.83897333268682]
宇宙船のポース推定は、ランデブー、ドッキング、軌道上のドッキングのような自律的な宇宙活動の基本的な能力である。
既存のドメイン適応アプローチは、この問題を軽減することを目的としているが、ラベル付きターゲットサンプルの少ない数が利用できる場合、しばしば性能が低下する。
本稿では,SPEキーポイント回帰に適したSDA(Supervised Domain Adaptation)フレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-17T08:03:05Z) - Unsupervised Domain Adaptation for 3D LiDAR Semantic Segmentation Using Contrastive Learning and Multi-Model Pseudo Labeling [0.7373617024876725]
セグメントレベルでの教師なしのコントラスト学習は、バックボーンネットワークを事前訓練するために使用される。
多様な最先端アーキテクチャのアンサンブルを利用して、マルチモデル擬似ラベル戦略を導入する。
Semantic KITTIからラベルのないターゲットデータセットに適応する実験は、セグメンテーション精度を大幅に改善したことを示している。
論文 参考訳(メタデータ) (2025-07-24T08:21:43Z) - Exploiting Aggregation and Segregation of Representations for Domain Adaptive Human Pose Estimation [50.31351006532924]
人間のポーズ推定(HPE)は最近、モーション分析、バーチャルリアリティー、ヘルスケア等に広く応用されているため、注目を集めている。
時間と労働集約的なアノテーションのために、ラベル付き現実世界のデータセットが不足している。
本稿では,ドメイン適応型人間のポーズ推定のための表現集約と分離を両立させる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-29T17:59:45Z) - Adversarially Domain-adaptive Latent Diffusion for Unsupervised Semantic Segmentation [7.099012213719071]
本研究では、ICCLD(Inter-Coder Connected Latent Diffusion)と呼ばれる潜在拡散モデルに基づくセマンティックセグメンテーション手法を提案する。
ICCLDは最先端のUDAメソッドより優れており、mIoUスコアは74.4(GTA5$rightarrow$Cityscapes)と67.2(Synthia$rightarrow$Cityscapes)である。
論文 参考訳(メタデータ) (2024-12-22T04:55:41Z) - Stagewise Unsupervised Domain Adaptation with Adversarial Self-Training
for Road Segmentation of Remote Sensing Images [93.50240389540252]
リモートセンシング画像からの道路セグメンテーションは、幅広い応用可能性を持つ課題である。
本稿では,この領域における領域シフト(DS)問題に対処するため,RoadDAと呼ばれる新たな段階的ドメイン適応モデルを提案する。
2つのベンチマーク実験の結果、RoadDAはドメインギャップを効率的に減らし、最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-08-28T09:29:14Z) - AFAN: Augmented Feature Alignment Network for Cross-Domain Object
Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。
本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。
提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2021-06-10T05:01:20Z) - Geometric Unsupervised Domain Adaptation for Semantic Segmentation [35.492127636785824]
シミュレータは、セマンティックセグメンテーションのようなラベルが難しいタスクを完全に監督して、大量のラベル付き合成データを効率的に生成できます。
このギャップを橋渡しし、sim-to-real unsupervised domain adaptを改善するために、自己監視単眼深度推定をプロキシタスクとして使用する。
本手法は, 合成データの質や量によく対応し, 深度予測も改善する。
論文 参考訳(メタデータ) (2021-03-30T21:33:00Z) - Unsupervised and self-adaptative techniques for cross-domain person
re-identification [82.54691433502335]
非重複カメラにおける人物再識別(ReID)は難しい課題である。
Unsupervised Domain Adaptation(UDA)は、ソースで訓練されたモデルから、IDラベルアノテーションなしでターゲットドメインへの機能学習適応を実行するため、有望な代替手段です。
本稿では,新しいオフライン戦略によって生成されたサンプルのトリプレットを利用する,UDAベースのReID手法を提案する。
論文 参考訳(メタデータ) (2021-03-21T23:58:39Z) - Alleviating Semantic-level Shift: A Semi-supervised Domain Adaptation
Method for Semantic Segmentation [97.8552697905657]
このタスクの重要な課題は、ソースとターゲットドメイン間のデータ分散の相違を緩和する方法である。
本稿では,グローバルな視点とローカルな視点の両方から分布の整合性を促進できるASS(Alleviating Semantic-level Shift)を提案する。
GTA5、Cityscapes、Synthia、Cityscapesの2つのドメイン適応タスクにASSを適用します。
論文 参考訳(メタデータ) (2020-04-02T03:25:05Z) - Unsupervised Domain Adaptation in Person re-ID via k-Reciprocal
Clustering and Large-Scale Heterogeneous Environment Synthesis [76.46004354572956]
個人再識別のための教師なし領域適応手法を提案する。
実験結果から,ktCUDA法とSHRED法は,再同定性能において,+5.7 mAPの平均的改善を実現することがわかった。
論文 参考訳(メタデータ) (2020-01-14T17:43:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。