論文の概要: Unsupervised Domain Adaptation for Sim-to-Real Object Pose Estimation with Contrastive Alignment and Pseudo-Label Refinement
- arxiv url: http://arxiv.org/abs/2606.21287v1
- Date: Fri, 19 Jun 2026 10:11:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 14:37:58.168575
- Title: Unsupervised Domain Adaptation for Sim-to-Real Object Pose Estimation with Contrastive Alignment and Pseudo-Label Refinement
- Title(参考訳): コントラストアライメントと擬似ラベルリファインメントを用いたSim-to-Real Object Pose推定のための教師なしドメイン適応
- Authors: Nidhal Eddine Chenni, Arunkumar Rathinam, Djamila Aouada,
- Abstract要約: 教師なしドメイン適応(UDA)は、シミュレーションから実環境への知識の堅牢な伝達を可能にする。
本稿では,局所領域におけるポーズに敏感な特徴の適応を目的としたCAPLRを提案する。
CAPLRは、複数のよく知られたオブジェクトポーズ推定ベンチマークにおいて、最先端のパフォーマンスを実現する。
- 参考スコア(独自算出の注目度): 14.854437007037683
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Unsupervised domain adaptation (UDA) enables robust transfer of knowledge from simulated to real environments while exploiting a subset of unlabeled target data to improve real-world performance. Existing UDA methods for Object pose estimation often rely on global feature matching, multi-stage larger frameworks, or image translation pipelines, which tend to overlook the pose-specific information embedded in feature representations. To bridge this limitation, we introduce CAPLR that targets the adaptation of pose-sensitive features in localized regions, ensuring that domain alignment preserves the geometric cues essential for accurate pose estimation. CAPLR achieves UDA with three key components: (1) Efficient Cross-Domain Pairing strategy leveraging intermediate features to identify pose similar image pairs across domains without supervision; (2) Contrastive Alignment to perform feature alignment at localised regions in both intermediate and task-specific representations; and (3) Consistency-Based Pseudo-Label Refinement to improve reliability by encouraging stable target predictions. Extensive experiments demonstrate that CAPLR achieves state-of-the-art performance across multiple well-known object pose estimation benchmarks featuring diverse and challenging scenarios.
- Abstract(参考訳): 教師なしドメイン適応(UDA)は、ラベルのないターゲットデータのサブセットを活用しながら、シミュレーションから実環境への知識の堅牢な伝達を可能にし、実世界のパフォーマンスを向上させる。
既存のオブジェクトのポーズ推定のUDAメソッドは、グローバルな特徴マッチング、多段階の大規模フレームワーク、あるいは画像翻訳パイプラインに依存していることが多い。
この制限を埋めるために、我々は、局所的な領域におけるポーズに敏感な特徴の適応を目標としたCAPLRを導入し、ドメインアライメントが正確なポーズ推定に不可欠な幾何学的手がかりを保存することを保証する。
CAPLR は,(1) 中間機能を活用して,ドメイン間の類似した画像ペアを識別する効率的なクロスドメインペアリング戦略,(2) 中間領域とタスク固有表現の両方において局所化領域で特徴アライメントを行うコントラストアライメント,(3) 一貫性に基づく擬似ラベルリファインメントにより信頼性を向上し,安定した目標予測を奨励するコントラストアライメント,の3つの重要な構成要素で UDA を実現する。
広範な実験により、CAPLRは、多種多様な挑戦的なシナリオを特徴とする、複数のよく知られたオブジェクトポーズ推定ベンチマークで最先端のパフォーマンスを達成している。
関連論文リスト
- Hierarchical Consistency Learning for Test-time Adaptation in Camouflage Perception [50.278200968044665]
カモフラージュされた物体検出(COD)は、物理的属性を通して背景から最小限の知覚差を示すターゲットをローカライズすることを目的としている。
既存のメソッドは、静的なTrain-then-freezeパラダイムによって制約されており、ドメインの剛性と依存性のアノテーションに悩まされている。
動的表現再構成のためのテスト時間適応を統合した階層的一貫性学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-05-25T09:57:46Z) - Topology-Aware Modeling for Unsupervised Simulation-to-Reality Point Cloud Recognition [63.55828203989405]
我々はオブジェクトポイントクラウド上でSim2Real UDAのための新しいTopology-Aware Modeling (TAM)フレームワークを紹介する。
提案手法は,低レベルの高周波3次元構造を特徴とするグローバル空間トポロジを利用して,領域間隙を緩和する。
本稿では,クロスドメイン・コントラスト学習と自己学習を組み合わせた高度な自己学習戦略を提案する。
論文 参考訳(メタデータ) (2025-06-26T11:53:59Z) - Exploiting Aggregation and Segregation of Representations for Domain Adaptive Human Pose Estimation [50.31351006532924]
人間のポーズ推定(HPE)は最近、モーション分析、バーチャルリアリティー、ヘルスケア等に広く応用されているため、注目を集めている。
時間と労働集約的なアノテーションのために、ラベル付き現実世界のデータセットが不足している。
本稿では,ドメイン適応型人間のポーズ推定のための表現集約と分離を両立させる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-29T17:59:45Z) - RADA: Robust and Accurate Feature Learning with Domain Adaptation [7.905594146253435]
本稿では、2つの重要な要素を組み込んだ多層機能集約ネットワークを導入し、堅牢で正確な特徴の学習を容易にする。
提案手法は,画像マッチング,カメラポーズ推定,視覚的ローカライゼーションタスクにおいて優れた結果が得られる。
論文 参考訳(メタデータ) (2024-07-22T16:49:58Z) - Domain Generalisation for Object Detection under Covariate and Concept Shift [10.32461766065764]
ドメインの一般化は、ドメイン固有の特徴を抑えながら、ドメイン不変の機能の学習を促進することを目的としている。
オブジェクト検出のためのドメイン一般化手法を提案し, オブジェクト検出アーキテクチャに適用可能な最初のアプローチを提案する。
論文 参考訳(メタデータ) (2022-03-10T11:14:18Z) - Unsupervised Domain Adaptive 3D Detection with Multi-Level Consistency [90.71745178767203]
ディープラーニングに基づく3Dオブジェクト検出は、大規模な自律走行データセットの出現によって、前例のない成功を収めた。
既存の3Dドメイン適応検出手法は、しばしばターゲットのドメインアノテーションへの事前アクセスを前提とします。
我々は、ソースドメインアノテーションのみを利用する、より現実的な、教師なしの3Dドメイン適応検出について研究する。
論文 参考訳(メタデータ) (2021-07-23T17:19:23Z) - AFAN: Augmented Feature Alignment Network for Cross-Domain Object
Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。
本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。
提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2021-06-10T05:01:20Z) - Harmonizing Transferability and Discriminability for Adapting Object
Detectors [48.78231850215302]
本稿では,特徴表現の伝達可能性を校正し,識別性を調和させる階層的伝達可能性ネットワーク(HTCN)を提案する。
実験の結果、HTCNはベンチマークデータセットで最先端の手法を著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2020-03-13T13:47:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。