論文の概要: MSDA: Monocular Self-supervised Domain Adaptation for 6D Object Pose
Estimation
- arxiv url: http://arxiv.org/abs/2302.07300v1
- Date: Tue, 14 Feb 2023 19:34:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-16 16:39:28.873287
- Title: MSDA: Monocular Self-supervised Domain Adaptation for 6D Object Pose
Estimation
- Title(参考訳): MSDA:6次元オブジェクトポス推定のための単眼自己教師型ドメイン適応
- Authors: Dingding Cai, Janne Heikkil\"a, Esa Rahtu
- Abstract要約: 実画像からラベル付き6Dポーズを取得するための自己教師付きドメイン適応手法を提案する。
まず、合成RGB画像を用いてモデルを事前訓練し、次に実RGB(-D)画像を用いて事前訓練されたモデルを微調整する。
我々は,本手法が完全教師付き手法と同等の性能を発揮することを実験的に実証した。
- 参考スコア(独自算出の注目度): 12.773040823634908
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Acquiring labeled 6D poses from real images is an expensive and
time-consuming task. Though massive amounts of synthetic RGB images are easy to
obtain, the models trained on them suffer from noticeable performance
degradation due to the synthetic-to-real domain gap. To mitigate this
degradation, we propose a practical self-supervised domain adaptation approach
that takes advantage of real RGB(-D) data without needing real pose labels. We
first pre-train the model with synthetic RGB images and then utilize real
RGB(-D) images to fine-tune the pre-trained model. The fine-tuning process is
self-supervised by the RGB-based pose-aware consistency and the depth-guided
object distance pseudo-label, which does not require the time-consuming online
differentiable rendering. We build our domain adaptation method based on the
recent pose estimator SC6D and evaluate it on the YCB-Video dataset. We
experimentally demonstrate that our method achieves comparable performance
against its fully-supervised counterpart while outperforming existing
state-of-the-art approaches.
- Abstract(参考訳): 実画像からラベル付き6Dポーズを取得するのは、高価で時間を要する作業だ。
合成RGB画像の大量取得は容易であるが,合成ドメイン間ギャップによりトレーニングされたモデルは顕著な性能劣化に悩まされる。
この劣化を軽減するために,実際のrgb(-d)データを利用した実用的な自己教師付きドメイン適応手法を提案する。
まず,合成rgb画像を用いてモデルを事前学習し,実rgb(-d)画像を用いて事前学習したモデルを微調整する。
微調整プロセスは、rgbベースのポーズ認識一貫性と、時間を要するオンライン微分可能レンダリングを必要としない深度誘導オブジェクト距離擬似ラベルによって自己管理される。
提案手法は最近のポーズ推定器SC6Dに基づいて構築し,YCB-Videoデータセット上で評価する。
提案手法は,既存の最先端手法に勝るものの,完全教師付き手法と同等の性能を示した。
関連論文リスト
- RDPN6D: Residual-based Dense Point-wise Network for 6Dof Object Pose Estimation Based on RGB-D Images [13.051302134031808]
単一のRGB-D画像を用いてオブジェクトの6DoFポーズを計算する新しい手法を提案する。
オブジェクトのポーズを直接予測する既存の手法や、ポーズ回復のためのスパースキーポイントに依存する既存の手法とは異なり、我々のアプローチは密度の高い対応を使ってこの課題に対処する。
論文 参考訳(メタデータ) (2024-05-14T10:10:45Z) - RGB-based Category-level Object Pose Estimation via Decoupled Metric
Scale Recovery [72.13154206106259]
本研究では、6次元のポーズとサイズ推定を分離し、不完全なスケールが剛性変換に与える影響を緩和するパイプラインを提案する。
具体的には,事前学習した単分子推定器を用いて局所的な幾何学的情報を抽出する。
別個のブランチは、カテゴリレベルの統計に基づいてオブジェクトのメートル法スケールを直接復元するように設計されている。
論文 参考訳(メタデータ) (2023-09-19T02:20:26Z) - Learning 6D Pose Estimation from Synthetic RGBD Images for Robotic
Applications [0.6299766708197883]
提案したパイプラインは、興味のある対象のために大量の写真リアリスティックなRGBD画像を生成することができる。
オブジェクト検出器YOLO-V4-tinyと6次元ポーズ推定アルゴリズムPVN3Dを統合し,リアルタイム2次元ポーズ推定手法を開発した。
結果として得られたネットワークは、LineModデータセットで評価した場合の最先端手法と比較して、競合性能を示す。
論文 参考訳(メタデータ) (2022-08-30T14:17:15Z) - Unseen Object Instance Segmentation with Fully Test-time RGB-D
Embeddings Adaptation [14.258456366985444]
最近では、大規模な合成データのRGB-D機能を活用し、実世界のシナリオにモデルを適用するのが一般的である。
本稿では,Sim2Realドメイン間の適応プロセスを再強調する。
本稿では,BatchNorm層のパラメータに基づいて,完全テスト時間RGB-D埋め込み適応(FTEA)を行うフレームワークを提案する。
論文 参考訳(メタデータ) (2022-04-21T02:35:20Z) - Occlusion-Aware Self-Supervised Monocular 6D Object Pose Estimation [88.8963330073454]
自己教師付き学習による新しい単眼6次元ポーズ推定手法を提案する。
ノイズの多い学生のトレーニングと差別化可能なレンダリングの現在の傾向を活用して、モデルをさらに自己監督する。
提案する自己超越法は,合成データに依存する他の方法よりも優れている。
論文 参考訳(メタデータ) (2022-03-19T15:12:06Z) - SO-Pose: Exploiting Self-Occlusion for Direct 6D Pose Estimation [98.83762558394345]
SO-Poseは、オブジェクトの6自由度(6DoF)をすべて、単一のRGBイメージから散らばった環境でポーズさせるフレームワークである。
本稿では,3次元オブジェクトの2層表現を確立するために,自己閉塞に関する新たな推論を導入する。
対応性,自己閉塞性,6次元ポーズを整列する層間合成により,精度とロバスト性をさらに向上させることができる。
論文 参考訳(メタデータ) (2021-08-18T19:49:29Z) - Robust RGB-based 6-DoF Pose Estimation without Real Pose Annotations [92.5075742765229]
そこで本研究では,実際のポーズアノテーションを使わずに,課題条件下での6-DoFのポーズを頑健かつ正確に推定する手法を提案する。
LINEMOD と OccludedLINEMOD を実地設定なしで実現し、Occluded-LINEMOD のトレーニング中に実際のアノテーションに依存する方法よりも優れています。
論文 参考訳(メタデータ) (2020-08-19T12:07:01Z) - Self6D: Self-Supervised Monocular 6D Object Pose Estimation [114.18496727590481]
自己教師付き学習による単眼6次元ポーズ推定のアイデアを提案する。
ニューラルレンダリングの最近の進歩を活用して、注釈のない実RGB-Dデータのモデルをさらに自己監督する。
論文 参考訳(メタデータ) (2020-04-14T13:16:36Z) - Introducing Pose Consistency and Warp-Alignment for Self-Supervised 6D
Object Pose Estimation in Color Images [38.9238085806793]
オブジェクトの6Dポーズを推定する最も成功したアプローチは、現実世界の画像で注釈付きのポーズで学習を監督することによって、ニューラルネットワークを訓練する。
既存のニューラルネットワークベースのアプローチの上に適用可能な2段階の6Dオブジェクトポーズ推定フレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-27T11:53:38Z) - CPS++: Improving Class-level 6D Pose and Shape Estimation From Monocular
Images With Self-Supervised Learning [74.53664270194643]
現代のモノクロ6Dポーズ推定手法は、少数のオブジェクトインスタンスにしか対応できない。
そこで本研究では,計量形状検索と組み合わせて,クラスレベルのモノクル6次元ポーズ推定手法を提案する。
1枚のRGB画像から正確な6Dポーズとメートル法形状を抽出できることを実験的に実証した。
論文 参考訳(メタデータ) (2020-03-12T15:28:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。