論文の概要: Self6D: Self-Supervised Monocular 6D Object Pose Estimation
- arxiv url: http://arxiv.org/abs/2004.06468v3
- Date: Mon, 3 Aug 2020 23:47:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-13 09:50:04.233040
- Title: Self6D: Self-Supervised Monocular 6D Object Pose Estimation
- Title(参考訳): Self6D: 自己監督型モノクロ6Dオブジェクトポス推定
- Authors: Gu Wang, Fabian Manhardt, Jianzhun Shao, Xiangyang Ji, Nassir Navab,
Federico Tombari
- Abstract要約: 自己教師付き学習による単眼6次元ポーズ推定のアイデアを提案する。
ニューラルレンダリングの最近の進歩を活用して、注釈のない実RGB-Dデータのモデルをさらに自己監督する。
- 参考スコア(独自算出の注目度): 114.18496727590481
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 6D object pose estimation is a fundamental problem in computer vision.
Convolutional Neural Networks (CNNs) have recently proven to be capable of
predicting reliable 6D pose estimates even from monocular images. Nonetheless,
CNNs are identified as being extremely data-driven, and acquiring adequate
annotations is oftentimes very time-consuming and labor intensive. To overcome
this shortcoming, we propose the idea of monocular 6D pose estimation by means
of self-supervised learning, removing the need for real annotations. After
training our proposed network fully supervised with synthetic RGB data, we
leverage recent advances in neural rendering to further self-supervise the
model on unannotated real RGB-D data, seeking for a visually and geometrically
optimal alignment. Extensive evaluations demonstrate that our proposed
self-supervision is able to significantly enhance the model's original
performance, outperforming all other methods relying on synthetic data or
employing elaborate techniques from the domain adaptation realm.
- Abstract(参考訳): 6Dオブジェクトのポーズ推定はコンピュータビジョンの基本的な問題である。
畳み込みニューラルネットワーク(cnns)は、単眼画像からでも信頼できる6dポーズ推定を予測できることが最近証明されている。
それでも、CNNは極めてデータ駆動であり、適切なアノテーションを取得することは、しばしば非常に時間がかかり、労力がかかる。
この欠点を克服するために,自己教師付き学習による単眼6次元ポーズ推定のアイデアを提案し,実際のアノテーションの必要性を排除した。
提案するネットワークを合成rgbデータで完全に教師ありに訓練した後,近年のニューラルレンダリングの進歩を利用して,無注釈実rgb-dデータに対するモデルの自己監督を行い,視覚的かつ幾何学的に最適なアライメントを求める。
大規模評価の結果,提案する自己スーパービジョンは,合成データやドメイン適応領域からの精巧な手法を用いることで,モデル本来の性能を大幅に向上させることができることがわかった。
関連論文リスト
- Hierarchical Graph Neural Networks for Proprioceptive 6D Pose Estimation
of In-hand Objects [1.8263882169310044]
マルチモーダル(ビジョンとタッチ)データを組み合わせた階層型グラフニューラルネットワークアーキテクチャを提案する。
また、グラフベースのオブジェクト表現を学習するために、モダリティ内および横断的に情報を流す階層的なメッセージパッシング操作を導入する。
論文 参考訳(メタデータ) (2023-06-28T01:18:53Z) - GEO-Bench: Toward Foundation Models for Earth Monitoring [139.77907168809085]
6つの分類と6つのセグメンテーションタスクからなるベンチマークを提案する。
このベンチマークは、さまざまな地球観測タスクの進行の原動力となる。
論文 参考訳(メタデータ) (2023-06-06T16:16:05Z) - FS6D: Few-Shot 6D Pose Estimation of Novel Objects [116.34922994123973]
6Dオブジェクトポーズ推定ネットワークは、多数のオブジェクトインスタンスにスケールする能力に制限がある。
本研究では,未知の物体の6次元ポーズを,余分な訓練を伴わずにいくつかの支援ビューで推定する。
論文 参考訳(メタデータ) (2022-03-28T10:31:29Z) - Occlusion-Aware Self-Supervised Monocular 6D Object Pose Estimation [88.8963330073454]
自己教師付き学習による新しい単眼6次元ポーズ推定手法を提案する。
ノイズの多い学生のトレーニングと差別化可能なレンダリングの現在の傾向を活用して、モデルをさらに自己監督する。
提案する自己超越法は,合成データに依存する他の方法よりも優れている。
論文 参考訳(メタデータ) (2022-03-19T15:12:06Z) - VIPose: Real-time Visual-Inertial 6D Object Pose Tracking [3.44942675405441]
本稿では,オブジェクトのポーズ追跡問題にリアルタイムに対処するために,VIPoseと呼ばれる新しいディープニューラルネットワーク(DNN)を提案する。
重要な貢献は、オブジェクトの相対的な6Dポーズを予測するために視覚的および慣性的特徴を融合する新しいDNNアーキテクチャの設計である。
このアプローチでは、最先端技術に匹敵する精度性能を示すが、リアルタイムであることにはさらなるメリットがある。
論文 参考訳(メタデータ) (2021-07-27T06:10:23Z) - Spatial Attention Improves Iterative 6D Object Pose Estimation [52.365075652976735]
本稿では,RGB画像を用いた6次元ポーズ推定の改良手法を提案する。
私たちの主な洞察力は、最初のポーズ推定の後、オブジェクトの異なる空間的特徴に注意を払うことが重要です。
実験により,このアプローチが空間的特徴に順応することを学び,被写体の一部を無視することを学び,データセット間でのポーズ推定を改善することを実証した。
論文 参考訳(メタデータ) (2021-01-05T17:18:52Z) - se(3)-TrackNet: Data-driven 6D Pose Tracking by Calibrating Image
Residuals in Synthetic Domains [12.71983073907091]
本研究では,長期6次元ポーズトラッキングのためのデータ駆動型最適化手法を提案する。
本研究の目的は、現在のRGB-D観測と、前回の推定値と対象物のモデルに基づいて条件付けされた合成画像から、最適な相対的なポーズを特定することである。
提案手法は, 実画像を用いて訓練した場合でも, 常に頑健な評価を達成し, 代替品よりも優れる。
論文 参考訳(メタデータ) (2020-07-27T21:09:36Z) - CPS++: Improving Class-level 6D Pose and Shape Estimation From Monocular
Images With Self-Supervised Learning [74.53664270194643]
現代のモノクロ6Dポーズ推定手法は、少数のオブジェクトインスタンスにしか対応できない。
そこで本研究では,計量形状検索と組み合わせて,クラスレベルのモノクル6次元ポーズ推定手法を提案する。
1枚のRGB画像から正確な6Dポーズとメートル法形状を抽出できることを実験的に実証した。
論文 参考訳(メタデータ) (2020-03-12T15:28:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。