論文の概要: Introducing Pose Consistency and Warp-Alignment for Self-Supervised 6D
Object Pose Estimation in Color Images
- arxiv url: http://arxiv.org/abs/2003.12344v2
- Date: Fri, 16 Oct 2020 09:49:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-19 05:12:24.607119
- Title: Introducing Pose Consistency and Warp-Alignment for Self-Supervised 6D
Object Pose Estimation in Color Images
- Title(参考訳): カラー画像における自己監督型6次元オブジェクトポス推定のためのポス一貫性とワープアライメントの導入
- Authors: Juil Sock, Guillermo Garcia-Hernando, Anil Armagan, Tae-Kyun Kim
- Abstract要約: オブジェクトの6Dポーズを推定する最も成功したアプローチは、現実世界の画像で注釈付きのポーズで学習を監督することによって、ニューラルネットワークを訓練する。
既存のニューラルネットワークベースのアプローチの上に適用可能な2段階の6Dオブジェクトポーズ推定フレームワークを提案する。
- 参考スコア(独自算出の注目度): 38.9238085806793
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most successful approaches to estimate the 6D pose of an object typically
train a neural network by supervising the learning with annotated poses in real
world images. These annotations are generally expensive to obtain and a common
workaround is to generate and train on synthetic scenes, with the drawback of
limited generalisation when the model is deployed in the real world. In this
work, a two-stage 6D object pose estimator framework that can be applied on top
of existing neural-network-based approaches and that does not require pose
annotations on real images is proposed. The first self-supervised stage
enforces the pose consistency between rendered predictions and real input
images, narrowing the gap between the two domains. The second stage fine-tunes
the previously trained model by enforcing the photometric consistency between
pairs of different object views, where one image is warped and aligned to match
the view of the other and thus enabling their comparison. In the absence of
both real image annotations and depth information, applying the proposed
framework on top of two recent approaches results in state-of-the-art
performance when compared to methods trained only on synthetic data, domain
adaptation baselines and a concurrent self-supervised approach on LINEMOD,
LINEMOD OCCLUSION and HomebrewedDB datasets.
- Abstract(参考訳): オブジェクトの6Dポーズを推定する最も成功したアプローチは、現実世界の画像で注釈付きのポーズで学習を監督することでニューラルネットワークを訓練する。
これらのアノテーションは一般に入手するのに高価であり、モデルが現実世界に展開される際には、限られた一般化の欠点があり、合成シーンを生成および訓練することが一般的な回避策である。
本研究は,既存のニューラルネットワークに基づくアプローチ上で適用可能で,実画像に対するポーズアノテーションを必要としない2段階の6dオブジェクトポーズ推定フレームワークを提案する。
第1の自己教師付きステージは、レンダリングされた予測と実際の入力画像の間のポーズ一貫性を強制し、2つのドメイン間のギャップを狭める。
第2段階は、異なるオブジェクトビューのペア間の光度一貫性を強制することにより、事前訓練されたモデルを微調整する。
実画像アノテーションと深度情報がない場合、提案手法を2つの最近のアプローチの上に適用すると、合成データ、ドメイン適応ベースライン、LINEMOD、LINEMOD OCCLUSION、HomebrewedDBデータセットに対する同時自己管理アプローチのみにトレーニングされた手法と比較して、最先端のパフォーマンスが得られる。
関連論文リスト
- Generalizable Single-view Object Pose Estimation by Two-side Generating and Matching [19.730504197461144]
本稿では,RGB画像のみを用いてオブジェクトのポーズを決定するために,新しい一般化可能なオブジェクトポーズ推定手法を提案する。
本手法は,オブジェクトの参照画像1枚で操作し,3次元オブジェクトモデルやオブジェクトの複数ビューの必要性を解消する。
論文 参考訳(メタデータ) (2024-11-24T14:31:50Z) - BOP-Distrib: Revisiting 6D Pose Estimation Benchmark for Better Evaluation under Visual Ambiguities [0.7499722271664147]
6次元ポーズ推定は、カメラの観察を最もよく説明する対象のポーズを決定することを目的としている。
現在、6次元ポーズ推定法は、その基礎となる真理アノテーションに対して、視覚的曖昧性は、グローバルなオブジェクト対称性にのみ関連していると考えるデータセット上でベンチマークされている。
本稿では,画像内の物体表面の視認性を考慮し,各画像に特有の6次元ポーズ分布を付加したデータセットのアノテート手法を提案する。
論文 参考訳(メタデータ) (2024-08-30T13:52:26Z) - FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects [55.77542145604758]
FoundationPoseは、6Dオブジェクトのポーズ推定と追跡のための統合基盤モデルである。
我々のアプローチは、微調整なしで、テスト時に新しいオブジェクトに即座に適用できる。
論文 参考訳(メタデータ) (2023-12-13T18:28:09Z) - Pseudo Flow Consistency for Self-Supervised 6D Object Pose Estimation [14.469317161361202]
補助情報なしで純粋なRGB画像で訓練できる6次元オブジェクトポーズ推定法を提案する。
提案手法を3つの挑戦的データセット上で評価し,最先端の自己管理手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-08-19T13:52:18Z) - TexPose: Neural Texture Learning for Self-Supervised 6D Object Pose
Estimation [55.94900327396771]
合成データから6次元オブジェクトポーズ推定のためのニューラルネットワークによるテクスチャ学習を提案する。
実画像からオブジェクトの現実的なテクスチャを予測することを学ぶ。
画素完全合成データからポーズ推定を学習する。
論文 参考訳(メタデータ) (2022-12-25T13:36:32Z) - RNNPose: Recurrent 6-DoF Object Pose Refinement with Robust
Correspondence Field Estimation and Pose Optimization [46.144194562841435]
本稿では、オブジェクトポーズ改善のためのリカレントニューラルネットワーク(RNN)に基づくフレームワークを提案する。
この問題は、推定対応フィールドに基づいて非線形最小二乗問題として定式化される。
各イテレーションにおいて、対応フィールド推定とポーズ精錬を代替して行い、正確なオブジェクトポーズを復元する。
論文 参考訳(メタデータ) (2022-03-24T06:24:55Z) - Perspective Flow Aggregation for Data-Limited 6D Object Pose Estimation [121.02948087956955]
宇宙や水中の深層などのいくつかのアプリケーションでは、実際の画像を取得することは、注釈のないものであっても、事実上不可能である。
本稿では,合成画像のみに限定してトレーニングできる手法を提案する。
これは、アノテートされた実画像を必要としない場合、トレーニングのためにアノテートされた実画像を必要とするメソッドと同等に動作し、20個の実画像を使用する場合、かなりパフォーマンスが向上する。
論文 参考訳(メタデータ) (2022-03-18T10:20:21Z) - Deep Bingham Networks: Dealing with Uncertainty and Ambiguity in Pose
Estimation [74.76155168705975]
Deep Bingham Networks (DBN)は、3Dデータに関するほぼすべての実生活アプリケーションで発生するポーズ関連の不確実性と曖昧性を扱うことができる。
DBNは、(i)異なる分布モードを生成できる多仮説予測ヘッドにより、アートダイレクトポーズ回帰ネットワークの状態を拡張する。
トレーニング中のモードや後方崩壊を回避し,数値安定性を向上させるための新しいトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2020-12-20T19:20:26Z) - MirrorNet: A Deep Bayesian Approach to Reflective 2D Pose Estimation
from Human Images [42.27703025887059]
標準的な教師ありアプローチの大きな問題は、しばしば解剖学的に不可解なポーズをもたらすことである。
ポーズアノテーションを使わずに画像を効果的に活用できる半教師付き手法を提案する。
実験の結果,提案した反射型アーキテクチャが解剖学的に妥当なポーズを推定できることが示唆された。
論文 参考訳(メタデータ) (2020-04-08T05:02:48Z) - Two-shot Spatially-varying BRDF and Shape Estimation [89.29020624201708]
形状とSVBRDFを段階的に推定した新しいディープラーニングアーキテクチャを提案する。
ドメインランダム化された幾何学と現実的な材料を用いた大規模合成学習データセットを作成する。
合成データセットと実世界のデータセットの両方の実験により、合成データセットでトレーニングされたネットワークが、実世界の画像に対してうまく一般化できることが示されている。
論文 参考訳(メタデータ) (2020-04-01T12:56:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。