論文の概要: Learning Implicit Probability Distribution Functions for Symmetric
Orientation Estimation from RGB Images Without Pose Labels
- arxiv url: http://arxiv.org/abs/2211.11394v1
- Date: Mon, 21 Nov 2022 12:07:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 22:36:20.567976
- Title: Learning Implicit Probability Distribution Functions for Symmetric
Orientation Estimation from RGB Images Without Pose Labels
- Title(参考訳): ポーズラベルのないrgb画像からの対称方向推定のための暗黙確率分布関数の学習
- Authors: Arul Selvam Periyasamy, Luis Denninger, and Sven Behnke
- Abstract要約: RGB-D画像の自動ポーズラベリング方式を提案する。
我々は、RGB画像の向き仮説の確率を推定するために、インプリシットPDFモデルを訓練する。
SO(3)多様体の効率的な階層的サンプリングは、完備な対称性の集合を抽出可能な生成を可能にする。
- 参考スコア(独自算出の注目度): 23.01797447932351
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Object pose estimation is a necessary prerequisite for autonomous robotic
manipulation, but the presence of symmetry increases the complexity of the pose
estimation task. Existing methods for object pose estimation output a single 6D
pose. Thus, they lack the ability to reason about symmetries. Lately, modeling
object orientation as a non-parametric probability distribution on the SO(3)
manifold by neural networks has shown impressive results. However, acquiring
large-scale datasets to train pose estimation models remains a bottleneck. To
address this limitation, we introduce an automatic pose labeling scheme. Given
RGB-D images without object pose annotations and 3D object models, we design a
two-stage pipeline consisting of point cloud registration and
render-and-compare validation to generate multiple symmetrical
pseudo-ground-truth pose labels for each image. Using the generated pose
labels, we train an ImplicitPDF model to estimate the likelihood of an
orientation hypothesis given an RGB image. An efficient hierarchical sampling
of the SO(3) manifold enables tractable generation of the complete set of
symmetries at multiple resolutions. During inference, the most likely
orientation of the target object is estimated using gradient ascent. We
evaluate the proposed automatic pose labeling scheme and the ImplicitPDF model
on a photorealistic dataset and the T-Less dataset, demonstrating the
advantages of the proposed method.
- Abstract(参考訳): 物体のポーズ推定は自律的なロボット操作に必要な前提条件であるが、対称性の存在はポーズ推定タスクの複雑さを増加させる。
既存のオブジェクトポーズ推定方法は、単一の6dポーズを出力する。
したがって、対称性を推論する能力が欠如している。
近年, ニューラルネットワークによるSO(3)多様体上の非パラメトリック確率分布としての物体配向のモデル化が注目されている。
しかし、ポーズ推定モデルのトレーニングのために大規模なデータセットを取得することはボトルネックである。
この制限に対処するために,自動ポーズラベリング方式を導入する。
オブジェクトポーズアノテーションや3dオブジェクトモデルを持たないrgb-dイメージが与えられると、ポイントクラウド登録とrender-and-compareバリデーションからなる2段階パイプラインを設計して、画像毎に複数の対称的な疑似接地-真実のポーズラベルを生成する。
生成されたポーズラベルを用いて、RGB画像の向き仮説の確率を推定するために、インプリシットPDFモデルを訓練する。
SO(3)多様体の効率的な階層的サンプリングは、複数の解像度で完備な対称性の集合を抽出可能な生成を可能にする。
推定中、ターゲットオブジェクトの最も可能性の高い向きは勾配上昇を用いて推定される。
本稿では,フォトリアリスティックデータセットとtレスデータセットを用いた自動ポーズラベリング方式と暗黙のpdfモデルを評価し,提案手法の利点を示す。
関連論文リスト
- DVMNet: Computing Relative Pose for Unseen Objects Beyond Hypotheses [59.51874686414509]
現在のアプローチは、多数の離散的なポーズ仮説を持つ連続的なポーズ表現を近似している。
本稿では,DVMNet(Deep Voxel Matching Network)を提案する。
提案手法は,最先端の手法に比べて計算コストの低い新しいオブジェクトに対して,より正確なポーズ推定を行う。
論文 参考訳(メタデータ) (2024-03-20T15:41:32Z) - FoundPose: Unseen Object Pose Estimation with Foundation Features [11.32559845631345]
FoundPoseは、単一のRGB画像から見えないオブジェクトを6Dポーズで推定するモデルベースの手法である。
この方法は、オブジェクトやタスク固有のトレーニングを必要とせずに、3Dモデルを使って、新しいオブジェクトを素早くオンボードできる。
論文 参考訳(メタデータ) (2023-11-30T18:52:29Z) - Image to Sphere: Learning Equivariant Features for Efficient Pose
Prediction [3.823356975862006]
単一点推定を予測する方法は、対称性を持つ物体のポーズをうまく予測せず、不確実性を表現できない。
画像領域から3次元回転多様体への特徴量の新しいマッピングを提案する。
本稿では,オブジェクト指向予測における本手法の有効性を実証し,PASCAL3D+データセットの最先端性能を実現する。
論文 参考訳(メタデータ) (2023-02-27T16:23:19Z) - Semantic keypoint-based pose estimation from single RGB frames [64.80395521735463]
一つのRGB画像からオブジェクトの連続6-DoFポーズを推定する手法を提案する。
このアプローチは、畳み込みネットワーク(convnet)によって予測されるセマンティックキーポイントと、変形可能な形状モデルを組み合わせる。
提案手法は,インスタンスベースのシナリオとクラスベースのシナリオの両方に対して,6-DoFオブジェクトのポーズを正確に復元できることを示す。
論文 参考訳(メタデータ) (2022-04-12T15:03:51Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Adversarial Parametric Pose Prior [106.12437086990853]
我々は、SMPLパラメータを現実的なポーズを生成する値に制限する事前学習を行う。
得られた先行学習は実データ分布の多様性をカバーし、2次元キーポイントからの3次元再構成の最適化を容易にし、画像からの回帰に使用する場合のポーズ推定精度を向上することを示す。
論文 参考訳(メタデータ) (2021-12-08T10:05:32Z) - Stochastic Modeling for Learnable Human Pose Triangulation [0.7646713951724009]
本研究では,3次元ポーズ三角測量のためのモデリングフレームワークを提案し,その性能を異なるデータセットと空間カメラアレンジメントで評価する。
提案したポーズ三角測量モデルは、異なるカメラアレンジメントと2つの公開データセット間の一般化に成功している。
論文 参考訳(メタデータ) (2021-10-01T09:26:25Z) - Implicit-PDF: Non-Parametric Representation of Probability Distributions
on the Rotation Manifold [47.31074799708132]
我々はSO(3)上の任意の非パラメトリック分布を推定する手法を提案する。
私たちのキーとなるアイデアは、入力画像と候補ポーズの確率を推定するニューラルネットワークで、分布を暗黙的に表現することです。
我々はPascal3D+とModelNet10-SO(3)ベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2021-06-10T17:57:23Z) - SymmetryNet: Learning to Predict Reflectional and Rotational Symmetries
of 3D Shapes from Single-View RGB-D Images [26.38270361331076]
本稿では3次元物体の反射対称性と回転対称性の両方を予測できるエンドツーエンドのディープニューラルネットワークを提案する。
単視点RGB-D画像に基づく3次元対称性検出のベンチマークにも貢献する。
論文 参考訳(メタデータ) (2020-08-02T14:10:09Z) - EPOS: Estimating 6D Pose of Objects with Symmetries [57.448933686429825]
1つのRGB入力から利用可能な3次元モデルを用いて、剛体物体の6次元ポーズを推定する新しい手法を提案する。
オブジェクトは、体系的な方法で対称性を許容するコンパクトな表面フラグメントによって表現される。
エンコーダデコーダネットワークを用いて,高密度サンプリング画素とフラグメントの対応性を予測する。
論文 参考訳(メタデータ) (2020-04-01T17:41:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。