論文の概要: Image to Sphere: Learning Equivariant Features for Efficient Pose
Prediction
- arxiv url: http://arxiv.org/abs/2302.13926v1
- Date: Mon, 27 Feb 2023 16:23:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-28 15:02:06.265697
- Title: Image to Sphere: Learning Equivariant Features for Efficient Pose
Prediction
- Title(参考訳): Image to Sphere: 効率的なポーズ予測のための等価特徴の学習
- Authors: David M. Klee and Ondrej Biza and Robert Platt and Robin Walters
- Abstract要約: 単一点推定を予測する方法は、対称性を持つ物体のポーズをうまく予測せず、不確実性を表現できない。
画像領域から3次元回転多様体への特徴量の新しいマッピングを提案する。
本稿では,オブジェクト指向予測における本手法の有効性を実証し,PASCAL3D+データセットの最先端性能を実現する。
- 参考スコア(独自算出の注目度): 3.823356975862006
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Predicting the pose of objects from a single image is an important but
difficult computer vision problem. Methods that predict a single point estimate
do not predict the pose of objects with symmetries well and cannot represent
uncertainty. Alternatively, some works predict a distribution over orientations
in $\mathrm{SO}(3)$. However, training such models can be computation- and
sample-inefficient. Instead, we propose a novel mapping of features from the
image domain to the 3D rotation manifold. Our method then leverages
$\mathrm{SO}(3)$ equivariant layers, which are more sample efficient, and
outputs a distribution over rotations that can be sampled at arbitrary
resolution. We demonstrate the effectiveness of our method at object
orientation prediction, and achieve state-of-the-art performance on the popular
PASCAL3D+ dataset. Moreover, we show that our method can model complex object
symmetries, without any modifications to the parameters or loss function. Code
is available at https://dmklee.github.io/image2sphere.
- Abstract(参考訳): 単一の画像からオブジェクトのポーズを予測することは、重要なが難しいコンピュータビジョンの問題である。
単一点推定を予測する方法は、対称性を持つ物体のポーズをうまく予測せず、不確実性を表現できない。
あるいは、$\mathrm{SO}(3)$の配向上の分布を予測する研究もある。
しかし、そのようなモデルのトレーニングは計算とサンプル非効率である。
代わりに、画像領域から3次元回転多様体への特徴量の新たなマッピングを提案する。
この手法では,よりサンプリング効率のよい$\mathrm{SO}(3)$等変層を利用し,任意の解像度でサンプリング可能な回転上の分布を出力する。
オブジェクト指向予測における本手法の有効性を実証し,PASCAL3D+データセットの最先端性能を実現する。
さらに,提案手法はパラメータや損失関数を変更することなく,複雑な物体対称性をモデル化できることを示した。
コードはhttps://dmklee.github.io/image2sphereで入手できる。
関連論文リスト
- No Pose, No Problem: Surprisingly Simple 3D Gaussian Splats from Sparse Unposed Images [100.80376573969045]
NoPoSplatは、多視点画像から3Dガウスアンによってパラメータ化された3Dシーンを再構成できるフィードフォワードモデルである。
提案手法は,推定時にリアルタイムな3次元ガウス再構成を実現する。
この研究は、ポーズフリーの一般化可能な3次元再構成において大きな進歩をもたらし、実世界のシナリオに適用可能であることを示す。
論文 参考訳(メタデータ) (2024-10-31T17:58:22Z) - DVMNet: Computing Relative Pose for Unseen Objects Beyond Hypotheses [59.51874686414509]
現在のアプローチは、多数の離散的なポーズ仮説を持つ連続的なポーズ表現を近似している。
本稿では,DVMNet(Deep Voxel Matching Network)を提案する。
提案手法は,最先端の手法に比べて計算コストの低い新しいオブジェクトに対して,より正確なポーズ推定を行う。
論文 参考訳(メタデータ) (2024-03-20T15:41:32Z) - Diff-DOPE: Differentiable Deep Object Pose Estimation [29.703385848843414]
Diff-DOPE, 画像入力を行う6-DoFポーズ精細機, オブジェクトの3次元テクスチャモデル, オブジェクトの初期ポーズを紹介する。
この方法は、画像とモデルの投影の間の視覚的エラーを最小限に抑えるために、オブジェクトのポーズを更新するために微分可能なレンダリングを使用する。
このシンプルで効果的なアイデアは、ポーズ推定データセットで最先端の結果を得ることができることを示す。
論文 参考訳(メタデータ) (2023-09-30T18:52:57Z) - Uncertainty-aware 3D Object-Level Mapping with Deep Shape Priors [15.34487368683311]
未知のオブジェクトに対して高品質なオブジェクトレベルマップを再構築するフレームワークを提案する。
提案手法では,複数のRGB-D画像を入力として,高密度な3次元形状と検出対象に対する9-DoFポーズを出力する。
2つの新たな損失関数を通して形状を伝播し不確実性を生じさせる確率的定式化を導出する。
論文 参考訳(メタデータ) (2023-09-17T00:48:19Z) - EFEM: Equivariant Neural Field Expectation Maximization for 3D Object
Segmentation Without Scene Supervision [35.232051353760035]
本研究では,3次元シーンのオブジェクトをアノテーションやトレーニングなしでセグメント化するために,EFEM(Equivariant Neural Field expectation Maximization)を導入する。
まず、この問題に同変形状表現を導入し、オブジェクト構成の変化によって引き起こされる複雑さを解消する。
第2に,前述した同変形状を用いて分割マスクを反復的に洗練する新しいEMアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-03-27T17:59:29Z) - Learning Implicit Probability Distribution Functions for Symmetric
Orientation Estimation from RGB Images Without Pose Labels [23.01797447932351]
RGB-D画像の自動ポーズラベリング方式を提案する。
我々は、RGB画像の向き仮説の確率を推定するために、インプリシットPDFモデルを訓練する。
SO(3)多様体の効率的な階層的サンプリングは、完備な対称性の集合を抽出可能な生成を可能にする。
論文 参考訳(メタデータ) (2022-11-21T12:07:40Z) - Unseen Object 6D Pose Estimation: A Benchmark and Baselines [62.8809734237213]
本稿では,新しい物体の6次元ポーズ推定をアルゴリズムで行えるようにするための新しいタスクを提案する。
実画像と合成画像の両方でデータセットを収集し、テストセットで最大48個の未確認オブジェクトを収集する。
エンド・ツー・エンドの3D対応ネットワークをトレーニングすることにより、未確認物体と部分ビューRGBD画像との対応点を高精度かつ効率的に見つけることができる。
論文 参考訳(メタデータ) (2022-06-23T16:29:53Z) - Adversarial Parametric Pose Prior [106.12437086990853]
我々は、SMPLパラメータを現実的なポーズを生成する値に制限する事前学習を行う。
得られた先行学習は実データ分布の多様性をカバーし、2次元キーポイントからの3次元再構成の最適化を容易にし、画像からの回帰に使用する場合のポーズ推定精度を向上することを示す。
論文 参考訳(メタデータ) (2021-12-08T10:05:32Z) - Implicit-PDF: Non-Parametric Representation of Probability Distributions
on the Rotation Manifold [47.31074799708132]
我々はSO(3)上の任意の非パラメトリック分布を推定する手法を提案する。
私たちのキーとなるアイデアは、入力画像と候補ポーズの確率を推定するニューラルネットワークで、分布を暗黙的に表現することです。
我々はPascal3D+とModelNet10-SO(3)ベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2021-06-10T17:57:23Z) - Neural Articulated Radiance Field [90.91714894044253]
本稿では,画像から学習した明瞭な物体に対する新しい変形可能な3次元表現であるニューラルArticulated Radiance Field(NARF)を提案する。
実験の結果,提案手法は効率的であり,新しいポーズにうまく一般化できることがわかった。
論文 参考訳(メタデータ) (2021-04-07T13:23:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。