論文の概要: Particle-based 6D Object Pose Estimation from Point Clouds using Diffusion Models
- arxiv url: http://arxiv.org/abs/2412.00835v1
- Date: Sun, 01 Dec 2024 14:52:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-04 15:45:38.148687
- Title: Particle-based 6D Object Pose Estimation from Point Clouds using Diffusion Models
- Title(参考訳): 拡散モデルを用いた点群からの粒子ベース6次元物体位置推定
- Authors: Christian Möller, Niklas Funk, Jan Peters,
- Abstract要約: 本研究では,6次元オブジェクトのポーズ推定のための拡散モデルを提案する。
推論の間、訓練された生成モデルは複数の粒子、すなわち仮説をサンプリングすることができる。
本稿では,追加のトレーニングや計算集約的な操作を必要としない2つの新規かつ効果的なポーズ選択戦略を提案する。
- 参考スコア(独自算出の注目度): 15.582644209879957
- License:
- Abstract: Object pose estimation from a single view remains a challenging problem. In particular, partial observability, occlusions, and object symmetries eventually result in pose ambiguity. To account for this multimodality, this work proposes training a diffusion-based generative model for 6D object pose estimation. During inference, the trained generative model allows for sampling multiple particles, i.e., pose hypotheses. To distill this information into a single pose estimate, we propose two novel and effective pose selection strategies that do not require any additional training or computationally intensive operations. Moreover, while many existing methods for pose estimation primarily focus on the image domain and only incorporate depth information for final pose refinement, our model solely operates on point cloud data. The model thereby leverages recent advancements in point cloud processing and operates upon an SE(3)-equivariant latent space that forms the basis for the particle selection strategies and allows for improved inference times. Our thorough experimental results demonstrate the competitive performance of our approach on the Linemod dataset and showcase the effectiveness of our design choices. Code is available at https://github.com/zitronian/6DPoseDiffusion .
- Abstract(参考訳): 単一のビューからのオブジェクトのポーズ推定は、依然として難しい問題です。
特に、部分可観測性、オクルージョン、および対象対称性は最終的に曖昧さを生じる。
本研究は, この多モード性を考慮するために, 6次元オブジェクトのポーズ推定のための拡散型生成モデルを訓練することを提案する。
推論の間、訓練された生成モデルは複数の粒子、すなわち仮説をサンプリングすることができる。
この情報を1つのポーズ推定値に抽出するために、追加のトレーニングや計算集約的な操作を必要としない2つの新規かつ効果的なポーズ選択戦略を提案する。
さらに、ポーズ推定のための既存の多くの手法は、主に画像領域に焦点をあて、最終ポーズ改善のための深度情報のみを組み込むが、我々のモデルは、ポイントクラウドデータのみを運用する。
このモデルは、ポイントクラウド処理の最近の進歩を活用し、SE(3)-同変ラテント空間上で動作し、粒子選択戦略の基礎を形成し、推論時間を改善することができる。
実験の結果,Linemodデータセットに対するアプローチの競合性能を実証し,設計選択の有効性を実証した。
コードはhttps://github.com/zitronian/6DPoseDiffusionで入手できる。
関連論文リスト
- Diffusion Features for Zero-Shot 6DoF Object Pose Estimation [7.949705607963995]
本研究は,ゼロショットポーズ推定における潜在拡散モデル (LDM) のバックボーンの影響を評価する。
LDMを用いたゼロショット方式でポーズを推定するテンプレートベースのマルチステージ手法を提案する。
論文 参考訳(メタデータ) (2024-11-25T18:53:56Z) - Generalizable Single-view Object Pose Estimation by Two-side Generating and Matching [19.730504197461144]
本稿では,RGB画像のみを用いてオブジェクトのポーズを決定するために,新しい一般化可能なオブジェクトポーズ推定手法を提案する。
本手法は,オブジェクトの参照画像1枚で操作し,3次元オブジェクトモデルやオブジェクトの複数ビューの必要性を解消する。
論文 参考訳(メタデータ) (2024-11-24T14:31:50Z) - FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects [55.77542145604758]
FoundationPoseは、6Dオブジェクトのポーズ推定と追跡のための統合基盤モデルである。
我々のアプローチは、微調整なしで、テスト時に新しいオブジェクトに即座に適用できる。
論文 参考訳(メタデータ) (2023-12-13T18:28:09Z) - DiffPose: SpatioTemporal Diffusion Model for Video-Based Human Pose
Estimation [16.32910684198013]
本稿では、条件付きヒートマップ生成問題として、ビデオに基づく人間のポーズ推定を定式化する新しい拡散アーキテクチャDiffPoseを提案する。
ポーズ推定タスクにおけるDiffPoseの特徴として,(i)複数のポーズ推定を組み合わせて予測精度を向上させる能力,(ii)モデルを再訓練することなく特徴改善のための反復的なステップ数を調整する能力,の2点を挙げる。
論文 参考訳(メタデータ) (2023-07-31T14:00:23Z) - PoseMatcher: One-shot 6D Object Pose Estimation by Deep Feature Matching [51.142988196855484]
本稿では,PoseMatcherを提案する。
3ビューシステムに基づくオブジェクトと画像のマッチングのための新しいトレーニングパイプラインを作成します。
PoseMatcherは、画像とポイントクラウドの異なる入力モダリティに対応できるように、IO-Layerを導入します。
論文 参考訳(メタデータ) (2023-04-03T21:14:59Z) - MegaPose: 6D Pose Estimation of Novel Objects via Render & Compare [84.80956484848505]
MegaPoseは、トレーニング中に見えない新しいオブジェクトの6Dポーズを推定する方法である。
本稿では,新しいオブジェクトに適用可能なR&Compare戦略に基づく6次元ポーズリファインダを提案する。
第2に,合成レンダリングと同一物体の観察画像間のポーズ誤差をリファインダで補正できるか否かを分類するために訓練されたネットワークを利用する,粗いポーズ推定のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-12-13T19:30:03Z) - CPPF++: Uncertainty-Aware Sim2Real Object Pose Estimation by Vote Aggregation [67.12857074801731]
そこで本研究では,シミュレートからリアルなポーズ推定のための新しい手法であるCPPF++を提案する。
投票衝突による課題に対処するため,投票の不確実性をモデル化する新たなアプローチを提案する。
ノイズの多いペアフィルタリング、オンラインアライメント最適化、機能アンサンブルなど、いくつかの革新的なモジュールを組み込んでいます。
論文 参考訳(メタデータ) (2022-11-24T03:27:00Z) - RNNPose: Recurrent 6-DoF Object Pose Refinement with Robust
Correspondence Field Estimation and Pose Optimization [46.144194562841435]
本稿では、オブジェクトポーズ改善のためのリカレントニューラルネットワーク(RNN)に基づくフレームワークを提案する。
この問題は、推定対応フィールドに基づいて非線形最小二乗問題として定式化される。
各イテレーションにおいて、対応フィールド推定とポーズ精錬を代替して行い、正確なオブジェクトポーズを復元する。
論文 参考訳(メタデータ) (2022-03-24T06:24:55Z) - Precise Object Placement with Pose Distance Estimations for Different
Objects and Grippers [7.883179102580462]
提案手法では,複数の6次元オブジェクトのポーズをオブジェクトクラスとともに推定し,オブジェクトのポーズ推定のためのポーズ距離,オブジェクト配置のためのターゲットからのポーズ距離を推定する。
モデル知識をシステムに組み込むことにより、我々の手法は最先端のモデルフリーアプローチよりも、把握に成功率が高い。
論文 参考訳(メタデータ) (2021-10-03T12:18:59Z) - Learning Monocular Depth in Dynamic Scenes via Instance-Aware Projection
Consistency [114.02182755620784]
本稿では,複数の動的物体の6-DoF動作,エゴモーション,深度を,監督なしで一眼レフカメラで明示的にモデル化する,エンドツーエンドのジョイントトレーニングフレームワークを提案する。
筆者らのフレームワークは,最先端の深度・動き推定法より優れていた。
論文 参考訳(メタデータ) (2021-02-04T14:26:42Z) - Deep Bingham Networks: Dealing with Uncertainty and Ambiguity in Pose
Estimation [74.76155168705975]
Deep Bingham Networks (DBN)は、3Dデータに関するほぼすべての実生活アプリケーションで発生するポーズ関連の不確実性と曖昧性を扱うことができる。
DBNは、(i)異なる分布モードを生成できる多仮説予測ヘッドにより、アートダイレクトポーズ回帰ネットワークの状態を拡張する。
トレーニング中のモードや後方崩壊を回避し,数値安定性を向上させるための新しいトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2020-12-20T19:20:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。