論文の概要: SE(3)-PoseFlow: Estimating 6D Pose Distributions for Uncertainty-Aware Robotic Manipulation
- arxiv url: http://arxiv.org/abs/2511.01501v1
- Date: Mon, 03 Nov 2025 12:11:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 16:37:27.250787
- Title: SE(3)-PoseFlow: Estimating 6D Pose Distributions for Uncertainty-Aware Robotic Manipulation
- Title(参考訳): SE(3)-PoseFlow:不確実性を考慮したロボットマニピュレーションのための6次元空間分布の推定
- Authors: Yufeng Jin, Niklas Funk, Vignesh Prasad, Zechu Li, Mathias Franzius, Jan Peters, Georgia Chalvatzaki,
- Abstract要約: 本稿では,SE(3)多様体上のフローマッチングを利用して6次元オブジェクトのポーズ分布を推定する新しい確率的フレームワークを提案する。
我々はReal275、YCB-V、LM-Oの最先端の成果を達成し、下流ロボット操作タスクにおいてサンプルベースのポーズ推定がどのように活用できるかを実証した。
- 参考スコア(独自算出の注目度): 21.433019604658366
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Object pose estimation is a fundamental problem in robotics and computer vision, yet it remains challenging due to partial observability, occlusions, and object symmetries, which inevitably lead to pose ambiguity and multiple hypotheses consistent with the same observation. While deterministic deep networks achieve impressive performance under well-constrained conditions, they are often overconfident and fail to capture the multi-modality of the underlying pose distribution. To address these challenges, we propose a novel probabilistic framework that leverages flow matching on the SE(3) manifold for estimating 6D object pose distributions. Unlike existing methods that regress a single deterministic output, our approach models the full pose distribution with a sample-based estimate and enables reasoning about uncertainty in ambiguous cases such as symmetric objects or severe occlusions. We achieve state-of-the-art results on Real275, YCB-V, and LM-O, and demonstrate how our sample-based pose estimates can be leveraged in downstream robotic manipulation tasks such as active perception for disambiguating uncertain viewpoints or guiding grasp synthesis in an uncertainty-aware manner.
- Abstract(参考訳): 物体のポーズ推定はロボティクスやコンピュータビジョンの基本的な問題であるが、部分的な観測可能性、オクルージョン、物体対称性により、必然的にあいまいさや複数の仮説が同じ観測と一致しているため、依然として困難である。
決定論的深層ネットワークは、よく制約された条件下では印象的な性能を達成するが、それらはしばしば過度に信頼され、基礎となるポーズ分布の多重モダリティを捉えることができない。
これらの課題に対処するために,SE(3)多様体上のフローマッチングを利用して6次元オブジェクトのポーズ分布を推定する新しい確率的フレームワークを提案する。
単一決定論的出力を回帰する既存の手法とは異なり、我々のアプローチはサンプルベース推定で完全なポーズ分布をモデル化し、対称オブジェクトや重度オクルージョンのような曖昧なケースにおける不確実性について推論することができる。
我々は,Real275,YCB-V,LM-Oの最先端の成果を達成し,不確実な視点を曖昧にしたり,不確実性を意識した理解合成を導くために,我々のサンプルベースのポーズ推定が,下流ロボット操作タスクにどのように活用できるかを実証した。
関連論文リスト
- Adaptive Dual Uncertainty Optimization: Boosting Monocular 3D Object Detection under Test-Time Shifts [80.32933059529135]
TTA(Test-Time Adaptation)メソッドが出現し、推論中にターゲット分布に適応する。
我々は、堅牢なM3ODの両不確実性を共同で最小化するために設計された、最初のTTAフレームワークであるDual Uncertainity Optimization (DUO)を提案する。
並列に,明瞭な意味的手がかりを持つ領域における幾何学的コヒーレンスを保存する意味認識型正規場制約を設計する。
論文 参考訳(メタデータ) (2025-08-28T07:09:21Z) - Uncertainty-aware Probabilistic 3D Human Motion Forecasting via Invertible Networks [6.671593490919892]
人間の3D動作予測は、自律的なアプリケーションの実現を目的としている。
本稿では,不整合空間におけるポーズをパラメータ化するための非可逆ネットワークを導入したProbHMIを提案する。
予測モジュールは将来の潜伏分布を明示的に予測し、効果的な不確実性定量化を可能にする。
論文 参考訳(メタデータ) (2025-07-19T17:02:07Z) - ProPLIKS: Probablistic 3D human body pose estimation [7.397323069796547]
本稿では,確率論的モデルを用いた3次元人間のポーズ推定手法を提案する。
具体的には,SO(3)回転群に配向した流れを正規化し,M"オビウス変換に基づく結合機構を組み込む。
また,これらの入力を様々なポーズにマッピングする作業として,2次元画素配列の入力から3次元人物を再構成する課題を再解釈する。
論文 参考訳(メタデータ) (2024-12-05T23:21:05Z) - HandFlow: Quantifying View-Dependent 3D Ambiguity in Two-Hand
Reconstruction with Normalizing Flow [73.7895717883622]
条件付き正規化フローフレームワークにおける可塑性再構成の分布を明示的にモデル化する。
この課題に対して,明示的な曖昧さモデリングが適していることを示す。
論文 参考訳(メタデータ) (2022-10-04T15:42:22Z) - Ki-Pode: Keypoint-based Implicit Pose Distribution Estimation of Rigid
Objects [1.209625228546081]
本稿では,新しいポーズ分布推定法を提案する。
オブジェクトのポーズ上の確率分布の暗黙的な定式化は、キーポイントの集合としてのオブジェクトの中間表現から導かれる。
本手法は,YCB-VおよびT-LESSデータセット上での回転分布推定のタスクに基づいて評価されている。
論文 参考訳(メタデータ) (2022-09-20T11:59:05Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Implicit-PDF: Non-Parametric Representation of Probability Distributions
on the Rotation Manifold [47.31074799708132]
我々はSO(3)上の任意の非パラメトリック分布を推定する手法を提案する。
私たちのキーとなるアイデアは、入力画像と候補ポーズの確率を推定するニューラルネットワークで、分布を暗黙的に表現することです。
我々はPascal3D+とModelNet10-SO(3)ベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2021-06-10T17:57:23Z) - Deep Bingham Networks: Dealing with Uncertainty and Ambiguity in Pose
Estimation [74.76155168705975]
Deep Bingham Networks (DBN)は、3Dデータに関するほぼすべての実生活アプリケーションで発生するポーズ関連の不確実性と曖昧性を扱うことができる。
DBNは、(i)異なる分布モードを生成できる多仮説予測ヘッドにより、アートダイレクトポーズ回帰ネットワークの状態を拡張する。
トレーニング中のモードや後方崩壊を回避し,数値安定性を向上させるための新しいトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2020-12-20T19:20:26Z) - Kinematic-Structure-Preserved Representation for Unsupervised 3D Human
Pose Estimation [58.72192168935338]
大規模インスタディオデータセットの監視を用いて開発された人間のポーズ推定モデルの一般化可能性については疑問が残る。
本稿では,2対あるいは2対の弱い監督者によって抑制されない,新しいキネマティック構造保存型非教師付き3次元ポーズ推定フレームワークを提案する。
提案モデルでは,前方運動学,カメラ投影,空間マップ変換という3つの連続的な微分可能変換を用いる。
論文 参考訳(メタデータ) (2020-06-24T23:56:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。