論文の概要: PhysPose: Refining 6D Object Poses with Physical Constraints
- arxiv url: http://arxiv.org/abs/2503.23587v1
- Date: Sun, 30 Mar 2025 20:52:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-01 19:35:57.193449
- Title: PhysPose: Refining 6D Object Poses with Physical Constraints
- Title(参考訳): PhysPose:6Dオブジェクトを物理的制約で精製する
- Authors: Martin Malenický, Martin Cífka, Médéric Fourmy, Louis Montaut, Justin Carpentier, Josef Sivic, Vladimir Petrik,
- Abstract要約: ポーズ推定に物理推論を統合する新しいアプローチであるPhysPoseを紹介する。
シーンジオメトリを活用することで、PhysPoseは物理的妥当性を確保するために推定値を取得する。
我々は、ロボット工学におけるその影響を、挑戦的なピック・アンド・プレイス・タスクの成功率を大幅に向上させることで実証する。
- 参考スコア(独自算出の注目度): 26.47867548297063
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate 6D object pose estimation from images is a key problem in object-centric scene understanding, enabling applications in robotics, augmented reality, and scene reconstruction. Despite recent advances, existing methods often produce physically inconsistent pose estimates, hindering their deployment in real-world scenarios. We introduce PhysPose, a novel approach that integrates physical reasoning into pose estimation through a postprocessing optimization enforcing non-penetration and gravitational constraints. By leveraging scene geometry, PhysPose refines pose estimates to ensure physical plausibility. Our approach achieves state-of-the-art accuracy on the YCB-Video dataset from the BOP benchmark and improves over the state-of-the-art pose estimation methods on the HOPE-Video dataset. Furthermore, we demonstrate its impact in robotics by significantly improving success rates in a challenging pick-and-place task, highlighting the importance of physical consistency in real-world applications.
- Abstract(参考訳): 画像からの正確な6Dオブジェクトのポーズ推定は、ロボット工学、拡張現実、シーン再構築の応用を可能にする、オブジェクト中心のシーン理解において重要な問題である。
近年の進歩にもかかわらず、既存の手法は物理的に矛盾したポーズ推定をしばしば生み出し、実際のシナリオへの展開を妨げている。
我々はPhysPoseを紹介した。これは物理推論を非ペネレーションと重力制約を強制する後処理最適化を通じてポーズ推定に統合する新しいアプローチである。
シーンジオメトリを活用することで、PhysPoseは物理的妥当性を確保するために推定値を取得する。
提案手法は,BOPベンチマークからYCB-Videoデータセットの最先端精度を達成し,HOPE-Videoデータセットの最先端ポーズ推定方法を改善する。
さらに、ロボット工学におけるその影響を、挑戦的なピック・アンド・プレイス・タスクの成功率を大幅に向上させ、現実世界のアプリケーションにおける物理的な一貫性の重要性を強調した。
関連論文リスト
- DynOPETs: A Versatile Benchmark for Dynamic Object Pose Estimation and Tracking in Moving Camera Scenarios [20.835782699441797]
本稿では,制約のない環境下でのオブジェクトポーズ推定と追跡のための新しいデータセットDynOPETを提案する。
提案手法は,ポーズ推定とポーズ追跡を革新的に統合し,擬似ラベルを生成する。
得られたデータセットは、動くカメラから観察される動的オブジェクトの正確なポーズアノテーションを提供する。
論文 参考訳(メタデータ) (2025-03-25T13:13:44Z) - Targeted Hard Sample Synthesis Based on Estimated Pose and Occlusion Error for Improved Object Pose Estimation [9.637714330461037]
モデルに依存しない新しいハードサンプル合成法を提案する。
本研究では,最先端ポーズ推定モデルを用いて,複数のROBIデータセットオブジェクトに対して最大20%の精度で検出率を向上することを示す。
論文 参考訳(メタデータ) (2024-12-05T16:00:55Z) - Physically Compatible 3D Object Modeling from a Single Image [109.98124149566927]
単一画像を3次元物理オブジェクトに変換するフレームワークを提案する。
我々のフレームワークは、リコンストラクションプロセスに物理的な互換性を組み込む。
既存の手法よりも3Dモデルの物理的リアリズムを一貫して強化する。
論文 参考訳(メタデータ) (2024-05-30T21:59:29Z) - DeepSimHO: Stable Pose Estimation for Hand-Object Interaction via
Physics Simulation [81.11585774044848]
我々は、前方物理シミュレーションと後方勾配近似とニューラルネットワークを組み合わせた新しいディープラーニングパイプラインであるDeepSimHOを紹介する。
提案手法は, 評価の安定性を著しく向上し, テスト時間最適化よりも優れた効率性を実現する。
論文 参考訳(メタデータ) (2023-10-11T05:34:36Z) - RNNPose: Recurrent 6-DoF Object Pose Refinement with Robust
Correspondence Field Estimation and Pose Optimization [46.144194562841435]
本稿では、オブジェクトポーズ改善のためのリカレントニューラルネットワーク(RNN)に基づくフレームワークを提案する。
この問題は、推定対応フィールドに基づいて非線形最小二乗問題として定式化される。
各イテレーションにおいて、対応フィールド推定とポーズ精錬を代替して行い、正確なオブジェクトポーズを復元する。
論文 参考訳(メタデータ) (2022-03-24T06:24:55Z) - A Bayesian Treatment of Real-to-Sim for Deformable Object Manipulation [59.29922697476789]
本稿では,変形可能な物体の状態を分布埋め込みとして表現する手法を用いて,画像列から状態情報を抽出する手法を提案する。
実験により, 弾性, 摩擦, スケールなどの物性の後方分布を, 布やロープなどの高変形性物体で推定できることが確認された。
論文 参考訳(メタデータ) (2021-12-09T17:50:54Z) - Spatial Attention Improves Iterative 6D Object Pose Estimation [52.365075652976735]
本稿では,RGB画像を用いた6次元ポーズ推定の改良手法を提案する。
私たちの主な洞察力は、最初のポーズ推定の後、オブジェクトの異なる空間的特徴に注意を払うことが重要です。
実験により,このアプローチが空間的特徴に順応することを学び,被写体の一部を無視することを学び,データセット間でのポーズ推定を改善することを実証した。
論文 参考訳(メタデータ) (2021-01-05T17:18:52Z) - Kinematic-Structure-Preserved Representation for Unsupervised 3D Human
Pose Estimation [58.72192168935338]
大規模インスタディオデータセットの監視を用いて開発された人間のポーズ推定モデルの一般化可能性については疑問が残る。
本稿では,2対あるいは2対の弱い監督者によって抑制されない,新しいキネマティック構造保存型非教師付き3次元ポーズ推定フレームワークを提案する。
提案モデルでは,前方運動学,カメラ投影,空間マップ変換という3つの連続的な微分可能変換を用いる。
論文 参考訳(メタデータ) (2020-06-24T23:56:33Z) - Occlusion resistant learning of intuitive physics from videos [52.25308231683798]
人工システムの鍵となる能力は、オブジェクト間の物理的相互作用を理解し、状況の将来的な結果を予測することである。
この能力は直感的な物理学と呼ばれ、近年注目されており、ビデオシーケンスからこれらの物理規則を学ぶためのいくつかの方法が提案されている。
論文 参考訳(メタデータ) (2020-04-30T19:35:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。