論文の概要: Benchmarking the Effects of Object Pose Estimation and Reconstruction on Robotic Grasping Success
- arxiv url: http://arxiv.org/abs/2602.17101v1
- Date: Thu, 19 Feb 2026 05:55:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-20 15:21:28.714907
- Title: Benchmarking the Effects of Object Pose Estimation and Reconstruction on Robotic Grasping Success
- Title(参考訳): 物体の姿勢推定と再構成がロボットグラスピング成功に及ぼす影響のベンチマーク
- Authors: Varun Burde, Pavel Burget, Torsten Sattler,
- Abstract要約: 3D再構成は、多くのロボット知覚タスクの基礎となるレイヤーとして機能する。
標準的な幾何学的評価は、再構成品質がロボット操作性能などの下流作業にどのように影響するかを反映していない。
本稿では,6次元ポーズ推定器と3次元メッシュモデルを用いた大規模物理モデルを提案する。
- 参考スコア(独自算出の注目度): 22.465450378914316
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D reconstruction serves as the foundational layer for numerous robotic perception tasks, including 6D object pose estimation and grasp pose generation. Modern 3D reconstruction methods for objects can produce visually and geometrically impressive meshes from multi-view images, yet standard geometric evaluations do not reflect how reconstruction quality influences downstream tasks such as robotic manipulation performance. This paper addresses this gap by introducing a large-scale, physics-based benchmark that evaluates 6D pose estimators and 3D mesh models based on their functional efficacy in grasping. We analyze the impact of model fidelity by generating grasps on various reconstructed 3D meshes and executing them on the ground-truth model, simulating how grasp poses generated with an imperfect model affect interaction with the real object. This assesses the combined impact of pose error, grasp robustness, and geometric inaccuracies from 3D reconstruction. Our results show that reconstruction artifacts significantly decrease the number of grasp pose candidates but have a negligible effect on grasping performance given an accurately estimated pose. Our results also reveal that the relationship between grasp success and pose error is dominated by spatial error, and even a simple translation error provides insight into the success of the grasping pose of symmetric objects. This work provides insight into how perception systems relate to object manipulation using robots.
- Abstract(参考訳): 3D再構成は、6Dオブジェクトのポーズ推定やつかみポーズ生成など、多数のロボット知覚タスクの基盤層として機能する。
オブジェクトの現代的な3D再構成手法は、多視点画像から視覚的および幾何学的に印象的なメッシュを生成することができるが、標準的な幾何学的評価は、ロボット操作性能などの下流タスクに、再構成品質がどのように影響するかを反映していない。
本稿では,6次元ポーズ推定器と3次元メッシュモデルとを,その機能的有効性に基づいて評価する,大規模物理ベースのベンチマークを導入することにより,このギャップを解消する。
本研究では, 各種3次元メッシュのグリップを生成し, グラウンド・トゥルース・モデル上で実行することにより, モデル忠実度の影響を解析し, 不完全なモデルによって生成されたグリップ・ポーズが実際の物体との相互作用にどのように影響するかをシミュレーションした。
これにより,3次元再構成によるポーズ誤差,強靭さの把握,幾何的不正確さの複合的影響を評価する。
以上の結果から,再建アーチファクトは把握ポーズ候補の数を著しく減少させるが,正確に推定されたポーズが得られた場合の把握性能には無視できる効果が認められた。
また, 認識成功とポーズ誤りの関係は空間的誤差が支配的であり, 単純な翻訳誤りでさえ, 対称物体の把握ポーズの成功についての知見を提供する。
この研究は、知覚システムがロボットを用いた物体操作とどのように関連しているかについての洞察を与える。
関連論文リスト
- EasyHOI: Unleashing the Power of Large Models for Reconstructing Hand-Object Interactions in the Wild [79.71523320368388]
本研究の目的は,手動物体のインタラクションを単一視点画像から再構築することである。
まず、手ポーズとオブジェクト形状を推定する新しいパイプラインを設計する。
最初の再構築では、事前に誘導された最適化方式を採用する。
論文 参考訳(メタデータ) (2024-11-21T16:33:35Z) - Floating No More: Object-Ground Reconstruction from a Single Image [33.34421517827975]
本研究では,3次元物体形状の再構成を目的とした新しい作業であるORG(Object Restruction with Ground)を紹介する。
提案手法では,2つのコンパクトなピクセルレベル表現を用いて,カメラ,オブジェクト,グラウンドの関係を表現している。
論文 参考訳(メタデータ) (2024-07-26T17:59:56Z) - Uncertainty-aware Active Learning of NeRF-based Object Models for Robot Manipulators using Visual and Re-orientation Actions [8.059133373836913]
本稿では,ロボットが対象物の完全な3次元モデルを高速に学習し,不慣れな方向で操作できるアプローチを提案する。
我々は、部分的に構築されたNeRFモデルのアンサンブルを用いて、モデルの不確実性を定量化し、次の動作を決定する。
提案手法は, 部分的NeRFモデルにより対象物をいつ, どのように把握し, 再指向するかを判断し, 相互作用中に導入された不整合を補正するために, 対象のポーズを再推定する。
論文 参考訳(メタデータ) (2024-04-02T10:15:06Z) - MegaPose: 6D Pose Estimation of Novel Objects via Render & Compare [84.80956484848505]
MegaPoseは、トレーニング中に見えない新しいオブジェクトの6Dポーズを推定する方法である。
本稿では,新しいオブジェクトに適用可能なR&Compare戦略に基づく6次元ポーズリファインダを提案する。
第2に,合成レンダリングと同一物体の観察画像間のポーズ誤差をリファインダで補正できるか否かを分類するために訓練されたネットワークを利用する,粗いポーズ推定のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-12-13T19:30:03Z) - Few-View Object Reconstruction with Unknown Categories and Camera Poses [80.0820650171476]
この研究は、カメラのポーズやオブジェクトのカテゴリを知らない少数の画像から、一般的な現実世界のオブジェクトを再構築する。
私たちの研究の要点は、形状再構成とポーズ推定という、2つの基本的な3D視覚問題を解決することです。
提案手法は,各ビューから3次元特徴を予測し,それらを入力画像と組み合わせて活用し,クロスビュー対応を確立する。
論文 参考訳(メタデータ) (2022-12-08T18:59:02Z) - Kinematic-Structure-Preserved Representation for Unsupervised 3D Human
Pose Estimation [58.72192168935338]
大規模インスタディオデータセットの監視を用いて開発された人間のポーズ推定モデルの一般化可能性については疑問が残る。
本稿では,2対あるいは2対の弱い監督者によって抑制されない,新しいキネマティック構造保存型非教師付き3次元ポーズ推定フレームワークを提案する。
提案モデルでは,前方運動学,カメラ投影,空間マップ変換という3つの連続的な微分可能変換を用いる。
論文 参考訳(メタデータ) (2020-06-24T23:56:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。