論文の概要: Mind the Shape Gap: A Benchmark and Baseline for Deformation-Aware 6D Pose Estimation of Agricultural Produce
- arxiv url: http://arxiv.org/abs/2603.27429v1
- Date: Sat, 28 Mar 2026 22:06:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:44.953654
- Title: Mind the Shape Gap: A Benchmark and Baseline for Deformation-Aware 6D Pose Estimation of Agricultural Produce
- Title(参考訳): マインド・ザ・シェイプ・ギャップ:農業生産物の変形を考慮した6Dポス推定のためのベンチマークとベースライン
- Authors: Nikolas Chatzis, Angeliki Tsinouka, Katerina Papadimitriou, Niki Efthymiou, Marios Glytsos, George Retsinas, Paris Oikonomou, Gerasimos Potamianos, Petros Maragos, Panagiotis Paraskevas Filntisis,
- Abstract要約: PEARは,8つのカテゴリーにまたがって,関節6次元ポーズと3次元変形基底真理を提供する最初のベンチマークである。
実世界の生産物に固有の幾何学的偏差に直面すると,最先端の手法が最大6倍の性能劣化に悩まされることを示す。
単一画像からの6次元ポーズと明示的な格子変形を共同で予測する統合RGBのみのフレームワークSEEDを提案する。
- 参考スコア(独自算出の注目度): 32.03751544524548
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate 6D pose estimation for robotic harvesting is fundamentally hindered by the biological deformability and high intra-class shape variability of agricultural produce. Instance-level methods fail in this setting, as obtaining exact 3D models for every unique piece of produce is practically infeasible, while category-level approaches that rely on a fixed template suffer significant accuracy degradation when the prior deviates from the true instance geometry. To bridge such lack of robustness to deformation, we introduce PEAR (Pose and dEformation of Agricultural pRoduce), the first benchmark providing joint 6D pose and per-instance 3D deformation ground truth across 8 produce categories, acquired via a robotic manipulator for high annotation accuracy. Using PEAR, we show that state-of-the-art methods suffer up to 6x performance degradation when faced with the inherent geometric deviations of real-world produce. Motivated by this finding, we propose SEED (Simultaneous Estimation of posE and Deformation), a unified RGB-only framework that jointly predicts 6D pose and explicit lattice deformations from a single image across multiple produce categories. Trained entirely on synthetic data with generative texture augmentation applied at the UV level, SEED outperforms MegaPose on 6 out of 8 categories under identical RGB-only conditions, demonstrating that explicit shape modeling is a critical step toward reliable pose estimation in agricultural robotics.
- Abstract(参考訳): ロボット収穫における高精度な6次元ポーズ推定は, 生物変形性や農作物のクラス内形状のばらつきによって根本的に阻害される。
インスタンスレベルの手法はこの設定では失敗し、各ユニークな生産物に対して正確な3Dモデルを取得することは事実上不可能であり、一方、固定テンプレートに依存するカテゴリレベルのアプローチは、前のインスタンスが真のインスタンス形状から逸脱した場合、かなり精度が低下する。
PEAR(Pose and dEformation of Agricultural pRoduce)は,ロボットマニピュレータを用いて高精度な精度で取得した8つのカテゴリーにまたがる関節6Dポーズと3次元変形グラウンド真実を提供する最初のベンチマークである。
PEARを用いて、実世界の生産物に固有の幾何学的偏差に直面すると、最先端の手法が最大6倍の性能劣化に悩まされることを示す。
この発見を動機として,複数生成カテゴリにまたがる単一画像からの6次元ポーズと明示的な変形を共同で予測する統一RGB専用フレームワークSEED(Simultaneous Estimation of posE and deformation)を提案する。
SEEDは、UVレベルに適用された生成的テクスチャ増強による合成データに基づいて、同一のRGBのみの条件下で8つのカテゴリのうち6つでMegaPoseを上回り、農業ロボット工学において、明確な形状モデリングが信頼性の高いポーズ推定への重要なステップであることを実証した。
関連論文リスト
- Beyond 'Templates': Category-Agnostic Object Pose, Size, and Shape Estimation from a Single View [69.6117755984012]
物体の6Dポーズ、サイズ、形状を視覚入力から推定することは、コンピュータビジョンの基本的な問題である。
一つのRGB-D画像から6次元のポーズ,サイズ,密な形状を同時に予測する統合されたカテゴリ非依存フレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-13T17:49:15Z) - UnPose: Uncertainty-Guided Diffusion Priors for Zero-Shot Pose Estimation [19.76147681894604]
UnPoseはゼロショットでモデルなしの6Dオブジェクトのポーズ推定と再構成のためのフレームワークである。
事前訓練された拡散モデルから3Dの先行値と不確実性の推定値を利用する。
6次元ポーズ推定精度と3次元再構成品質の両方において、既存のアプローチを著しく上回っている。
論文 参考訳(メタデータ) (2025-08-21T21:31:04Z) - Category-Level 6D Object Pose Estimation in Agricultural Settings Using a Lattice-Deformation Framework and Diffusion-Augmented Synthetic Data [22.68237431620023]
我々は、RGB入力にのみ依存するカテゴリ6D推定のための新しいフレームワークを開発する。
各種形状,大きさ,熟度の評価に挑戦するベンチマーク評価において,本フレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2025-05-30T14:25:52Z) - Any6D: Model-free 6D Pose Estimation of Novel Objects [76.30057578269668]
我々は,6次元オブジェクトのポーズ推定のためのモデルフリーフレームワークであるAny6Dを紹介する。
新たなシーンでは、未知の物体の6Dポーズと大きさを推定するために、1枚のRGB-Dアンカー画像しか必要としない。
提案手法を5つの挑戦的データセットで評価する。
論文 参考訳(メタデータ) (2025-03-24T13:46:21Z) - Zero123-6D: Zero-shot Novel View Synthesis for RGB Category-level 6D Pose Estimation [66.3814684757376]
本研究は,RGB 6Dのカテゴリレベルでのポーズ推定を向上するための拡散モデルに基づく新規ビュー合成器の実用性を示す最初の研究であるZero123-6Dを示す。
本手法は,データ要求の低減,ゼロショットカテゴリレベルの6Dポーズ推定タスクにおける深度情報の必要性の除去,およびCO3Dデータセットの実験により定量的に示された性能の向上を示す。
論文 参考訳(メタデータ) (2024-03-21T10:38:18Z) - FSD: Fast Self-Supervised Single RGB-D to Categorical 3D Objects [37.175069234979645]
本研究は,実世界の3次元ラベル付きデータに依存しない3次元オブジェクト認識の課題に対処する。
我々のゴールは、単一のRGB-D画像内のオブジェクトの3次元形状、サイズ、および6次元のポーズを予測し、カテゴリレベルで動作し、推論中のCADモデルの必要性を排除することである。
論文 参考訳(メタデータ) (2023-10-19T17:59:09Z) - SO-Pose: Exploiting Self-Occlusion for Direct 6D Pose Estimation [98.83762558394345]
SO-Poseは、オブジェクトの6自由度(6DoF)をすべて、単一のRGBイメージから散らばった環境でポーズさせるフレームワークである。
本稿では,3次元オブジェクトの2層表現を確立するために,自己閉塞に関する新たな推論を導入する。
対応性,自己閉塞性,6次元ポーズを整列する層間合成により,精度とロバスト性をさらに向上させることができる。
論文 参考訳(メタデータ) (2021-08-18T19:49:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。