論文の概要: Box6D : Zero-shot Category-level 6D Pose Estimation of Warehouse Boxes
- arxiv url: http://arxiv.org/abs/2511.15884v1
- Date: Wed, 19 Nov 2025 21:22:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-21 17:08:52.378421
- Title: Box6D : Zero-shot Category-level 6D Pose Estimation of Warehouse Boxes
- Title(参考訳): Box6D : 倉庫箱のゼロショットカテゴリーレベルの6次元ポス推定
- Authors: Yintao Ma, Sajjad Pakdamansavoji, Amir Rasouli, Tongtong Cao,
- Abstract要約: 倉庫環境における記憶ボックスに適したカテゴリレベルの6Dポーズ推定手法であるBox6dを提案する。
Box6Dは、高速なバイナリ検索を通じてボックスの次元を推測し、カテゴリCADテンプレートを使用してポーズを推定する。
提案手法は, 提案手法の精度を向上し, 推定時間を約76%短縮する。
- 参考スコア(独自算出の注目度): 13.760323763554448
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate and efficient 6D pose estimation of novel objects under clutter and occlusion is critical for robotic manipulation across warehouse automation, bin picking, logistics, and e-commerce fulfillment. There are three main approaches in this domain; Model-based methods assume an exact CAD model at inference but require high-resolution meshes and transfer poorly to new environments; Model-free methods that rely on a few reference images or videos are more flexible, however often fail under challenging conditions; Category-level approaches aim to balance flexibility and accuracy but many are overly general and ignore environment and object priors, limiting their practicality in industrial settings. To this end, we propose Box6d, a category-level 6D pose estimation method tailored for storage boxes in the warehouse context. From a single RGB-D observation, Box6D infers the dimensions of the boxes via a fast binary search and estimates poses using a category CAD template rather than instance-specific models. Suing a depth-based plausibility filter and early-stopping strategy, Box6D then rejects implausible hypotheses, lowering computational cost. We conduct evaluations on real-world storage scenarios and public benchmarks, and show that our approach delivers competitive or superior 6D pose precision while reducing inference time by approximately 76%.
- Abstract(参考訳): クラッタおよび閉塞下での新規物体の高精度かつ効率的な6Dポーズ推定は、倉庫の自動化、ビンの摘み、物流、電子商取引のフルフィルメントにおけるロボット操作に不可欠である。
この領域には3つの主要なアプローチがある:モデルベースの手法は推論時に正確なCADモデルを仮定するが、高解像度のメッシュが必要であり、新しい環境への転送が不必要である; 少しの参照画像やビデオに依存するモデルフリーの手法はより柔軟だが、困難な条件下では失敗することが多い;カテゴリーレベルのアプローチは柔軟性と精度のバランスを目標としているが、多くは過度に一般的な環境やオブジェクトの事前を無視し、産業環境における実用性を制限している。
そこで本研究では,ストレージボックスに適したカテゴリレベルの6Dポーズ推定手法であるBox6dを提案する。
1つのRGB-D観測から、Box6Dは高速なバイナリサーチによってボックスの寸法を推定し、インスタンス固有のモデルではなくカテゴリCADテンプレートを使用してポーズを推定する。
深度に基づく可視性フィルタと早期停止戦略を仮定すると、Box6Dは不可解な仮説を拒絶し、計算コストを下げる。
実世界のストレージシナリオと公開ベンチマークの評価を行い、提案手法が競合性や優れた6Dポーズの精度を実現し、推論時間を約76%短縮することを示した。
関連論文リスト
- Any6D: Model-free 6D Pose Estimation of Novel Objects [76.30057578269668]
我々は,6次元オブジェクトのポーズ推定のためのモデルフリーフレームワークであるAny6Dを紹介する。
新たなシーンでは、未知の物体の6Dポーズと大きさを推定するために、1枚のRGB-Dアンカー画像しか必要としない。
提案手法を5つの挑戦的データセットで評価する。
論文 参考訳(メタデータ) (2025-03-24T13:46:21Z) - Category Level 6D Object Pose Estimation from a Single RGB Image using Diffusion [9.025235713063509]
一つのRGB画像からカテゴリレベルのオブジェクトのポーズ推定を行う難しい問題に対処する。
本稿では,特定のオブジェクトモデルや深度情報を必要としない新しいソリューションを提案する。
我々のアプローチは、REAL275データセットの現在の最先端をかなりのマージンで上回る。
論文 参考訳(メタデータ) (2024-12-16T03:39:33Z) - SA6D: Self-Adaptive Few-Shot 6D Pose Estimator for Novel and Occluded
Objects [24.360831082478313]
提案手法は,SA6Dと呼ばれる数ショットポーズ推定(FSPE)手法である。
自己適応的なセグメンテーションモジュールを使用して、新しいターゲットオブジェクトを特定し、ターゲットオブジェクトのポイントクラウドモデルを構築する。
実世界のテーブルトップオブジェクトデータセット上でSA6Dを評価し,既存のFSPE手法よりもSA6Dが優れていることを示す。
論文 参考訳(メタデータ) (2023-08-31T08:19:26Z) - Learning to Estimate 6DoF Pose from Limited Data: A Few-Shot,
Generalizable Approach using RGB Images [60.0898989456276]
本稿では,数ショットの6DoFポーズ推定のためのCas6Dという新しいフレームワークを提案する。
極めて少数の設定で対象物検出の偽陽性に対処するために,本フレームワークでは,自己教師付き事前学習型ViTを用いて,ロバストな特徴表現を学習する。
LINEMODとGenMOPデータセットの実験結果は、Cas6Dが32ショット設定で最先端の手法を9.2%、精度3.8%(Proj-5)で上回ることを示した。
論文 参考訳(メタデータ) (2023-06-13T07:45:42Z) - Rigidity-Aware Detection for 6D Object Pose Estimation [60.88857851869196]
最近の6Dオブジェクトのポーズ推定方法は、最初にオブジェクト検出を使用して2Dバウンディングボックスを取得し、実際にポーズを回帰する。
本研究では,6次元ポーズ推定において対象物体が剛性であるという事実を利用した剛性認識検出手法を提案する。
このアプローチの成功の鍵となるのは可視性マップであり、これは境界ボックス内の各ピクセルとボックス境界の間の最小障壁距離を用いて構築することを提案する。
論文 参考訳(メタデータ) (2023-03-22T09:02:54Z) - FS6D: Few-Shot 6D Pose Estimation of Novel Objects [116.34922994123973]
6Dオブジェクトポーズ推定ネットワークは、多数のオブジェクトインスタンスにスケールする能力に制限がある。
本研究では,未知の物体の6次元ポーズを,余分な訓練を伴わずにいくつかの支援ビューで推定する。
論文 参考訳(メタデータ) (2022-03-28T10:31:29Z) - CPS++: Improving Class-level 6D Pose and Shape Estimation From Monocular
Images With Self-Supervised Learning [74.53664270194643]
現代のモノクロ6Dポーズ推定手法は、少数のオブジェクトインスタンスにしか対応できない。
そこで本研究では,計量形状検索と組み合わせて,クラスレベルのモノクル6次元ポーズ推定手法を提案する。
1枚のRGB画像から正確な6Dポーズとメートル法形状を抽出できることを実験的に実証した。
論文 参考訳(メタデータ) (2020-03-12T15:28:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。