論文の概要: Omni6DPose: A Benchmark and Model for Universal 6D Object Pose Estimation and Tracking
- arxiv url: http://arxiv.org/abs/2406.04316v1
- Date: Thu, 6 Jun 2024 17:57:20 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-07 13:20:51.163668
- Title: Omni6DPose: A Benchmark and Model for Universal 6D Object Pose Estimation and Tracking
- Title(参考訳): Omni6DPose:Universal 6D Object Poseの推定と追跡のためのベンチマークとモデル
- Authors: Jiyao Zhang, Weiyao Huang, Bo Peng, Mingdong Wu, Fei Hu, Zijian Chen, Bo Zhao, Hao Dong,
- Abstract要約: 6D Object Pose Estimationは、大規模なデータセットの不足に悩まされているコンピュータビジョンにおいて、決定的に難しいタスクである。
本稿では,Omni6DPoseについて紹介する。Omni6DPoseは,オブジェクトのカテゴリ,大規模,多様性の多様性を特徴とするデータセットである。
我々は、SOTAカテゴリレベルのポーズ推定フレームワークの強化版であるGenPose++を紹介し、2つの重要な改善を取り入れた。
- 参考スコア(独自算出の注目度): 9.365544189576363
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 6D Object Pose Estimation is a crucial yet challenging task in computer vision, suffering from a significant lack of large-scale datasets. This scarcity impedes comprehensive evaluation of model performance, limiting research advancements. Furthermore, the restricted number of available instances or categories curtails its applications. To address these issues, this paper introduces Omni6DPose, a substantial dataset characterized by its diversity in object categories, large scale, and variety in object materials. Omni6DPose is divided into three main components: ROPE (Real 6D Object Pose Estimation Dataset), which includes 332K images annotated with over 1.5M annotations across 581 instances in 149 categories; SOPE(Simulated 6D Object Pose Estimation Dataset), consisting of 475K images created in a mixed reality setting with depth simulation, annotated with over 5M annotations across 4162 instances in the same 149 categories; and the manually aligned real scanned objects used in both ROPE and SOPE. Omni6DPose is inherently challenging due to the substantial variations and ambiguities. To address this challenge, we introduce GenPose++, an enhanced version of the SOTA category-level pose estimation framework, incorporating two pivotal improvements: Semantic-aware feature extraction and Clustering-based aggregation. Moreover, we provide a comprehensive benchmarking analysis to evaluate the performance of previous methods on this large-scale dataset in the realms of 6D object pose estimation and pose tracking.
- Abstract(参考訳): 6D Object Pose Estimationは、大規模なデータセットの不足に悩まされているコンピュータビジョンにおいて、決定的に難しいタスクである。
この不足は、モデル性能の包括的な評価を妨げ、研究の進歩を制限する。
さらに、利用可能なインスタンスやカテゴリの制限された数は、そのアプリケーションに要する。
これらの課題に対処するために,Omni6DPoseについて紹介する。
Omni6DPoseは3つの主要コンポーネントに分けられる: ROPE (Real 6D Object Pose Estimation Dataset) は、149のカテゴリで581のインスタンスに1.5M以上のアノテーションで注釈付けされた332Kイメージ、SOPE (Simulated 6D Object Pose Estimation Dataset) は475Kイメージで構成され、深さシミュレーションと混合現実設定で作成され、同じ149のカテゴリで4162のインスタンスで5M以上のアノテーションで注釈付けされている。
Omni6DPoseは、実質的な変異と曖昧さのために本質的に困難である。
この課題に対処するために、私たちは、SOTAカテゴリレベルのポーズ推定フレームワークの拡張バージョンであるGenPose++を導入し、セマンティックな特徴抽出とクラスタリングベースのアグリゲーションという2つの重要な改善を取り入れた。
さらに,6次元オブジェクトのポーズ推定とポーズ追跡の領域において,この大規模データセット上での過去の手法の性能を評価するための総合的なベンチマーク分析を行う。
関連論文リスト
- Omni6D: Large-Vocabulary 3D Object Dataset for Category-Level 6D Object Pose Estimation [74.44739529186798]
Omni6Dは、さまざまなカテゴリとさまざまな背景を持つ総合的なRGBDデータセットである。
データセットは166のカテゴリ、標準ポーズに調整された4688のインスタンス、0.8万以上のキャプチャで構成されている。
我々は、このイニシアチブが、産業と学術の両方において、新たな洞察と実質的な進歩の道を開くと信じている。
論文 参考訳(メタデータ) (2024-09-26T20:13:33Z) - SA6D: Self-Adaptive Few-Shot 6D Pose Estimator for Novel and Occluded
Objects [24.360831082478313]
提案手法は,SA6Dと呼ばれる数ショットポーズ推定(FSPE)手法である。
自己適応的なセグメンテーションモジュールを使用して、新しいターゲットオブジェクトを特定し、ターゲットオブジェクトのポイントクラウドモデルを構築する。
実世界のテーブルトップオブジェクトデータセット上でSA6Dを評価し,既存のFSPE手法よりもSA6Dが優れていることを示す。
論文 参考訳(メタデータ) (2023-08-31T08:19:26Z) - POPE: 6-DoF Promptable Pose Estimation of Any Object, in Any Scene, with
One Reference [72.32413378065053]
Promptable Object Pose Estimation (POPE) と呼ばれるオブジェクトポーズ推定のための一般的なパラダイムを提案する。
POPEは、任意のシーンの任意の対象オブジェクトに対してゼロショット6DoFオブジェクトのポーズ推定を可能にし、サポートビューは単一の参照のみを採用する。
総合的な実験結果から、POPEはゼロショット設定で非競合なロバストな性能を示すことが示された。
論文 参考訳(メタデータ) (2023-05-25T05:19:17Z) - HouseCat6D -- A Large-Scale Multi-Modal Category Level 6D Object
Perception Dataset with Household Objects in Realistic Scenarios [41.54851386729952]
新しいカテゴリレベルの6DポーズデータセットであるHouseCat6Dを紹介する。
1) ポラリメトリック RGB と Depth (RGBD+P) によるマルチモダリティ、2) フォトメトリックに挑戦する2つのカテゴリを含む10のカテゴリにわたる194の多様なオブジェクトを含み、3) エラー範囲が 1.35 mm から 1.74 mm である高品質なポーズアノテーションを提供する。
論文 参考訳(メタデータ) (2022-12-20T17:06:32Z) - MegaPose: 6D Pose Estimation of Novel Objects via Render & Compare [84.80956484848505]
MegaPoseは、トレーニング中に見えない新しいオブジェクトの6Dポーズを推定する方法である。
本稿では,新しいオブジェクトに適用可能なR&Compare戦略に基づく6次元ポーズリファインダを提案する。
第2に,合成レンダリングと同一物体の観察画像間のポーズ誤差をリファインダで補正できるか否かを分類するために訓練されたネットワークを利用する,粗いポーズ推定のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-12-13T19:30:03Z) - A mixed-reality dataset for category-level 6D pose and size estimation
of hand-occluded containers [36.189924244458595]
カテゴリーレベルの6次元オブジェクトのポーズとサイズ推定のための,手持ち容器の混合現実性データセットを提案する。
データセットは、レンダリングされた手と48の合成オブジェクトを保持する前腕の138,240の画像で構成され、30の実際の背景に対して3つの把握カテゴリに分けられる。
論文 参考訳(メタデータ) (2022-11-18T19:14:52Z) - Unseen Object 6D Pose Estimation: A Benchmark and Baselines [62.8809734237213]
本稿では,新しい物体の6次元ポーズ推定をアルゴリズムで行えるようにするための新しいタスクを提案する。
実画像と合成画像の両方でデータセットを収集し、テストセットで最大48個の未確認オブジェクトを収集する。
エンド・ツー・エンドの3D対応ネットワークをトレーニングすることにより、未確認物体と部分ビューRGBD画像との対応点を高精度かつ効率的に見つけることができる。
論文 参考訳(メタデータ) (2022-06-23T16:29:53Z) - PhoCaL: A Multi-Modal Dataset for Category-Level Object Pose Estimation
with Photometrically Challenging Objects [45.31344700263873]
我々は、PhoCaLと呼ばれる光度に挑戦するオブジェクトを用いたカテゴリレベルのオブジェクトポーズ推定のためのマルチモーダルデータセットを提案する。
PhoCaLは、高い反射率、透明度、対称度を含む8種類以上の家庭用品の60種類の高品質な3Dモデルで構成されている。
これにより、不透明で光沢のある透明な物体のポーズのサブミリ秒精度が保証され、動きのぼやけも無く、カメラの同期も完璧になる。
論文 参考訳(メタデータ) (2022-05-18T09:21:09Z) - DONet: Learning Category-Level 6D Object Pose and Size Estimation from
Depth Observation [53.55300278592281]
単一深度画像からカテゴリレベルの6次元オブジェクト・ポースとサイズ推定(COPSE)を提案する。
筆者らのフレームワークは,深度チャネルのみの物体のリッチな幾何学的情報に基づいて推論を行う。
我々のフレームワークは、ラベル付き現実世界の画像を必要とする最先端のアプローチと競合する。
論文 参考訳(メタデータ) (2021-06-27T10:41:50Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。