論文の概要: PhoCaL: A Multi-Modal Dataset for Category-Level Object Pose Estimation
with Photometrically Challenging Objects
- arxiv url: http://arxiv.org/abs/2205.08811v1
- Date: Wed, 18 May 2022 09:21:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-19 13:00:26.320285
- Title: PhoCaL: A Multi-Modal Dataset for Category-Level Object Pose Estimation
with Photometrically Challenging Objects
- Title(参考訳): PhoCaL:光干渉型オブジェクトを用いたカテゴリーレベルオブジェクト位置推定のためのマルチモーダルデータセット
- Authors: Pengyuan Wang, HyunJun Jung, Yitong Li, Siyuan Shen, Rahul
Parthasarathy Srikanth, Lorenzo Garattoni, Sven Meier, Nassir Navab, Benjamin
Busam
- Abstract要約: 我々は、PhoCaLと呼ばれる光度に挑戦するオブジェクトを用いたカテゴリレベルのオブジェクトポーズ推定のためのマルチモーダルデータセットを提案する。
PhoCaLは、高い反射率、透明度、対称度を含む8種類以上の家庭用品の60種類の高品質な3Dモデルで構成されている。
これにより、不透明で光沢のある透明な物体のポーズのサブミリ秒精度が保証され、動きのぼやけも無く、カメラの同期も完璧になる。
- 参考スコア(独自算出の注目度): 45.31344700263873
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Object pose estimation is crucial for robotic applications and augmented
reality. Beyond instance level 6D object pose estimation methods, estimating
category-level pose and shape has become a promising trend. As such, a new
research field needs to be supported by well-designed datasets. To provide a
benchmark with high-quality ground truth annotations to the community, we
introduce a multimodal dataset for category-level object pose estimation with
photometrically challenging objects termed PhoCaL. PhoCaL comprises 60 high
quality 3D models of household objects over 8 categories including highly
reflective, transparent and symmetric objects. We developed a novel
robot-supported multi-modal (RGB, depth, polarisation) data acquisition and
annotation process. It ensures sub-millimeter accuracy of the pose for opaque
textured, shiny and transparent objects, no motion blur and perfect camera
synchronisation. To set a benchmark for our dataset, state-of-the-art RGB-D and
monocular RGB methods are evaluated on the challenging scenes of PhoCaL.
- Abstract(参考訳): オブジェクトのポーズ推定はロボットアプリケーションや拡張現実にとって不可欠である。
インスタンスレベルの6Dオブジェクトのポーズ推定方法以外にも、カテゴリレベルのポーズと形状の推定は有望なトレンドとなっている。
そのため、適切に設計されたデータセットによって新しい研究分野をサポートする必要がある。
本稿では,PhoCaL と呼ばれる写真に挑戦するオブジェクトを用いたカテゴリレベルのオブジェクトポーズ推定のためのマルチモーダルデータセットを提案する。
phocalは、高反射率、透明、対称のオブジェクトを含む8つのカテゴリの家庭用オブジェクトの60の高品質な3dモデルで構成されている。
我々は,ロボット支援型マルチモーダル(RGB,深さ,偏光)データ取得およびアノテーションプロセスを開発した。
これにより、不透明なテクスチャ、光沢のある透明な物体、動きのぼやけがなく、完璧なカメラ同期のためのポーズのサブミリメートル精度が保証される。
我々のデータセットのベンチマークを作成するために,PhoCaLの挑戦的なシーンにおいて,最先端のRGB-DとモノクルのRGB手法を評価した。
関連論文リスト
- Omni6D: Large-Vocabulary 3D Object Dataset for Category-Level 6D Object Pose Estimation [74.44739529186798]
Omni6Dは、さまざまなカテゴリとさまざまな背景を持つ総合的なRGBDデータセットである。
データセットは166のカテゴリ、標準ポーズに調整された4688のインスタンス、0.8万以上のキャプチャで構成されている。
我々は、このイニシアチブが、産業と学術の両方において、新たな洞察と実質的な進歩の道を開くと信じている。
論文 参考訳(メタデータ) (2024-09-26T20:13:33Z) - Multi-Modal Dataset Acquisition for Photometrically Challenging Object [56.30027922063559]
本稿では,3次元視覚タスクにおける現在のデータセットの限界について,精度,サイズ,リアリズム,および光度に挑戦する対象に対する適切な画像モダリティの観点から検討する。
既存の3次元認識と6次元オブジェクトポーズデータセットを強化する新しいアノテーションと取得パイプラインを提案する。
論文 参考訳(メタデータ) (2023-08-21T10:38:32Z) - MV-ROPE: Multi-view Constraints for Robust Category-level Object Pose and Size Estimation [23.615122326731115]
本稿では,RGBビデオストリームを利用した新しいソリューションを提案する。
本フレームワークは,スケール対応単分子高密度SLAMソリューション,軽量オブジェクトポーズ予測器,オブジェクトレベルのポーズグラフの3つのモジュールから構成される。
提案手法は,高精細度情報を用いた公開データセットを用いた場合,最先端のRGB-D手法に匹敵する性能を示す。
論文 参考訳(メタデータ) (2023-08-17T08:29:54Z) - HouseCat6D -- A Large-Scale Multi-Modal Category Level 6D Object
Perception Dataset with Household Objects in Realistic Scenarios [41.54851386729952]
新しいカテゴリレベルの6DポーズデータセットであるHouseCat6Dを紹介する。
1) ポラリメトリック RGB と Depth (RGBD+P) によるマルチモダリティ、2) フォトメトリックに挑戦する2つのカテゴリを含む10のカテゴリにわたる194の多様なオブジェクトを含み、3) エラー範囲が 1.35 mm から 1.74 mm である高品質なポーズアノテーションを提供する。
論文 参考訳(メタデータ) (2022-12-20T17:06:32Z) - MegaPose: 6D Pose Estimation of Novel Objects via Render & Compare [84.80956484848505]
MegaPoseは、トレーニング中に見えない新しいオブジェクトの6Dポーズを推定する方法である。
本稿では,新しいオブジェクトに適用可能なR&Compare戦略に基づく6次元ポーズリファインダを提案する。
第2に,合成レンダリングと同一物体の観察画像間のポーズ誤差をリファインダで補正できるか否かを分類するために訓練されたネットワークを利用する,粗いポーズ推定のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-12-13T19:30:03Z) - Object Level Depth Reconstruction for Category Level 6D Object Pose
Estimation From Monocular RGB Image [12.382992538846896]
本稿では,RGB画像のみをカテゴリレベルの6Dオブジェクトポーズ推定の入力として用いたオブジェクトレベル深さ再構成ネットワーク(OLD-Net)を提案する。
本稿では,一眼レフ画像からオブジェクトレベルの深度と標準NOCS表現に先立ってカテゴリレベルの形状を変形させることにより,オブジェクトレベルの深度を直接予測する。
挑戦的なCAMERA25とREAL275データセットの実験は、我々のモデルが最先端のパフォーマンスを達成することを示している。
論文 参考訳(メタデータ) (2022-04-04T15:33:28Z) - StereOBJ-1M: Large-scale Stereo Image Dataset for 6D Object Pose
Estimation [43.839322860501596]
本稿では,大規模なステレオRGB画像オブジェクトのポーズ推定データセットであるtextbfStereOBJ-1M$データセットを提案する。
このデータセットは、オブジェクトの透明性、透過性、スペキュラリフレクションといった困難なケースに対処するように設計されている。
複雑で柔軟な環境でデータをキャプチャできる多視点方式でポーズデータを効率的にアノテートする新しい手法を提案する。
論文 参考訳(メタデータ) (2021-09-21T11:56:38Z) - DONet: Learning Category-Level 6D Object Pose and Size Estimation from
Depth Observation [53.55300278592281]
単一深度画像からカテゴリレベルの6次元オブジェクト・ポースとサイズ推定(COPSE)を提案する。
筆者らのフレームワークは,深度チャネルのみの物体のリッチな幾何学的情報に基づいて推論を行う。
我々のフレームワークは、ラベル付き現実世界の画像を必要とする最先端のアプローチと競合する。
論文 参考訳(メタデータ) (2021-06-27T10:41:50Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - Pose Estimation of Specular and Symmetrical Objects [0.719973338079758]
ロボット産業では、眼鏡とテクスチャレスの金属部品がユビキタスである。
リッチテクスチャが欠如しているため, 単眼RGBカメラのみを用いた6次元ポーズ推定は困難である。
そこで本研究では,データ駆動型手法を用いて,対象物の6次元ポーズを推定する手法を提案する。
論文 参考訳(メタデータ) (2020-10-31T22:08:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。