Fugu-MT 論文翻訳(概要): HouseCat6D -- A Large-Scale Multi-Modal Category Level 6D Object Perception Dataset with Household Objects in Realistic Scenarios

論文の概要: HouseCat6D -- A Large-Scale Multi-Modal Category Level 6D Object Perception Dataset with Household Objects in Realistic Scenarios

arxiv url: http://arxiv.org/abs/2212.10428v5
Date: Fri, 1 Dec 2023 13:23:47 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-04 19:03:46.394507
Title: HouseCat6D -- A Large-Scale Multi-Modal Category Level 6D Object Perception Dataset with Household Objects in Realistic Scenarios
Title（参考訳）: housecat6d -- 現実的なシナリオで家庭用オブジェクトを含む大規模マルチモーダルカテゴリレベル6dオブジェクト知覚データセット
Authors: HyunJun Jung, Guangyao Zhai, Shun-Cheng Wu, Patrick Ruhkamp, Hannah Schieber, Giulia Rizzoli, Pengyuan Wang, Hongcheng Zhao, Lorenzo Garattoni, Sven Meier, Daniel Roth, Nassir Navab, Benjamin Busam
Abstract要約: 新しいカテゴリレベルの6DポーズデータセットであるHouseCat6Dを紹介する。 1) ポラリメトリック RGB と Depth (RGBD+P) によるマルチモダリティ、2) フォトメトリックに挑戦する2つのカテゴリを含む10のカテゴリにわたる194の多様なオブジェクトを含み、3) エラー範囲が 1.35 mm から 1.74 mm である高品質なポーズアノテーションを提供する。
参考スコア（独自算出の注目度）: 41.54851386729952
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Estimating 6D object poses is a major challenge in 3D computer vision. Building on successful instance-level approaches, research is shifting towards category-level pose estimation for practical applications. Current category-level datasets, however, fall short in annotation quality and pose variety. Addressing this, we introduce HouseCat6D, a new category-level 6D pose dataset. It features 1) multi-modality with Polarimetric RGB and Depth (RGBD+P), 2) encompasses 194 diverse objects across 10 household categories, including two photometrically challenging ones, and 3) provides high-quality pose annotations with an error range of only 1.35 mm to 1.74 mm. The dataset also includes 4) 41 large-scale scenes with comprehensive viewpoint and occlusion coverage, 5) a checkerboard-free environment, and 6) dense 6D parallel-jaw robotic grasp annotations. Additionally, we present benchmark results for leading category-level pose estimation networks.
Abstract（参考訳）: 6dオブジェクトポーズの推定は、3dコンピュータビジョンにおいて大きな課題である。成功したインスタンスレベルのアプローチに基づいて、研究は実用的なアプリケーションのためのカテゴリレベルのポーズ推定へとシフトしている。しかし、現在のカテゴリレベルのデータセットは、アノテーションの品質に乏しく、多様である。これに対応するために、新しいカテゴリレベルの6DポーズデータセットであるHouseCat6Dを紹介する。特徴 1) ポラリメトリックRGBと深さ(RGBD+P)による多モード性 2)10のカテゴリーにまたがる194の多様なオブジェクトを包含し,2つのフォトメトリックに挑戦するオブジェクトを含む。 3. エラー範囲がわずか 1.35 mm から 1.74 mm の高品質なポーズアノテーションを提供する。データセットも含んでいます 4)包括的視点と咬合範囲を有する大規模場面41件。 5)チェッカーボードのない環境,及び 6) 密集した6次元パラレルジャウロボット把持アノテーション。さらに,主要なカテゴリーレベルのポーズ推定ネットワークのベンチマーク結果を示す。

関連論文リスト

Any6D: Model-free 6D Pose Estimation of Novel Objects [76.30057578269668]
我々は,6次元オブジェクトのポーズ推定のためのモデルフリーフレームワークであるAny6Dを紹介する。新たなシーンでは、未知の物体の6Dポーズと大きさを推定するために、1枚のRGB-Dアンカー画像しか必要としない。提案手法を5つの挑戦的データセットで評価する。
論文参考訳（メタデータ） (2025-03-24T13:46:21Z)
Omni6D: Large-Vocabulary 3D Object Dataset for Category-Level 6D Object Pose Estimation [74.44739529186798]
Omni6Dは、さまざまなカテゴリとさまざまな背景を持つ総合的なRGBDデータセットである。データセットは166のカテゴリ、標準ポーズに調整された4688のインスタンス、0.8万以上のキャプチャで構成されている。我々は、このイニシアチブが、産業と学術の両方において、新たな洞察と実質的な進歩の道を開くと信じている。
論文参考訳（メタデータ） (2024-09-26T20:13:33Z)
Omni6DPose: A Benchmark and Model for Universal 6D Object Pose Estimation and Tracking [9.365544189576363]
6D Object Pose Estimationは、大規模なデータセットの不足に悩まされているコンピュータビジョンにおいて、決定的に難しいタスクである。本稿では,Omni6DPoseについて紹介する。Omni6DPoseは,オブジェクトのカテゴリ,大規模,多様性の多様性を特徴とするデータセットである。我々は、SOTAカテゴリレベルのポーズ推定フレームワークの強化版であるGenPose++を紹介し、2つの重要な改善を取り入れた。
論文参考訳（メタデータ） (2024-06-06T17:57:20Z)
PhoCaL: A Multi-Modal Dataset for Category-Level Object Pose Estimation with Photometrically Challenging Objects [45.31344700263873]
我々は、PhoCaLと呼ばれる光度に挑戦するオブジェクトを用いたカテゴリレベルのオブジェクトポーズ推定のためのマルチモーダルデータセットを提案する。 PhoCaLは、高い反射率、透明度、対称度を含む8種類以上の家庭用品の60種類の高品質な3Dモデルで構成されている。これにより、不透明で光沢のある透明な物体のポーズのサブミリ秒精度が保証され、動きのぼやけも無く、カメラの同期も完璧になる。
論文参考訳（メタデータ） (2022-05-18T09:21:09Z)
Coupled Iterative Refinement for 6D Multi-Object Pose Estimation [64.7198752089041]
既知の3DオブジェクトのセットとRGBまたはRGB-Dの入力画像から、各オブジェクトの6Dポーズを検出して推定する。我々のアプローチは、ポーズと対応を緊密に結合した方法で反復的に洗練し、アウトレーヤを動的に除去して精度を向上させる。
論文参考訳（メタデータ） (2022-04-26T18:00:08Z)
GPV-Pose: Category-level Object Pose Estimation via Geometry-guided Point-wise Voting [103.74918834553249]
GPV-Poseはロバストなカテゴリーレベルのポーズ推定のための新しいフレームワークである。幾何学的洞察を利用して、カテゴリーレベルのポーズ感応的特徴の学習を強化する。一般的な公開ベンチマークにおいて、最先端の競合相手に優れた結果をもたらす。
論文参考訳（メタデータ） (2022-03-15T13:58:50Z)
Weakly Supervised Learning of Keypoints for 6D Object Pose Estimation [73.40404343241782]
2次元キーポイント検出に基づく弱教師付き6次元オブジェクトポーズ推定手法を提案する。提案手法は,最先端の完全教師付きアプローチと同等の性能を実現する。
論文参考訳（メタデータ） (2022-03-07T16:23:47Z)
StereOBJ-1M: Large-scale Stereo Image Dataset for 6D Object Pose Estimation [43.839322860501596]
本稿では,大規模なステレオRGB画像オブジェクトのポーズ推定データセットであるtextbfStereOBJ-1M$データセットを提案する。このデータセットは、オブジェクトの透明性、透過性、スペキュラリフレクションといった困難なケースに対処するように設計されている。複雑で柔軟な環境でデータをキャプチャできる多視点方式でポーズデータを効率的にアノテートする新しい手法を提案する。
論文参考訳（メタデータ） (2021-09-21T11:56:38Z)
Single-stage Keypoint-based Category-level Object Pose Estimation from an RGB Image [27.234658117816103]
カテゴリレベルのオブジェクトポーズ推定のための,単一段階のキーポイントに基づくアプローチを提案する。提案ネットワークは2次元オブジェクト検出を行い、2次元キーポイントを検出し、6-DoFのポーズを推定し、相対的に有界な立方体次元を回帰する。我々は,3次元IoU測定値における最先端の手法よりも優れた,挑戦的なObjectronベンチマークに関する広範囲な実験を行った。
論文参考訳（メタデータ） (2021-09-13T17:55:00Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。