論文の概要: IndustryShapes: An RGB-D Benchmark dataset for 6D object pose estimation of industrial assembly components and tools
- arxiv url: http://arxiv.org/abs/2602.05555v1
- Date: Thu, 05 Feb 2026 11:28:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:08.904947
- Title: IndustryShapes: An RGB-D Benchmark dataset for 6D object pose estimation of industrial assembly components and tools
- Title(参考訳): IndustryShapes: 産業組み立て部品とツールの6Dオブジェクトポーズ推定のためのRGB-Dベンチマークデータセット
- Authors: Panagiotis Sapoutzoglou, Orestis Vaggelis, Athina Zacharia, Evangelos Sartinas, Maria Pateraki,
- Abstract要約: 産業用ツールとコンポーネントの新しいRGB-DベンチマークデータセットであるIndustrialShapesを紹介します。
このデータセットは、オブジェクト6Dのポーズ推定アプローチをベンチマークするための、現実的でアプリケーション関連のテストベッドを提供する。
- 参考スコア(独自算出の注目度): 0.8046834313965849
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce IndustryShapes, a new RGB-D benchmark dataset of industrial tools and components, designed for both instance-level and novel object 6D pose estimation approaches. The dataset provides a realistic and application-relevant testbed for benchmarking these methods in the context of industrial robotics bridging the gap between lab-based research and deployment in real-world manufacturing scenarios. Unlike many previous datasets that focus on household or consumer products or use synthetic, clean tabletop datasets, or objects captured solely in controlled lab environments, IndustryShapes introduces five new object types with challenging properties, also captured in realistic industrial assembly settings. The dataset has diverse complexity, from simple to more challenging scenes, with single and multiple objects, including scenes with multiple instances of the same object and it is organized in two parts: the classic set and the extended set. The classic set includes a total of 4,6k images and 6k annotated poses. The extended set introduces additional data modalities to support the evaluation of model-free and sequence-based approaches. To the best of our knowledge, IndustryShapes is the first dataset to offer RGB-D static onboarding sequences. We further evaluate the dataset on a representative set of state-of-the art methods for instance-based and novel object 6D pose estimation, including also object detection, segmentation, showing that there is room for improvement in this domain. The dataset page can be found in https://pose-lab.github.io/IndustryShapes.
- Abstract(参考訳): 本稿では,産業用ツールとコンポーネントのRGB-DベンチマークデータセットであるIndustrialShapesを紹介する。
このデータセットは、ラボベースの研究と実際の製造シナリオにおける展開のギャップを埋める産業ロボット工学の文脈において、これらの手法をベンチマークするための、現実的でアプリケーション関連のテストベッドを提供する。
家庭や消費者製品にフォーカスする以前のデータセットや、人工的でクリーンなテーブルトップデータセット、あるいはコントロールされたラボ環境でのみキャプチャされたオブジェクトなどとは異なり、IndustrialShapesは5つの新しいオブジェクトタイプを導入している。
データセットは、単一のオブジェクトと複数のオブジェクトを含む単純なシーンからより困難なシーンまで、さまざまな複雑さを持ち、同じオブジェクトの複数のインスタンスを含むシーンは、古典的なセットと拡張されたセットの2つの部分に分けられる。
古典的なセットには、合計4,6kの画像と6kの注釈付きポーズが含まれている。
拡張セットでは、モデルフリーおよびシーケンスベースアプローチの評価をサポートするために、追加のデータモダリティが導入されている。
私たちの知る限りでは、IndustrialShapesはRGB-Dの静的なオンボーディングシーケンスを提供する最初のデータセットです。
さらに、オブジェクト検出、セグメンテーションを含む、インスタンスベースおよび新規なオブジェクト6Dポーズ推定のための最先端手法の代表的なセットに基づいてデータセットを評価し、この領域に改善の余地があることを示す。
データセットのページはhttps://pose-lab.github.io/IndustryShapesにある。
関連論文リスト
- IMD: A 6-DoF Pose Estimation Benchmark for Industrial Metallic Objects [4.959150853096882]
産業用途に適した新しいデータセットとベンチマークである textitIndustrial Metallic dataset (IMD) を提案する。
このデータセットは45の産業用部品からなり、自然の屋内照明の下でRGB-Dカメラで撮影する。
このベンチマークは、ビデオオブジェクトセグメンテーション、6Dポーズトラッキング、ワンショット6Dポーズ推定を含む3つのタスクをサポートする。
論文 参考訳(メタデータ) (2025-09-15T08:28:15Z) - XYZ-IBD: A High-precision Bin-picking Dataset for Object 6D Pose Estimation Capturing Real-world Industrial Complexity [46.05421425745179]
XYZ-IBDは6Dポーズ推定のためのビンピッキングデータセットである。
ミリ精度アノテーションによる本物のロボット操作のシナリオを反映している。
データセットには15のテクスチャなし、金属で、ほとんど対称な形状と大きさのオブジェクトが含まれている。
論文 参考訳(メタデータ) (2025-05-31T15:15:27Z) - CAP-Net: A Unified Network for 6D Pose and Size Estimation of Categorical Articulated Parts from a Single RGB-D Image [86.75098349480014]
本稿では,ロボット操作作業における調音物体のカテゴリーレベルのポーズ推定に取り組む。
そこで本研究では,Categorical Articulated Partsの6次元ポーズとサイズを推定するためのシングルステージネットワークCAP-Netを提案する。
我々は,RGB画像と実センサからシミュレーションした深度雑音を特徴とするRGB-D調音データセットであるRGBD-Artデータセットを紹介した。
論文 参考訳(メタデータ) (2025-04-15T14:30:26Z) - MegaPose: 6D Pose Estimation of Novel Objects via Render & Compare [84.80956484848505]
MegaPoseは、トレーニング中に見えない新しいオブジェクトの6Dポーズを推定する方法である。
本稿では,新しいオブジェクトに適用可能なR&Compare戦略に基づく6次元ポーズリファインダを提案する。
第2に,合成レンダリングと同一物体の観察画像間のポーズ誤差をリファインダで補正できるか否かを分類するために訓練されたネットワークを利用する,粗いポーズ推定のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-12-13T19:30:03Z) - StandardSim: A Synthetic Dataset For Retail Environments [0.07874708385247352]
本稿では,意味的セグメンテーション,インスタンスセグメンテーション,深さ推定,オブジェクト検出のためのアノテーションを特徴とする大規模合成データセットを提案する。
私たちのデータセットはシーン毎に複数のビューを提供し、マルチビュー表現学習を可能にします。
我々は、データセットのセグメンテーションと深さ推定に広く使用されているモデルをベンチマークし、我々のテストセットが現在の小規模データセットと比較して難しいベンチマークを構成することを示す。
論文 参考訳(メタデータ) (2022-02-04T22:28:35Z) - SynPick: A Dataset for Dynamic Bin Picking Scene Understanding [25.706613724135046]
ビンピッキングシナリオにおける動的シーン理解のための合成データセットであるSynPickを提案する。
既存のデータセットとは対照的に、私たちのデータセットはどちらも現実的な産業アプリケーションドメイン内にあります。
データセットは人気のあるBOPデータセットフォーマットと互換性がある。
論文 参考訳(メタデータ) (2021-07-10T14:58:43Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - Unsupervised Learning of 3D Object Categories from Videos in the Wild [75.09720013151247]
オブジェクトインスタンスの大規模なコレクションの複数のビューからモデルを学ぶことに重点を置いています。
再構成を大幅に改善するワープコンディショニングレイ埋め込み(WCR)と呼ばれる新しいニューラルネットワーク設計を提案する。
本評価は,既存のベンチマークを用いた複数の深部単眼再構成ベースラインに対する性能改善を示す。
論文 参考訳(メタデータ) (2021-03-30T17:57:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。