論文の概要: Detecting 3D Line Segments for 6DoF Pose Estimation with Limited Data
- arxiv url: http://arxiv.org/abs/2601.12090v1
- Date: Sat, 17 Jan 2026 15:49:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:22.456888
- Title: Detecting 3D Line Segments for 6DoF Pose Estimation with Limited Data
- Title(参考訳): 有限データを用いた6DoF空間推定のための3次元線分検出
- Authors: Matej Mok, Lukáš Gajdošech, Michal Mesároš, Martin Madaras, Viktor Kocur,
- Abstract要約: そこで本研究では,産業環境で用いられるビンに着目した6DoFポーズ推定手法を提案する。
まず,その頂点に対応する中間3次元線分を検出することで,ビンの立方体形状を推定する。
提案手法は,現在最先端の6DoFポーズ推定法よりも精度が高いことを示す。
- 参考スコア(独自算出の注目度): 3.3243678439936133
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The task of 6DoF object pose estimation is one of the fundamental problems of 3D vision with many practical applications such as industrial automation. Traditional deep learning approaches for this task often require extensive training data or CAD models, limiting their application in real-world industrial settings where data is scarce and object instances vary. We propose a novel method for 6DoF pose estimation focused specifically on bins used in industrial settings. We exploit the cuboid geometry of bins by first detecting intermediate 3D line segments corresponding to their top edges. Our approach extends the 2D line segment detection network LeTR to operate on structured point cloud data. The detected 3D line segments are then processed using a simple geometric procedure to robustly determine the bin's 6DoF pose. To evaluate our method, we extend an existing dataset with a newly collected and annotated dataset, which we make publicly available. We show that incorporating synthetic training data significantly improves pose estimation accuracy on real scans. Moreover, we show that our method significantly outperforms current state-of-the-art 6DoF pose estimation methods in terms of the pose accuracy (3 cm translation error, 8.2$^\circ$ rotation error) while not requiring instance-specific CAD models during inference.
- Abstract(参考訳): 6DoFオブジェクトポーズ推定のタスクは、産業自動化など多くの実用的応用で3Dビジョンの基本的な問題の一つである。
このタスクの従来のディープラーニングアプローチは、広範囲なトレーニングデータやCADモデルを必要とすることが多く、データの不足やオブジェクトインスタンスの変化など、実際の産業環境でのアプリケーションを制限する。
そこで本研究では,産業環境で用いられるビンに着目した6DoFポーズ推定手法を提案する。
まず,その頂点に対応する中間3次元線分を検出することで,ビンの立方体形状を推定する。
提案手法は,2次元線分検出ネットワークLeTRを拡張して,構造化点クラウドデータを操作する。
検出された3Dラインセグメントは、単純な幾何学的手順で処理され、ビンの6DoFのポーズをしっかりと決定する。
提案手法を評価するため,既存のデータセットを新たに収集した注釈付きデータセットで拡張し,公開する。
合成トレーニングデータを組み込むことで、実際のスキャンにおけるポーズ推定精度が大幅に向上することを示す。
さらに,提案手法は,インスタンス固有のCADモデルを必要とせず,ポーズ精度(3cm翻訳誤差,8.2$^\circ$回転誤差)の観点から,現在最先端の6DoFポーズ推定法を著しく上回っていることを示す。
関連論文リスト
- Sparse Multiview Open-Vocabulary 3D Detection [27.57172918603858]
3Dオブジェクト検出は伝統的に、固定されたカテゴリのセットを検出するトレーニングによって解決されてきた。
本研究では,オープンボキャブラリによる3次元物体検出の課題について検討する。
我々のアプローチは、計算コストのかかる3D特徴フュージョンを使わずに、事前訓練されたオフザシェルフ2Dファンデーションモデルに頼っている。
論文 参考訳(メタデータ) (2025-09-19T12:22:24Z) - 3D Adversarial Augmentations for Robust Out-of-Domain Predictions [115.74319739738571]
ドメイン外データへの一般化の改善に注力する。
対象を逆向きに変形させるベクトルの集合を学習する。
本研究では,学習したサンプル非依存ベクトルをモデルトレーニング時に利用可能なオブジェクトに適用することにより,対数拡大を行う。
論文 参考訳(メタデータ) (2023-08-29T17:58:55Z) - V-DETR: DETR with Vertex Relative Position Encoding for 3D Object
Detection [73.37781484123536]
DETRフレームワークを用いた点雲のための高性能な3次元物体検出器を提案する。
限界に対処するため,新しい3次元相対位置(3DV-RPE)法を提案する。
挑戦的なScanNetV2ベンチマークで例外的な結果を示す。
論文 参考訳(メタデータ) (2023-08-08T17:14:14Z) - Lifting 2D Object Locations to 3D by Discounting LiDAR Outliers across
Objects and Views [70.1586005070678]
本稿では,2次元マスクオブジェクトの予測と生のLiDAR点雲を自動的に3次元境界ボックスに変換するシステムを提案する。
これらの手法は, より複雑なパイプラインや3Dモデル, 付加的な人為的な事前情報ソースを使用するにもかかわらず, 従来よりもはるかに優れていた。
論文 参考訳(メタデータ) (2021-09-16T13:01:13Z) - RandomRooms: Unsupervised Pre-training from Synthetic Shapes and
Randomized Layouts for 3D Object Detection [138.2892824662943]
有望な解決策は、CADオブジェクトモデルで構成される合成データセットをよりよく利用して、実際のデータセットでの学習を促進することである。
最近の3次元事前学習の研究は、合成物体から他の実世界の応用へ学習した伝達特性が失敗することを示している。
本研究では,この目的を達成するためにRandomRoomsという新しい手法を提案する。
論文 参考訳(メタデータ) (2021-08-17T17:56:12Z) - 3D Registration for Self-Occluded Objects in Context [66.41922513553367]
このシナリオを効果的に処理できる最初のディープラーニングフレームワークを紹介します。
提案手法はインスタンスセグメンテーションモジュールとポーズ推定モジュールから構成される。
これにより、高価な反復手順を必要とせず、ワンショットで3D登録を行うことができます。
論文 参考訳(メタデータ) (2020-11-23T08:05:28Z) - DOPS: Learning to Detect 3D Objects and Predict their 3D Shapes [54.239416488865565]
LIDARデータに対する高速な1段3次元物体検出法を提案する。
我々の手法の中核となる新規性は高速かつシングルパスアーキテクチャであり、どちらも3次元の物体を検出し、それらの形状を推定する。
提案手法は,ScanNetシーンのオブジェクト検出で5%,オープンデータセットでは3.4%の精度で結果が得られた。
論文 参考訳(メタデータ) (2020-04-02T17:48:50Z) - L6DNet: Light 6 DoF Network for Robust and Precise Object Pose
Estimation with Small Datasets [0.0]
1枚のRGB-D画像から6つのDoFオブジェクトのポーズ推定を行う新しい手法を提案する。
データ駆動と幾何学という2段階のハイブリッドパイプラインを採用しています。
私たちのアプローチは最先端の手法よりも堅牢で正確です。
論文 参考訳(メタデータ) (2020-02-03T17:41:29Z) - Simultaneous 3D Object Segmentation and 6-DOF Pose Estimation [0.7252027234425334]
純粋な3次元点雲シーンにおける3次元オブジェクト分割と6-DOFポーズ推定を同時に行う手法を提案する。
提案手法の重要な構成要素は,純3次元点群における3次元オブジェクト分割と6-DOFポーズ推定を同時に予測できるマルチタスクCNNアーキテクチャである。
実験評価のために,Augmented Reality (AR) を用いた2つの最先端3Dオブジェクトデータセット citePLciteTLINEMOD のための拡張トレーニングデータを生成する。
論文 参考訳(メタデータ) (2019-12-27T13:48:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。