論文の概要: SD-Net: Symmetric-Aware Keypoint Prediction and Domain Adaptation for 6D Pose Estimation In Bin-picking Scenarios
- arxiv url: http://arxiv.org/abs/2403.09317v1
- Date: Thu, 14 Mar 2024 12:08:44 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-15 20:47:15.550004
- Title: SD-Net: Symmetric-Aware Keypoint Prediction and Domain Adaptation for 6D Pose Estimation In Bin-picking Scenarios
- Title(参考訳): SD-Net:ビンピッキングシナリオにおける6次元空間推定のための対称性を考慮したキーポイント予測とドメイン適応
- Authors: Ding-Tao Huang, En-Te Lin, Lipeng Chen, Li-Fu Liu, Long Zeng,
- Abstract要約: 対称認識型キーポイント予測と自己学習領域適応(SD-Net)を備えた新しい6次元ポーズ推定ネットワークを提案する。
キーポイント予測段階では,高度に隠蔽されたシーンにおいても,ロバストな3Dキーポイント選択戦略を設計し,3Dキーポイントを特定する。
ドメイン適応段階において,学生-教員養成方式を用いた自己学習フレームワークを提案する。
パブリックなSil'eaneデータセットでは、SD-Netは最先端の結果を達成し、平均精度は96%である。
- 参考スコア(独自算出の注目度): 2.786599193929693
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite the success in 6D pose estimation in bin-picking scenarios, existing methods still struggle to produce accurate prediction results for symmetry objects and real world scenarios. The primary bottlenecks include 1) the ambiguity keypoints caused by object symmetries; 2) the domain gap between real and synthetic data. To circumvent these problem, we propose a new 6D pose estimation network with symmetric-aware keypoint prediction and self-training domain adaptation (SD-Net). SD-Net builds on pointwise keypoint regression and deep hough voting to perform reliable detection keypoint under clutter and occlusion. Specifically, at the keypoint prediction stage, we designe a robust 3D keypoints selection strategy considering the symmetry class of objects and equivalent keypoints, which facilitate locating 3D keypoints even in highly occluded scenes. Additionally, we build an effective filtering algorithm on predicted keypoint to dynamically eliminate multiple ambiguity and outlier keypoint candidates. At the domain adaptation stage, we propose the self-training framework using a student-teacher training scheme. To carefully distinguish reliable predictions, we harnesses a tailored heuristics for 3D geometry pseudo labelling based on semi-chamfer distance. On public Sil'eane dataset, SD-Net achieves state-of-the-art results, obtaining an average precision of 96%. Testing learning and generalization abilities on public Parametric datasets, SD-Net is 8% higher than the state-of-the-art method. The code is available at https://github.com/dingthuang/SD-Net.
- Abstract(参考訳): ビンピッキングシナリオにおける6次元ポーズ推定の成功にもかかわらず、既存の手法は対称性オブジェクトや実世界のシナリオの正確な予測結果の生成に苦慮している。
主なボトルネックは
1) 対象対称性による曖昧性キーポイント
2) 実データと合成データの領域ギャップ。
これらの問題を回避するために、対称対応キーポイント予測と自己学習領域適応(SD-Net)を備えた新しい6次元ポーズ推定ネットワークを提案する。
SD-Netは、ポイントワイドキーポイント回帰とディープヒュー投票に基づいて、クラッタとオクルージョンの下で信頼性の高い検出キーポイントを実行する。
具体的には,キーポイント予測段階において,オブジェクトと等価キーポイントの対称性クラスを考慮したロバストな3Dキーポイント選択戦略を設計し,高度に隠蔽されたシーンにおいても3Dキーポイントの配置を容易にする。
さらに、予測キーポイント上に効率的なフィルタリングアルゴリズムを構築し、複数のあいまいさと外れ値キーポイント候補を動的に除去する。
ドメイン適応段階において,学生-教員養成方式を用いた自己学習フレームワークを提案する。
信頼性の高い予測を慎重に識別するために,セミ・チャンファー距離に基づく3次元幾何擬似ラベリングのための調整されたヒューリスティックスを利用する。
パブリックなSil'eaneデータセットでは、SD-Netは最先端の結果を達成し、平均精度は96%である。
パブリックパラメトリックデータセット上での学習と一般化能力のテストでは、SD-Netは最先端の手法よりも8%高い。
コードはhttps://github.com/dingthuang/SD-Netで公開されている。
関連論文リスト
- E$^3$-Net: Efficient E(3)-Equivariant Normal Estimation Network [47.77270862087191]
正規推定のための等価性を実現するために,E3-Netを提案する。
本稿では,この作業に必要なトレーニングリソースを,従来の作業の1/8に大幅に削減する,効率的なランダムフレーム手法を提案する。
提案手法は, 合成と実世界の両方のデータセットにおいて優れた結果が得られ, 最先端技術よりもかなり優れている。
論文 参考訳(メタデータ) (2024-06-01T07:53:36Z) - Learning Better Keypoints for Multi-Object 6DoF Pose Estimation [1.0878040851638]
グラフネットワークをトレーニングして、同様に分散された投票で分散されたキーポイントのセットを選択する。
これらの投票は、キーポイントの位置の証拠を蓄積するために回帰ネットワークによって学習され、より正確に回帰することができる。
実験では、KeyGNetが選択したキーポイントが、テストされた7つのデータセットのすべての評価指標の精度を改善した。
論文 参考訳(メタデータ) (2023-08-15T15:11:13Z) - SC3K: Self-supervised and Coherent 3D Keypoints Estimation from Rotated,
Noisy, and Decimated Point Cloud Data [17.471342278936365]
そこで本研究では,任意のオブジェクトカテゴリからキーポイントを推定する手法を提案する。
我々は,キーポイント推定のための自己指導型トレーニング戦略を提案することで,これらのデシダータを実現する。
提案手法によって推定されるキーポイントと最先端の教師なしアプローチのキーポイントを比較した。
論文 参考訳(メタデータ) (2023-08-10T08:10:01Z) - DQS3D: Densely-matched Quantization-aware Semi-supervised 3D Detection [6.096961718434965]
本研究では,3次元屋内空間の散在を考慮し,半教師付き3次元物体検出の課題について検討する。
我々は,最近セミ教師付き学習の顕著な進歩を招いた,堅牢で原則化された自己学習の枠組みに頼っている。
そこで本研究では,空間的に密集したトレーニング信号を可能にする,最初の半教師付き3次元検出アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-25T17:59:54Z) - Piecewise Planar Hulls for Semi-Supervised Learning of 3D Shape and Pose
from 2D Images [133.68032636906133]
本研究では,1つの2次元画像から,物体の3次元形状とポーズをキーポイントで推定する問題について検討する。
形状とポーズは、カテゴリによって収集された画像と、その部分的な2Dキーポイントアノテーションから直接学習される。
論文 参考訳(メタデータ) (2022-11-14T16:18:11Z) - PDC-Net+: Enhanced Probabilistic Dense Correspondence Network [161.76275845530964]
高度確率密度対応ネットワーク(PDC-Net+)は、精度の高い高密度対応を推定できる。
我々は、堅牢で一般化可能な不確実性予測に適したアーキテクチャと強化されたトレーニング戦略を開発する。
提案手法は,複数の挑戦的幾何マッチングと光学的フローデータセットに対して,最先端の結果を得る。
論文 参考訳(メタデータ) (2021-09-28T17:56:41Z) - Accurate Grid Keypoint Learning for Efficient Video Prediction [87.71109421608232]
キーポイントベースのビデオ予測手法は、トレーニングやデプロイメントにおいて、かなりの計算資源を消費することができる。
本稿では,長期的効率的な映像予測のための頑健で説明可能な中間キーポイント表現を目的とした,新しいグリッドキーポイント学習フレームワークを設計する。
提案手法は,計算資源の98%以上を節約しつつ,最先端のビデオ予測手法よりも優れていた。
論文 参考訳(メタデータ) (2021-07-28T05:04:30Z) - Uncertainty-Aware Camera Pose Estimation from Points and Lines [101.03675842534415]
Perspective-n-Point-and-Line (Pn$PL) は、2D-3D特徴座標の3Dモデルに関して、高速で正確で堅牢なカメラローカライゼーションを目指している。
論文 参考訳(メタデータ) (2021-07-08T15:19:36Z) - 6D Object Pose Estimation using Keypoints and Part Affinity Fields [24.126513851779936]
RGB画像からの6Dオブジェクトのポーズ推定のタスクは、自律型サービスロボットが現実世界と対話できるための重要な要件である。
既知物体の6自由度変換と配向を推定するための2段階パイプラインを提案する。
論文 参考訳(メタデータ) (2021-07-05T14:41:19Z) - 3DIoUMatch: Leveraging IoU Prediction for Semi-Supervised 3D Object
Detection [76.42897462051067]
3DIoUMatchは屋内および屋外の場面両方に適当3D目的の検出のための新しい半監視された方法です。
教師と教師の相互学習の枠組みを活用し,ラベル付けされていない列車の情報を擬似ラベルの形で伝達する。
本手法は,ScanNetとSUN-RGBDのベンチマークにおける最先端の手法を,全てのラベル比で有意差で継続的に改善する。
論文 参考訳(メタデータ) (2020-12-08T11:06:26Z) - Robust 6D Object Pose Estimation by Learning RGB-D Features [59.580366107770764]
本稿では、この局所最適問題を解くために、回転回帰のための離散連続的な新しい定式化を提案する。
我々はSO(3)の回転アンカーを均一にサンプリングし、各アンカーから目標への制約付き偏差を予測し、最適な予測を選択するための不確実性スコアを出力する。
LINEMOD と YCB-Video の2つのベンチマーク実験により,提案手法が最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-02-29T06:24:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。