論文の概要: Learning Better Keypoints for Multi-Object 6DoF Pose Estimation
- arxiv url: http://arxiv.org/abs/2308.07827v1
- Date: Tue, 15 Aug 2023 15:11:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-16 12:22:05.071188
- Title: Learning Better Keypoints for Multi-Object 6DoF Pose Estimation
- Title(参考訳): マルチオブジェクト6DoFポース推定のためのより良いキーポイントの学習
- Authors: Yangzheng Wu and Michael Greenspan
- Abstract要約: グラフネットワークをトレーニングして、同様に分散された投票で分散されたキーポイントのセットを選択する。
これらの投票は、以前のキーポイントアルゴリズムよりも正確に回帰することができる。
実験では、KeyGNetが選択したキーポイントが、テストされた7つのデータセットのすべての評価指標の精度を改善した。
- 参考スコア(独自算出の注目度): 1.0878040851638
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: We investigate the impact of pre-defined keypoints for pose estimation, and
found that accuracy and efficiency can be improved by training a graph network
to select a set of disperse keypoints with similarly distributed votes. These
votes, learned by a regression network to accumulate evidence for the keypoint
locations, can be regressed more accurately compared to previous heuristic
keypoint algorithms. The proposed KeyGNet, supervised by a combined loss
measuring both Wassserstein distance and dispersion, learns the color and
geometry features of the target objects to estimate optimal keypoint locations.
Experiments demonstrate the keypoints selected by KeyGNet improved the accuracy
for all evaluation metrics of all seven datasets tested, for three keypoint
voting methods. The challenging Occlusion LINEMOD dataset notably improved
ADD(S) by +16.4% on PVN3D, and all core BOP datasets showed an AR improvement
for all objects, of between +1% and +21.5%. There was also a notable increase
in performance when transitioning from single object to multiple object
training using KeyGNet keypoints, essentially eliminating the SISO-MIMO gap for
Occlusion LINEMOD.
- Abstract(参考訳): 本研究では,事前定義されたキーポイントがポーズ推定に与える影響について検討し,グラフネットワークをトレーニングすることにより,分散キーポイントのセットを同じように分散投票で選択することで,精度と効率性が向上できることを見出した。
これらの投票は回帰ネットワークによって学習され、キーポイントの位置の証拠を蓄積し、従来のヒューリスティックなキーポイントアルゴリズムよりも正確に回帰することができる。
提案するkeygnetは,wasserstein距離と分散値の両方の損失測定を併用し,対象物体の色と形状の特徴を学習し,最適なキーポイント位置を推定する。
KeyGNetが選択したキーポイントは、テストされた7つのデータセットのすべての評価指標の精度を3つのキーポイント投票法で改善した。
挑戦的なOcclusion LINEMODデータセットは、PVN3DでADD(S)を+16.4%改善し、すべてのコアBOPデータセットは、+1%から+21.5%までのすべてのオブジェクトに対してARの改善を示した。
また、単一オブジェクトからKeyGNetキーポイントを使用した複数オブジェクトトレーニングへの移行時のパフォーマンスも顕著に向上し、Occlusion LINEMODのSISO-MIMOギャップを排除した。
関連論文リスト
- GMM-IKRS: Gaussian Mixture Models for Interpretable Keypoint Refinement and Scoring [9.322937309882022]
キーポイントには、品質に応じてスコアをランク付けできるスコアが付属する。
学習されたキーポイントは手作りのものよりも優れた特性を示すことが多いが、それらのスコアは容易に解釈できない。
本稿では,どの手法でも抽出したキーポイントを解釈可能なスコアで特徴付けることができるフレームワークを提案する。
論文 参考訳(メタデータ) (2024-08-30T09:39:59Z) - KGpose: Keypoint-Graph Driven End-to-End Multi-Object 6D Pose Estimation via Point-Wise Pose Voting [0.0]
KGposeは、複数のオブジェクトの6Dポーズ推定のためのエンドツーエンドフレームワークである。
我々のアプローチはキーポイントベースの手法とキーポイントグラフによる学習可能なポーズ回帰を組み合わせる。
論文 参考訳(メタデータ) (2024-07-12T01:06:00Z) - Visibility-Aware Keypoint Localization for 6DoF Object Pose Estimation [56.07676459156789]
2次元画像における3Dキーポイントの局所化は、6DoFオブジェクトのポーズ推定のための3D-2D対応を確立する効果的な方法である。
本稿では、重要なキーポイントを可視性の観点からローカライズすることでこの問題に対処する。
我々は、可視性を考慮した重要度と最先端のポーズ推定アルゴリズムを統合することにより、VAPO(Visibility-Aware POse estimator)を構築する。
論文 参考訳(メタデータ) (2024-03-21T16:59:45Z) - SD-Net: Symmetric-Aware Keypoint Prediction and Domain Adaptation for 6D Pose Estimation In Bin-picking Scenarios [2.786599193929693]
対称認識型キーポイント予測と自己学習領域適応(SD-Net)を備えた新しい6次元ポーズ推定ネットワークを提案する。
キーポイント予測段階では,高度に隠蔽されたシーンにおいても,ロバストな3Dキーポイント選択戦略を設計し,3Dキーポイントを特定する。
ドメイン適応段階において,学生-教員養成方式を用いた自己学習フレームワークを提案する。
パブリックなSil'eaneデータセットでは、SD-Netは最先端の結果を達成し、平均精度は96%である。
論文 参考訳(メタデータ) (2024-03-14T12:08:44Z) - SC3K: Self-supervised and Coherent 3D Keypoints Estimation from Rotated,
Noisy, and Decimated Point Cloud Data [17.471342278936365]
そこで本研究では,任意のオブジェクトカテゴリからキーポイントを推定する手法を提案する。
我々は,キーポイント推定のための自己指導型トレーニング戦略を提案することで,これらのデシダータを実現する。
提案手法によって推定されるキーポイントと最先端の教師なしアプローチのキーポイントを比較した。
論文 参考訳(メタデータ) (2023-08-10T08:10:01Z) - Learning Feature Matching via Matchable Keypoint-Assisted Graph Neural
Network [52.29330138835208]
画像のペア間の局所的な特徴の正確なマッチングは、コンピュータビジョンの課題である。
従来の研究では、注意に基づくグラフニューラルネットワーク(GNN)と、画像内のキーポイントに完全に接続されたグラフを使用するのが一般的だった。
本稿では,非繰り返しキーポイントをバイパスし,マッチング可能なキーポイントを利用してメッセージパッシングを誘導する,疎注意に基づくGNNアーキテクチャであるMaKeGNNを提案する。
論文 参考訳(メタデータ) (2023-07-04T02:50:44Z) - SASA: Semantics-Augmented Set Abstraction for Point-based 3D Object
Detection [78.90102636266276]
SASA(Semantics-Augmented Set Abstraction)と呼ばれる新しい集合抽象化手法を提案する。
そこで本研究では, 推定点前景スコアに基づいて, より重要な前景点の維持を支援するセマンティックス誘導点サンプリングアルゴリズムを提案する。
実際には、SASAは、前景オブジェクトに関連する貴重な点を識別し、ポイントベースの3D検出のための特徴学習を改善するのに有効である。
論文 参考訳(メタデータ) (2022-01-06T08:54:47Z) - Accurate Grid Keypoint Learning for Efficient Video Prediction [87.71109421608232]
キーポイントベースのビデオ予測手法は、トレーニングやデプロイメントにおいて、かなりの計算資源を消費することができる。
本稿では,長期的効率的な映像予測のための頑健で説明可能な中間キーポイント表現を目的とした,新しいグリッドキーポイント学習フレームワークを設計する。
提案手法は,計算資源の98%以上を節約しつつ,最先端のビデオ予測手法よりも優れていた。
論文 参考訳(メタデータ) (2021-07-28T05:04:30Z) - Bottom-Up Human Pose Estimation Via Disentangled Keypoint Regression [81.05772887221333]
従来のキーポイント検出およびグループ化フレームワークに劣る密度の高いキーポイント回帰フレームワークについて検討する。
我々は,dekr(disentangled keypoint regression)という,単純かつ効果的な手法を提案する。
提案手法はキーポイント検出法やグループ化法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-06T05:54:46Z) - Keypoint Autoencoders: Learning Interest Points of Semantics [4.551313396927381]
キーポイント検出のための教師なし学習手法であるキーポイントオートエンコーダを提案する。
キーポイントから元のポイントクラウドへの再構成を強制することで、疎いセマンティックキーポイントの選択を奨励する。
選択したキーポイントの特異性を示すために、スパースキーポイントで形状を分類する下流タスクを行う。
論文 参考訳(メタデータ) (2020-08-11T03:43:18Z) - PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation [111.7241018610573]
私たちは、インスタンスセグメンテーションのための新しいエンドツーエンドボトムアップアーキテクチャであるPointGroupを紹介します。
我々は2分岐ネットワークを設計し、ポイントの特徴を抽出し、セマンティックラベルとオフセットを予測し、各ポイントをそれぞれのインスタンスセントロイドに向けてシフトさせる。
クラスタリングコンポーネントは、元のおよびオフセットシフトされた点座標セットの両方を利用するために、その相補的な強度を利用する。
ScanNet v2 と S3DIS の2つの挑戦的データセットに対する広範な実験を行い、ScanNet v2 と S3DIS が最も高い性能を達成し、63.6% と 64.0% の2つを以前のベストが達成した54.9% と54.4% と比較した。
論文 参考訳(メタデータ) (2020-04-03T16:26:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。