論文の概要: Pseudo-keypoints RKHS Learning for Self-supervised 6DoF Pose Estimation
- arxiv url: http://arxiv.org/abs/2311.09500v1
- Date: Thu, 16 Nov 2023 01:52:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-17 17:04:17.780915
- Title: Pseudo-keypoints RKHS Learning for Self-supervised 6DoF Pose Estimation
- Title(参考訳): 自己教師付き6次元ポーズ推定のための疑似鍵点rkhs学習
- Authors: Yangzheng Wu and Michael Greenspan
- Abstract要約: 自己監督型キーポイントラジアル投票に基づく6DoF PEフレームワークの提案
RKHSPoseは、一般的に使用される3つの6DoF PEデータセットで最先端のパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 1.0878040851638
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper addresses the simulation-to-real domain gap in 6DoF PE, and
proposes a novel self-supervised keypoint radial voting-based 6DoF PE
framework, effectively narrowing this gap using a learnable kernel in RKHS. We
formulate this domain gap as a distance in high-dimensional feature space,
distinct from previous iterative matching methods. We propose an adapter
network, which evolves the network parameters from the source domain, which has
been massively trained on synthetic data with synthetic poses, to the target
domain, which is trained on real data. Importantly, the real data training only
uses pseudo-poses estimated by pseudo-keypoints, and thereby requires no real
groundtruth data annotations. RKHSPose achieves state-of-the-art performance on
three commonly used 6DoF PE datasets including LINEMOD (+4.2%), Occlusion
LINEMOD (+2%), and YCB-Video (+3%). It also compares favorably to fully
supervised methods on all six applicable BOP core datasets, achieving within
-10.8% to -0.3% of the top fully supervised results.
- Abstract(参考訳): 本稿では,6DoF PEにおけるシミュレーションと現実の領域ギャップに対処し,RKHSの学習可能なカーネルを用いて,このギャップを効果的に狭める,自己監督型キーポイントラジアル投票に基づく6DoF PEフレームワークを提案する。
我々は、この領域ギャップを高次元特徴空間における距離として定式化し、従来の反復マッチング法とは異なる。
本稿では,合成ポーズを用いた合成データで大規模に訓練されたソースドメインから,実際のデータで訓練されたターゲットドメインまで,ネットワークパラメータを進化させるアダプタネットワークを提案する。
重要なことは、実際のデータトレーニングは擬似キーポイントによって推定される擬似目的のみを使用するため、実際の基礎データアノテーションは不要である。
RKHSPoseはLINEMOD (+4.2%)、Occlusion LINEMOD (+2%)、YCB-Video (+3%)を含む3つの一般的な6DoF PEデータセットで最先端のパフォーマンスを達成する。
また、適用可能な6つのbopコアデータセットの完全な教師付きメソッドと比較し、上位の教師付き結果の10.8%から-0.3%に到達した。
関連論文リスト
- IPoD: Implicit Field Learning with Point Diffusion for Generalizable 3D Object Reconstruction from Single RGB-D Images [50.4538089115248]
シングルビューRGB-D画像からの3Dオブジェクトの汎用化は依然として難しい課題である。
本稿では,暗黙の場学習と点拡散を調和させる新しい手法IPoDを提案する。
CO3D-v2データセットによる実験では、IPoDの優位性が確認され、Fスコアは7.8%、チャンファー距離は28.6%向上した。
論文 参考訳(メタデータ) (2024-03-30T07:17:37Z) - Learning Better Keypoints for Multi-Object 6DoF Pose Estimation [1.0878040851638]
グラフネットワークをトレーニングして、同様に分散された投票で分散されたキーポイントのセットを選択する。
これらの投票は、キーポイントの位置の証拠を蓄積するために回帰ネットワークによって学習され、より正確に回帰することができる。
実験では、KeyGNetが選択したキーポイントが、テストされた7つのデータセットのすべての評価指標の精度を改善した。
論文 参考訳(メタデータ) (2023-08-15T15:11:13Z) - One-Shot Learning for Periocular Recognition: Exploring the Effect of
Domain Adaptation and Data Bias on Deep Representations [59.17685450892182]
広範に使用されているCNNモデルにおける深部表現の挙動をワンショット近視認識のための極端データ不足下で検討する。
我々は、バイオメトリックデータセットで訓練されたネットワークを数百万の画像で活用し、最先端の結果を改善した。
SIFTのような従来のアルゴリズムは、限られたデータでCNNより優れている。
論文 参考訳(メタデータ) (2023-07-11T09:10:16Z) - TridentAdapt: Learning Domain-invariance via Source-Target Confrontation
and Self-induced Cross-domain Augmentation [0.0]
主な課題は、仮想データから恩恵を受けるために、入力のドメインに依存しない表現を学ぶことである。
本稿では,対立ソースとターゲット制約を同時に満たすために,共有機能エンコーダを強制するトリデント型アーキテクチャを提案する。
また、フォワードパス中に自己誘導型クロスドメインデータ拡張を可能にする新しいトレーニングパイプラインも導入する。
論文 参考訳(メタデータ) (2021-11-30T11:25:46Z) - What Stops Learning-based 3D Registration from Working in the Real
World? [53.68326201131434]
この研究は、3Dポイントのクラウド登録失敗の原因を特定し、その原因を分析し、解決策を提案する。
最終的に、これは最も実践的な3D登録ネットワーク(BPNet)に変換される。
我々のモデルは微調整をせずに実データに一般化し、商用センサで得られた見えない物体の点雲上で最大67%の精度に達する。
論文 参考訳(メタデータ) (2021-11-19T19:24:27Z) - FS-Net: Fast Shape-based Network for Category-Level 6D Object Pose
Estimation with Decoupled Rotation Mechanism [49.89268018642999]
6次元ポーズ推定のための効率的なカテゴリレベルの特徴抽出が可能な高速形状ベースネットワーク(FS-Net)を提案する。
提案手法は,カテゴリレベルおよびインスタンスレベルの6Dオブジェクトのポーズ推定における最先端性能を実現する。
論文 参考訳(メタデータ) (2021-03-12T03:07:24Z) - Inception Convolution with Efficient Dilation Search [121.41030859447487]
拡散畳み込みは、効果的な受容場を制御し、オブジェクトの大規模な分散を処理するための標準的な畳み込みニューラルネットワークの重要な変異体である。
そこで我々は,異なる軸,チャネル,層間の独立な拡散を有する拡張畳み込みの新たな変異体,すなわち開始(拡張)畳み込みを提案する。
本稿では,データに複雑なインセプション・コンボリューションを適合させる実用的な手法を探索し,統計的最適化に基づく簡易かつ効果的な拡張探索アルゴリズム(EDO)を開発した。
論文 参考訳(メタデータ) (2020-12-25T14:58:35Z) - 3D Point-to-Keypoint Voting Network for 6D Pose Estimation [8.801404171357916]
3次元キーポイントの空間構造特性に基づくRGB-Dデータから6次元ポーズ推定のためのフレームワークを提案する。
提案手法は, LINEMOD と OCCLUSION LINEMOD の2つのベンチマークデータセットで検証する。
論文 参考訳(メタデータ) (2020-12-22T11:43:15Z) - 3DIoUMatch: Leveraging IoU Prediction for Semi-Supervised 3D Object
Detection [76.42897462051067]
3DIoUMatchは屋内および屋外の場面両方に適当3D目的の検出のための新しい半監視された方法です。
教師と教師の相互学習の枠組みを活用し,ラベル付けされていない列車の情報を擬似ラベルの形で伝達する。
本手法は,ScanNetとSUN-RGBDのベンチマークにおける最先端の手法を,全てのラベル比で有意差で継続的に改善する。
論文 参考訳(メタデータ) (2020-12-08T11:06:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。