論文の概要: Pseudo-keypoint RKHS Learning for Self-supervised 6DoF Pose Estimation
- arxiv url: http://arxiv.org/abs/2311.09500v2
- Date: Sat, 18 Nov 2023 04:09:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-22 16:03:53.268573
- Title: Pseudo-keypoint RKHS Learning for Self-supervised 6DoF Pose Estimation
- Title(参考訳): 擬似キーポイントRKHSによる自己教師付き6DoFデータ推定
- Authors: Yangzheng Wu and Michael Greenspan
- Abstract要約: 自己監督型キーポイントラジアル投票に基づく6DoF PEフレームワークの提案
RKHSPoseは、一般的に使用される3つの6DoF PEデータセットで最先端のパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 1.0878040851638
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper addresses the simulation-to-real domain gap in 6DoF PE, and
proposes a novel self-supervised keypoint radial voting-based 6DoF PE
framework, effectively narrowing this gap using a learnable kernel in RKHS. We
formulate this domain gap as a distance in high-dimensional feature space,
distinct from previous iterative matching methods. We propose an adapter
network, which evolves the network parameters from the source domain, which has
been massively trained on synthetic data with synthetic poses, to the target
domain, which is trained on real data. Importantly, the real data training only
uses pseudo-poses estimated by pseudo-keypoints, and thereby requires no real
groundtruth data annotations. RKHSPose achieves state-of-the-art performance on
three commonly used 6DoF PE datasets including LINEMOD (+4.2%), Occlusion
LINEMOD (+2%), and YCB-Video (+3%). It also compares favorably to fully
supervised methods on all six applicable BOP core datasets, achieving within
-10.8% to -0.3% of the top fully supervised results.
- Abstract(参考訳): 本稿では,6DoF PEにおけるシミュレーションと現実の領域ギャップに対処し,RKHSの学習可能なカーネルを用いて,このギャップを効果的に狭める,自己監督型キーポイントラジアル投票に基づく6DoF PEフレームワークを提案する。
我々は、この領域ギャップを高次元特徴空間における距離として定式化し、従来の反復マッチング法とは異なる。
本稿では,合成ポーズを用いた合成データで大規模に訓練されたソースドメインから,実際のデータで訓練されたターゲットドメインまで,ネットワークパラメータを進化させるアダプタネットワークを提案する。
重要なことは、実際のデータトレーニングは擬似キーポイントによって推定される擬似目的のみを使用するため、実際の基礎データアノテーションは不要である。
RKHSPoseはLINEMOD (+4.2%)、Occlusion LINEMOD (+2%)、YCB-Video (+3%)を含む3つの一般的な6DoF PEデータセットで最先端のパフォーマンスを達成する。
また、適用可能な6つのbopコアデータセットの完全な教師付きメソッドと比較し、上位の教師付き結果の10.8%から-0.3%に到達した。
関連論文リスト
- Correspondence-Free SE(3) Point Cloud Registration in RKHS via Unsupervised Equivariant Learning [13.098807543505028]
本稿では,ポイント対応を必要としないロバストなSE(3)ポイントクラウド登録手法を提案する。
ノイズ、外周、非対称データの中で信頼性の高い性能を提供する新しいRKHS距離測定法が提案されている。
提案手法は, 合成 (ModelNet40) と実世界 (ETH3D) の両方のノイズ, 外れ値の多いデータセットの登録精度において, 古典的, 教師ありの手法より優れている。
論文 参考訳(メタデータ) (2024-07-29T17:57:38Z) - Syn-to-Real Unsupervised Domain Adaptation for Indoor 3D Object Detection [50.448520056844885]
室内3次元物体検出における非教師なし領域適応のための新しいフレームワークを提案する。
合成データセット3D-FRONTから実世界のデータセットScanNetV2とSUN RGB-Dへの適応結果は、ソースオンリーベースラインよりも9.7%、9.1%のmAP25が顕著に改善されていることを示している。
論文 参考訳(メタデータ) (2024-06-17T08:18:41Z) - E$^3$-Net: Efficient E(3)-Equivariant Normal Estimation Network [47.77270862087191]
正規推定のための等価性を実現するために,E3-Netを提案する。
本稿では,この作業に必要なトレーニングリソースを,従来の作業の1/8に大幅に削減する,効率的なランダムフレーム手法を提案する。
提案手法は, 合成と実世界の両方のデータセットにおいて優れた結果が得られ, 最先端技術よりもかなり優れている。
論文 参考訳(メタデータ) (2024-06-01T07:53:36Z) - IPoD: Implicit Field Learning with Point Diffusion for Generalizable 3D Object Reconstruction from Single RGB-D Images [50.4538089115248]
シングルビューRGB-D画像からの3Dオブジェクトの汎用化は依然として難しい課題である。
本稿では,暗黙の場学習と点拡散を調和させる新しい手法IPoDを提案する。
CO3D-v2データセットによる実験では、IPoDの優位性が確認され、Fスコアは7.8%、チャンファー距離は28.6%向上した。
論文 参考訳(メタデータ) (2024-03-30T07:17:37Z) - AdaTriplet-RA: Domain Matching via Adaptive Triplet and Reinforced
Attention for Unsupervised Domain Adaptation [15.905869933337101]
教師なしドメイン適応(Unsupervised Domain Adaption、UDA)は、ソースドメインのデータとアノテーションが利用できるが、トレーニング中にラベル付けされていないターゲットデータにのみアクセスできるトランスファー学習タスクである。
本稿では、ドメイン間サンプルマッチング方式を用いて、教師なしドメイン適応タスクを改善することを提案する。
ドメイン間サンプルに合わせるために,広く利用され,堅牢なTriplet損失を適用した。
トレーニング中に発生する不正確な擬似ラベルの破滅的効果を低減するため,信頼度の高い擬似ラベルを自動的に選択し,段階的に改良する新しい不確実性測定法を提案する。
論文 参考訳(メタデータ) (2022-11-16T13:04:24Z) - What Stops Learning-based 3D Registration from Working in the Real
World? [53.68326201131434]
この研究は、3Dポイントのクラウド登録失敗の原因を特定し、その原因を分析し、解決策を提案する。
最終的に、これは最も実践的な3D登録ネットワーク(BPNet)に変換される。
我々のモデルは微調整をせずに実データに一般化し、商用センサで得られた見えない物体の点雲上で最大67%の精度に達する。
論文 参考訳(メタデータ) (2021-11-19T19:24:27Z) - Inception Convolution with Efficient Dilation Search [121.41030859447487]
拡散畳み込みは、効果的な受容場を制御し、オブジェクトの大規模な分散を処理するための標準的な畳み込みニューラルネットワークの重要な変異体である。
そこで我々は,異なる軸,チャネル,層間の独立な拡散を有する拡張畳み込みの新たな変異体,すなわち開始(拡張)畳み込みを提案する。
本稿では,データに複雑なインセプション・コンボリューションを適合させる実用的な手法を探索し,統計的最適化に基づく簡易かつ効果的な拡張探索アルゴリズム(EDO)を開発した。
論文 参考訳(メタデータ) (2020-12-25T14:58:35Z) - 3DIoUMatch: Leveraging IoU Prediction for Semi-Supervised 3D Object
Detection [76.42897462051067]
3DIoUMatchは屋内および屋外の場面両方に適当3D目的の検出のための新しい半監視された方法です。
教師と教師の相互学習の枠組みを活用し,ラベル付けされていない列車の情報を擬似ラベルの形で伝達する。
本手法は,ScanNetとSUN-RGBDのベンチマークにおける最先端の手法を,全てのラベル比で有意差で継続的に改善する。
論文 参考訳(メタデータ) (2020-12-08T11:06:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。