論文の概要: KeypointNet: A Large-scale 3D Keypoint Dataset Aggregated from Numerous
Human Annotations
- arxiv url: http://arxiv.org/abs/2002.12687v6
- Date: Fri, 7 Aug 2020 02:07:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-28 02:32:09.529949
- Title: KeypointNet: A Large-scale 3D Keypoint Dataset Aggregated from Numerous
Human Annotations
- Title(参考訳): KeypointNet: 多数のアノテーションから集約された大規模3Dキーポイントデータセット
- Authors: Yang You, Yujing Lou, Chengkun Li, Zhoujun Cheng, Liangwei Li,
Lizhuang Ma, Weiming Wang, Cewu Lu
- Abstract要約: KeypointNetは、最初の大規模かつ多様な3Dキーポイントデータセットである。
16のカテゴリから103,450個のキーポイントと8,234個の3Dモデルを含んでいる。
提案したデータセットに10種類の最先端手法をベンチマークする。
- 参考スコア(独自算出の注目度): 56.34297279246823
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Detecting 3D objects keypoints is of great interest to the areas of both
graphics and computer vision. There have been several 2D and 3D keypoint
datasets aiming to address this problem in a data-driven way. These datasets,
however, either lack scalability or bring ambiguity to the definition of
keypoints. Therefore, we present KeypointNet: the first large-scale and diverse
3D keypoint dataset that contains 103,450 keypoints and 8,234 3D models from 16
object categories, by leveraging numerous human annotations. To handle the
inconsistency between annotations from different people, we propose a novel
method to aggregate these keypoints automatically, through minimization of a
fidelity loss. Finally, ten state-of-the-art methods are benchmarked on our
proposed dataset. Our code and data are available on
https://github.com/qq456cvb/KeypointNet.
- Abstract(参考訳): 3dオブジェクトの検出 キーポイントは、グラフィックスとコンピュータビジョンの両方の領域で非常に興味があります。
データ駆動方式でこの問題に対処するための2Dおよび3Dキーポイントデータセットがいくつか存在する。
しかし、これらのデータセットはスケーラビリティを欠いているか、キーポイントの定義にあいまいさをもたらす。
そこで我々は,16のオブジェクトカテゴリから103,450個のキーポイントと8,234個の3Dモデルを含む,最初の大規模かつ多様な3DキーポイントデータセットであるKeypointNetを提案する。
異なる人物のアノテーション間の不整合に対処するため,これらのキーポイントを自動的に集約し,忠実度損失を最小限に抑える手法を提案する。
最後に、提案したデータセットに10の最先端手法をベンチマークする。
私たちのコードとデータはhttps://github.com/qq456cvb/keypointnetで入手できます。
関連論文リスト
- Key-Grid: Unsupervised 3D Keypoints Detection using Grid Heatmap Features [20.935803672362283]
我々は、剛体および変形可能な物体の両方に対して、キーグリッド(Key-Grid)を革新的な教師なしキーポイント検出器として導入する。
同定されたキーポイントを利用して,デコーダ部で使用されるグリッドヒートマップと呼ばれる3次元グリッド特徴ヒートマップを形成する。
Key-Gridはキーポイントのセマンティック一貫性と位置精度に関する最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-10-03T06:16:50Z) - MoCap-to-Visual Domain Adaptation for Efficient Human Mesh Estimation from 2D Keypoints [8.405938712823563]
Key2Meshは、2次元の人間のポーズキーポイントを入力として取り、対応するボディメッシュを推定するモデルである。
以上の結果から,Key2MeshはPA-MPJPEおよび3DPWデータセットにおいて,他のモデルよりも優れた性能を発揮することがわかった。
論文 参考訳(メタデータ) (2024-04-10T15:34:10Z) - VoxelKP: A Voxel-based Network Architecture for Human Keypoint
Estimation in LiDAR Data [53.638818890966036]
textitVoxelKPは、LiDARデータにおける人間のキーポイント推定に適した、完全にスパースなネットワークアーキテクチャである。
本研究では,人間の各インスタンス内のキーポイント間の空間的相関を学習するために,スパースボックスアテンションを導入する。
鳥の視線を符号化する2次元格子に3次元ボクセルを投影する際に, 絶対的な3次元座標を利用するために空間符号化を組み込んだ。
論文 参考訳(メタデータ) (2023-12-11T23:50:14Z) - Back to 3D: Few-Shot 3D Keypoint Detection with Back-Projected 2D Features [64.39691149255717]
3次元形状のキーポイント検出には意味的および幾何学的認識が必要である。
我々はキーポイント候補最適化モジュールを用いて,その形状上のキーポイントの平均分布を一致させる。
結果として得られたアプローチは、KeyPointNetデータセットで数ショットのキーポイント検出のための新しい状態を実現する。
論文 参考訳(メタデータ) (2023-11-29T21:58:41Z) - DeDoDe: Detect, Don't Describe -- Describe, Don't Detect for Local
Feature Matching [14.837075102089]
キーポイント検出は3次元再構成において重要なステップであり、シーンの各ビューで最大K点のセットを検出する。
従来の学習に基づく手法は、通常、キーポイントを持つ記述子を学習し、キーポイント検出を隣り合う隣人の二項分類タスクとして扱う。
本研究は, キーポイントを3次元整合性から直接学習し, この目的を達成するための半教師付き2視点検出目標を導出する。
その結果,複数の幾何ベンチマークにおいて,DeDoDeという手法が大幅に向上していることが判明した。
論文 参考訳(メタデータ) (2023-08-16T16:37:02Z) - SC3K: Self-supervised and Coherent 3D Keypoints Estimation from Rotated,
Noisy, and Decimated Point Cloud Data [17.471342278936365]
そこで本研究では,任意のオブジェクトカテゴリからキーポイントを推定する手法を提案する。
我々は,キーポイント推定のための自己指導型トレーニング戦略を提案することで,これらのデシダータを実現する。
提案手法によって推定されるキーポイントと最先端の教師なしアプローチのキーポイントを比較した。
論文 参考訳(メタデータ) (2023-08-10T08:10:01Z) - SNAKE: Shape-aware Neural 3D Keypoint Field [62.91169625183118]
形状復元には点雲から3Dキーポイントを検出することが重要である。
形状再構成は3次元キーポイント検出に有効か?
本稿では,形状認識型ニューラル3Dキーポイントフィールドに短いSNAKEという,教師なしの新たなパラダイムを提案する。
論文 参考訳(メタデータ) (2022-06-03T17:58:43Z) - End-to-End Learning of Multi-category 3D Pose and Shape Estimation [128.881857704338]
本稿では,画像から2次元キーポイントを同時に検出し,それらを3次元に引き上げるエンド・ツー・エンド手法を提案する。
提案手法は2次元キーポイントアノテーションからのみ2次元検出と3次元リフトを学習する。
画像から3D学習へのエンドツーエンド化に加えて,1つのニューラルネットワークを用いて複数のカテゴリからのオブジェクトも処理する。
論文 参考訳(メタデータ) (2021-12-19T17:10:40Z) - Understanding Pixel-level 2D Image Semantics with 3D Keypoint Knowledge
Engine [56.09471066808409]
本稿では,3次元領域における画像に対応するセマンティクスを予測し,それを2次元画像に投影してピクセルレベルの理解を実現する手法を提案する。
16のカテゴリから103,450個のキーポイントと8,234個の3Dモデルを含むKeypointNetと呼ばれる大規模キーポイント知識エンジンを構築した。
論文 参考訳(メタデータ) (2021-11-21T13:25:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。