論文の概要: 3D Landmark Detection on Human Point Clouds: A Benchmark and A Dual
Cascade Point Transformer Framework
- arxiv url: http://arxiv.org/abs/2401.07251v1
- Date: Sun, 14 Jan 2024 10:56:16 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-17 19:09:10.487885
- Title: 3D Landmark Detection on Human Point Clouds: A Benchmark and A Dual
Cascade Point Transformer Framework
- Title(参考訳): 人点雲上の3次元ランドマーク検出:ベンチマークと二重カスケード変換器フレームワーク
- Authors: Fan Zhang, Shuyi Mao, Qing Li, Xiaojiang Peng
- Abstract要約: 3Dランドマーク検出は、3D登録、ポーズ推定、仮想トライオンなど、さまざまなアプリケーションにおいて重要な役割を果たす。
本稿では,人点雲における3次元ランドマーク検出という新たな課題を紹介し,主な貢献点を2つ提示する。
まず,3Dランドマーク検出コミュニティを支援するために,HPoint103という総合的な人点クラウドデータセットを構築した。
次に, 2次元カスケード点変換器(D-CPT)モデルを提案する。
- 参考スコア(独自算出の注目度): 16.08883869260593
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D landmark detection plays a pivotal role in various applications such as 3D
registration, pose estimation, and virtual try-on. While considerable success
has been achieved in 2D human landmark detection or pose estimation, there is a
notable scarcity of reported works on landmark detection in unordered 3D point
clouds. This paper introduces a novel challenge, namely 3D landmark detection
on human point clouds, presenting two primary contributions. Firstly, we
establish a comprehensive human point cloud dataset, named HPoint103, designed
to support the 3D landmark detection community. This dataset comprises 103
human point clouds created with commercial software and actors, each manually
annotated with 11 stable landmarks. Secondly, we propose a Dual Cascade Point
Transformer (D-CPT) model for precise point-based landmark detection. D-CPT
gradually refines the landmarks through cascade Transformer decoder layers
across the entire point cloud stream, simultaneously enhancing landmark
coordinates with a RefineNet over local regions. Comparative evaluations with
popular point-based methods on HPoint103 and the public dataset DHP19
demonstrate the dramatic outperformance of our D-CPT. Additionally, the
integration of our RefineNet into existing methods consistently improves
performance.
- Abstract(参考訳): 3Dランドマーク検出は、3D登録、ポーズ推定、仮想トライオンなど、さまざまなアプリケーションにおいて重要な役割を果たす。
2次元のランドマーク検出やポーズ推定でかなりの成功を収めてきたが、未秩序な3次元点雲におけるランドマーク検出に関する報告がほとんどない。
本稿では,人間点雲における3次元ランドマーク検出という新たな課題について紹介する。
まず,3Dランドマーク検出コミュニティを支援するために,HPoint103という総合的な人点クラウドデータセットを構築した。
このデータセットは、商用ソフトウェアとアクターで作成された103のヒューマンポイントクラウドで構成され、それぞれが手動で11の安定したランドマークで注釈付けされている。
次に, 2次元カスケード点変換器(D-CPT)モデルを提案する。
D-CPTは、ポイントクラウドストリーム全体にわたってカスケードトランスフォーマーデコーダ層を通じてランドマークを徐々に洗練し、同時にローカルリージョン上のRefineNetとのランドマーク座標を拡張している。
hpoint103とdhp19の一般的なポイントベース手法による比較評価は,d-cptの劇的な性能低下を示している。
さらに、既存のメソッドへのRefineNetの統合は、パフォーマンスを継続的に改善します。
関連論文リスト
- Point-DETR3D: Leveraging Imagery Data with Spatial Point Prior for Weakly Semi-supervised 3D Object Detection [32.86369670395974]
本稿では,弱半教師付き3D検出のための教師支援フレームワークであるPoint-DETR3Dを紹介する。
ラベル付きデータの5%しか持たないPoint-DETR3Dは、完全な教師付きデータのパフォーマンスを90%以上達成している。
論文 参考訳(メタデータ) (2024-03-22T16:11:29Z) - 3D Cascade RCNN: High Quality Object Detection in Point Clouds [122.42455210196262]
本稿では3次元カスケードRCNNを提案する。これはカスケードパラダイムにおいて、酸化点雲に基づいて複数の検出器を割り当てる。
提案する3次元カスケードRCNNは,最先端の3次元物体検出技術と比較した場合の優位性を検証した。
論文 参考訳(メタデータ) (2022-11-15T15:58:36Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - Point3D: tracking actions as moving points with 3D CNNs [27.814375805542394]
現在の最先端のアクション検出器は、主にアンカーベースである。
初期アンカーレスアプローチを応用して,動作認識の精度の高いフレキシブルで効率的なネットワークであるPoint3Dを提案する。
論文 参考訳(メタデータ) (2022-03-20T15:41:47Z) - SASA: Semantics-Augmented Set Abstraction for Point-based 3D Object
Detection [78.90102636266276]
SASA(Semantics-Augmented Set Abstraction)と呼ばれる新しい集合抽象化手法を提案する。
そこで本研究では, 推定点前景スコアに基づいて, より重要な前景点の維持を支援するセマンティックス誘導点サンプリングアルゴリズムを提案する。
実際には、SASAは、前景オブジェクトに関連する貴重な点を識別し、ポイントベースの3D検出のための特徴学習を改善するのに有効である。
論文 参考訳(メタデータ) (2022-01-06T08:54:47Z) - Anchor-free 3D Single Stage Detector with Mask-Guided Attention for
Point Cloud [79.39041453836793]
我々は、点雲をアンカーフリーで検出する新しい1段3次元検出器を開発した。
ボクセルをベースとしたスパース3D特徴量からスパース2D特徴量マップに変換することでこれを克服する。
検出信頼度スコアとバウンディングボックス回帰の精度との相関性を改善するために,IoUに基づく検出信頼度再校正手法を提案する。
論文 参考訳(メタデータ) (2021-08-08T13:42:13Z) - P2-Net: Joint Description and Detection of Local Features for Pixel and
Point Matching [78.18641868402901]
この研究は、2D画像と3D点雲の微粒な対応を確立するための取り組みである。
画素領域と点領域の固有情報変動を緩和するために,新しい損失関数と組み合わせた超広帯域受信機構を設計した。
論文 参考訳(メタデータ) (2021-03-01T14:59:40Z) - Automated 3D cephalometric landmark identification using computerized
tomography [1.4349468613117398]
頭蓋骨の形状を代用する3次元頭蓋骨計測のランドマークの同定は、頭蓋骨計測の基本的なステップである。
近年,ディープラーニング(dl)を用いた2次元頭部画像の自動ランドマーク作成が大きな成功を収めているが,80以上のランドマークに対する3次元ランドマークは,まだ満足のいくレベルには達していない。
本論文では,匿名化されたランドマークデータセットと対のCTデータを取り除いた,半教師付き3次元ランドマーク用DL法を提案する。
論文 参考訳(メタデータ) (2020-12-16T07:29:32Z) - Cross-Modality 3D Object Detection [63.29935886648709]
本稿では,3次元物体検出のための新しい2段階多モード融合ネットワークを提案する。
アーキテクチャ全体が2段階の融合を促進する。
KITTIデータセットを用いた実験により,提案したマルチステージ融合により,ネットワークがより良い表現を学習できることが示唆された。
論文 参考訳(メタデータ) (2020-08-16T11:01:20Z) - 1st Place Solution for Waymo Open Dataset Challenge -- 3D Detection and
Domain Adaptation [7.807118356899879]
本研究では,一段式,アンカーフリー,NMSフリーの3Dポイント・クラウド・オブジェクト検出器AFDetを提案する。
AFDetは私たちの勝利ソリューションの強力なベースラインとして機能します。
我々は、より強力なネットワークを設計し、デンシフィケーションとポイントペインティングを用いてポイントクラウドデータを強化する。
論文 参考訳(メタデータ) (2020-06-28T04:49:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。