論文の概要: Semi-Supervised 3D Hand Shape and Pose Estimation with Label Propagation
- arxiv url: http://arxiv.org/abs/2111.15199v1
- Date: Tue, 30 Nov 2021 08:18:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-02 01:25:20.206562
- Title: Semi-Supervised 3D Hand Shape and Pose Estimation with Label Propagation
- Title(参考訳): ラベル伝搬を用いた半教師付き3次元手形とポーズ推定
- Authors: Samira Kaviani, Amir Rahimi, Richard Hartley
- Abstract要約: 本稿では,ラベル付きフレームから近傍の未ラベルフレームへの3Dアノテーションを疎アノテーションで表現するPose Alignmentネットワークを提案する。
ラベル付きアンラベリングフレームにアライメントを組み込むことで、ポーズ推定精度を向上させることができることを示す。
- 参考スコア(独自算出の注目度): 17.86721740779611
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To obtain 3D annotations, we are restricted to controlled environments or
synthetic datasets, leading us to 3D datasets with less generalizability to
real-world scenarios. To tackle this issue in the context of semi-supervised 3D
hand shape and pose estimation, we propose the Pose Alignment network to
propagate 3D annotations from labelled frames to nearby unlabelled frames in
sparsely annotated videos. We show that incorporating the alignment supervision
on pairs of labelled-unlabelled frames allows us to improve the pose estimation
accuracy. Besides, we show that the proposed Pose Alignment network can
effectively propagate annotations on unseen sparsely labelled videos without
fine-tuning.
- Abstract(参考訳): 3Dアノテーションを得るためには、制御された環境や合成データセットに制限されるため、現実のシナリオに対する一般化性の低い3Dデータセットが得られます。
半教師付き3次元手形状とポーズ推定の文脈でこの問題に対処するために,ラベル付きフレームから近傍の未ラベルフレームへ疎アノテーションで3Dアノテーションを伝達するPose Alignmentネットワークを提案する。
ラベル付きフレームのペアにアライメントの監督を組み込むことで,ポーズ推定精度の向上が期待できることを示す。
また,提案するポーズアライメントネットワークは,微調整をすることなく,目立たないラベル付きビデオに注釈を効果的に伝達できることを示す。
関連論文リスト
- PF3plat: Pose-Free Feed-Forward 3D Gaussian Splatting [54.7468067660037]
PF3platは、設計選択を検証した包括的なアブレーション研究によってサポートされた、すべてのベンチマークに新しい最先端を設定します。
本フレームワークは,3DGSの高速,スケーラビリティ,高品質な3D再構成とビュー合成機能を活用している。
論文 参考訳(メタデータ) (2024-10-29T15:28:15Z) - DatasetNeRF: Efficient 3D-aware Data Factory with Generative Radiance Fields [68.94868475824575]
本稿では,無限で高品質な3Dアノテーションを3Dポイントクラウドセグメンテーションとともに生成できる新しいアプローチを提案する。
我々は3次元生成モデルに先立って強力なセマンティクスを活用してセマンティクスデコーダを訓練する。
トレーニングが完了すると、デコーダは遅延空間を効率よく一般化し、無限のデータの生成を可能にする。
論文 参考訳(メタデータ) (2023-11-18T21:58:28Z) - PanopticNeRF-360: Panoramic 3D-to-2D Label Transfer in Urban Scenes [54.49897326605168]
粗い3Dアノテーションとノイズの多い2Dセマンティックキューを組み合わせて高品質なパノプティカルラベルを生成する新しいアプローチであるPanopticNeRF-360を提案する。
実験では,KITTI-360データセット上でのラベル転送方式に対するPanopticNeRF-360の最先端性能を実証した。
論文 参考訳(メタデータ) (2023-09-19T17:54:22Z) - When 3D Bounding-Box Meets SAM: Point Cloud Instance Segmentation with
Weak-and-Noisy Supervision [20.625754683390536]
本稿では,CIP-WPIS法を提案する。
2次元基礎モデルSAMと3次元幾何に埋め込まれた事前学習知識を活用し、正確なポイントワイズ・インスタンス・ラベルを実現する。
提案手法は,ノイズの多い3次元境界ボックスアノテーションに対して頑健であり,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-09-02T05:17:03Z) - You Only Label Once: 3D Box Adaptation from Point Cloud to Image via
Semi-Supervised Learning [31.914887148307706]
本研究では,パノラマカメラの外観を完璧に適合させるために,Lidar 3Dバウンディングボックスの最小パラメータを自動的に調整する学習型3Dボックス適応手法を提案する。
これは精度と効率のバランスを良くし、正確な立方体アノテーションに対するラベル付けの労力を劇的に削減する。
論文 参考訳(メタデータ) (2022-11-17T02:28:58Z) - Dual Adaptive Transformations for Weakly Supervised Point Cloud
Segmentation [78.6612285236938]
弱制御点雲分割のための新しいDATモデル(textbfDual textbfAdaptive textbfTransformations)を提案する。
我々は,大規模S3DISデータセットとScanNet-V2データセットの2つの人気バックボーンを用いたDATモデルの評価を行った。
論文 参考訳(メタデータ) (2022-07-19T05:43:14Z) - On Triangulation as a Form of Self-Supervision for 3D Human Pose
Estimation [57.766049538913926]
ラベル付きデータが豊富である場合, 単一画像からの3次元ポーズ推定に対する改良されたアプローチは, 極めて効果的である。
最近の注目の多くは、セミと(あるいは)弱い教師付き学習に移行している。
本稿では,多視点の幾何学的制約を,識別可能な三角測量を用いて課し,ラベルがない場合の自己監督の形式として用いることを提案する。
論文 参考訳(メタデータ) (2022-03-29T19:11:54Z) - Panoptic NeRF: 3D-to-2D Label Transfer for Panoptic Urban Scene
Segmentation [48.677336052620895]
そこで本研究では,画素ごとの2Dセマンティックスとインスタンスラベルの取得を目的とした,新しい3D-to-2Dラベル転送手法であるPanoptic NeRFを提案する。
3D空間内での推論と2Dラベルへのレンダリングにより、我々の2Dセマンティクスとインスタンスラベルは、設計によって複数ビューに一貫性がある。
論文 参考訳(メタデータ) (2022-03-29T04:16:40Z) - Neural View Synthesis and Matching for Semi-Supervised Few-Shot Learning
of 3D Pose [10.028521796737314]
本稿では,ラベル付きサンプルと非ラベル付きデータの集合から3次元オブジェクトのポーズを推定する学習の課題について検討する。
我々の主な貢献は学習フレームワークであるニューラルビュー合成とマッチングであり、3Dポーズアノテーションをラベル付けされたラベル付き画像から、確実に非ラベル付き画像に転送することができる。
論文 参考訳(メタデータ) (2021-10-27T06:53:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。