Fugu-MT 論文翻訳(概要): Learning Temporal 3D Human Pose Estimation with Pseudo-Labels

論文の概要: Learning Temporal 3D Human Pose Estimation with Pseudo-Labels

arxiv url: http://arxiv.org/abs/2110.07578v1
Date: Thu, 14 Oct 2021 17:40:45 GMT
ステータス: 翻訳完了
システム内更新日: 2021-10-15 14:46:36.682991
Title: Learning Temporal 3D Human Pose Estimation with Pseudo-Labels
Title（参考訳）: 擬似ラベルを用いた時間的3次元ポーズ推定の学習
Authors: Arij Bouazizi and Ulrich Kressel and Vasileios Belagiannis
Abstract要約: 自己監督型3次元ポーズ推定のための簡易かつ効果的なアプローチを提案する。我々は、マルチビューカメラシステムの2Dボディポーズ推定を三角測量に頼っている。提案手法はHuman3.6MとMPI-INF-3DHPベンチマークにおける最先端性能を実現する。
参考スコア（独自算出の注目度）: 3.0954251281114513
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We present a simple, yet effective, approach for self-supervised 3D human pose estimation. Unlike the prior work, we explore the temporal information next to the multi-view self-supervision. During training, we rely on triangulating 2D body pose estimates of a multiple-view camera system. A temporal convolutional neural network is trained with the generated 3D ground-truth and the geometric multi-view consistency loss, imposing geometrical constraints on the predicted 3D body skeleton. During inference, our model receives a sequence of 2D body pose estimates from a single-view to predict the 3D body pose for each of them. An extensive evaluation shows that our method achieves state-of-the-art performance in the Human3.6M and MPI-INF-3DHP benchmarks. Our code and models are publicly available at \url{https://github.com/vru2020/TM_HPE/}.
Abstract（参考訳）: 自己監督型3次元ポーズ推定のための簡易で効果的なアプローチを提案する。先行研究と異なり、我々は多視点自己監督の隣の時間的情報を探究する。トレーニング中は、マルチビューカメラシステムの2Dボディポーズ推定を三角測量に頼っている。時間畳み込みニューラルネットワークは、生成された3次元地下構造と幾何学的多視点整合性損失で訓練され、予測された3次元体骨格に幾何学的制約を与える。推測中、モデルでは1つの視点から2dボディポーズのシーケンスを受け取り、3dボディポーズの予測を行う。提案手法はHuman3.6MとMPI-INF-3DHPベンチマークの最先端性能を実現する。私たちのコードとモデルは、 \url{https://github.com/vru2020/TM_HPE/}で公開されています。

関連論文リスト

E3D-Bench: A Benchmark for End-to-End 3D Geometric Foundation Models [78.1674905950243]
3次元幾何学基礎モデル(GFM)の総合ベンチマークを初めて提示する。 GFMは、単一のフィードフォワードパスで密度の高い3D表現を直接予測し、スローまたは未使用のカメラパラメータを不要にする。我々は16の最先端GFMを評価し、タスクやドメイン間の長所と短所を明らかにした。すべてのコード、評価スクリプト、処理されたデータは公開され、3D空間インテリジェンスの研究が加速される。
論文参考訳（メタデータ） (2025-06-02T17:53:09Z)
Unsupervised Learning of Category-Level 3D Pose from Object-Centric Videos [15.532504015622159]
カテゴリーレベルの3Dポーズ推定は、コンピュータビジョンとロボット工学において基本的に重要な問題である。カテゴリーレベルの3Dポーズを,カジュアルに撮られた対象中心の動画からのみ推定する学習の課題に取り組む。
論文参考訳（メタデータ） (2024-07-05T09:43:05Z)
UPose3D: Uncertainty-Aware 3D Human Pose Estimation with Cross-View and Temporal Cues [55.69339788566899]
UPose3Dは多視点人間のポーズ推定のための新しいアプローチである。直接的な3Dアノテーションを必要とせずに、堅牢性と柔軟性を向上させる。
論文参考訳（メタデータ） (2024-04-23T00:18:00Z)
Unsupervised Multi-Person 3D Human Pose Estimation From 2D Poses Alone [4.648549457266638]
本研究は,教師なし多人数2D-3Dポーズ推定の実現可能性について検討した最初の研究の1つである。本手法では,各被験者の2次元ポーズを3次元に独立に持ち上げ,それらを共有3次元座標系で組み合わせる。これにより、ポーズの正確な3D再構成を検索することができる。
論文参考訳（メタデータ） (2023-09-26T11:42:56Z)
Self-supervised 3D Human Pose Estimation from a Single Image [1.0878040851638]
本研究では,1枚の画像から3次元人体ポーズを予測する自己教師型手法を提案する。予測ネットワークは、典型的なポーズの人物と、未ペアの2Dポーズのセットを描写した未ラベル画像のデータセットから訓練される。
論文参考訳（メタデータ） (2023-04-05T10:26:21Z)
Self-Supervised 3D Human Pose Estimation with Multiple-View Geometry [2.7541825072548805]
本稿では,複数視点カメラシステムに基づく1人の人物の3次元ポーズ推定のための自己教師付き学習アルゴリズムを提案する。そこで本研究では,2次元・3次元の立体ポーズが不要な4自由度関数学習アルゴリズムを提案する。
論文参考訳（メタデータ） (2021-08-17T17:31:24Z)
Self-Attentive 3D Human Pose and Shape Estimation from Videos [82.63503361008607]
3D人間のポーズと形状推定のためのビデオベースの学習アルゴリズムを紹介します。ビデオの時間情報を利用して自己着脱モジュールを提案する。本手法を3DPW, MPI-INF-3DHP, Human3.6Mデータセット上で評価した。
論文参考訳（メタデータ） (2021-03-26T00:02:19Z)
Graph and Temporal Convolutional Networks for 3D Multi-person Pose Estimation in Monocular Videos [33.974241749058585]
本稿では, グラフ畳み込みネットワーク(GCN)と時間畳み込みネットワーク(TCN)を統合し, カメラ中心のマルチパーソナライズされた3Dポーズを頑健に推定するフレームワークを提案する。特に,姿勢推定結果を改善するために,2次元ポーズ推定器の信頼度スコアを用いたヒューマンジョイントgcnを提案する。 2つのGCNが連携して空間的なフレーム回りの3Dポーズを推定し、ターゲットフレーム内の可視関節情報と骨情報の両方を使用して、人の一部または欠落した情報を推定します。
論文参考訳（メタデータ） (2020-12-22T03:01:19Z)
Synthetic Training for Monocular Human Mesh Recovery [100.38109761268639]
本稿では,RGB画像と大規模に異なる複数の身体部位の3次元メッシュを推定することを目的とする。主な課題は、2D画像のすべての身体部分の3Dアノテーションを完備するトレーニングデータがないことである。本稿では,D2S(Deep-to-scale)投影法を提案する。
論文参考訳（メタデータ） (2020-10-27T03:31:35Z)
Pose2Mesh: Graph Convolutional Network for 3D Human Pose and Mesh Recovery from a 2D Human Pose [70.23652933572647]
本稿では,人間のメッシュ頂点の3次元座標を直接推定するグラフ畳み込みニューラルネットワーク(GraphCNN)を提案する。我々のPose2Meshは、様々なベンチマークデータセットにおいて、以前の3次元人間のポーズとメッシュ推定方法よりも優れていることを示す。
論文参考訳（メタデータ） (2020-08-20T16:01:56Z)
From Image Collections to Point Clouds with Self-supervised Shape and Pose Networks [53.71440550507745]
2次元画像から3Dモデルを再構成することは、コンピュータビジョンの基本的な問題の一つである。本研究では,1枚の画像から3次元オブジェクトを再構成する深層学習手法を提案する。我々は,3次元点雲の再構成と推定ネットワークの自己教師方式の両方を学習する。
論文参考訳（メタデータ） (2020-05-05T04:25:16Z)
Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image Synthesis [72.34794624243281]
ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。 3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
論文参考訳（メタデータ） (2020-04-09T07:55:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。