論文の概要: WorldPose: A World Cup Dataset for Global 3D Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2501.02771v1
- Date: Mon, 06 Jan 2025 05:24:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-07 17:07:08.971867
- Title: WorldPose: A World Cup Dataset for Global 3D Human Pose Estimation
- Title(参考訳): WorldPose:グローバルな3D人物推定のためのワールドカップデータセット
- Authors: Tianjian Jiang, Johsan Billingham, Sebastian Müksch, Juan Zarate, Nicolas Evans, Martin R. Oswald, Marc Polleyfeys, Otmar Hilliges, Manuel Kaufmann, Jie Song,
- Abstract要約: WorldPoseは、野生における多人数のグローバルポーズ推定の研究を進めるための、新しいデータセットである。
我々はHDカメラの静的多視点設定を利用して、前例のない精度で3Dプレーヤーのポーズと動きを復元する。
得られたデータセットは80以上のシークエンスで構成され、約2.5万の3Dポーズと総走行距離は120km以上である。
- 参考スコア(独自算出の注目度): 33.58288086976396
- License:
- Abstract: We present WorldPose, a novel dataset for advancing research in multi-person global pose estimation in the wild, featuring footage from the 2022 FIFA World Cup. While previous datasets have primarily focused on local poses, often limited to a single person or in constrained, indoor settings, the infrastructure deployed for this sporting event allows access to multiple fixed and moving cameras in different stadiums. We exploit the static multi-view setup of HD cameras to recover the 3D player poses and motions with unprecedented accuracy given capture areas of more than 1.75 acres. We then leverage the captured players' motions and field markings to calibrate a moving broadcasting camera. The resulting dataset comprises more than 80 sequences with approx 2.5 million 3D poses and a total traveling distance of over 120 km. Subsequently, we conduct an in-depth analysis of the SOTA methods for global pose estimation. Our experiments demonstrate that WorldPose challenges existing multi-person techniques, supporting the potential for new research in this area and others, such as sports analysis. All pose annotations (in SMPL format), broadcasting camera parameters and footage will be released for academic research purposes.
- Abstract(参考訳): We present WorldPose, a novel dataset for research for multi-person global pose estimation in the wild, featured footage from the 2022 FIFA World Cup。
以前のデータセットは、主に1人または制約のある屋内設定に限られるローカルのポーズに焦点を当てていたが、このスポーツイベントに配備されたインフラは、異なるスタジアムで複数の固定および移動カメラへのアクセスを可能にする。
我々はHDカメラの静的なマルチビュー設定を利用して、3Dプレーヤーのポーズや動きを1.75エーカー以上の撮影領域で前例のない精度で再現する。
次に、キャプチャされた選手の動きとフィールドマーキングを活用して、移動中の放送カメラを校正する。
得られたデータセットは80以上のシークエンスで構成され、約2.5万の3Dポーズと総走行距離は120km以上である。
次に,大域的ポーズ推定のためのSOTA手法の詳細な分析を行う。
我々の実験は、WorldPoseが既存のマルチパーソン技術に挑戦し、スポーツ分析など、この分野における新たな研究の可能性を支えることを実証している。
すべてのポーズアノテーション(SMPLフォーマット)、カメラパラメータと映像の放送は学術研究のためにリリースされる。
関連論文リスト
- SoccerNet Game State Reconstruction: End-to-End Athlete Tracking and Identification on a Minimap [102.5232204867158]
我々は、ゲーム状態再構成のタスクを形式化し、フットボールビデオに焦点を当てた新しいゲーム状態再構成データセットである、サッカーネット-GSRを紹介する。
SoccerNet-GSRは、ピッチローカライゼーションとカメラキャリブレーションのための937万行のアノテートにより、30秒間の200の動画シーケンスで構成されている。
我々の実験は、GSRは挑戦的な新しい課題であり、将来の研究の場を開くことを示している。
論文 参考訳(メタデータ) (2024-04-17T12:53:45Z) - EMDB: The Electromagnetic Database of Global 3D Human Pose and Shape in
the Wild [31.787149079366877]
電磁気データベースEMDBについて述べる。
EMDBには高品質な3D SMPLのポーズと、ワイド動画のためのグローバルボディとカメラトラジェクトリを備えた形状パラメータが含まれている。
我々は、ボディウーン、ワイヤレス電磁(EM)センサーとハンドヘルドiPhoneを使って58分間のモーションデータを記録します。
論文 参考訳(メタデータ) (2023-08-31T17:56:19Z) - Monocular 3D Human Pose Estimation for Sports Broadcasts using Partial
Sports Field Registration [0.0]
スポーツ場の一部登録による2次元ポーズ推定とカメラキャリブレーションの進歩を組み合わせることで,有効な大規模運動データ収集の道筋を示す。
異なる視点、実行スタイル、ボディタイプを備えた、Unreal Engine 5で10k以上の画像の合成データセットを生成します。
論文 参考訳(メタデータ) (2023-04-10T07:41:44Z) - SLOPER4D: A Scene-Aware Dataset for Global 4D Human Pose Estimation in
Urban Environments [0.0]
SLOPER4Dは,大都市環境下で収集された新たなシーン認識データセットである。
我々は,エゴセントリックな視点から,10の多様な都市シーンにおける12人の被験者の活動を記録している。
SLOPER4Dは15個の人間の動きで構成され、それぞれが200メートル以上の軌道長を持つ。
論文 参考訳(メタデータ) (2023-03-16T05:54:15Z) - Scene-Aware 3D Multi-Human Motion Capture from a Single Camera [83.06768487435818]
静止カメラで記録された1枚のRGBビデオから、シーン内の複数の人間の3次元位置を推定し、その身体形状と調音を推定する問題を考察する。
コンピュータビジョンの最近の進歩を,2次元の人体関節,関節角度,正規化不均等マップ,人間のセグメンテーションマスクなど,様々なモダリティのための大規模事前訓練モデルを用いて活用している。
特に,2次元の関節と関節角度を用いた正規化不均等予測から,シーン深度とユニークな人格尺度を推定する。
論文 参考訳(メタデータ) (2023-01-12T18:01:28Z) - SoccerNet-Tracking: Multiple Object Tracking Dataset and Benchmark in
Soccer Videos [62.686484228479095]
本稿では,各30の200列からなる複数物体追跡のための新しいデータセットを提案する。
データセットは、バウンディングボックスとトラックレットIDで完全に注釈付けされている。
分析の結果,サッカービデオにおける複数の選手,審判,ボール追跡が解決されるには程遠いことがわかった。
論文 参考訳(メタデータ) (2022-04-14T12:22:12Z) - MetaPose: Fast 3D Pose from Multiple Views without 3D Supervision [72.5863451123577]
正確な3Dポーズとカメラ推定が可能なニューラルモデルをトレーニングする方法を示す。
本手法は,古典的バンドル調整と弱教師付き単分子3Dベースラインの両方に優れる。
論文 参考訳(メタデータ) (2021-08-10T18:39:56Z) - CanonPose: Self-Supervised Monocular 3D Human Pose Estimation in the
Wild [31.334715988245748]
ラベルのないマルチビューデータから1つの画像3Dポーズ推定器を学習する自己教師型アプローチを提案する。
既存のほとんどの方法とは対照的に、校正カメラは必要とせず、移動カメラから学ぶことができる。
成功の鍵は、ビューとトレーニングサンプルの情報を混ぜ合わせた、新しく偏見のない再建目標である。
論文 参考訳(メタデータ) (2020-11-30T10:42:27Z) - Towards Generalization of 3D Human Pose Estimation In The Wild [73.19542580408971]
3DBodyTex.Poseは、3Dの人間のポーズ推定のタスクに対処するデータセットである。
3DBodyTex.Poseは、さまざまな衣服やポーズで405種類の実際の被写体を含む高品質でリッチなデータを提供する。
論文 参考訳(メタデータ) (2020-04-21T13:31:58Z) - Cross-View Tracking for Multi-Human 3D Pose Estimation at over 100 FPS [13.191601826570786]
マルチキャリブレーションカメラビューから複数人の3Dポーズを推定する新しい手法を提案する。
異なるカメラ座標の2Dポーズを入力として取り、グローバル座標の正確な3Dポーズを目指しています。
カメラビューが12から28の大規模マルチヒューマンデータセットを提案する。
論文 参考訳(メタデータ) (2020-03-09T08:54:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。