論文の概要: Markerless Multi-view 3D Human Pose Estimation: a survey
- arxiv url: http://arxiv.org/abs/2407.03817v1
- Date: Thu, 4 Jul 2024 10:44:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-08 18:32:28.298617
- Title: Markerless Multi-view 3D Human Pose Estimation: a survey
- Title(参考訳): マーカレスマルチビュー3次元人物位置推定:サーベイ
- Authors: Ana Filipa Rodrigues Nogueira, Hélder P. Oliveira, Luís F. Teixeira,
- Abstract要約: 3D人間のポーズ推定は、複数の関節を検知することで、シーン内のすべての個人の骨格を再構築することを目的としている。
3Dポーズの再構築に関わるすべての課題を解決する方法はまだない。
さらに、高い精度の3Dポーズを計算コストで迅速に推測できるアプローチを開発するためには、さらなる研究が必要である。
- 参考スコア(独自算出の注目度): 0.49157446832511503
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: 3D human pose estimation aims to reconstruct the human skeleton of all the individuals in a scene by detecting several body joints. The creation of accurate and efficient methods is required for several real-world applications including animation, human-robot interaction, surveillance systems or sports, among many others. However, several obstacles such as occlusions, random camera perspectives, or the scarcity of 3D labelled data, have been hampering the models' performance and limiting their deployment in real-world scenarios. The higher availability of cameras has led researchers to explore multi-view solutions due to the advantage of being able to exploit different perspectives to reconstruct the pose. Thus, the goal of this survey is to present an overview of the methodologies used to estimate the 3D pose in multi-view settings, understand what were the strategies found to address the various challenges and also, identify their limitations. Based on the reviewed articles, it was possible to find that no method is yet capable of solving all the challenges associated with the reconstruction of the 3D pose. Due to the existing trade-off between complexity and performance, the best method depends on the application scenario. Therefore, further research is still required to develop an approach capable of quickly inferring a highly accurate 3D pose with bearable computation cost. To this goal, techniques such as active learning, methods that learn with a low level of supervision, the incorporation of temporal consistency, view selection, estimation of depth information and multi-modal approaches might be interesting strategies to keep in mind when developing a new methodology to solve this task.
- Abstract(参考訳): 3D人間のポーズ推定は、複数の関節を検知することで、シーン内のすべての個人の骨格を再構築することを目的としている。
アニメーション、人間とロボットのインタラクション、監視システム、スポーツなど、現実のいくつかの応用において、正確で効率的な方法の作成が求められている。
しかし、オクルージョンやランダムカメラの視点、あるいは3Dラベル付きデータの不足といったいくつかの障害は、モデルの性能を阻害し、実際のシナリオへの展開を制限してきた。
カメラの高可用性により、研究者は様々な視点を利用してポーズを再構築できるという利点から、マルチビューのソリューションを探ることができた。
そこで本調査の目的は,多視点環境での3次元ポーズ推定手法の概要を提示し,様々な課題に対処する戦略を把握し,その限界を識別することである。
レビューした論文から,3次元ポーズの再構築に伴う課題をすべて解決できる手法が存在しないことが確認できた。
複雑さとパフォーマンスの間に既存のトレードオフがあるため、最良のメソッドはアプリケーションのシナリオに依存します。
そのため,高精度な3次元ポーズを計算コストで迅速に推定できるアプローチを開発するためには,さらなる研究が必要である。
この目的のためには、アクティブラーニング、低レベルの監督で学習する手法、時間的一貫性、視点選択、深度情報の推定、マルチモーダルアプローチといった手法が、この課題を解決するための新しい方法論を開発する際に留意すべき興味深い戦略である。
関連論文リスト
- Deep learning for 3D human pose estimation and mesh recovery: A survey [6.535833206786788]
本稿では過去5年間の3次元ポーズ推定のためのディープラーニング手法の進歩を概観する。
我々の知る限りでは、この調査は人間の3次元ポーズ推定のためのディープラーニング手法を包括的にカバーした最初のものであることは間違いない。
論文 参考訳(メタデータ) (2024-02-29T04:30:39Z) - Markerless 3D human pose tracking through multiple cameras and AI:
Enabling high accuracy, robustness, and real-time performance [0.0]
リアルタイムに3Dの人間の動きを追跡することは、多くの分野にわたる多くのアプリケーションにとって不可欠である。
人工知能の最近の進歩はマーカーレスソリューションを可能にしている。
本稿では,マルチカメラビューと2次元AIに基づくポーズ推定手法を組み合わせたマーカーレスフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-31T15:06:50Z) - Towards unconstrained joint hand-object reconstruction from RGB videos [81.97694449736414]
ハンドオブジェクト操作の再構築は、ロボット工学と人間のデモから学ぶ大きな可能性を秘めている。
まず,手動物体の相互作用をシームレスに処理できる学習不要な手動物体再構成手法を提案する。
論文 参考訳(メタデータ) (2021-08-16T12:26:34Z) - Recent Advances in Monocular 2D and 3D Human Pose Estimation: A Deep
Learning Perspective [69.44384540002358]
この問題に対処するための包括的で包括的な2D-to-3D視点を提供する。
2014年からの主流とマイルストーンのアプローチを統一フレームワークで分類しています。
また,ポーズ表現スタイル,ベンチマーク,評価指標,一般的なアプローチの定量的評価を要約した。
論文 参考訳(メタデータ) (2021-04-23T11:07:07Z) - 3D Human Pose, Shape and Texture from Low-Resolution Images and Videos [107.36352212367179]
本稿では,解像度認識ネットワーク,自己スーパービジョン損失,コントラスト学習スキームからなるrsc-netを提案する。
提案手法は1つのモデルで異なる解像度で3次元物体のポーズと形状を学習できる。
低解像度映像を扱うRSC-Netを拡張し、低解像度入力からテクスチャ化された3D歩行者の再構築に適用します。
論文 参考訳(メタデータ) (2021-03-11T06:52:12Z) - HMOR: Hierarchical Multi-Person Ordinal Relations for Monocular
Multi-Person 3D Pose Estimation [54.23770284299979]
本稿では, 階層型多人数常連関係(HMOR)を新たに導入する。
HMORは相互作用情報を階層的に深さと角度の順序関係として符号化する。
統合トップダウンモデルは、学習プロセスにおけるこれらの順序関係を活用するように設計されている。
提案手法は, 公開されている多人数の3Dポーズデータセットにおいて, 最先端の手法を著しく上回っている。
論文 参考訳(メタデータ) (2020-08-01T07:53:27Z) - 3D Human Shape and Pose from a Single Low-Resolution Image with
Self-Supervised Learning [105.49950571267715]
3次元人物形状とポーズ推定のための既存のディープラーニング手法は、比較的高解像度な入力画像に依存している。
本稿では,レゾリューション・アウェア・ネットワーク,セルフ・スーパービジョン・ロス,コントラッシブ・ラーニング・スキームからなるRCC-Netを提案する。
これら2つの新たなトレーニング損失は,3次元形状を学習し,弱教師ありの姿勢を示す。
論文 参考訳(メタデータ) (2020-07-27T16:19:52Z) - Weakly-Supervised 3D Human Pose Learning via Multi-view Images in the
Wild [101.70320427145388]
本稿では、3Dアノテーションを必要としない弱教師付きアプローチを提案し、ラベルのないマルチビューデータから3Dポーズを推定する。
提案手法を2つの大規模データセット上で評価する。
論文 参考訳(メタデータ) (2020-03-17T08:47:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。