論文の概要: Markerless Multi-view 3D Human Pose Estimation: a survey
- arxiv url: http://arxiv.org/abs/2407.03817v2
- Date: Mon, 09 Jun 2025 22:57:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-11 15:11:38.565767
- Title: Markerless Multi-view 3D Human Pose Estimation: a survey
- Title(参考訳): マーカレスマルチビュー3次元人物位置推定:サーベイ
- Authors: Ana Filipa Rodrigues Nogueira, Hélder P. Oliveira, Luís F. Teixeira,
- Abstract要約: 3D人間のポーズ推定は、人体の関節を検出することによって人間の骨格を再構築する。
アニメーション、人間とロボットのインタラクション、監視、スポーツなど、いくつかの現実世界のアプリケーションには、正確で効率的なソリューションが必要である。
しかし、オクルージョンや2Dポーズミスマッチ、ランダムカメラの視点、限られた3Dラベル付きデータといった課題は、モデルの性能を妨げている。
- 参考スコア(独自算出の注目度): 0.49157446832511503
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: 3D human pose estimation involves reconstructing the human skeleton by detecting the body joints. Accurate and efficient solutions are required for several real-world applications including animation, human-robot interaction, surveillance, and sports. However, challenges such as occlusions, 2D pose mismatches, random camera perspectives, and limited 3D labelled data have been hampering the models' performance and limiting their deployment in real-world scenarios. The higher availability of cameras has led researchers to explore multi-view solutions to take advantage of the different perspectives to reconstruct the pose. Most existing reviews have mainly focused on monocular 3D human pose estimation, so a comprehensive survey on multi-view approaches has been missing since 2012. According to the reviewed articles, the majority of the existing methods are fully-supervised approaches based on geometric constraints, which are often limited by 2D pose mismatches. To mitigate this, researchers have proposed incorporating temporal consistency or depth information. Alternatively, working directly with 3D features has been shown to completely overcome this issue, albeit at the cost of increased computational complexity. Additionally, models with lower levels of supervision have been identified to help address challenges such as annotated data scarcity and generalisation to new setups. Therefore, no method currently addresses all challenges associated with 3D pose reconstruction, and a trade-off between complexity and performance exists. Further research is needed to develop approaches capable of quickly inferring a highly accurate 3D pose with bearable computation cost. Techniques such as active learning, low-supervision methods, temporal consistency, view selection, depth information estimation, and multi-modal approaches are strategies to consider when developing a new method for this task.
- Abstract(参考訳): 3D人間のポーズ推定は、人体の関節を検出することによって人間の骨格を再構築する。
アニメーション、人間とロボットのインタラクション、監視、スポーツなど、いくつかの現実世界のアプリケーションには、正確で効率的なソリューションが必要である。
しかし、オクルージョンや2Dポーズミスマッチ、ランダムカメラの視点、限られた3Dラベル付きデータといった課題は、モデルの性能を阻害し、実際のシナリオへの展開を制限してきた。
カメラの高可用性により、研究者は様々な視点を利用してポーズを再構築するマルチビューソリューションを探求した。
既存のレビューのほとんどは、主にモノラルな3D人間のポーズ推定に焦点を当てているため、マルチビューアプローチに関する包括的な調査は2012年以来欠落している。
レビュー記事によると、既存の手法のほとんどは幾何学的制約に基づく完全に教師されたアプローチであり、しばしば2次元ポーズミスマッチによって制限される。
これを軽減するため、研究者たちは時間的一貫性や深度情報を取り入れることを提案した。
あるいは、3D機能を直接扱うことで、計算の複雑さを増大させるコストにもかかわらず、この問題を完全に克服できることが示されている。
さらに、アノテートされたデータの不足や新しいセットアップへの一般化といった課題に対処するために、監督レベルが低いモデルが特定されている。
したがって、現在3次元ポーズ復元に関わるすべての課題に対処する手法は存在せず、複雑さと性能のトレードオフが存在する。
さらに、高精度な3次元ポーズを計算コストで迅速に推測できるアプローチを開発する必要がある。
アクティブラーニング,低スーパービジョン手法,時間的一貫性,ビュー選択,深度情報推定,マルチモーダルアプローチといった手法は,新しい手法を開発する際に考慮すべき戦略である。
関連論文リスト
- DeProPose: Deficiency-Proof 3D Human Pose Estimation via Adaptive Multi-View Fusion [57.83515140886807]
欠陥認識型3Dポーズ推定の課題について紹介する。
DeProPoseは、トレーニングの複雑さを減らすために、ネットワークアーキテクチャをシンプルにするためのフレキシブルなメソッドである。
我々は,新しい3次元ポーズ推定データセットを開発した。
論文 参考訳(メタデータ) (2025-02-23T03:22:54Z) - Deep learning for 3D human pose estimation and mesh recovery: A survey [6.535833206786788]
本稿では過去5年間の3次元ポーズ推定のためのディープラーニング手法の進歩を概観する。
我々の知る限りでは、この調査は人間の3次元ポーズ推定のためのディープラーニング手法を包括的にカバーした最初のものであることは間違いない。
論文 参考訳(メタデータ) (2024-02-29T04:30:39Z) - Markerless 3D human pose tracking through multiple cameras and AI:
Enabling high accuracy, robustness, and real-time performance [0.0]
リアルタイムに3Dの人間の動きを追跡することは、多くの分野にわたる多くのアプリケーションにとって不可欠である。
人工知能の最近の進歩はマーカーレスソリューションを可能にしている。
本稿では,マルチカメラビューと2次元AIに基づくポーズ推定手法を組み合わせたマーカーレスフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-31T15:06:50Z) - Towards unconstrained joint hand-object reconstruction from RGB videos [81.97694449736414]
ハンドオブジェクト操作の再構築は、ロボット工学と人間のデモから学ぶ大きな可能性を秘めている。
まず,手動物体の相互作用をシームレスに処理できる学習不要な手動物体再構成手法を提案する。
論文 参考訳(メタデータ) (2021-08-16T12:26:34Z) - Recent Advances in Monocular 2D and 3D Human Pose Estimation: A Deep
Learning Perspective [69.44384540002358]
この問題に対処するための包括的で包括的な2D-to-3D視点を提供する。
2014年からの主流とマイルストーンのアプローチを統一フレームワークで分類しています。
また,ポーズ表現スタイル,ベンチマーク,評価指標,一般的なアプローチの定量的評価を要約した。
論文 参考訳(メタデータ) (2021-04-23T11:07:07Z) - 3D Human Pose, Shape and Texture from Low-Resolution Images and Videos [107.36352212367179]
本稿では,解像度認識ネットワーク,自己スーパービジョン損失,コントラスト学習スキームからなるrsc-netを提案する。
提案手法は1つのモデルで異なる解像度で3次元物体のポーズと形状を学習できる。
低解像度映像を扱うRSC-Netを拡張し、低解像度入力からテクスチャ化された3D歩行者の再構築に適用します。
論文 参考訳(メタデータ) (2021-03-11T06:52:12Z) - HMOR: Hierarchical Multi-Person Ordinal Relations for Monocular
Multi-Person 3D Pose Estimation [54.23770284299979]
本稿では, 階層型多人数常連関係(HMOR)を新たに導入する。
HMORは相互作用情報を階層的に深さと角度の順序関係として符号化する。
統合トップダウンモデルは、学習プロセスにおけるこれらの順序関係を活用するように設計されている。
提案手法は, 公開されている多人数の3Dポーズデータセットにおいて, 最先端の手法を著しく上回っている。
論文 参考訳(メタデータ) (2020-08-01T07:53:27Z) - 3D Human Shape and Pose from a Single Low-Resolution Image with
Self-Supervised Learning [105.49950571267715]
3次元人物形状とポーズ推定のための既存のディープラーニング手法は、比較的高解像度な入力画像に依存している。
本稿では,レゾリューション・アウェア・ネットワーク,セルフ・スーパービジョン・ロス,コントラッシブ・ラーニング・スキームからなるRCC-Netを提案する。
これら2つの新たなトレーニング損失は,3次元形状を学習し,弱教師ありの姿勢を示す。
論文 参考訳(メタデータ) (2020-07-27T16:19:52Z) - Weakly-Supervised 3D Human Pose Learning via Multi-view Images in the
Wild [101.70320427145388]
本稿では、3Dアノテーションを必要としない弱教師付きアプローチを提案し、ラベルのないマルチビューデータから3Dポーズを推定する。
提案手法を2つの大規模データセット上で評価する。
論文 参考訳(メタデータ) (2020-03-17T08:47:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。