論文の概要: Human Pose-based Estimation, Tracking and Action Recognition with Deep
Learning: A Survey
- arxiv url: http://arxiv.org/abs/2310.13039v1
- Date: Thu, 19 Oct 2023 17:59:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-24 01:55:36.625091
- Title: Human Pose-based Estimation, Tracking and Action Recognition with Deep
Learning: A Survey
- Title(参考訳): 深層学習による人間のポーズに基づく推定・追跡・行動認識
- Authors: Lijuan Zhou and Xiang Meng and Zhihuan Liu and Mengqi Wu and Zhimin
Gao and Pichao Wang
- Abstract要約: 本稿では, 深層学習, ポーズ推定, ポーズ追跡, 行動認識を応用したポーズベースアプリケーションについて検討する。
姿勢推定は、画像や画像のシーケンスから人間の関節の位置を決定することである。
ポーズトラッキングは、時間とともに一貫性のある人間のポーズトラジェクトリを生成することを目的とした、新たな研究方向である。
アクション認識は、ポーズ推定や追跡データを使用してアクションタイプの識別をターゲットとする。
- 参考スコア(独自算出の注目度): 15.920237822185301
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human pose analysis has garnered significant attention within both the
research community and practical applications, owing to its expanding array of
uses, including gaming, video surveillance, sports performance analysis, and
human-computer interactions, among others. The advent of deep learning has
significantly improved the accuracy of pose capture, making pose-based
applications increasingly practical. This paper presents a comprehensive survey
of pose-based applications utilizing deep learning, encompassing pose
estimation, pose tracking, and action recognition.Pose estimation involves the
determination of human joint positions from images or image sequences. Pose
tracking is an emerging research direction aimed at generating consistent human
pose trajectories over time. Action recognition, on the other hand, targets the
identification of action types using pose estimation or tracking data. These
three tasks are intricately interconnected, with the latter often reliant on
the former. In this survey, we comprehensively review related works, spanning
from single-person pose estimation to multi-person pose estimation, from 2D
pose estimation to 3D pose estimation, from single image to video, from mining
temporal context gradually to pose tracking, and lastly from tracking to
pose-based action recognition. As a survey centered on the application of deep
learning to pose analysis, we explicitly discuss both the strengths and
limitations of existing techniques. Notably, we emphasize methodologies for
integrating these three tasks into a unified framework within video sequences.
Additionally, we explore the challenges involved and outline potential
directions for future research.
- Abstract(参考訳): 人間のポーズ分析は、ゲーム、ビデオ監視、スポーツパフォーマンス分析、人間とコンピュータの相互作用など幅広い用途のために、研究コミュニティと実用的なアプリケーションの両方で大きな注目を集めている。
深層学習の出現により、ポーズキャプチャの精度が大幅に向上し、ポーズベースのアプリケーションがますます実用的になった。
本稿では, 深層学習, ポーズ推定, ポーズ追跡, 行動認識を応用したポーズベースアプリケーションに関する総合的な調査を行い, 画像や画像からの関節位置の決定を含む。
ポーズトラッキングは、時間とともに一貫性のある人間のポーズトラジェクトリを生成することを目的とした、新たな研究方向である。
一方、行動認識はポーズ推定や追跡データを用いて行動タイプの識別を目標としている。
これら3つのタスクは複雑に相互接続され、後者はしばしば前者に依存する。
本研究では,1人のポーズ推定から複数人のポーズ推定まで,2次元ポーズ推定から3次元ポーズ推定まで,単一画像からビデオまで,時間的コンテキストのマイニングからポーズ追跡まで,トラッキングからポーズベースのアクション認識まで,関連作品を総合的に検討した。
分析への深層学習の適用を中心とした調査として,既存の手法の強みと限界を明示的に議論する。
特に,これらの3つのタスクをビデオシーケンス内の統一フレームワークに統合する手法を強調した。
さらに,今後の研究に向けた課題を探究し,今後の方向性を概説する。
関連論文リスト
- Deep Learning-Based Object Pose Estimation: A Comprehensive Survey [73.74933379151419]
ディープラーニングに基づくオブジェクトポーズ推定の最近の進歩について論じる。
また、複数の入力データモダリティ、出力ポーズの自由度、オブジェクト特性、下流タスクについても調査した。
論文 参考訳(メタデータ) (2024-05-13T14:44:22Z) - Improving Multi-Person Pose Tracking with A Confidence Network [37.84514614455588]
我々は、人間の検出とポーズ推定を改善するために、新しいキーポイント信頼ネットワークと追跡パイプラインを開発する。
具体的には、キーポイント信頼ネットワークは、各キーポイントが閉鎖されているかどうかを決定するように設計されている。
追従パイプラインでは,Bbox-revisionモジュールが欠落検出を低減し,ID-retrieveモジュールが損失軌跡を補正する。
論文 参考訳(メタデータ) (2023-10-29T06:36:27Z) - Understanding Pose and Appearance Disentanglement in 3D Human Pose
Estimation [72.50214227616728]
ポーズ情報から外見情報を引き離すために,自己教師型で画像表現を学習する手法がいくつか提案されている。
我々は,多種多様な画像合成実験を通じて,自己教師ネットワークの観点から,ゆがみについて検討する。
我々は,対象の自然な外見変化を生起することに焦点を当てた敵対的戦略を設計し,その反対に,絡み合ったネットワークが堅牢であることを期待している。
論文 参考訳(メタデータ) (2023-09-20T22:22:21Z) - A survey of top-down approaches for human pose estimation [0.0]
Deep Learningで実装された最先端の手法は、人間のポーズ推定の分野で顕著な成果をもたらした。
本稿では,人々のポーズを認識するための深層学習手法に基づく2次元画像の広範なレビューを新参者に提供することを目的とする。
論文 参考訳(メタデータ) (2022-02-05T23:27:46Z) - Learning Dynamics via Graph Neural Networks for Human Pose Estimation
and Tracking [98.91894395941766]
ポーズ検出とは無関係なポーズダイナミクスを学習する新しいオンライン手法を提案する。
具体的には、空間的・時間的情報と視覚的情報の両方を明示的に考慮したグラフニューラルネットワーク(GNN)を通して、このダイナミクスの予測を導出する。
PoseTrack 2017とPoseTrack 2018データセットの実験では、提案手法が人間のポーズ推定とトラッキングタスクの両方において、技術の現状よりも優れた結果が得られることを示した。
論文 参考訳(メタデータ) (2021-06-07T16:36:50Z) - Recent Advances in Monocular 2D and 3D Human Pose Estimation: A Deep
Learning Perspective [69.44384540002358]
この問題に対処するための包括的で包括的な2D-to-3D視点を提供する。
2014年からの主流とマイルストーンのアプローチを統一フレームワークで分類しています。
また,ポーズ表現スタイル,ベンチマーク,評価指標,一般的なアプローチの定量的評価を要約した。
論文 参考訳(メタデータ) (2021-04-23T11:07:07Z) - Deep Learning-Based Human Pose Estimation: A Survey [66.01917727294163]
人間のポーズ推定は、過去10年間に注目を集めてきた。
ヒューマン・コンピュータ・インタラクション、モーション・アナリティクス、拡張現実、バーチャル・リアリティーなど幅広い用途で利用されている。
最近のディープラーニングベースのソリューションは、人間のポーズ推定において高いパフォーマンスを実現している。
論文 参考訳(メタデータ) (2020-12-24T18:49:06Z) - View-Invariant, Occlusion-Robust Probabilistic Embedding for Human Pose [36.384824115033304]
本研究では,3次元のポーズを明示的に予測することなく,2次元のボディジョイントキーポイントからコンパクトなビュー不変埋め込み空間を学習する手法を提案する。
実験の結果,異なるカメラビューで類似のポーズを検索すると,埋め込みモデルの精度が向上することがわかった。
論文 参考訳(メタデータ) (2020-10-23T17:58:35Z) - Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image
Synthesis [72.34794624243281]
ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。
3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
論文 参考訳(メタデータ) (2020-04-09T07:55:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。