論文の概要: Best Practices for 2-Body Pose Forecasting
- arxiv url: http://arxiv.org/abs/2304.05758v1
- Date: Wed, 12 Apr 2023 10:46:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-13 15:20:41.214563
- Title: Best Practices for 2-Body Pose Forecasting
- Title(参考訳): 2-Body Pose Forecastingのベストプラクティス
- Authors: Muhammad Rameez Ur Rahman, Luca Scofano, Edoardo De Matteis,
Alessandro Flaborea, Alessio Sampieri, Fabio Galasso
- Abstract要約: 我々は、人間のポーズ予測の進捗状況を概観し、最善を尽くす一対一の実践を詳細に評価する。
他の1人のプラクティスは2体に移行しないため、提案されているベストプラクティスは階層的なボディモデリングや注目に基づくインタラクションエンコーディングは含まない。
提案した2体ポーズによるベストプラクティス予測では,最新のExPIデータセットのパフォーマンスが21.9%向上した。
- 参考スコア(独自算出の注目度): 58.661899246497896
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The task of collaborative human pose forecasting stands for predicting the
future poses of multiple interacting people, given those in previous frames.
Predicting two people in interaction, instead of each separately, promises
better performance, due to their body-body motion correlations. But the task
has remained so far primarily unexplored.
In this paper, we review the progress in human pose forecasting and provide
an in-depth assessment of the single-person practices that perform best for
2-body collaborative motion forecasting. Our study confirms the positive impact
of frequency input representations, space-time separable and fully-learnable
interaction adjacencies for the encoding GCN and FC decoding. Other
single-person practices do not transfer to 2-body, so the proposed best ones do
not include hierarchical body modeling or attention-based interaction encoding.
We further contribute a novel initialization procedure for the 2-body spatial
interaction parameters of the encoder, which benefits performance and
stability. Altogether, our proposed 2-body pose forecasting best practices
yield a performance improvement of 21.9% over the state-of-the-art on the most
recent ExPI dataset, whereby the novel initialization accounts for 3.5%. See
our project page at https://www.pinlab.org/bestpractices2body
- Abstract(参考訳): 協調的な人間のポーズ予測のタスクは、複数の相互作用する人々の将来のポーズを予測するためのものである。
身体と体の動きの相関により、それぞれ別々に2人の人間を予測することでパフォーマンスが向上する。
しかし、この課題は主に未調査のままだ。
本稿では,人間のポーズ予測の進歩を概観し,身体協調行動予測において最善を尽くす一人称実践の深い評価を行う。
本研究は,GCNおよびFCデコーディングにおける周波数入力表現,時空間分離可能および完全学習可能相互作用の正の効果を検証した。
他の1人のプラクティスは2体に移行しないため、提案されているベストプラクティスは階層的なボディモデリングや注目に基づくインタラクションエンコーディングは含まない。
さらに,エンコーダの2体空間相互作用パラメータに対する新しい初期化手順を提案し,性能と安定性に寄与する。
全体として,提案する2体のポーズ予測ベストプラクティスは,最新のexpiデータセットでは21.9%のパフォーマンス向上を実現しており,新たな初期化が3.5%を占めている。
プロジェクトのページはhttps://www.pinlab.org/bestpractices2bodyを参照。
関連論文リスト
- Interact with me: Joint Egocentric Forecasting of Intent to Interact, Attitude and Social Actions [25.464036307823974]
SocialEgoNetはグラフベースのフレームワークで、階層的な学習アプローチを通じてタスク依存を利用する。
SocialEgoNetは、高い推論速度のためにビデオ入力のわずか1秒から抽出されたボディスケルトン(顔、手、体からキーポイント)を使用する。
評価のために、新しいクラスラベルとバウンディングボックスアノテーションとの既存のエゴセントリックなヒューマンエージェントインタラクションを強化する。
論文 参考訳(メタデータ) (2024-12-21T16:54:28Z) - Expressive Forecasting of 3D Whole-body Human Motions [38.93700642077312]
私たちは初めて、全身の人間のポーズ予測フレームワークを定式化した。
我々のモデルは、クロスコンテキストアライメント(XCA)とクロスコンテキストインタラクション(XCI)の2つの重要な構成要素を含んでいる。
我々は,新たに導入した大規模ベンチマークの広範な実験を行い,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-12-19T09:09:46Z) - DisenHCN: Disentangled Hypergraph Convolutional Networks for
Spatiotemporal Activity Prediction [53.76601630407521]
本稿では,既存のソリューションのギャップを埋めるために,DistenHCNと呼ばれるハイパーグラフネットワークモデルを提案する。
特に,ユーザの好みと時間的活動の複雑なマッチングをヘテロジニアスなハイパーグラフにまとめる。
次に、ユーザ表現を異なる側面(位置認識、時間認識、活動認識)に切り離し、構築したハイパーグラフ上に対応するアスペクトの特徴を集約する。
論文 参考訳(メタデータ) (2022-08-14T06:51:54Z) - Jointformer: Single-Frame Lifting Transformer with Error Prediction and
Refinement for 3D Human Pose Estimation [11.592567773739407]
人間の3次元ポーズ推定技術は、人間の動きデータの可用性を大幅に向上させる可能性がある。
シングルイメージ2D-3Dリフトの最高の性能モデルは、通常、異なる体節間の関係を定義するために手動入力を必要とするグラフ畳み込みネットワーク(GCN)を使用する。
より一般化された自己認識機構を用いてこれらの関係を学習するトランスフォーマーに基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2022-08-07T12:07:19Z) - Development of Human Motion Prediction Strategy using Inception Residual
Block [1.0705399532413613]
Inception Residual Block (IRB) を提案する。
我々の主な貢献は、事前に観測されたポーズと次の予測されたポーズの間に連続性を持つように、入力と開始ブロックの出力の間の残差接続を提案することである。
提案したアーキテクチャでは、人間のポーズに関する事前知識をよりよく学習し、論文で詳述したよりはるかに高い予測精度を達成する。
論文 参考訳(メタデータ) (2021-08-09T12:49:48Z) - Improving Robustness and Accuracy via Relative Information Encoding in
3D Human Pose Estimation [59.94032196768748]
位置および時間的拡張表現を出力する相対情報符号化法を提案する。
提案手法は2つの公開データセット上で最先端の手法より優れている。
論文 参考訳(メタデータ) (2021-07-29T14:12:19Z) - Online Multi-Agent Forecasting with Interpretable Collaborative Graph
Neural Network [65.11999700562869]
複数の協調予測器からの予測を協調グラフに従って集約する新しい協調予測ユニット(CoPU)を提案する。
本手法は,3つのタスクの最先端処理を平均28.6%,17.4%,21.0%で上回っている。
論文 参考訳(メタデータ) (2021-07-02T08:20:06Z) - SIMPLE: SIngle-network with Mimicking and Point Learning for Bottom-up
Human Pose Estimation [81.03485688525133]
Single-network with Mimicking and Point Learning for Bottom-up Human Pose Estimation (SIMPLE) を提案する。
具体的には、トレーニングプロセスにおいて、SIMPLEが高性能なトップダウンパイプラインからのポーズ知識を模倣できるようにする。
さらに、SIMPLEは人間検出とポーズ推定を統一的なポイントラーニングフレームワークとして定式化し、単一ネットワークで相互に補完する。
論文 参考訳(メタデータ) (2021-04-06T13:12:51Z) - Human Trajectory Forecasting in Crowds: A Deep Learning Perspective [89.4600982169]
本稿では,既存の深層学習に基づくソーシャルインタラクションのモデル化手法について詳細に分析する。
本稿では、これらの社会的相互作用を効果的に捉えるための知識に基づく2つのデータ駆動手法を提案する。
我々は,人間の軌道予測分野において,重要かつ欠落したコンポーネントであるTrajNet++を大規模に開発する。
論文 参考訳(メタデータ) (2020-07-07T17:19:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。