論文の概要: MuPPet: Multi-person 2D-to-3D Pose Lifting
- arxiv url: http://arxiv.org/abs/2604.09715v1
- Date: Wed, 08 Apr 2026 12:29:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:15.623507
- Title: MuPPet: Multi-person 2D-to-3D Pose Lifting
- Title(参考訳): MuPPet:マルチパーソン2D-to-3D Pose Lifting
- Authors: Thomas Markhorst, Zhi-Yi Lin, Jouh Yeong Chew, Jan van Gemert, Xucong Zhang,
- Abstract要約: 我々は,新しい2D-to-3DポーズリフトフレームワークであるMuPPetを提案する。
MuPPetは、最先端のシングルパーソンとマルチパーソンの2D-to-3Dポーズリフト法を著しく上回っている。
本研究は、人物間の相関関係をモデル化することの重要性を強調し、正確で社会的に認識された3Dポーズ推定の道を開くものである。
- 参考スコア(独自算出の注目度): 11.539750714535773
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-person social interactions are inherently built on coherence and relationships among all individuals within the group, making multi-person localization and body pose estimation essential to understanding these social dynamics. One promising approach is 2D-to-3D pose lifting which provides a 3D human pose consisting of rich spatial details by building on the significant advances in 2D pose estimation. However, the existing 2D-to-3D pose lifting methods often neglect inter-person relationships or cannot handle varying group sizes, limiting their effectiveness in multi-person settings. We propose MuPPet, a novel multi-person 2D-to-3D pose lifting framework that explicitly models inter-person correlations. To leverage these inter-person dependencies, our approach introduces Person Encoding to structure individual representations, Permutation Augmentation to enhance training diversity, and Dynamic Multi-Person Attention to adaptively model correlations between individuals. Extensive experiments on group interaction datasets demonstrate MuPPet significantly outperforms state-of-the-art single- and multi-person 2D-to-3D pose lifting methods, and improves robustness in occlusion scenarios. Our findings highlight the importance of modeling inter-person correlations, paving the way for accurate and socially-aware 3D pose estimation. Our code is available at: https://github.com/Thomas-Markhorst/MuPPet
- Abstract(参考訳): 多人数の社会的相互作用は、本質的に、グループ内のすべての個人間の一貫性と関係に基づいて構築されており、これらの社会的ダイナミクスを理解するために、多人数の局所化と身体のポーズ推定が不可欠である。
1つの有望なアプローチは2次元から3次元のポーズリフトであり、これは2次元のポーズ推定における重要な進歩に基づいて、豊かな空間的詳細からなる3次元のポーズを提供する。
しかし、既存の2D-to-3Dは、対人関係を無視したり、異なるグループサイズを扱えない場合が多いため、マルチパーソン設定での有効性を制限している。
個人間の相関関係を明示的にモデル化する新しい2D-to-3DポーズリフトフレームワークであるMuPPetを提案する。
これらの個人間の依存関係を活用するために,個人間の関係を適応的にモデル化する動的マルチパーソン・アテンション(Dynamic Multi-Person Attention)を導入する。
グループインタラクションデータセットに関する大規模な実験により、MuPPetは最先端のシングルパーソンとマルチパーソンの2D-to-3Dポーズリフト法を著しく上回り、オクルージョンシナリオの堅牢性を向上させる。
本研究は、人物間の相関関係をモデル化することの重要性を強調し、正確で社会的に認識された3Dポーズ推定の道を開くものである。
私たちのコードは、https://github.com/Thomas-Markhorst/MuPPetで利用可能です。
関連論文リスト
- CHORUS: Learning Canonicalized 3D Human-Object Spatial Relations from
Unbounded Synthesized Images [10.4286198282079]
本研究では,3次元における多種多様な物体間相互作用の空間的共通感覚を理解し,モデル化する手法を提案する。
我々は、人間が同じ種類の物体と対話するとき、異なる視点から撮影した複数の2D画像を示す。
実画像よりも画質が不完全であるにもかかわらず、合成画像は3次元的対象空間関係を学習するのに十分であることを示す。
論文 参考訳(メタデータ) (2023-08-23T17:59:11Z) - MPM: A Unified 2D-3D Human Pose Representation via Masked Pose Modeling [59.74064212110042]
mpmcanは、3D人間のポーズ推定、クラッドされた2Dポーズからの3Dポーズ推定、3Dポーズ完了をtextocbsingleフレームワークで処理する。
MPI-INF-3DHPにおいて、広く使われているポーズデータセットの広範な実験とアブレーション研究を行い、最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-06-29T10:30:00Z) - Graph-Based 3D Multi-Person Pose Estimation Using Multi-View Images [79.70127290464514]
我々は,タスクを2つの段階,すなわち人物のローカライゼーションとポーズ推定に分解する。
また,効率的なメッセージパッシングのための3つのタスク固有グラフニューラルネットワークを提案する。
提案手法は,CMU Panoptic と Shelf のデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2021-09-13T11:44:07Z) - SMAP: Single-Shot Multi-Person Absolute 3D Pose Estimation [46.85865451812981]
本稿では,まず,この2.5D表現に基づいて,まず2.5D表現の集合を回帰し,さらに深部認識部分関連アルゴリズムを用いて3D絶対ポーズを再構成するシステムを提案する。
このような単発ボトムアップ方式により、システムは人物間の深度関係をよりよく学習し、推論し、3Dと2Dの両方のポーズ推定を改善することができる。
論文 参考訳(メタデータ) (2020-08-26T09:56:07Z) - Unsupervised Cross-Modal Alignment for Multi-Person 3D Pose Estimation [52.94078950641959]
マルチパーソン・ヒューマン・ポーズ推定のためのデプロイフレンドリーで高速なボトムアップ・フレームワークを提案する。
我々は,人物の位置を対応する3Dポーズ表現と統一する,多人数の3Dポーズのニューラル表現を採用する。
ペア化された2Dまたは3Dポーズアノテーションが利用できない実用的な配置パラダイムを提案する。
論文 参考訳(メタデータ) (2020-08-04T07:54:25Z) - HMOR: Hierarchical Multi-Person Ordinal Relations for Monocular
Multi-Person 3D Pose Estimation [54.23770284299979]
本稿では, 階層型多人数常連関係(HMOR)を新たに導入する。
HMORは相互作用情報を階層的に深さと角度の順序関係として符号化する。
統合トップダウンモデルは、学習プロセスにおけるこれらの順序関係を活用するように設計されている。
提案手法は, 公開されている多人数の3Dポーズデータセットにおいて, 最先端の手法を著しく上回っている。
論文 参考訳(メタデータ) (2020-08-01T07:53:27Z) - Fusing Wearable IMUs with Multi-View Images for Human Pose Estimation: A
Geometric Approach [76.10879433430466]
多視点画像と人手足に装着したIMUから3次元人間のポーズを推定する。
まず2つの信号から2Dのポーズを検出し、3D空間に持ち上げる。
単純な2段階のアプローチは、公開データセット上の大きなマージンによる最先端のエラーを低減する。
論文 参考訳(メタデータ) (2020-03-25T00:26:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。