論文の概要: Flow Matching for Probabilistic Monocular 3D Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2601.16763v1
- Date: Fri, 23 Jan 2026 14:09:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-26 14:27:27.710374
- Title: Flow Matching for Probabilistic Monocular 3D Human Pose Estimation
- Title(参考訳): 確率的単眼3次元人物位置推定のためのフローマッチング
- Authors: Cuong Le, Pavló Melnyk, Bastian Wandt, Mårten Wadenbäck,
- Abstract要約: フローマッチング生成手法に基づく確率的3次元ポーズ推定法であるFMPoseを提案する。
FMPoseは、単純なソース分布から連続正規化フローを介して、可塑性な3次元ポーズ分布への最適な輸送を学習する。
拡散法と比較して、最適な輸送量を持つFMPoseはより高速で正確な3Dポーズを生成する。
- 参考スコア(独自算出の注目度): 12.773184391232467
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recovering 3D human poses from a monocular camera view is a highly ill-posed problem due to the depth ambiguity. Earlier studies on 3D human pose lifting from 2D often contain incorrect-yet-overconfident 3D estimations. To mitigate the problem, emerging probabilistic approaches treat the 3D estimations as a distribution, taking into account the uncertainty measurement of the poses. Falling in a similar category, we proposed FMPose, a probabilistic 3D human pose estimation method based on the flow matching generative approach. Conditioned on the 2D cues, the flow matching scheme learns the optimal transport from a simple source distribution to the plausible 3D human pose distribution via continuous normalizing flows. The 2D lifting condition is modeled via graph convolutional networks, leveraging the learnable connections between human body joints as the graph structure for feature aggregation. Compared to diffusion-based methods, the FMPose with optimal transport produces faster and more accurate 3D pose generations. Experimental results show major improvements of our FMPose over current state-of-the-art methods on three common benchmarks for 3D human pose estimation, namely Human3.6M, MPI-INF-3DHP and 3DPW.
- Abstract(参考訳): モノクロカメラビューから3D人間のポーズを復元することは、奥行きのあいまいさのため、非常に不適切な問題である。
2Dから3Dのポーズを持ち上げるという以前の研究は、しばしば不正確で不確実な3D推定を含んでいた。
問題を緩和するため、新しい確率論的アプローチは、ポーズの不確実性の測定を考慮し、3次元推定を分布として扱う。
類似のカテゴリーに該当し,フローマッチング生成手法に基づく確率的3次元ポーズ推定法であるFMPoseを提案する。
フローマッチングスキームは2次元キューに条件付きで、簡単なソース分布から連続正規化フローを介して可視的な3次元ポーズ分布への最適な輸送を学習する。
2次元昇降条件は、人体関節間の学習可能な接続を特徴集約のためのグラフ構造として活用し、グラフ畳み込みネットワークを介してモデル化される。
拡散法と比較して、最適な輸送量を持つFMPoseはより高速で正確な3Dポーズを生成する。
実験結果から,ヒト3.6M, MPI-INF-3DHP, 3DPWの3次元ポーズ推定において, 現状の手法に比べてFMPoseの大幅な改善が認められた。
関連論文リスト
- D3PRefiner: A Diffusion-based Denoise Method for 3D Human Pose
Refinement [3.514184876338779]
拡散型3次元ポース・リファイナは既存の3次元ポーズ推定器の出力を改良するために提案される。
現在の拡散モデルのアーキテクチャを利用して、ノイズの多い3Dポーズの分布を3Dポーズに変換する。
実験により,提案アーキテクチャは,現在の3次元ポーズ推定器の性能を大幅に向上させることができることを示した。
論文 参考訳(メタデータ) (2024-01-08T14:21:02Z) - ManiPose: Manifold-Constrained Multi-Hypothesis 3D Human Pose Estimation [71.2556016049579]
ManiPoseは、人為的な2D-to-3Dリフトのための多様体拘束型マルチハイブリッドモデルである。
人間のポーズ多様体上の出力を制約することにより、ManiPoseはすべての仮説的なポーズの一貫性を保証する。
実世界のデータセット上でのManiPoseのパフォーマンスを示す。
論文 参考訳(メタデータ) (2023-12-11T13:50:10Z) - Diffusion-Based 3D Human Pose Estimation with Multi-Hypothesis
Aggregation [64.874000550443]
ジョイントワイズ・リジェクション・ベース・マルチハイブリッド・アグリゲーション(JPMA)を用いた拡散型3次元ポス推定法を提案する。
提案したJPMAは,D3DPが生成する複数の仮説を1つの3次元ポーズにまとめて実用的に利用する。
提案手法は, 最先端の決定論的アプローチと確率論的アプローチをそれぞれ1.5%, 8.9%上回った。
論文 参考訳(メタデータ) (2023-03-21T04:00:47Z) - A generic diffusion-based approach for 3D human pose prediction in the
wild [68.00961210467479]
3D人間のポーズ予測、すなわち、過去の観察されたポーズのシーケンスが与えられた後の人間の3Dポーズのシーケンスを予測することは、困難な時間課題である。
本稿では,不完全な要素(予測や観測に関係しない)をノイズとして扱える統一的な定式化法を提案し,それらを認知し,妥当なポーズを予測する条件拡散モデルを提案する。
本研究は,4つの標準データセットについて検討し,現状よりも大幅に改善された。
論文 参考訳(メタデータ) (2022-10-11T17:59:54Z) - Probabilistic Monocular 3D Human Pose Estimation with Normalizing Flows [24.0966076588569]
本稿では,不明瞭な逆2D-to-3D問題を解くために,決定論的3D-to-2Dマッピングを利用する正規化フローベース手法を提案する。
我々は、Human3.6MとMPI-INF-3DHPの2つのベンチマークデータセットに対するアプローチを評価し、ほとんどの指標において同等の手法を上回りました。
論文 参考訳(メタデータ) (2021-07-29T07:33:14Z) - 3D Multi-bodies: Fitting Sets of Plausible 3D Human Models to Ambiguous
Image Data [77.57798334776353]
単眼・部分閉塞視からヒトの高密度3次元再構成を実現することの問題点を考察する。
身体の形状やポーズをパラメータ化することで、あいまいさをより効果的にモデル化できることを示唆する。
提案手法は, 3次元人間の標準ベンチマークにおいて, あいまいなポーズ回復において, 代替手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-02T13:55:31Z) - Weakly Supervised Generative Network for Multiple 3D Human Pose
Hypotheses [74.48263583706712]
単一画像からの3次元ポーズ推定は、欠落した深さのあいまいさに起因する逆問題である。
逆問題に対処するために,弱い教師付き深層生成ネットワークを提案する。
論文 参考訳(メタデータ) (2020-08-13T09:26:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。