論文の概要: FMPose3D: monocular 3D pose estimation via flow matching
- arxiv url: http://arxiv.org/abs/2602.05755v1
- Date: Thu, 05 Feb 2026 15:25:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:08.998655
- Title: FMPose3D: monocular 3D pose estimation via flow matching
- Title(参考訳): FMPose3D:フローマッチングによる単眼3Dポーズ推定
- Authors: Ti Wang, Xiaohang Yu, Mackenzie Weygandt Mathis,
- Abstract要約: 正規微分方程式(ODE)で定義される速度場をフローマッチングを用いて学習する。
本稿では3次元ポーズ推定を条件分布輸送問題として定式化する新しい生成的ポーズ推定フレームワークFMPose3Dを提案する。
FMPose3Dは、広く使われているヒトのポーズ推定ベンチマークであるHuman3.6MとMPI-INF-3DHPの既存の手法を超越し、3D動物のポーズデータセットであるAnimal3DとCtrlAni3Dの最先端のパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 3.599033387924161
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Monocular 3D pose estimation is fundamentally ill-posed due to depth ambiguity and occlusions, thereby motivating probabilistic methods that generate multiple plausible 3D pose hypotheses. In particular, diffusion-based models have recently demonstrated strong performance, but their iterative denoising process typically requires many timesteps for each prediction, making inference computationally expensive. In contrast, we leverage Flow Matching (FM) to learn a velocity field defined by an Ordinary Differential Equation (ODE), enabling efficient generation of 3D pose samples with only a few integration steps. We propose a novel generative pose estimation framework, FMPose3D, that formulates 3D pose estimation as a conditional distribution transport problem. It continuously transports samples from a standard Gaussian prior to the distribution of plausible 3D poses conditioned only on 2D inputs. Although ODE trajectories are deterministic, FMPose3D naturally generates various pose hypotheses by sampling different noise seeds. To obtain a single accurate prediction from those hypotheses, we further introduce a Reprojection-based Posterior Expectation Aggregation (RPEA) module, which approximates the Bayesian posterior expectation over 3D hypotheses. FMPose3D surpasses existing methods on the widely used human pose estimation benchmarks Human3.6M and MPI-INF-3DHP, and further achieves state-of-the-art performance on the 3D animal pose datasets Animal3D and CtrlAni3D, demonstrating strong performance across both 3D pose domains. The code is available at https://github.com/AdaptiveMotorControlLab/FMPose3D.
- Abstract(参考訳): 単分子式3Dポーズ推定は、深さのあいまいさと閉塞性により基本的に不適切であり、複数のプラプティブルな3Dポーズ仮説を生成する確率的手法を動機付けている。
特に拡散モデルは最近、強い性能を示したが、その反復的認知過程は通常、予測ごとに多くの時間ステップを必要とし、推論を計算的に高価にしている。
対照的に、フローマッチング(FM)を利用して、通常微分方程式(ODE)によって定義される速度場を学習し、ほんの数ステップで3Dポーズサンプルを効率的に生成することができる。
本稿では3次元ポーズ推定を条件分布輸送問題として定式化する新しい生成的ポーズ推定フレームワークFMPose3Dを提案する。
標準ガウスからサンプルを連続的に輸送し、2次元入力でのみ条件付けられた可視的な3Dポーズを配信する。
ODE軌道は決定論的であるが、FMPose3Dは異なるノイズシードをサンプリングすることによって自然に様々なポーズ仮説を生成する。
それらの仮説から単一の正確な予測を得るために,3次元仮説よりもベイズ的先行予想を近似したReprojection-based Posterior expectation Aggregation (RPEA)モジュールを導入する。
FMPose3Dは、広く使われているヒトのポーズ推定ベンチマークであるHuman3.6MとMPI-INF-3DHPの既存の手法を超越し、3D動物のポーズデータセットであるAnimal3DとCtrlAni3Dの最先端のパフォーマンスを更に達成し、両方の3Dポーズドメインで強いパフォーマンスを示す。
コードはhttps://github.com/AdaptiveMotorControlLab/FMPose3Dで公開されている。
関連論文リスト
- Flow Matching for Probabilistic Monocular 3D Human Pose Estimation [12.773184391232467]
フローマッチング生成手法に基づく確率的3次元ポーズ推定法であるFMPoseを提案する。
FMPoseは、単純なソース分布から連続正規化フローを介して、可塑性な3次元ポーズ分布への最適な輸送を学習する。
拡散法と比較して、最適な輸送量を持つFMPoseはより高速で正確な3Dポーズを生成する。
論文 参考訳(メタデータ) (2026-01-23T14:09:33Z) - UPose3D: Uncertainty-Aware 3D Human Pose Estimation with Cross-View and Temporal Cues [55.69339788566899]
UPose3Dは多視点人間のポーズ推定のための新しいアプローチである。
直接的な3Dアノテーションを必要とせずに、堅牢性と柔軟性を向上させる。
論文 参考訳(メタデータ) (2024-04-23T00:18:00Z) - Diffusion-based Pose Refinement and Muti-hypothesis Generation for 3D
Human Pose Estimaiton [27.708016152889787]
従来の3次元人物姿勢推定モデル(3DHPE)は、複数の仮説を生成することで、ポーズの精度を高めることを目的としていた。
ほとんどの仮説は真のポーズから大きく逸脱した。
決定論的モデルと比較すると、確率論的モデルにおける過剰な不確実性は、単一仮説予測においてより弱い性能をもたらす。
本稿では,逆拡散による決定論的モデルの出力を改良する拡散に基づく DRPose というフレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-10T04:07:50Z) - D3PRefiner: A Diffusion-based Denoise Method for 3D Human Pose
Refinement [3.514184876338779]
拡散型3次元ポース・リファイナは既存の3次元ポーズ推定器の出力を改良するために提案される。
現在の拡散モデルのアーキテクチャを利用して、ノイズの多い3Dポーズの分布を3Dポーズに変換する。
実験により,提案アーキテクチャは,現在の3次元ポーズ推定器の性能を大幅に向上させることができることを示した。
論文 参考訳(メタデータ) (2024-01-08T14:21:02Z) - ManiPose: Manifold-Constrained Multi-Hypothesis 3D Human Pose Estimation [71.2556016049579]
ManiPoseは、人為的な2D-to-3Dリフトのための多様体拘束型マルチハイブリッドモデルである。
人間のポーズ多様体上の出力を制約することにより、ManiPoseはすべての仮説的なポーズの一貫性を保証する。
実世界のデータセット上でのManiPoseのパフォーマンスを示す。
論文 参考訳(メタデータ) (2023-12-11T13:50:10Z) - Diffusion-Based 3D Human Pose Estimation with Multi-Hypothesis
Aggregation [64.874000550443]
ジョイントワイズ・リジェクション・ベース・マルチハイブリッド・アグリゲーション(JPMA)を用いた拡散型3次元ポス推定法を提案する。
提案したJPMAは,D3DPが生成する複数の仮説を1つの3次元ポーズにまとめて実用的に利用する。
提案手法は, 最先端の決定論的アプローチと確率論的アプローチをそれぞれ1.5%, 8.9%上回った。
論文 参考訳(メタデータ) (2023-03-21T04:00:47Z) - A generic diffusion-based approach for 3D human pose prediction in the
wild [68.00961210467479]
3D人間のポーズ予測、すなわち、過去の観察されたポーズのシーケンスが与えられた後の人間の3Dポーズのシーケンスを予測することは、困難な時間課題である。
本稿では,不完全な要素(予測や観測に関係しない)をノイズとして扱える統一的な定式化法を提案し,それらを認知し,妥当なポーズを予測する条件拡散モデルを提案する。
本研究は,4つの標準データセットについて検討し,現状よりも大幅に改善された。
論文 参考訳(メタデータ) (2022-10-11T17:59:54Z) - Probabilistic Monocular 3D Human Pose Estimation with Normalizing Flows [24.0966076588569]
本稿では,不明瞭な逆2D-to-3D問題を解くために,決定論的3D-to-2Dマッピングを利用する正規化フローベース手法を提案する。
我々は、Human3.6MとMPI-INF-3DHPの2つのベンチマークデータセットに対するアプローチを評価し、ほとんどの指標において同等の手法を上回りました。
論文 参考訳(メタデータ) (2021-07-29T07:33:14Z) - Weakly Supervised Generative Network for Multiple 3D Human Pose
Hypotheses [74.48263583706712]
単一画像からの3次元ポーズ推定は、欠落した深さのあいまいさに起因する逆問題である。
逆問題に対処するために,弱い教師付き深層生成ネットワークを提案する。
論文 参考訳(メタデータ) (2020-08-13T09:26:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。