論文の概要: Zero-shot Human Pose Estimation using Diffusion-based Inverse solvers
- arxiv url: http://arxiv.org/abs/2510.02043v1
- Date: Thu, 02 Oct 2025 14:16:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:21.159508
- Title: Zero-shot Human Pose Estimation using Diffusion-based Inverse solvers
- Title(参考訳): 拡散型逆解法を用いたゼロショットヒューマンポース推定
- Authors: Sahil Bhandary Karnoor, Romit Roy Choudhury,
- Abstract要約: 本稿では,ポーズ推定を逆問題として定式化し,ゼロショットの一般化が可能なアルゴリズムを設計する。
提案したInPose法は, 身近な身近な計測を最もよく説明できるポーズ列を生成的に推定する。
- 参考スコア(独自算出の注目度): 6.981449837924022
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Pose estimation refers to tracking a human's full body posture, including their head, torso, arms, and legs. The problem is challenging in practical settings where the number of body sensors are limited. Past work has shown promising results using conditional diffusion models, where the pose prediction is conditioned on both <location, rotation> measurements from the sensors. Unfortunately, nearly all these approaches generalize poorly across users, primarly because location measurements are highly influenced by the body size of the user. In this paper, we formulate pose estimation as an inverse problem and design an algorithm capable of zero-shot generalization. Our idea utilizes a pre-trained diffusion model and conditions it on rotational measurements alone; the priors from this model are then guided by a likelihood term, derived from the measured locations. Thus, given any user, our proposed InPose method generatively estimates the highly likely sequence of poses that best explains the sparse on-body measurements.
- Abstract(参考訳): 姿勢推定とは、頭部、胴体、腕、脚を含む人間の全身の姿勢を追跡することを指す。
この問題は、身体センサーの数が限られている現実的な環境では難しい。
過去の研究では,センサからの<location, rotation>測定の両方において,ポーズ予測を条件付き拡散モデルを用いて有望な結果を示した。
残念なことに、これらのアプローチのほとんどは、主に位置測定がユーザーの体の大きさに大きく影響しているため、ユーザ間での一般化が不十分である。
本稿では,ポーズ推定を逆問題として定式化し,ゼロショットの一般化が可能なアルゴリズムを設計する。
我々のアイデアは、事前学習された拡散モデルを利用し、回転測定のみで条件を定め、このモデルからの先行は、測定された位置から導かれる確率項によって導かれる。
そこで,本提案手法は,任意のユーザに対して,身長の少ないポーズ列を生成的に推定する。
関連論文リスト
- DPoser-X: Diffusion Model as Robust 3D Whole-body Human Pose Prior [82.9526308672547]
DPoser-Xは3次元人体写真の拡散に基づく先行モデルである。
提案手法は,様々なポーズ中心タスクを逆問題として統一し,変分拡散サンプリングにより解決する。
我々のモデルは、常に最先端の代替品よりも優れており、人体全体のポーズを事前モデリングするための新しいベンチマークを確立している。
論文 参考訳(メタデータ) (2025-08-01T12:56:39Z) - CondiMen: Conditional Multi-Person Mesh Recovery [0.0]
本研究ではコンディメン(CondiMen)を提案する。コンディメン(CondiMen)は、カメラへのポーズ、体形、内在性、距離に関する共同パラメトリック分布を出力する手法である。
私たちのモデルは、最先端技術と同等以上のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-12-17T16:22:56Z) - Estimating Ego-Body Pose from Doubly Sparse Egocentric Video Data [16.431101717478796]
エゴボディポーズ推定の現在の手法は、時間的に密度の高いセンサデータに依存している。
本研究では,問題を時間的完備化と空間的完備化に分解する2段階のアプローチを開発する。
論文 参考訳(メタデータ) (2024-11-05T23:53:19Z) - Estimating Body and Hand Motion in an Ego-sensed World [62.61989004520802]
頭部装着装置から人体の動きを推定するシステムであるEgoAlloについて述べる。
エゴセントリックなSLAMポーズとイメージのみを使用して、EgoAlloは条件付き拡散モデルからサンプリングを行い、3Dボディポーズ、高さ、手のパラメータを推定する。
論文 参考訳(メタデータ) (2024-10-04T17:59:57Z) - Rethinking pose estimation in crowds: overcoming the detection
information-bottleneck and ambiguity [46.10812760258666]
個人間の頻繁な相互作用は、ポーズ推定アルゴリズムの基本的な課題である。
ボトムアップ条件付きトップダウンポーズ推定と呼ばれる新しいパイプラインを提案する。
動物と人間のポーズ推定ベンチマークにおけるアプローチの性能と効率を実証する。
論文 参考訳(メタデータ) (2023-06-13T16:14:40Z) - Error Estimation for Single-Image Human Body Mesh Reconstruction [1.4721615285883425]
人間のポーズと形状推定法は、予測されたポーズが正しくない場合は表現できない。
これらの手法が人間とロボットの相互作用のシナリオで使用される場合、これは重大な結果をもたらす。
本稿では,OpenPose と SPIN からの情報を組み合わせて,最も信頼性の低い予測メッシュ上の領域をハイライトする手法を提案する。
論文 参考訳(メタデータ) (2023-05-26T20:18:42Z) - Learning Dynamics via Graph Neural Networks for Human Pose Estimation
and Tracking [98.91894395941766]
ポーズ検出とは無関係なポーズダイナミクスを学習する新しいオンライン手法を提案する。
具体的には、空間的・時間的情報と視覚的情報の両方を明示的に考慮したグラフニューラルネットワーク(GNN)を通して、このダイナミクスの予測を導出する。
PoseTrack 2017とPoseTrack 2018データセットの実験では、提案手法が人間のポーズ推定とトラッキングタスクの両方において、技術の現状よりも優れた結果が得られることを示した。
論文 参考訳(メタデータ) (2021-06-07T16:36:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。