Fugu-MT 論文翻訳(概要): Measuring Physical Plausibility of 3D Human Poses Using Physics Simulation

論文の概要: Measuring Physical Plausibility of 3D Human Poses Using Physics Simulation

arxiv url: http://arxiv.org/abs/2502.04483v1
Date: Thu, 06 Feb 2025 20:15:49 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-10 18:29:32.917457
Title: Measuring Physical Plausibility of 3D Human Poses Using Physics Simulation
Title（参考訳）: 物理シミュレーションによる3次元人体電位の物理的可視性の測定
Authors: Nathan Louis, Mahzad Khoshlessan, Jason J. Corso,
Abstract要約: 本研究では,任意の3次元姿勢推定モデルから予測された3次元ポーズの物理的妥当性と安定性を捉えるための2つの指標を提案する。物理シミュレーションを用いて,既存の可視性測定値との相関と運動時の安定性の測定を行う。
参考スコア（独自算出の注目度）: 19.26289173517333
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Modeling humans in physical scenes is vital for understanding human-environment interactions for applications involving augmented reality or assessment of human actions from video (e.g. sports or physical rehabilitation). State-of-the-art literature begins with a 3D human pose, from monocular or multiple views, and uses this representation to ground the person within a 3D world space. While standard metrics for accuracy capture joint position errors, they do not consider physical plausibility of the 3D pose. This limitation has motivated researchers to propose other metrics evaluating jitter, floor penetration, and unbalanced postures. Yet, these approaches measure independent instances of errors and are not representative of balance or stability during motion. In this work, we propose measuring physical plausibility from within physics simulation. We introduce two metrics to capture the physical plausibility and stability of predicted 3D poses from any 3D Human Pose Estimation model. Using physics simulation, we discover correlations with existing plausibility metrics and measuring stability during motion. We evaluate and compare the performances of two state-of-the-art methods, a multi-view triangulated baseline, and ground truth 3D markers from the Human3.6m dataset.
Abstract（参考訳）: 物理的な場面における人間のモデリングは、拡張現実やビデオ(例えばスポーツや身体のリハビリテーション)からの人間の行動の評価を含む応用のための人間と環境の相互作用を理解するために不可欠である。最先端の文学は、モノラルまたは複数の視点から3Dの人間のポーズから始まり、この表現を使って3Dの世界空間の人物をグラウンドにする。精度の標準的な指標は関節位置の誤差を捉えるが、3Dポーズの物理的妥当性は考慮しない。この制限は、ジッタ、フロア浸透、バランスの取れない姿勢を評価する他の指標を提案する動機となった。しかし、これらのアプローチは独立したエラーの事例を計測し、運動中のバランスや安定性を表すものではない。そこで本研究では,物理シミュレーションから物理可視性を測定することを提案する。本研究では,任意の3次元姿勢推定モデルから予測された3次元ポーズの物理的妥当性と安定性を捉えるための2つの指標を提案する。物理シミュレーションを用いて,既存の可視性測定値との相関と運動時の安定性の測定を行う。我々は、Human3.6mデータセットから、最先端の2つの手法、多視点三角形ベースライン、地底真理3Dマーカーの性能を評価し、比較する。

関連論文リスト

Human-level 3D shape perception emerges from multi-view learning [63.048728487674815]
任意のオブジェクトに対する人間の3次元形状推論を予測するためのモデリングフレームワークを開発する。我々は、自然主義的な知覚データよりも視覚空間的目的を用いて訓練された新しいニューラルネットワークのクラスでこれを達成した。人間のレベル3D知覚は、自然主義的な視覚空間データよりもシンプルでスケーラブルな学習目標から生まれる可能性がある。
論文参考訳（メタデータ） (2026-02-19T18:56:05Z)
DreamPose3D: Hallucinative Diffusion with Prompt Learning for 3D Human Pose Estimation [18.240580699213197]
本研究では,3次元ポーズ推定のための行動認識推論と時間的想像力を組み合わせた拡散型フレームワークDreamPose3Dを紹介する。 DreamPose3Dは2次元ポーズシーケンスから抽出したタスク関連アクションプロンプトを用いて動的にデノナイズ処理を条件付け、ハイレベルなインテントをキャプチャする。本研究では,関節間の構造的関係を効果的にモデル化するために,運動的関節親和性を注目機構に組み込んだ表現エンコーダを提案する。幻覚的ポーズデコーダは、トレーニング中の時間的コヒーレントな3Dポーズを予測する。
論文参考訳（メタデータ） (2025-11-12T17:31:41Z)
PP-Motion: Physical-Perceptual Fidelity Evaluation for Human Motion Generation [84.40992836326613]
人間の運動生成は、AR/VR、映画、スポーツ、医療リハビリテーションに広く応用されている。従来のアプローチでは、人間の知覚や身体的制約を用いた動きの忠実度評価が試みられている。人間の運動の身体的および知覚的忠実度を評価するための新しいデータ駆動計量PP-Motionを提案する。
論文参考訳（メタデータ） (2025-08-11T16:59:15Z)
Half-Physics: Enabling Kinematic 3D Human Model with Physical Interactions [88.01918532202716]
SMPL-Xを周囲との動的物理的相互作用が可能な有形実体に埋め込む新しい手法を提案する。本手法は,シーンやオブジェクトとの物理的に妥当な相互作用を確保しつつ,固有のSMPL-Xポーズの運動制御を維持する。広範かつ複雑な訓練を必要とする強化学習法とは異なり、ハーフフィック法は学習自由であり、あらゆる身体形状や運動に一般化する。
論文参考訳（メタデータ） (2025-07-31T17:58:33Z)
DreamPhysics: Learning Physics-Based 3D Dynamics with Video Diffusion Priors [75.83647027123119]
本稿では,映像拡散前の物体の物理的特性を学習することを提案する。次に,物理に基づくMaterial-Point-Methodシミュレータを用いて,現実的な動きを伴う4Dコンテンツを生成する。
論文参考訳（メタデータ） (2024-06-03T16:05:25Z)
Hybrid 3D Human Pose Estimation with Monocular Video and Sparse IMUs [15.017274891943162]
モノクロビデオからの時間的3Dポーズ推定は、人間中心のコンピュータビジョンにおいて難しい課題である。情報ソースを補完するために慣性センサが導入された。物理的に合理的な3Dポーズを生成するために、異種センサデータを統合することは依然として困難である。
論文参考訳（メタデータ） (2024-04-27T09:02:42Z)
MultiPhys: Multi-Person Physics-aware 3D Motion Estimation [28.91813849219037]
モノクロビデオから多人数動作を復元する手法であるMultiPhysを紹介する。私たちの焦点は、様々なエンゲージメントの度合いで、ペアの個人間のコヒーレントな空間配置をキャプチャすることにあります。本研究では,運動量に基づく運動を物理シミュレーターに自動回帰的に供給するパイプラインを考案する。
論文参考訳（メタデータ） (2024-04-18T08:29:29Z)
Decaf: Monocular Deformation Capture for Face and Hand Interactions [77.75726740605748]
本稿では,単眼のRGBビデオから人間の顔と対話する人間の手を3Dで追跡する手法を提案する。動作中の非剛性面の変形を誘発する定形物体として手をモデル化する。本手法は,マーカーレスマルチビューカメラシステムで取得した現実的な顔変形を伴う手動・インタラクションキャプチャーデータセットに頼っている。
論文参考訳（メタデータ） (2023-09-28T17:59:51Z)
Trajectory Optimization for Physics-Based Reconstruction of 3d Human Pose from Monocular Video [31.96672354594643]
本研究は,単眼映像から身体的に可視な人間の動きを推定する作業に焦点をあてる。物理を考慮しない既存のアプローチは、しばしば運動人工物と時間的に矛盾した出力を生み出す。提案手法は,Human3.6Mベンチマークにおける既存の物理法と競合する結果が得られることを示す。
論文参考訳（メタデータ） (2022-05-24T18:02:49Z)
Differentiable Dynamics for Articulated 3d Human Motion Reconstruction [29.683633237503116]
DiffPhyは、映像から3次元の人間の動きを再現する物理モデルである。モノクロ映像から物理的に可視な3次元動作を正確に再現できることを実証し,本モデルの有効性を検証した。
論文参考訳（メタデータ） (2022-05-24T17:58:37Z)
LatentHuman: Shape-and-Pose Disentangled Latent Representation for Human Bodies [78.17425779503047]
本稿では,人体に対する新しい暗黙の表現法を提案する。完全に微分可能で、非交叉形状で最適化可能であり、潜在空間を映し出す。我々のモデルは、よく設計された損失を伴う、水密でない生データを直接訓練し、微調整することができる。
論文参考訳（メタデータ） (2021-11-30T04:10:57Z)
Adapted Human Pose: Monocular 3D Human Pose Estimation with Zero Real 3D Pose Data [14.719976311208502]
トレーニングとテストデータドメインのギャップは、しばしばモデルのパフォーマンスに悪影響を及ぼします。本稿では、外見とポーズ空間の両方における適応問題に対処する適応的ヒューマンポーズ(AHuP)アプローチを提案する。 AHuPは、実際のアプリケーションでは、ターゲットドメインからのデータはアクセスできないか、限られた情報しか取得できないという現実的な前提に基づいて構築されている。
論文参考訳（メタデータ） (2021-05-23T01:20:40Z)
PhysCap: Physically Plausible Monocular 3D Motion Capture in Real Time [89.68248627276955]
シングルカラーカメラからのマーカレス3Dモーションキャプチャは、大きな進歩を遂げた。しかし、これは非常に困難な問題であり、深刻な問題である。我々はPhysCapについて紹介する。PhysCapは物理的に可塑性でリアルタイムでマーカーのない人間の3Dモーションキャプチャのための最初のアルゴリズムである。
論文参考訳（メタデータ） (2020-08-20T10:46:32Z)
Contact and Human Dynamics from Monocular Video [73.47466545178396]
既存のディープモデルは、ほぼ正確に見えるエラーを含むビデオから2Dと3Dキネマティックのポーズを予測する。本稿では,最初の2次元と3次元のポーズ推定を入力として,映像系列から3次元の人間の動きを推定する物理に基づく手法を提案する。
論文参考訳（メタデータ） (2020-07-22T21:09:11Z)
Kinematic-Structure-Preserved Representation for Unsupervised 3D Human Pose Estimation [58.72192168935338]
大規模インスタディオデータセットの監視を用いて開発された人間のポーズ推定モデルの一般化可能性については疑問が残る。本稿では,2対あるいは2対の弱い監督者によって抑制されない,新しいキネマティック構造保存型非教師付き3次元ポーズ推定フレームワークを提案する。提案モデルでは,前方運動学,カメラ投影,空間マップ変換という3つの連続的な微分可能変換を用いる。
論文参考訳（メタデータ） (2020-06-24T23:56:33Z)
Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image Synthesis [72.34794624243281]
ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。 3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
論文参考訳（メタデータ） (2020-04-09T07:55:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。