論文の概要: MAGE:A Multi-stage Avatar Generator with Sparse Observations
- arxiv url: http://arxiv.org/abs/2505.06411v1
- Date: Fri, 09 May 2025 20:21:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-13 20:21:48.830614
- Title: MAGE:A Multi-stage Avatar Generator with Sparse Observations
- Title(参考訳): MAGE:スパース観測用多段アバター発電機
- Authors: Fangyu Du, Yang Yang, Xuehao Gao, Hongye Hou,
- Abstract要約: Head Mounted Devicesからフルボディのポーズを推測することは、幅広いAR/VRアプリケーションにおいて難しいタスクである。
本稿では,この一段直接モーションマッピング学習をプログレッシブな予測戦略で分解する多段アバターGEnerator MAGEを提案する。
MAGEは最先端の手法よりも精度と連続性が高い。
- 参考スコア(独自算出の注目度): 4.199061877728445
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Inferring full-body poses from Head Mounted Devices, which capture only 3-joint observations from the head and wrists, is a challenging task with wide AR/VR applications. Previous attempts focus on learning one-stage motion mapping and thus suffer from an over-large inference space for unobserved body joint motions. This often leads to unsatisfactory lower-body predictions and poor temporal consistency, resulting in unrealistic or incoherent motion sequences. To address this, we propose a powerful Multi-stage Avatar GEnerator named MAGE that factorizes this one-stage direct motion mapping learning with a progressive prediction strategy. Specifically, given initial 3-joint motions, MAGE gradually inferring multi-scale body part poses at different abstract granularity levels, starting from a 6-part body representation and gradually refining to 22 joints. With decreasing abstract levels step by step, MAGE introduces more motion context priors from former prediction stages and thus improves realistic motion completion with richer constraint conditions and less ambiguity. Extensive experiments on large-scale datasets verify that MAGE significantly outperforms state-of-the-art methods with better accuracy and continuity.
- Abstract(参考訳): ヘッドマウントデバイスからフルボディのポーズを推測すると、頭と手首から3つの関節の観察しか撮れず、幅広いAR/VRアプリケーションでは難しい作業だ。
これまでの試みでは、ワンステージのモーションマッピングの学習に重点を置いていたため、観測されていない身体の関節運動に対する過大な推論スペースに悩まされていた。
これはしばしば、不満足な下半身の予測と時間的一貫性の低下をもたらし、非現実的または不整合な動き列をもたらす。
そこで本研究では,この一段直接モーションマッピング学習を,プログレッシブな予測戦略で分解する多段アバターGEnerator MAGEを提案する。
具体的には、初期3関節運動が与えられたとき、MAGEは徐々に、様々な抽象的な粒度レベルに作用し、6部分の体表現から始まり、徐々に22個の関節に精製する。
抽象レベルを段階的に減少させることで、MAGEは以前の予測段階からより多くの動きコンテキストの先行を導入し、より豊かな制約条件と曖昧さを伴って現実的な動きの完了を改善する。
大規模データセットに対する大規模な実験により、MAGEは最先端の手法よりも精度と連続性が高いことが確認された。
関連論文リスト
- COIN: Control-Inpainting Diffusion Prior for Human and Camera Motion Estimation [98.05046790227561]
COINは、人間の動きとカメラの動きを細粒度に制御できる、コントロール・インパインティング・モーション拡散である。
COINは、グローバルな人間の動き推定とカメラの動き推定という観点から、最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2024-08-29T10:36:29Z) - MotionMix: Weakly-Supervised Diffusion for Controllable Motion
Generation [19.999239668765885]
MotionMixはノイズと無注釈の両方のモーションシーケンスを利用する弱い教師付き拡散モデルである。
我々のフレームワークは、テキスト・トゥ・モーション、アクション・トゥ・モーション、音楽・トゥ・ダンスのタスクにおける最先端のパフォーマンスを一貫して達成する。
論文 参考訳(メタデータ) (2024-01-20T04:58:06Z) - Realistic Full-Body Tracking from Sparse Observations via Joint-Level
Modeling [13.284947022380404]
頭部と手の3つの追跡信号だけで、正確でスムーズな全身運動を得ることができる2段階のフレームワークを提案する。
本フレームワークは,第1段階の関節レベル特徴を明示的にモデル化し,第2段階の関節レベル相関を捉えるために,空間的および時間的トランスフォーマーブロックの交互化に時間的トークンとして利用する。
AMASSモーションデータセットと実捕集データに関する広範な実験により,提案手法は既存の手法と比較して,より正確で滑らかな動きを実現することができることを示す。
論文 参考訳(メタデータ) (2023-08-17T08:27:55Z) - GraMMaR: Ground-aware Motion Model for 3D Human Motion Reconstruction [61.833152949826946]
本研究では,GraMMaRという3次元人体動作再構成のための新しいグラウンド・アウェア・モーション・モデルを提案する。
GraMMaRは、動きシーケンスの各時間ステップにおいて、ポーズにおける遷移の分布と、各関節面と接地面の間の相互作用を学習する。
運動と地面への距離変化との整合性を明確に促進するように訓練されている。
論文 参考訳(メタデータ) (2023-06-29T07:22:20Z) - BoDiffusion: Diffusing Sparse Observations for Full-Body Human Motion
Synthesis [14.331548412833513]
複合現実感アプリケーションは、没入感のある体験を可能にするために、ユーザのフルボディの動きを追跡する必要がある。
本稿では,この非拘束的再構成問題に対処するために,運動合成のための生成拡散モデルであるBoDiffusionを提案する。
本稿では,スムーズで現実的なフルボディモーションシーケンスを生成しつつ,スパーストラッキング入力をBoDiffusionが活用できる時間空間調和方式を提案する。
論文 参考訳(メタデータ) (2023-04-21T16:39:05Z) - Investigating Pose Representations and Motion Contexts Modeling for 3D
Motion Prediction [63.62263239934777]
歴史的ポーズシーケンスから人間の動きを予測することは、機械が人間と知的な相互作用を成功させるために不可欠である。
本研究では,様々なポーズ表現に関する詳細な研究を行い,その動作予測課題に対する効果に着目した。
AHMR(Attentive Hierarchical Motion Recurrent Network)と呼ばれる新しいRNNアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-12-30T10:45:22Z) - Generating Smooth Pose Sequences for Diverse Human Motion Prediction [90.45823619796674]
本稿では,多様な動作予測と制御可能な動作予測のための統合された深部生成ネットワークを提案する。
標準ベンチマークデータセットであるHuman3.6MとHumanEva-Iの2つの実験は、我々のアプローチがサンプルの多様性と精度の両方において最先端のベースラインより優れていることを示した。
論文 参考訳(メタデータ) (2021-08-19T00:58:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。