論文の概要: AtomicMotion: Learning Human Motion From Different Human Parts
- arxiv url: http://arxiv.org/abs/2605.22631v1
- Date: Thu, 21 May 2026 15:39:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 20:14:18.598296
- Title: AtomicMotion: Learning Human Motion From Different Human Parts
- Title(参考訳): AtomicMotion: 異なる人間のパーツから人間の動きを学ぶ
- Authors: Runzhen Liu, Chuhua Xian, Fa-Ting Hong,
- Abstract要約: 私たちは,3つのコアイノベーションを通じて身体のダイナミクスを分離し,再統合するように設計されたフレームワークであるAtomicMotionを紹介します。
まず,スケルトンを機能的意図に基づいて5つの異なるクラスタに分解する論理体分割方式を提案する。
第二に、スパース入力を高次元ポーズに頑健にマッピングするために、マスク付きフルボディプレコンディショニング戦略を採用する。
第3に,バニラ空間的注意の限界に対処し,キネマティック・アテンションを提案する。
- 参考スコア(独自算出の注目度): 9.72019653340761
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurately reconstructing full-body poses from sparse head and hand trajectories is a foundational challenge for immersive AR/VR telepresence. Current methods often struggle with error accumulation and unnatural joint coordination, primarily because they treat the human body as a monolithic entity, thereby failing to capture the fine-grained ``atomic intents'' embedded in subtle signal variations and overlooking the inherent structural topology. To bridge this gap, we present AtomicMotion, a framework designed to decouple and re-integrate body dynamics through three core innovations. First, we introduce a logical body partitioning scheme that decomposes the skeleton into five distinct clusters based on functional intent; this ensures that each partition preserves internal joint synergies while isolating local motion primitives. Second, to robustly map sparse inputs to high-dimensional poses, we employ a masked full-body pre-conditioning strategy during training, forcing the model to internalize global skeletal topology and latent kinematic constraints. Finally, addressing the limitations of vanilla spatial attention, which often ignores fixed physiological connectivity, we propose Kinematic Attention. By embedding the classical kinematic tree structure into the attention mechanism, we ensure biological plausibility in the synthesized motions. Extensive evaluations on the AMASS dataset demonstrate that AtomicMotion significantly outperforms existing baselines, yielding higher reconstruction fidelity and superior biomechanical realism.
- Abstract(参考訳): 没入型AR/VRテレプレゼンスのための基礎的な課題は、スパースヘッドとハンドトラジェクトリーのフルボディポーズを正確に再構築することである。
現在の方法では、主に人体をモノリシックな実体として扱うため、微妙な信号のバリエーションに埋め込まれ、固有の構造的トポロジーを覆い隠すために、エラーの蓄積と不自然な共同調整に苦労することが多い。
このギャップを埋めるために、私たちは3つのコアイノベーションを通じてボディダイナミクスを分離し、再統合するように設計されたフレームワークAtomicMotionを紹介します。
まず,機能的意図に基づいて骨格を5つの異なるクラスタに分解する論理的体分割方式を導入する。
第二に、スパース入力を高次元のポーズに頑健にマッピングするために、トレーニング中にマスク付きフルボディプレコンディショニング戦略を採用し、大域的な骨格トポロジーと潜時的制約を内在化させる。
最後に,固定された生理的接続を無視したバニラ空間的注意の限界に対処するため,キネマティック・アテンションを提案する。
古典的キネマティックツリー構造を注意機構に埋め込むことで、合成運動における生物学的な可視性を確保できる。
AMASSデータセットの大規模な評価は、AtomicMotionが既存のベースラインを著しく上回り、高い再構築忠実度と優れた生体力学的リアリズムをもたらすことを示している。
関連論文リスト
- HYPERPOSE: Hyperbolic Kinematic Phase-Space Attention for 3D Human Pose Estimation [0.0]
HYPERPOSEは、新しい3Dヒューマンポーズ推定フレームワークである。
人間の骨格の階層木の中で、ロレン時間的推論を行う。
論文 参考訳(メタデータ) (2026-05-11T07:17:32Z) - EgoMotion: Hierarchical Reasoning and Diffusion for Egocentric Vision-Language Motion Generation [74.07852250099559]
Egocentric Vision-Language (Ego-VL) モーション生成について検討する。
本課題は,1対1の視覚的観察と自然言語の指示を併用した3次元人間の動作を合成することである。
この課題に対処するために,階層型生成フレームワーク textbfEgoMotion を提案する。
論文 参考訳(メタデータ) (2026-04-21T05:31:06Z) - SocialMirror: Reconstructing 3D Human Interaction Behaviors from Monocular Videos with Semantic and Geometric Guidance [49.69016078147708]
密接な相互作用シナリオにおける人間の行動の正確な再構築は、拡張現実における現実的な仮想インタラクションの実現に不可欠である。
本稿では,これらの問題に効果的に対処するための意味的および幾何学的手がかりを統合する拡散ベースのフレームワークであるSocialMirrorを提案する。
SocialMirrorはインタラクティブなヒューマンメッシュを再構築する上で,最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-04-15T07:41:52Z) - Make Tracking Easy: Neural Motion Retargeting for Humanoid Whole-body Control [43.01629060165596]
本稿では,不均一な動きを潜在モチーフにグループ化するニューラルモーション・リターゲティング・フレームワークを提案する。
この戦略により、計算の並列学習の専門家は大幅に削減される。
参照は、全身制御ポリシーの収束を加速する。
論文 参考訳(メタデータ) (2026-03-23T16:59:00Z) - Scalable Spatio-Temporal SE(3) Diffusion for Long-Horizon Protein Dynamics [51.85385061275941]
分子動力学(MD)シミュレーションは、タンパク質動力学研究のゴールドスタンダードのままである。
近年の生成モデルではシミュレーションの加速が期待できるが、長軸生成に苦慮している。
物理的に可塑性なタンパク質軌道をマイクロスケールの時間スケールで生成する拡張拡散モデルSTAR-MDを提案する。
論文 参考訳(メタデータ) (2026-02-02T14:13:28Z) - PALUM: Part-based Attention Learning for Unified Motion Retargeting [53.17113525688095]
異なる骨格構造を持つキャラクター間の反発は、コンピュータアニメーションの基本的な課題である。
多様な骨格トポロジーにまたがる共通の動き表現を学習する新しいアプローチを提案する。
実験は、運動リアリズムと意味的忠実性を維持しながら、多様な骨格構造を扱う上で優れた性能を示す。
論文 参考訳(メタデータ) (2026-01-12T07:29:44Z) - ECHO: Ego-Centric modeling of Human-Object interactions [71.17118015822699]
ECHO (Ego-Centric Modeling of Human-Object Interaction) を開発した。
人間のポーズ、物体の動き、そしてそのような最小限の観察から接触の3つのモダリティを回復する。
同じ柔軟性を提供しない既存のメソッドよりも優れています。
論文 参考訳(メタデータ) (2025-08-29T12:12:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。