論文の概要: Amortized Inverse Kinematics via Graph Attention for Real-Time Human Avatar Animation
- arxiv url: http://arxiv.org/abs/2604.16629v1
- Date: Fri, 17 Apr 2026 18:30:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.111294
- Title: Amortized Inverse Kinematics via Graph Attention for Real-Time Human Avatar Animation
- Title(参考訳): Amortized Inverse Kiinematics by Graph Attention for Real-Time Human Avatar Animation
- Authors: Muhammad Saif Ullah Khan, Chen-Yu Wang, Tim Prokosch, Michael Lorenz, Bertram Taetz, Didier Stricker,
- Abstract要約: 逆キネマティクス(英: Inverse Kiinematics)は、アニメーション、ロボティクス、バイオメカニクスにおける中心的な操作である。
IK-GATは1つの前方パスで3次元関節位置から全体関節方向を再構築する軽量グラフアテンションネットワークである。
IK-GATはアニメーション対応のローカルローテーションを製作し、リグされたアバターを直接駆動したりSMPLのようなボディモデルのパラメーターに変換することができる。
- 参考スコア(独自算出の注目度): 16.714345824701386
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Inverse kinematics (IK) is a core operation in animation, robotics, and biomechanics: given Cartesian constraints, recover joint rotations under a known kinematic tree. In many real-time human avatar pipelines, the available signal per frame is a sparse set of tracked 3D joint positions, whereas animation systems require joint orientations to drive skinning. Recovering full orientations from positions is underconstrained, most notably because twist about bone axes is ambiguous, and classical IK solvers typically rely on iterative optimization that can be slow and sensitive to noisy inputs. We introduce IK-GAT, a lightweight graph-attention network that reconstructs full-body joint orientations from 3D joint positions in a single forward pass. The model performs message passing over the skeletal parent-child graph to exploit kinematic structure during rotation inference. To simplify learning, IK-GAT predicts rotations in a bone-aligned world-frame representation anchored to rest-pose bone frames. This parameterization makes the twist axis explicit and is exactly invertible to standard parent-relative local rotations given the kinematic tree and rest pose. The network uses a continuous 6D rotation representation and is trained with a geodesic loss on SO(3) together with an optional forward-kinematics consistency regularizer. IK-GAT produces animation-ready local rotations that can directly drive a rigged avatar or be converted to pose parameters of SMPL-like body models for real-time and online applications. With 374K parameters and over 650 FPS on CPU, IK-GAT outperforms VPoser-based per-frame iterative optimization without warm-start at significantly lower cost, and is robust to initial pose and input noise
- Abstract(参考訳): 逆キネマティクス(英: Inverse Kiinematics、IK)は、アニメーション、ロボティクス、バイオメカニクスにおいて中心となる操作である。
多くのリアルタイム人間のアバターパイプラインでは、フレーム当たりの信号はトラックされた3次元関節位置のスパースセットである。
骨軸のねじれは曖昧であり、古典的IKソルバは通常、遅くてノイズの多い入力に敏感な反復最適化に依存している。
IK-GATは1つの前方パスで3次元関節位置から全体関節方向を再構築する軽量グラフアテンションネットワークである。
このモデルは、回転推論中に運動構造を利用するため、骨格親子グラフ上でメッセージパッシングを行う。
学習を容易にするため、IK-GATは骨フレームの静止に固定された骨配位世界フレーム表現の回転を予測する。
このパラメータ化は、ツイスト軸を明示的にし、キネマティックツリーとレストポーズが与えられた標準的な親相対的局所回転に対して正確には可逆である。
ネットワークは連続した6次元回転表現を使用し、SO(3)上の測地損失とオプションのフォワード・キネマティクス整合正規化器で訓練される。
IK-GATはアニメーション対応のローカルローテーションを制作し、リグされたアバターを直接駆動したり、SMPLのようなボディモデルのパラメータをリアルタイムおよびオンラインアプリケーションに適用できる。
374KパラメータとCPU上で650FPSを超えるIK-GATは、VPoserベースのフレーム単位の反復最適化よりも大幅に低コストで、初期ポーズと入力ノイズに対して堅牢である。
関連論文リスト
- ViPS: Video-informed Pose Spaces for Auto-Rigged Meshes [55.32681167870698]
Video-informed Pose Spaces (ViPS)は、自動リップメッシュのための有効な調律の潜時分布を検出するフィードフォワードフレームワークである。
ViPSは生成ビデオの先行値を所定のリグパラメータ化上の普遍分布に転送する。
評価の結果,VPSは,合成アーティストが作成した4Dデータに基づいて訓練した最先端の手法の性能と,妥当性と多様性の両面で一致していることがわかった。
論文 参考訳(メタデータ) (2026-04-19T21:21:11Z) - Puppeteer: Rig and Animate Your 3D Models [105.11046762553121]
Puppeteerは、さまざまな3Dオブジェクトの自動リギングとアニメーションの両方に対処する包括的なフレームワークである。
本システムはまず, 自己回帰変換器を用いて, 可塑性骨格構造を推定する。
その後、注意に基づくアーキテクチャにより、皮膚の重量を推定する。
論文 参考訳(メタデータ) (2025-08-14T17:59:31Z) - PUMPS: Skeleton-Agnostic Point-based Universal Motion Pre-Training for Synthesis in Human Motion Tasks [44.19486142246208]
モーションスケルトンは、骨階層を変換することで3Dキャラクターアニメーションを駆動するが、比例や構造の違いにより、骨格間での移動が困難になる。
TPC(Temporal Point Clouds)は、構造化されていない、相互互換のモーション表現を提供する。
TPCデータのためのプリミティブオートエンコーダアーキテクチャであるPUMPSを提案する。
論文 参考訳(メタデータ) (2025-07-27T08:20:49Z) - GGMotion: Group Graph Dynamics-Kinematics Networks for Human Motion Prediction [0.0]
GGMotionはグループグラフのダイナミックス・キネマティクスネットワークで、人間のトポロジをグループでモデル化し、ダイナミックスやキネマティクスの事前利用を改善する。
グループ間およびグループ間相互作用モジュールは、異なるスケールで関節の依存関係をキャプチャするために使用される。
本手法は,短期動作予測において有意な性能差を達成している。
論文 参考訳(メタデータ) (2025-07-10T08:02:01Z) - KinePose: A temporally optimized inverse kinematics technique for 6DOF
human pose estimation with biomechanical constraints [11.912058874826549]
そこで本研究では,生体力学的情報および被験者特異的キネマティック・チェーン全体での関節配向を推定する手法を提案する。
境界条件におけるIKアプローチの一般精度と精度の両方を評価するために,3次元ポーズ動作シーケンスを生成する。
我々の時間的アルゴリズムは,MPJAS(Mean Per Joint Angular separation)誤差の低い6DOFポーズ推定を実現する。
論文 参考訳(メタデータ) (2022-07-26T12:17:07Z) - MoCaNet: Motion Retargeting in-the-wild via Canonicalization Networks [77.56526918859345]
そこで本研究では,制御された環境から3次元動作タスクを実現する新しいフレームワークを提案する。
モーションキャプチャシステムや3D再構成手順を使わずに、2Dモノクロ映像のキャラクタから3Dキャラクタへの体動を可能にする。
論文 参考訳(メタデータ) (2021-12-19T07:52:05Z) - Spatiotemporal Bundle Adjustment for Dynamic 3D Human Reconstruction in
the Wild [49.672487902268706]
本稿では,カメラの時間的アライメントと3次元点三角測量を共同で推定する枠組みを提案する。
複数の無同期・無同期ビデオカメラで捉えたイベントにおいて、人間の身体の3次元運動軌跡を再構成する。
論文 参考訳(メタデータ) (2020-07-24T23:50:46Z) - MotioNet: 3D Human Motion Reconstruction from Monocular Video with
Skeleton Consistency [72.82534577726334]
モノクロビデオから3次元人間の骨格の動きを直接再構成するディープニューラルネットワークであるMotioNetを紹介した。
本手法は,動作表現を完全かつ一般的に使用するキネマティックスケルトンを直接出力する最初のデータ駆動型手法である。
論文 参考訳(メタデータ) (2020-06-22T08:50:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。