論文の概要: Generative Motion In-betweening by Diffusion over Continuous Implicit Representations
- arxiv url: http://arxiv.org/abs/2605.12778v1
- Date: Tue, 12 May 2026 21:48:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:27.702483
- Title: Generative Motion In-betweening by Diffusion over Continuous Implicit Representations
- Title(参考訳): 連続的インプティシット表現上の拡散によるジェネレーティブ・モーション・イン・ベツワイニング
- Authors: Shiyu Fan, Paul Henderson, Edmond S. L. Ho,
- Abstract要約: 動作暗黙的ニューラル表現(INR)に基づく潜在拡散モデル(LDM)のための新しいパイプラインとサンプリング最適化手法を提案する。
このモデルでは, 極端にスパースで曖昧なデータからINRパラメータをサンプリングし, 多様体から可塑性かつ滑らかな運動を再構成することができる。
- 参考スコア(独自算出の注目度): 8.190723030003804
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in generative models have yielded impressive progress on motion in-betweening, allowing for more complex, varied, and realistic motion transitions. However, recent methods still exhibit noticeable limitations in preserving keyframe information and ensuring motion continuity. In this paper, we propose a novel pipeline and sampling optimization strategy for latent diffusion models (LDM) based on motion implicit neural representations (INR). By establishing a mapping between INR and sparse spatial or temporal information within latent diffusion, our model can sample the INR parameters from extremely sparse and ambiguous keyframe data and reconstruct plausible and smooth motions from the manifold. Our experiments demonstrate the superior performance of our model, which significantly improves motion generation quality in scenarios with few keyframes while ensuring both keyframe accuracy and diversity of in-between motions.
- Abstract(参考訳): 生成モデルの最近の進歩は、両者の動きの顕著な進歩をもたらし、より複雑で変化し、現実的な動きの遷移を可能にした。
しかし、近年の手法は、キーフレーム情報の保存と動きの継続性の確保において、目立った限界をみせている。
本稿では,動作暗黙的ニューラル表現(INR)に基づく潜在拡散モデル(LDM)のための新しいパイプラインとサンプリング最適化手法を提案する。
InRと空間的・時間的情報とのマッピングを潜伏拡散内で確立することにより,INRパラメータを極めてスパースで曖昧なキーフレームデータからサンプリングし,多様体から可塑性かつ滑らかな動きを再構成することができる。
本実験は,キーフレームの少ないシナリオにおいて,キーフレームの精度と相互動作の多様性を両立させながら,動き生成品質を著しく向上させるモデルの性能を実証する。
関連論文リスト
- Causal Motion Diffusion Models for Autoregressive Motion Generation [19.61051102039212]
因果運動拡散モデル(CMDM)は自己回帰運動生成のための統合されたフレームワークである。
CMDMはMAC-VAE(Motion-Language-Aligned Causal VAE)の上に構築され、動作シーケンスを時間的因果潜在表現にエンコードする。
HumanML3DとSnapMoGenの実験では、CMDMは、意味的忠実度と時間的滑らかさの両方において、既存の拡散モデルと自己回帰モデルより優れていることを示した。
論文 参考訳(メタデータ) (2026-02-26T03:58:25Z) - Geometric Neural Distance Fields for Learning Human Motion Priors [51.99890740169883]
本研究では,より頑健で時間的に整合性があり,物理的に妥当な3次元運動回復を可能にする新しい3D生成人体運動について紹介する。
AMASSデータセットをトレーニングし、NRMFは複数の入力モードにまたがって著しく一般化する。
論文 参考訳(メタデータ) (2025-09-11T17:58:18Z) - FlowMo: Variance-Based Flow Guidance for Coherent Motion in Video Generation [51.110607281391154]
FlowMoは、テキスト・ビデオ・モデルにおける動きコヒーレンスを高めるためのトレーニング不要のガイダンス手法である。
時間次元のパッチワイドな分散を測定して動きのコヒーレンスを推定し、サンプリング中にこの分散を動的に減少させるためにモデルを導く。
論文 参考訳(メタデータ) (2025-06-01T19:55:33Z) - Flexible Motion In-betweening with Diffusion Models [16.295323675781184]
比較によって導かれる多様な人間の動きを生成する際の拡散モデルの可能性について検討する。
従来のインベントワイニング法とは異なり、精密かつ多様な動作を生成できる単純な統一モデルを提案する。
テキスト条件付きHumanML3Dデータセット上でのCondMDIの性能を評価する。
論文 参考訳(メタデータ) (2024-05-17T23:55:51Z) - Efficient Text-driven Motion Generation via Latent Consistency Training [21.348658259929053]
非線形逆拡散軌道を解くための動き潜時整合トレーニングフレームワーク(MLCT)を提案する。
これらの拡張を組み合わせることで、非画素モダリティおよび潜在表現空間における安定かつ一貫性のあるトレーニングを実現する。
論文 参考訳(メタデータ) (2024-05-05T02:11:57Z) - Motion-aware Latent Diffusion Models for Video Frame Interpolation [51.78737270917301]
隣接するフレーム間の動き推定は、動きのあいまいさを避ける上で重要な役割を担っている。
我々は、新しい拡散フレームワーク、動き認識潜在拡散モデル(MADiff)を提案する。
提案手法は,既存手法を著しく上回る最先端性能を実現する。
論文 参考訳(メタデータ) (2024-04-21T05:09:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。