論文の概要: Unconditional Human Motion and Shape Generation via Balanced Score-Based Diffusion
- arxiv url: http://arxiv.org/abs/2510.12537v1
- Date: Tue, 14 Oct 2025 14:02:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-15 19:02:32.340904
- Title: Unconditional Human Motion and Shape Generation via Balanced Score-Based Diffusion
- Title(参考訳): バランス付きスコアベース拡散による非条件動作と形状生成
- Authors: David Björkstrand, Tiesheng Wang, Lars Bretzner, Josephine Sullivan,
- Abstract要約: スコアベース拡散モデルが非条件の人間の動作生成における最先端の結果と同等であることを示す。
提案手法を段階的に構築し,各コンポーネントに対する明確な理論的モチベーションを付与し,各追加提案の有効性を個別に示す。
- 参考スコア(独自算出の注目度): 3.8472567301096174
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Recent work has explored a range of model families for human motion generation, including Variational Autoencoders (VAEs), Generative Adversarial Networks (GANs), and diffusion-based models. Despite their differences, many methods rely on over-parameterized input features and auxiliary losses to improve empirical results. These strategies should not be strictly necessary for diffusion models to match the human motion distribution. We show that on par with state-of-the-art results in unconditional human motion generation are achievable with a score-based diffusion model using only careful feature-space normalization and analytically derived weightings for the standard L2 score-matching loss, while generating both motion and shape directly, thereby avoiding slow post hoc shape recovery from joints. We build the method step by step, with a clear theoretical motivation for each component, and provide targeted ablations demonstrating the effectiveness of each proposed addition in isolation.
- Abstract(参考訳): 最近の研究は、変分オートエンコーダ(VAE)、GAN(Generative Adversarial Networks)、拡散に基づくモデルなど、人間の動作生成のためのモデルファミリーを探索してきた。
これらの違いにもかかわらず、多くの手法は実験結果を改善するために過度にパラメータ化された入力特徴と補助的な損失に依存している。
これらの戦略は、人間の運動分布に一致する拡散モデルに厳密には必要ではない。
本研究では, 正常化の注意と標準L2スコアマッチング損失の解析的重み付けのみを用いたスコアベース拡散モデルにより, 無条件の人体運動生成における最先端の成果と同等に達成できることを示し, 動作と形状を直接生成しながら, 関節部からの緩やかな後ホック形状の回復を回避した。
提案手法を段階的に構築し,各コンポーネントに対する明確な理論的モチベーションを付与し,各追加提案の有効性を個別に示す。
関連論文リスト
- Projected Coupled Diffusion for Test-Time Constrained Joint Generation [49.69610867216755]
制約付きジョイント生成のための新しいテストタイムフレームワークであるProjected Coupled Diffusion (PCD)を提案する。
PCDは、拡散モデル間の協調を促進するために生成力学に結合したガイダンス項を導入し、各拡散ステップにプロジェクションステップを組み込んで厳しい制約を強制する。
その結果,過剰な計算コストを発生させることなく,結合効果の向上と制約満足度が保証された。
論文 参考訳(メタデータ) (2025-08-14T11:05:31Z) - Rethinking Diffusion for Text-Driven Human Motion Generation: Redundant Representations, Evaluation, and Masked Autoregression [8.153961351540834]
2023年以降、ベクトル量子化(VQ)に基づく離散生成法が人間の運動生成を支配している。
本研究では,現行のVQ法が有効である理由を考察し,既存の拡散型手法の限界について検討する。
提案手法では,修正されたデータ表現と分布に最適化された,マスク付き自己回帰を実現するための人間の動き拡散モデルを提案する。
論文 参考訳(メタデータ) (2024-11-25T16:59:42Z) - Energy-Based Diffusion Language Models for Text Generation [126.23425882687195]
エネルギーベース拡散言語モデル(Energy-based Diffusion Language Model, EDLM)は、拡散ステップごとに全シーケンスレベルで動作するエネルギーベースモデルである。
我々のフレームワークは、既存の拡散モデルよりも1.3$times$のサンプリングスピードアップを提供する。
論文 参考訳(メタデータ) (2024-10-28T17:25:56Z) - Distillation of Discrete Diffusion through Dimensional Correlations [21.078500510691747]
「ミクチャー」モデルは、拡張性を維持しながら次元相関を扱える。
損失関数により、混合モデルは、次元相関を学習することで、そのような多くのステップの従来のモデルをほんの数ステップに蒸留することができる。
その結果、画像領域と言語領域をまたいだ事前学習した離散拡散モデルの蒸留における提案手法の有効性が示された。
論文 参考訳(メタデータ) (2024-10-11T10:53:03Z) - Self-Play Fine-Tuning of Diffusion Models for Text-to-Image Generation [59.184980778643464]
ファインチューニング拡散モデル : 生成人工知能(GenAI)の最前線
本稿では,拡散モデル(SPIN-Diffusion)のための自己演奏ファインチューニングという革新的な手法を紹介する。
提案手法は従来の教師付き微調整とRL戦略の代替として,モデル性能とアライメントの両方を大幅に改善する。
論文 参考訳(メタデータ) (2024-02-15T18:59:18Z) - Non-Cross Diffusion for Semantic Consistency [12.645444338043934]
常微分方程式(ODE)モデルを学習するための生成モデリングにおける革新的アプローチであるNon-Cross Diffusionを導入する。
提案手法は,2つの分布からサンプリングされた点を非交差経路で効果的に接続する,入力の上昇次元を戦略的に組み込む。
論文 参考訳(メタデータ) (2023-11-30T05:53:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。