論文の概要: Refining Diffusion Models for Motion Synthesis with an Acceleration Loss to Generate Realistic IMU Data
- arxiv url: http://arxiv.org/abs/2512.08859v1
- Date: Tue, 09 Dec 2025 17:51:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-10 22:28:08.073043
- Title: Refining Diffusion Models for Motion Synthesis with an Acceleration Loss to Generate Realistic IMU Data
- Title(参考訳): 実時間IMUデータを生成する加速損失を用いた運動合成のための精製拡散モデル
- Authors: Lars Ole Häusler, Lena Uhlenberg, Göran Köber, Diyora Salimova, Oliver Amft,
- Abstract要約: 現実的なIMUデータを得るために,テキストからIMU(慣性計測単位)の動き合成フレームワークを提案する。
加速に基づく2次損失(L_acc)を伴う事前学習拡散モデル
L_accは、生成された動きの離散的な2階時間差に一貫性を強制する。
- 参考スコア(独自算出の注目度): 1.291843130404247
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We propose a text-to-IMU (inertial measurement unit) motion-synthesis framework to obtain realistic IMU data by fine-tuning a pretrained diffusion model with an acceleration-based second-order loss (L_acc). L_acc enforces consistency in the discrete second-order temporal differences of the generated motion, thereby aligning the diffusion prior with IMU-specific acceleration patterns. We integrate L_acc into the training objective of an existing diffusion model, finetune the model to obtain an IMU-specific motion prior, and evaluate the model with an existing text-to-IMU framework that comprises surface modelling and virtual sensor simulation. We analysed acceleration signal fidelity and differences between synthetic motion representation and actual IMU recordings. As a downstream application, we evaluated Human Activity Recognition (HAR) and compared the classification performance using data of our method with the earlier diffusion model and two additional diffusion model baselines. When we augmented the earlier diffusion model objective with L_acc and continued training, L_acc decreased by 12.7% relative to the original model. The improvements were considerably larger in high-dynamic activities (i.e., running, jumping) compared to low-dynamic activities~(i.e., sitting, standing). In a low-dimensional embedding, the synthetic IMU data produced by our refined model shifts closer to the distribution of real IMU recordings. HAR classification trained exclusively on our refined synthetic IMU data improved performance by 8.7% compared to the earlier diffusion model and by 7.6% over the best-performing comparison diffusion model. We conclude that acceleration-aware diffusion refinement provides an effective approach to align motion generation and IMU synthesis and highlights how flexible deep learning pipelines are for specialising generic text-to-motion priors to sensor-specific tasks.
- Abstract(参考訳): 本稿では,加速度に基づく2次損失(L_acc)による事前学習拡散モデルの微調整により,現実的なIMUデータを得るためのテキスト・ツー・IMU(慣性計測単位)モーションシンセシスフレームワークを提案する。
L_accは、生成した動きの離散的な2次時間差の一貫性を強制し、IMU固有の加速度パターンに先行して拡散を調整する。
既存の拡散モデルのトレーニング対象にL_accを組み込んで,IMU固有の動きを事前に把握し,表面モデリングと仮想センサシミュレーションを組み合わせた既存のテキスト・ツー・IMUフレームワークを用いてモデルの評価を行う。
我々は、加速度信号の忠実度と、合成運動表現と実際のIMU記録の違いを分析した。
ダウンストリームアプリケーションとして,HAR(Human Activity Recognition)を評価し,従来の拡散モデルと2つの拡散モデルに基づく分類性能を比較した。
L_acc の初期拡散モデル対象をL_acc に拡張し継続訓練を行ったところ,L_acc は元のモデルと比較して 12.7% 減少していた。
これらの改善は、低ダイナミックな活動(つまり、立位、立位)に比べて、高ダイナミックな活動(すなわち、ランニング、ジャンプ)においてかなり大きくなっていた。
低次元埋め込みでは、改良されたモデルにより生成された合成IMUデータが実際のIMU記録の分布に近づく。
HAR分類は, 従来の拡散モデルに比べて8.7%, 最高の比較拡散モデルよりも7.6%向上した。
我々は,加速度対応拡散改善法が,動作生成とIMU合成の整合性に有効なアプローチであり,センサ固有のタスクに先立って,汎用的なテキスト・ツー・モーションを専門とする深層学習パイプラインがいかに柔軟かを強調した。
関連論文リスト
- Optimization Benchmark for Diffusion Models on Dynamical Systems [1.1603243575080533]
本稿では,フロートラジェクトリをデノナイズする拡散モデルをトレーニングするための最近の最適化アルゴリズムをベンチマークする。
私たちは、MuonとSOAPがAdamWの非常に効率的な代替品であること(18%の最終損失)を観察します。
論文 参考訳(メタデータ) (2025-10-22T08:50:31Z) - Energy-Based Diffusion Language Models for Text Generation [126.23425882687195]
エネルギーベース拡散言語モデル(Energy-based Diffusion Language Model, EDLM)は、拡散ステップごとに全シーケンスレベルで動作するエネルギーベースモデルである。
我々のフレームワークは、既存の拡散モデルよりも1.3$times$のサンプリングスピードアップを提供する。
論文 参考訳(メタデータ) (2024-10-28T17:25:56Z) - Bayesian-Optimized One-Step Diffusion Model with Knowledge Distillation for Real-Time 3D Human Motion Prediction [2.402745776249116]
本稿では,知識蒸留とベイズ最適化を用いた1段階多層パーセプトロン(MLP)拡散モデルによる動き予測のトレーニングを提案する。
提案モデルでは,予測速度を大幅に向上し,性能の劣化を伴わないリアルタイム予測を実現している。
論文 参考訳(メタデータ) (2024-09-19T04:36:40Z) - Generative Modeling with Phase Stochastic Bridges [49.4474628881673]
拡散モデル(DM)は、連続入力のための最先端の生成モデルを表す。
我々はtextbfphase space dynamics に基づく新しい生成モデリングフレームワークを提案する。
我々のフレームワークは、動的伝播の初期段階において、現実的なデータポイントを生成する能力を示す。
論文 参考訳(メタデータ) (2023-10-11T18:38:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。