論文の概要: Cross-Modal Diffusion for Biomechanical Dynamical Systems Through Local Manifold Alignment
- arxiv url: http://arxiv.org/abs/2503.12214v1
- Date: Sat, 15 Mar 2025 17:44:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-18 12:28:07.233644
- Title: Cross-Modal Diffusion for Biomechanical Dynamical Systems Through Local Manifold Alignment
- Title(参考訳): 局所的マニフォールドアライメントによる生体力学系のクロスモーダル拡散
- Authors: Sharmita Dey, Sarath Ravindran Nair,
- Abstract要約: 本稿では,相互に協調した生体力学的運動生成のための拡散フレームワークを提案する。
それぞれのモダリティを,共振子力学系の相補的な観測として扱うことにより,各拡散段階における潜在表現を一致させる。
我々のアプローチは、ローカル時間ウィンドウの$X$と$Y$が、基礎となる動的システムの同じフェーズを表しているという事実に動機づけられている。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: We present a mutually aligned diffusion framework for cross-modal biomechanical motion generation, guided by a dynamical systems perspective. By treating each modality, e.g., observed joint angles ($X$) and ground reaction forces ($Y$), as complementary observations of a shared underlying locomotor dynamical system, our method aligns latent representations at each diffusion step, so that one modality can help denoise and disambiguate the other. Our alignment approach is motivated by the fact that local time windows of $X$ and $Y$ represent the same phase of an underlying dynamical system, thereby benefiting from a shared latent manifold. We introduce a simple local latent manifold alignment (LLMA) strategy that incorporates first-order and second-order alignment within the latent space for robust cross-modal biomechanical generation without bells and whistles. Through experiments on multimodal human biomechanics data, we show that aligning local latent dynamics across modalities improves generation fidelity and yields better representations.
- Abstract(参考訳): 本稿では,動的システムの観点から,相互に協調した生体力学的運動生成フレームワークを提案する。
各モード、例えば、観測された関節角(X$)と接地反応力(Y$)を共振子力学系の相補的な観測として扱うことにより、各拡散ステップにおいて遅延表現を整列させ、一方のモードが他方のモードを認知・曖昧化するのに役立ちます。
我々のアライメントアプローチは、X$ と$Y$ の局所時間窓が基礎となる力学系の同じ位相を表し、したがって共有潜在多様体の恩恵を受けるという事実によって動機付けられている。
ベルやホイッスルを使わずに頑健なクロスモーダルバイオメカニカル生成を実現するため, 簡易な局所潜在多様体アライメント (LLMA) 戦略を導入し, 潜時空間内に一階および二階アライメントを組み込んだ。
マルチモーダル・ヒューマン・バイオメカニクスデータを用いた実験により, 局所潜伏動態の調整により, 生成の忠実度が向上し, 表現性が向上することを示した。
関連論文リスト
- LaM-SLidE: Latent Space Modeling of Spatial Dynamical Systems via Linked Entities [11.76748620770499]
本稿では、LaM-SLidE(リンクされたエンティティによる空間力学系のラテント空間モデリング)を提案する。
我々のアプローチは、グラフニューラルネットワークの利点、すなわち時間ステップ間でのエンティティのトレーサビリティを組み合わせたものです。
本稿では,LaM-SLidEが速度,精度,一般化性において良好に動作することを示す。
論文 参考訳(メタデータ) (2025-02-17T18:49:13Z) - Transient Dynamics and Homogenization in Incoherent Collision Models [0.0]
本研究では,非コヒーレント衝突モデルの動的挙動について検討し,各ユニット間の相互作用を非コヒーレント制御スワップ(CSWAP)操作によってモデル化する。
コヒーレント相互作用と非コヒーレントスワップ相互作用の両方の場合の開系の力学は同一であるように見えるが、その過渡ダイナミクスは明らかに異なる。
論文 参考訳(メタデータ) (2025-01-27T18:50:39Z) - How to Bridge Spatial and Temporal Heterogeneity in Link Prediction? A Contrastive Method [11.719027225797037]
我々は,新しいtextbfContrastive Learning-based textbfLink textbfPrediction model, textbfCLPを提案する。
我々のマイモデルは最先端モデルよりも一貫して優れており、AUCとAPで平均10.10%、13.44%の改善が示されている。
論文 参考訳(メタデータ) (2024-11-01T14:20:53Z) - Generalized Flow Matching for Transition Dynamics Modeling [14.76793118877456]
局所力学から非線形性を学習することでシミュレーションをウォームアップするデータ駆動手法を提案する。
具体的には、局所力学データからポテンシャルエネルギー関数を推定し、2つの準安定状態間の可塑性経路を求める。
提案手法の有効性を検証するため, 合成分子系と実世界の分子系の両方において, 確率的経路をサンプリングする手法の有効性を検証する。
論文 参考訳(メタデータ) (2024-10-19T15:03:39Z) - Local Action-Guided Motion Diffusion Model for Text-to-Motion Generation [52.87672306545577]
既存の動き生成法は主に大域運動の直接合成に焦点を当てている。
本研究では,局所動作を微粒化制御信号として利用することにより,グローバルな動き生成を容易にする局所動作誘導型動き拡散モデルを提案する。
本手法は,様々な局所動作と連続誘導重み調整をシームレスに組み合わせる柔軟性を提供する。
論文 参考訳(メタデータ) (2024-07-15T08:35:00Z) - F$^3$low: Frame-to-Frame Coarse-grained Molecular Dynamics with SE(3) Guided Flow Matching [43.607506885746155]
本稿では,改良サンプリングのためのアンダーラインフローマッチング(F$3$low)を用いた生成モデルを提案する。
SE(3)上の無力な生成パラダイムにより、多種多様なコンフォメーションを迅速に生成する能力は、効率的なサンプリング方法への道を開く。
論文 参考訳(メタデータ) (2024-05-01T04:53:14Z) - MS-MANO: Enabling Hand Pose Tracking with Biomechanical Constraints [50.61346764110482]
筋骨格系と学習可能なパラメトリックハンドモデルMANOを統合し,MS-MANOを作成する。
このモデルは骨格系を駆動する筋肉と腱の力学をエミュレートし、結果として生じるトルク軌跡に生理学的に現実的な制約を与える。
また,マルチ層パーセプトロンネットワークによる初期推定ポーズを改良する,ループ式ポーズ改善フレームワークBioPRを提案する。
論文 参考訳(メタデータ) (2024-04-16T02:18:18Z) - Joint Multimodal Transformer for Emotion Recognition in the Wild [49.735299182004404]
マルチモーダル感情認識(MMER)システムは、通常、単調なシステムよりも優れている。
本稿では,キーベースのクロスアテンションと融合するために,ジョイントマルチモーダルトランス (JMT) を利用するMMER法を提案する。
論文 参考訳(メタデータ) (2024-03-15T17:23:38Z) - Generative Fractional Diffusion Models [53.36835573822926]
我々は,その基礎となる力学に分数拡散過程を利用する,最初の連続時間スコアベース生成モデルを導入する。
実画像データを用いた評価では,GFDMはFIDが低い値で示されるように,画素幅の多様性と画質の向上を実現している。
論文 参考訳(メタデータ) (2023-10-26T17:53:24Z) - Persistent-Transient Duality: A Multi-mechanism Approach for Modeling
Human-Object Interaction [58.67761673662716]
人間は高度に適応可能で、異なるタスク、状況、状況を扱うために異なるモードを素早く切り替える。
人間と物体の相互作用(HOI)において、これらのモードは、(1)活動全体に対する大規模な一貫した計画、(2)タイムラインに沿って開始・終了する小規模の子どもの対話的行動の2つのメカニズムに起因していると考えられる。
本研究は、人間の動作を協調的に制御する2つの同時メカニズムをモデル化することを提案する。
論文 参考訳(メタデータ) (2023-07-24T12:21:33Z) - Euclideanizing Flows: Diffeomorphic Reduction for Learning Stable
Dynamical Systems [74.80320120264459]
本研究では、限られた数の人間の実演からそのような動きを学ぶためのアプローチを提案する。
複素運動は安定な力学系のロールアウトとして符号化される。
このアプローチの有効性は、確立されたベンチマーク上での検証と、現実世界のロボットシステム上で収集されたデモによって実証される。
論文 参考訳(メタデータ) (2020-05-27T03:51:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。