論文の概要: LaDy: Lagrangian-Dynamic Informed Network for Skeleton-based Action Segmentation via Spatial-Temporal Modulation
- arxiv url: http://arxiv.org/abs/2603.24097v1
- Date: Wed, 25 Mar 2026 09:01:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 21:06:11.218206
- Title: LaDy: Lagrangian-Dynamic Informed Network for Skeleton-based Action Segmentation via Spatial-Temporal Modulation
- Title(参考訳): LaDy:ラグランジアン動的インフォームドネットワークによる時空間変調による骨格に基づく行動セグメンテーション
- Authors: Haoyu Ji, Xueting Liu, Yu Gao, Wenze Huang, Zhihao Yang, Weihong Ren, Zhiyong Wang, Honghai Liu,
- Abstract要約: 本稿では,ラグランジュ力学の原理をセグメンテーションプロセスに統合する枠組みを提案する。
挑戦的なデータセットの実験は、LaDyが最先端のパフォーマンスを達成することを示している。
- 参考スコア(独自算出の注目度): 34.31811348547604
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Skeleton-based Temporal Action Segmentation (STAS) aims to densely parse untrimmed skeletal sequences into frame-level action categories. However, existing methods, while proficient at capturing spatio-temporal kinematics, neglect the underlying physical dynamics that govern human motion. This oversight limits inter-class discriminability between actions with similar kinematics but distinct dynamic intents, and hinders precise boundary localization where dynamic force profiles shift. To address these, we propose the Lagrangian-Dynamic Informed Network (LaDy), a framework integrating principles of Lagrangian dynamics into the segmentation process. Specifically, LaDy first computes generalized coordinates from joint positions and then estimates Lagrangian terms under physical constraints to explicitly synthesize the generalized forces. To further ensure physical coherence, our Energy Consistency Loss enforces the work-energy theorem, aligning kinetic energy change with the work done by the net force. The learned dynamics then drive a Spatio-Temporal Modulation module: Spatially, generalized forces are fused with spatial representations to provide more discriminative semantics. Temporally, salient dynamic signals are constructed for temporal gating, thereby significantly enhancing boundary awareness. Experiments on challenging datasets show that LaDy achieves state-of-the-art performance, validating the integration of physical dynamics for action segmentation. Code is available at https://github.com/HaoyuJi/LaDy.
- Abstract(参考訳): スケルトンをベースとしたテンポラルアクションセグメンテーション(STAS)は、トリミングされていない骨格配列をフレームレベルのアクションカテゴリに密に解析することを目的としている。
しかし、既存の手法は時空間運動学を捉えるのに熟練しているが、人間の動きを管理する基礎となる物理力学を無視している。
この監視は、類似のキネマティクスを持つアクション間のクラス間差別性を制限し、動的力プロファイルがシフトする正確な境界局在を阻害する。
そこで我々は,ラグランジアン力学の原理をセグメンテーションプロセスに統合するフレームワークであるLagrangian-Dynamic Informed Network (LaDy)を提案する。
具体的には、LaDy はまず結合位置から一般化座標を計算し、次にラグランジュ項を物理的制約の下で推定し、一般化された力を明示的に合成する。
物理コヒーレンスをより確実にするために、我々のエネルギー一貫性損失は、運動エネルギーの変化とネット力による作業とを整合させて、仕事エネルギーの定理を強制する。
空間的に一般化された力は、より識別的な意味論を提供するために空間表現と融合する。
時間的に、時間的ゲーティングのために健全なダイナミック信号が構築され、境界認識が著しく向上する。
挑戦的なデータセットの実験では、LaDyが最先端のパフォーマンスを実現し、アクションセグメンテーションのための物理ダイナミクスの統合を検証する。
コードはhttps://github.com/HaoyuJi/LaDy.comで入手できる。
関連論文リスト
- MotionCFG: Boosting Motion Dynamics via Stochastic Concept Perturbation [60.48914865049489]
MotionCFGは、ターゲットコンセプトとノイズブレーブの概念を対比することにより、モーションダイナミクスを強化するフレームワークである。
明示的な否定とは異なり、このアプローチはグローバルな意味的アイデンティティをシフトすることなく暗黙的な否定的なガイダンスを促進する。
MotionCFGは、最先端のT2Vフレームワーク間のモーションダイナミクスを一貫して改善する。
論文 参考訳(メタデータ) (2026-03-14T18:39:37Z) - Lie Flow: Video Dynamic Fields Modeling and Predicting with Lie Algebra as Geometric Physics Principle [48.28007238304401]
LieFlowは動的放射率表現フレームワークで、動きを明示的にモデル化する。
SE(3)変換場は、運動の連続性と幾何学的整合性を維持するために物理的に着想を得た制約を強制する。
結果,SE(3)に基づくモーションモデリングは動的4Dシーンを表現するための頑健で物理的基盤の枠組みを提供することを確認した。
論文 参考訳(メタデータ) (2026-02-25T07:19:18Z) - Meta Dynamic Graph for Traffic Flow Prediction [4.6060644265855775]
動的メタグラフ(MetaDG)と呼ばれる交通予測のためのフレームワークを提案する。
ノード表現の動的グラフ構造をモデル時間力学に明示的に活用する。
4つの実世界のデータセットに対する大規模な実験は、MetaDGの有効性を検証する。
論文 参考訳(メタデータ) (2026-01-15T12:15:54Z) - GGMotion: Group Graph Dynamics-Kinematics Networks for Human Motion Prediction [0.0]
GGMotionはグループグラフのダイナミックス・キネマティクスネットワークで、人間のトポロジをグループでモデル化し、ダイナミックスやキネマティクスの事前利用を改善する。
グループ間およびグループ間相互作用モジュールは、異なるスケールで関節の依存関係をキャプチャするために使用される。
本手法は,短期動作予測において有意な性能差を達成している。
論文 参考訳(メタデータ) (2025-07-10T08:02:01Z) - ADD-SLAM: Adaptive Dynamic Dense SLAM with Gaussian Splatting [12.846353008321394]
ADD-SLAM: ガウス分割に基づくAdaptive Dynamic Dense SLAMフレームワーク。
シーン整合性解析に基づく適応的動的識別機構を設計する。
事前に定義されたセマンティックなカテゴリは必要とせず、シーンのダイナミクスを適応的に発見する。
論文 参考訳(メタデータ) (2025-05-26T02:17:17Z) - Spatial-Temporal Graph Diffusion Policy with Kinematic Modeling for Bimanual Robotic Manipulation [88.83749146867665]
既存のアプローチは、遠く離れた次のベストなエンドエフェクタのポーズを予測するポリシーを学びます。
すると、運動に対する対応する関節回転角を逆運動学を用いて計算する。
本稿では,Kinematics 拡張空間テンポアル gRaph diffuser を提案する。
論文 参考訳(メタデータ) (2025-03-13T17:48:35Z) - InterDyn: Controllable Interactive Dynamics with Video Diffusion Models [50.38647583839384]
我々は、初期フレームと駆動対象またはアクターの動作を符号化する制御信号が与えられたインタラクティブな動画像を生成するフレームワークであるInterDynを提案する。
我々の重要な洞察は、大規模なビデオ生成モデルは、大規模ビデオデータからインタラクティブなダイナミクスを学習し、ニューラルと暗黙の物理シミュレーターの両方として機能できるということです。
論文 参考訳(メタデータ) (2024-12-16T13:57:02Z) - Lagrangian Motion Fields for Long-term Motion Generation [51.02126882968116]
本稿では,ラグランジアン運動場の概念について紹介する。
各関節を短い間隔で一様速度でラグランジアン粒子として扱うことにより、我々のアプローチは運動表現を一連の「超運動」に凝縮する。
私たちのソリューションは万能で軽量で、ニューラルネットワークの前処理の必要性を排除しています。
論文 参考訳(メタデータ) (2024-09-03T01:38:06Z) - Degrees of Freedom Matter: Inferring Dynamics from Point Trajectories [28.701879490459675]
ニューラルネットワークによってパラメータ化された暗黙の運動場を学習し、同一領域内の新規点の動きを予測することを目的とする。
我々は、SIRENが提供する固有正則化を活用し、入力層を変更して時間的に滑らかな運動場を生成する。
実験では, 未知点軌道の予測におけるモデルの性能評価と, 変形を伴う時間メッシュアライメントへの応用について検討した。
論文 参考訳(メタデータ) (2024-06-05T21:02:10Z) - EAN: Event Adaptive Network for Enhanced Action Recognition [66.81780707955852]
本稿では,映像コンテンツの動的性質を調査するための統合された行動認識フレームワークを提案する。
まず、局所的な手がかりを抽出する際に、動的スケールの時空間カーネルを生成し、多様な事象を適応的に適合させる。
第2に、これらのキューを正確にグローバルなビデオ表現に集約するために、トランスフォーマーによって選択されたいくつかの前景オブジェクト間のインタラクションのみをマイニングすることを提案する。
論文 参考訳(メタデータ) (2021-07-22T15:57:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。