論文の概要: HaM-World: Soft-Hamiltonian World Models with Selective Memory for Planning
- arxiv url: http://arxiv.org/abs/2605.05951v1
- Date: Thu, 07 May 2026 09:58:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.679908
- Title: HaM-World: Soft-Hamiltonian World Models with Selective Memory for Planning
- Title(参考訳): HaM-World:Soft-Hamiltonian World Models with Selective Memory for Planning
- Authors: Haoyun Tang, Haodong Cui, Keyao Xu, Kun Wang, Zhandong Mei,
- Abstract要約: HaM-Worldは、潜在状態を標準部分空間(q, p)と文脈部分空間(c)に分解する構造化世界モデルである。
4つのDeepMind Control Suiteタスクにおいて、HaM-WorldはAUC (117.9, +9.5%) の最高値に達し、長時間のロールアウトエラーを強いベースラインモデルの45%に減らし、3,5,7 MSEセルで11/12 kを獲得した。
- 参考スコア(独自算出の注目度): 2.28917458387011
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: World models enable model-based planning through learned latent dynamics, but imagined rollouts become unstable as the planning horizon grows or the dynamics distribution shifts. We argue that this instability reflects two missing structures in planner-facing latents: history-conditioned memory for approximate Markov completeness, and geometric organization that separates configuration, momentum, and task semantics. We propose HaM-World (HMW), a structured world model that decomposes the latent state into a canonical (q, p) subspace and a context subspace c, while using Mamba selective state-space memory as the history-conditioned input to the same latent dynamics. Within this interface, (q, p) evolves through an energy-derived Hamiltonian vector field plus learnable residual/control dynamics, while c captures semantic, dissipative, and non-conservative factors. This gives the planner a single latent state shared by dynamics prediction, reward/value estimation, imagined rollouts, and CEM action search. On four DeepMind Control Suite tasks, HaM-World reaches the highest Avg. AUC (117.9, +9.5%), reduces long-horizon rollout error to 45% of a strong baseline model, and wins 11/12 k in {3,5,7} MSE cells. Under 12 OOD perturbations spanning dynamics shifts, action delay, and observation masking, HaM-World achieves the highest return in every condition, with average OOD-return gains of 10.2% on Finger Spin and 13.6% on Reacher Easy. Mechanism diagnostics further show bounded action-free Hamiltonian-energy drift, structured energy variation under policy rollouts, and coherent control-induced energy transfer, supporting the intended Soft-Hamiltonian dynamics design.
- Abstract(参考訳): 世界モデルは、学習された潜在力学を通してモデルベースの計画を可能にするが、計画の地平線が大きくなるか、ダイナミックス分布がシフトするにつれて、ロールアウトが不安定になることを想像する。
この不安定性は、マルコフ完全性を近似する履歴条件記憶と、構成、運動量、タスク意味論を分離する幾何学的構造という、プランナーに面した潜伏状態の2つの欠落構造を反映している、と我々は主張する。
本研究では,HMW(Hamba electure state-space memory)を履歴条件入力として使用しながら,潜在状態を標準部分空間(q, p)とコンテキスト部分空間(c)に分解する構造化世界モデルを提案する。
このインターフェースの中では、(q, p) はエネルギー由来のハミルトンベクトル場と学習可能な残留/制御力学を通して進化し、c は意味論的、散逸的、非保存的因子を捉えている。
これにより、プランナーは、動的予測、報酬/価値推定、想像されたロールアウト、CEMアクションサーチによって共有される単一の潜在状態を与える。
4つのDeepMind Control Suiteタスクにおいて、HaM-Worldは最高のAvgに達した。
AUC (117.9, +9.5%) は、長い水平ロールアウト誤差を強いベースラインモデルの45%に減らし、{3,5,7} MSE細胞で11/12kで勝利する。
ダイナミックスシフト、アクション遅延、観察マスキングにまたがる12のOOD摂動の下で、HaM-Worldはすべての条件において最も高いリターンを達成し、平均的なOOD-リターンはフィンガースピンで10.2%、リーチャー・イージーで13.6%向上した。
メカニズム診断により、フリーなハミルトンエネルギードリフト、ポリシーのロールアウトによる構造的エネルギー変動、コヒーレント制御によるエネルギー伝達がさらに示され、Soft-Hamiltonian dynamics設計が支持された。
関連論文リスト
- STRIDE: Structured Lagrangian and Stochastic Residual Dynamics via Flow Matching [2.5845893156827158]
本研究では、保守的な剛体力学を不確実かつ効果的に非保守的な相互作用効果から分離する動的学習フレームワークSTRIDEを提案する。
本研究は,ペンデュラム,Unitree Go1ruped,Unitree G1 humanoidなど複雑度の高いシステム上でのSTRIDEの評価である。
その結果, 長軸予測誤差が20%減少し, 接触力予測誤差が30%減少した。
論文 参考訳(メタデータ) (2026-03-09T15:15:21Z) - Infinite-World: Scaling Interactive World Models to 1000-Frame Horizons via Pose-Free Hierarchical Memory [101.2076718776139]
複雑な実環境において,1000フレーム以上のコヒーレントな視覚記憶を維持することのできる,堅牢な対話型世界モデルを提案する。
我々は,歴史的潜水剤を固定予算の幾何学的表現に蒸留するpose-free Memory (HPMC)を導入する。
また,連続動作を三状態論理に識別する不確実性認識型アクションラベルモジュールを提案する。
論文 参考訳(メタデータ) (2026-02-02T17:52:56Z) - Scalable Spatio-Temporal SE(3) Diffusion for Long-Horizon Protein Dynamics [51.85385061275941]
分子動力学(MD)シミュレーションは、タンパク質動力学研究のゴールドスタンダードのままである。
近年の生成モデルではシミュレーションの加速が期待できるが、長軸生成に苦慮している。
物理的に可塑性なタンパク質軌道をマイクロスケールの時間スケールで生成する拡張拡散モデルSTAR-MDを提案する。
論文 参考訳(メタデータ) (2026-02-02T14:13:28Z) - Prismatic World Model: Learning Compositional Dynamics for Planning in Hybrid Systems [38.4555621948915]
Prismatic World Model (PRISM-WM) は複雑なハイブリッド力学を構成可能なプリミティブに分解するように設計されている。
PRISM-WMは系力学におけるシャープモード遷移を正確にモデル化することでロールアウトドリフトを著しく低減する。
論文 参考訳(メタデータ) (2025-12-09T09:40:34Z) - Agentic World Modeling for 6G: Near-Real-Time Generative State-Space Reasoning [70.56067503630486]
第6世代(6G)インテリジェンスは、流動的なトークン予測ではなく、想像と選択の能力を校正している、と我々は主張する。
We showed that WM-MS3M cuts mean absolute error (MAE) by 1.69% vs MS3M with 32% less parameters and similar latency, and achieve a 35-80% lower root mean squared error (RMSE) than attention/hybrid baselines with 2.3-4.1x faster inference。
論文 参考訳(メタデータ) (2025-11-04T17:22:22Z) - Simplifying Latent Dynamics with Softly State-Invariant World Models [10.722955763425228]
エージェントの動作をより予測可能なものにするために、潜時力学を規則化する世界モデルであるParsimonious Latent Space Model (PLSM)を導入する。
我々の正規化は下流タスクの精度、一般化、性能を改善する。
論文 参考訳(メタデータ) (2024-01-31T13:52:11Z) - SyMetric: Measuring the Quality of Learnt Hamiltonian Dynamics Inferred
from Vision [73.26414295633846]
最近提案されたモデルのクラスは、高次元観測から潜在力学を学習しようと試みている。
既存の手法は画像再構成の品質に依存しており、学習した潜在力学の質を常に反映しているわけではない。
我々は、基礎となるハミルトン力学が忠実に捕獲されたかどうかのバイナリ指標を含む、一連の新しい尺度を開発する。
論文 参考訳(メタデータ) (2021-11-10T23:26:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。