論文の概要: PH-Dreamer: A Physics-Driven World Model via Port-Hamiltonian Generative Dynamics
- arxiv url: http://arxiv.org/abs/2605.18303v1
- Date: Mon, 18 May 2026 12:20:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:49.603601
- Title: PH-Dreamer: A Physics-Driven World Model via Port-Hamiltonian Generative Dynamics
- Title(参考訳): PH-Dreamer:ポート・ハミルトン生成ダイナミクスによる物理駆動世界モデル
- Authors: Xueyu Luan, Chenwei Shi,
- Abstract要約: リカレントステートスペースアーキテクチャ上に構築された世界モデルは、保存と散逸の原則に反するダイナミクスを生成する。
我々は,これらを3つの相乗的機構を通じて改善する統合されたポート・ハミルトンの枠組みを導入する。
視覚制御のベンチマーク全体では、このパラダイムは優れたリターンを得るだけでなく、想像と実の報酬の間により密着した、より低い分散アライメントを確立することで内部忠実度を高める。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: World models built on recurrent state space architectures enable efficient latent imagination, yet remain physically unstructured, producing dynamics that violate conservation and dissipative principles. We introduce a unified Port-Hamiltonian framework that remedies this through three synergistic mechanisms. First, we embed implicit physical priors into recurrent transitions by modeling projected latent evolution as action controlled energy routing governed by flow and dissipation, biasing the projected PH phase space toward a more compact and physically structured representation. Second, we develop a kinematics aware energy world model that estimates the Hamiltonian and power balance from proprioceptive observations, providing an explicit physical signal for thermodynamic reasoning. Third, leveraging these energy gradients, we establish an energy guided Actor-Critic that uses Lagrangian multipliers to regularize policy optimization toward lower energy and smoother control. Across visual control benchmarks, this paradigm not only attains superior asymptotic returns but also elevates internal simulator fidelity by establishing a tighter, lower variance alignment between imagined and real rewards, all while reducing latent phase space volume by 4.18-8.41%, energy consumption by up to 7.80%, and mean squared jerk by up to 9.38%.
- Abstract(参考訳): リカレントな状態空間アーキテクチャ上に構築された世界モデルは、効率的な潜伏的な想像を可能にするが、物理的に非構造のままであり、保存と散逸の原理に反するダイナミクスを生み出す。
我々は,これらを3つの相乗的機構を通じて改善する統合されたポート・ハミルトンの枠組みを導入する。
まず、流れと散逸によって支配される行動制御エネルギールーティングとして、予測された潜在進化をモデル化し、予測されたPH位相空間をよりコンパクトで物理的に構造化された表現へとバイアスすることで、暗黙の物理的前兆を繰り返し遷移に埋め込む。
第2に、熱力学的推論のための明示的な物理信号を提供し、主観的な観測からハミルトニアンとパワーバランスを推定するキネマティックス対応エネルギー世界モデルを開発する。
第三に、これらのエネルギー勾配を利用して、ラグランジアン乗算器を用いて、より低いエネルギーとより滑らかな制御に対する政策最適化を規則化するエネルギー誘導アクター・クライトを確立する。
視覚制御のベンチマーク全体では、このパラダイムは優れた漸近的リターンを得るだけでなく、想像と実の報酬の間により密着した、より低いばらつきのアライメントを確立することで内部シミュレータの忠実度を高める。
関連論文リスト
- LaWM: Least Action World Models for Long-Horizon Physical Consistency from Visual Observations [9.35652906982887]
学習された視覚的潜伏空間における最小アクションの原理を運用するためのラストアクション世界モデル(LaWM)を提案する。
LaWMは、学習された一般化された座標に観測を符号化し、連続的な潜伏状態上で潜在離散ラグランジアンを学ぶ。
遷移は離散的な変動原理によって誘導されるため、LaWMは長期の視覚予測のための構造保存バイアスを提供する。
論文 参考訳(メタデータ) (2026-05-08T07:03:13Z) - HaM-World: Soft-Hamiltonian World Models with Selective Memory for Planning [2.28917458387011]
HaM-Worldは、潜在状態を標準部分空間(q, p)と文脈部分空間(c)に分解する構造化世界モデルである。
4つのDeepMind Control Suiteタスクにおいて、HaM-WorldはAUC (117.9, +9.5%) の最高値に達し、長時間のロールアウトエラーを強いベースラインモデルの45%に減らし、3,5,7 MSEセルで11/12 kを獲得した。
論文 参考訳(メタデータ) (2026-05-07T09:58:18Z) - Detecting Deepfakes via Hamiltonian Dynamics [58.881686693914446]
本稿では,静的パターン認識から動的安定性解析へ移行するディープフェイク検出の新しい視点を提案する。
私たちのアプローチは、物理学にインスパイアされた先駆者によって動機付けられています。
Hamiltonian Action Anomaly Detection (HAAD) は、最先端のベースラインの評価に優れる。
論文 参考訳(メタデータ) (2026-05-06T01:55:38Z) - PhyCo: Learning Controllable Physical Priors for Generative Motion [55.59209981836171]
本稿では,ビデオ生成に連続的,解釈可能,物理的に接地された制御を導入するフレームワークであるPhyCoを紹介する。
i) 摩擦, 再構成, 変形, 力が様々なシナリオで体系的に変化する100K以上のフォトリアリスティック・シミュレーション・ビデオの大規模データセット, (ii) 物理制御された拡散モデルの微調整, (iii) VLM誘導報酬最適化, 微調整された視覚言語モデルにより、対象とする物理クエリを用いて生成されたビデオを評価し、異なるフィードバックを提供する。
論文 参考訳(メタデータ) (2026-04-30T17:53:03Z) - Resonance4D: Frequency-Domain Motion Supervision for Preset-Free Physical Parameter Learning in 4D Dynamic Physical Scene Simulation [53.141181758015186]
Resonance4Dは3次元ガウス散乱と物質点法を結合した物理駆動4次元動的シミュレーションフレームワークである。
我々の重要な洞察は、動的整合性は、相補的領域における共同的拘束運動によって、高密度時間発生なしに強制できるということである。
Resonance4Dは、ピークGPUメモリを35,GB以上から20GB程度に削減しつつ、強力な物理忠実性と運動の整合性を実現する。
論文 参考訳(メタデータ) (2026-04-02T13:00:22Z) - When Should a Model Change Its Mind? An Energy-Based Theory and Regularizer for Concept Drift in Electrocardiogram (ECG) Signals [0.9239657838690226]
既存のコンセプトドリフトフレームワークは、主に分散しており、モデルの内部表現がどれだけ動くかについての原則化されたガイダンスを提供していない。
本研究では,物理エネルギー保存理論(PECT)を紹介した。
PECTは、仮想的なドリフトの下では、正規化された潜時変位は正規化された信号エネルギーの変化と比例してスケールすべきであり、一方、この比例性の持続的な違反は実際の概念ドリフトを示す。
論文 参考訳(メタデータ) (2026-02-25T15:23:15Z) - PhysRVG: Physics-Aware Unified Reinforcement Learning for Video Generative Models [100.65199317765608]
物理原理は現実的な視覚シミュレーションには基本的だが、トランスフォーマーベースのビデオ生成において重要な監視対象である。
本研究では,物理衝突ルールを高次元空間に直接適用した映像生成モデルのための物理認識強化学習パラダイムを提案する。
このパラダイムを、MDcycle(Mimicry-Discovery Cycle)と呼ばれる統合フレームワークに拡張することで、大幅な微調整を可能にします。
論文 参考訳(メタデータ) (2026-01-16T08:40:10Z) - Transformers as Intrinsic Optimizers: Forward Inference through the Energy Principle [22.02194689588116]
本稿では、注意に基づくトランスフォーマーモデルを理解するために、レンズとしてのエネルギーの原理を再考する。
本稿では,大域エネルギー$F*$,エネルギー関数$E_i$,採用勾配降下(GD)の3つの主要成分からなる統一エネルギーベースフレームワークを提案する。
古典的なGDアルゴリズムに着想を得て、標準GDに基づく本来のアテンション定式化を運動量ベースGD、ネステロフ加速勾配(Nesterov Accelerated Gradient、NAG)およびニュートンのメソッド変種に拡張し、それぞれに対応する新しいアテンション構造を誘導する。
論文 参考訳(メタデータ) (2025-11-02T11:58:50Z) - Forecasting Continuous Non-Conservative Dynamical Systems in SO(3) [51.510040541600176]
コンピュータビジョンにおける移動物体の回転をモデル化するための新しい手法を提案する。
我々のアプローチは、入力ノイズに対して頑健でありながら、エネルギーと運動量保存に非依存である。
トレーニング中の雑音状態から物体のダイナミクスを近似させることで、シミュレーションや様々な現実世界の設定において頑健な外挿能力が得られる。
論文 参考訳(メタデータ) (2025-08-11T09:03:10Z) - Energy Transformer [64.22957136952725]
我々の研究は、機械学習における有望な3つのパラダイム、すなわち注意機構、エネルギーベースモデル、連想記憶の側面を組み合わせる。
本稿では,エネルギー変換器(ET,Energy Transformer)と呼ばれる新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-02-14T18:51:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。