論文の概要: DreamSAC: Learning Hamiltonian World Models via Symmetry Exploration
- arxiv url: http://arxiv.org/abs/2603.07545v1
- Date: Sun, 08 Mar 2026 09:09:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:14.794776
- Title: DreamSAC: Learning Hamiltonian World Models via Symmetry Exploration
- Title(参考訳): DreamSAC: 対称性探索によるハミルトン世界モデル学習
- Authors: Jinzhou Tang, Fan Feng, Minghao Fu, Wenjun Lin, Biwei Huang, Keze Wang,
- Abstract要約: 学習された世界モデルは補間一般化において優れるが、新しい物理的性質への補間一般化には失敗する。
この制限は、環境の根底にある生成規則よりも統計的相関を学習するため生じる。
これらの不変性を学ぶことが、堅牢な外挿の鍵であると主張する。
当社のフレームワークである textbfDreamSAC は、この活発にキュレートされたデータに基づいてトレーニングされており、3次元物理シミュレーションにおいて最先端のベースラインを大幅に上回っている。
- 参考スコア(独自算出の注目度): 36.81563433475655
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learned world models excel at interpolative generalization but fail at extrapolative generalization to novel physical properties. This limitation arises because they learn statistical correlations rather than the environment's underlying generative rules, such as physical invariances and conservation laws. We argue that learning these invariances is key to robust extrapolation. To achieve this, we first introduce \textbf{Symmetry Exploration}, an unsupervised exploration strategy where an agent is intrinsically motivated by a Hamiltonian-based curiosity bonus to actively probe and challenge its understanding of conservation laws, thereby collecting physically informative data. Second, we design a Hamiltonian-based world model that learns from the collected data, using a novel self-supervised contrastive objective to identify the invariant physical state from raw, view-dependent pixel observations. Our framework, \textbf{DreamSAC}, trained on this actively curated data, significantly outperforms state-of-the-art baselines in 3D physics simulations on tasks requiring extrapolation.
- Abstract(参考訳): 学習された世界モデルは補間一般化において優れるが、新しい物理的性質への補間一般化には失敗する。
この制限は、物理的不変性や保存法則のような環境の根底にある生成規則よりも統計的相関を学習するため生じる。
これらの不変性を学ぶことが、堅牢な外挿の鍵であると主張する。
そこで本研究では,ハミルトンをベースとしたキュリオシティのボーナスによってエージェントが本質的に動機付けられ,保存法則の理解に積極的に挑戦する,教師なしの探索戦略である「textbf{Symmetry Exploration」を紹介した。
第二に、収集されたデータから学習するハミルトン系世界モデルを設計し、新しい自己監督的コントラスト的目的を用いて、生のビュー依存画素観測から不変な物理状態を特定する。
我々のフレームワークである \textbf{DreamSAC} は、この活発にキュレートされたデータに基づいて訓練されており、外挿を必要とするタスクの3次元物理シミュレーションにおいて、最先端のベースラインを著しく上回っている。
関連論文リスト
- EscherVerse: An Open World Benchmark and Dataset for Teleo-Spatial Intelligence with Physical-Dynamic and Intent-Driven Understanding [56.89359230139883]
本稿では,Teleo-Spatial Intelligence(TSI)について紹介する。
本稿では、大規模なオープンワールドベンチマーク(Escher-Bench)、データセット(Escher-35k)、モデル(Escherシリーズ)からなるEscherVerseを紹介する。
これはIntent-Driven Reasoningを体系的に評価する最初のベンチマークである。
論文 参考訳(メタデータ) (2026-01-04T14:42:39Z) - A Comprehensive Survey on World Models for Embodied AI [14.457261562275121]
エンボディードAIは、アクションがどのように将来の世界国家を形作るかを理解し、行動し、予測するエージェントを必要とする。
この調査は、組み込みAIにおける世界モデルのための統一されたフレームワークを示す。
論文 参考訳(メタデータ) (2025-10-19T07:12:32Z) - Conservation-informed Graph Learning for Spatiotemporal Dynamics Prediction [84.26340606752763]
本稿では,保護インフォームドGNN(CiGNN)について紹介する。
このネットワークは、保守的かつ非保守的な情報が、潜時的行進戦略によって多次元空間を通過する対称性による一般的な対称性保存則に従うように設計されている。
結果は,CiGNNが顕著なベースライン精度と一般化性を示し,様々な時間的ダイナミクスの予測のための学習に容易に適用可能であることを示した。
論文 参考訳(メタデータ) (2024-12-30T13:55:59Z) - ManiBox: Enhancing Spatial Grasping Generalization via Scalable Simulation Data Generation [37.73074657448699]
bfManiBoxは、シミュレーションベースの教師学生フレームワーク上に構築された新しいバウンディングボックス誘導操作手法である。
ManiBoxは、空間的把握の一般化と多様なオブジェクトや背景への適応性を著しく改善した。
論文 参考訳(メタデータ) (2024-11-04T07:05:02Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z) - Learning Physical Dynamics with Subequivariant Graph Neural Networks [99.41677381754678]
グラフニューラルネットワーク(GNN)は、物理力学を学習するための一般的なツールとなっている。
物理法則は、モデル一般化に必須な帰納バイアスである対称性に従属する。
本モデルは,RigidFall上でのPhysylonと2倍低ロールアウトMSEの8つのシナリオにおいて,平均3%以上の接触予測精度の向上を実現している。
論文 参考訳(メタデータ) (2022-10-13T10:00:30Z) - Bridging the Gap to Real-World Object-Centric Learning [66.55867830853803]
自己教師付き方法で訓練されたモデルから特徴を再構成することは、完全に教師なしの方法でオブジェクト中心表現が生じるための十分な訓練信号であることを示す。
我々のアプローチであるDINOSAURは、シミュレーションデータ上で既存のオブジェクト中心学習モデルよりも大幅に優れています。
論文 参考訳(メタデータ) (2022-09-29T15:24:47Z) - Dream to Explore: Adaptive Simulations for Autonomous Systems [3.0664963196464448]
ベイズ的非パラメトリック法を適用し,力学系制御の学習に挑戦する。
ガウス過程を用いて潜在世界力学を探索することにより、強化学習で観測される一般的なデータ効率の問題を緩和する。
本アルゴリズムは,ログの変動的下界を最適化することにより,世界モデルと政策を共同で学習する。
論文 参考訳(メタデータ) (2021-10-27T04:27:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。