論文の概要: SmallWorlds: Assessing Dynamics Understanding of World Models in Isolated Environments
- arxiv url: http://arxiv.org/abs/2511.23465v1
- Date: Fri, 28 Nov 2025 18:56:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-01 19:47:56.0334
- Title: SmallWorlds: Assessing Dynamics Understanding of World Models in Isolated Environments
- Title(参考訳): SmallWorlds: 分離された環境での世界モデルのダイナミクス理解を評価する
- Authors: Xinyi Li, Zaishuo Xia, Weyl Lu, Chenjie Hao, Yubei Chen,
- Abstract要約: 我々はSmallWorld Benchmarkを紹介した。これは、分離された、正確に制御された動的条件下での世界モデル能力を評価するために設計されたテストベッドである。
我々は、Recurrent State Space Model、Transformer、Diffusion Model、Neural ODEなどの代表的アーキテクチャ上で、完全に観測可能な状態空間で包括的な実験を行う。
実験結果から, これらのモデルが環境構造を効果的に把握し, ロールアウトによる予測がいかに悪化するかが明らかになった。
- 参考スコア(独自算出の注目度): 15.243547292947397
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current world models lack a unified and controlled setting for systematic evaluation, making it difficult to assess whether they truly capture the underlying rules that govern environment dynamics. In this work, we address this open challenge by introducing the SmallWorld Benchmark, a testbed designed to assess world model capability under isolated and precisely controlled dynamics without relying on handcrafted reward signals. Using this benchmark, we conduct comprehensive experiments in the fully observable state space on representative architectures including Recurrent State Space Model, Transformer, Diffusion model, and Neural ODE, examining their behavior across six distinct domains. The experimental results reveal how effectively these models capture environment structure and how their predictions deteriorate over extended rollouts, highlighting both the strengths and limitations of current modeling paradigms and offering insights into future improvement directions in representation learning and dynamics modeling.
- Abstract(参考訳): 現在の世界モデルは、体系的な評価のための統一された制御された設定を欠いているため、それらが環境力学を管理する基盤となるルールを真に捉えているかどうかを評価することは困難である。
本研究では,このオープンな課題に対して,手作りの報酬信号に頼らずに,孤立的かつ正確に制御された動的条件下での世界モデル能力を評価するためのテストベッドであるSmallWorld Benchmarkを導入する。
このベンチマークを用いて、リカレントステートスペースモデル、トランスフォーマー、ディフュージョンモデル、ニューラルODEを含む代表的アーキテクチャの完全な観測可能な状態空間で包括的な実験を行い、6つの異なる領域でそれらの振る舞いを調べる。
実験結果は,これらのモデルが環境構造を効果的に把握し,その予測が拡張ロールアウトよりもどのように悪化するかを明らかにし,現在のモデリングパラダイムの強みと限界を強調し,表現学習と動的モデリングにおける将来の改善方向に関する洞察を提供する。
関連論文リスト
- A Step Toward World Models: A Survey on Robotic Manipulation [58.8419978790227]
本稿では,ロボット操作の手法のレビューを通じて,世界モデルのコア機能を示すアプローチについて考察する。
我々は、認識、予測、制御にまたがる役割を分析し、主要な課題と解決策を特定し、完全に実現された世界モデルが持つべきコアコンポーネント、能力、機能を蒸留する。
論文 参考訳(メタデータ) (2025-10-31T00:57:24Z) - Consistent World Models via Foresight Diffusion [56.45012929930605]
我々は、一貫した拡散に基づく世界モデルを学習する上で重要なボトルネックは、最適下予測能力にあると主張している。
本稿では,拡散に基づく世界モデリングフレームワークであるForesight Diffusion(ForeDiff)を提案する。
論文 参考訳(メタデータ) (2025-05-22T10:01:59Z) - AI in a vat: Fundamental limits of efficient world modelling for agent sandboxing and interpretability [84.52205243353761]
最近の研究は、世界モデルを使用して、AIエージェントをデプロイ前にテストできる制御された仮想環境を生成することを提案する。
評価対象のAIエージェントに非依存な世界モデルを簡単にする方法を検討する。
論文 参考訳(メタデータ) (2025-04-06T20:35:44Z) - Adapting World Models with Latent-State Dynamics Residuals [10.892848566977369]
ReDRAWは、シミュレーションで事前訓練され、ターゲット環境に調整された潜在状態自己回帰世界モデルである。
これにより、RLエージェントを、修正された動的条件の下で想像上のロールアウトで最適化し、現実世界にデプロイすることが可能になる。
論文 参考訳(メタデータ) (2025-04-03T03:41:30Z) - SPARTAN: A Sparse Transformer Learning Local Causation [63.29645501232935]
因果構造は、環境の変化に柔軟に適応する世界モデルにおいて中心的な役割を果たす。
本研究では,SPARse TrANsformer World Model(SPARTAN)を提案する。
オブジェクト指向トークン間の注意パターンに空間規則を適用することで、SPARTANは、将来のオブジェクト状態を正確に予測するスパース局所因果モデルを特定する。
論文 参考訳(メタデータ) (2024-11-11T11:42:48Z) - Zero-shot Safety Prediction for Autonomous Robots with Foundation World Models [0.12499537119440243]
世界モデルは、コントローラを訓練し、システムの内部のダイナミックモデルを学ぶことによって安全違反を予測するために代理世界を作成する。
本稿では,観察を意味的かつ因果的に潜伏した表現に組み込む基礎世界モデルを提案する。
これにより、Surrogate dynamicsは、トレーニング不要な大規模言語モデルを活用することで、因果先状態を直接予測できる。
論文 参考訳(メタデータ) (2024-03-30T20:03:49Z) - Dream to Explore: Adaptive Simulations for Autonomous Systems [3.0664963196464448]
ベイズ的非パラメトリック法を適用し,力学系制御の学習に挑戦する。
ガウス過程を用いて潜在世界力学を探索することにより、強化学習で観測される一般的なデータ効率の問題を緩和する。
本アルゴリズムは,ログの変動的下界を最適化することにより,世界モデルと政策を共同で学習する。
論文 参考訳(メタデータ) (2021-10-27T04:27:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。