論文の概要: stable-worldmodel-v1: Reproducible World Modeling Research and Evaluation
- arxiv url: http://arxiv.org/abs/2602.08968v1
- Date: Mon, 09 Feb 2026 18:04:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:25.413139
- Title: stable-worldmodel-v1: Reproducible World Modeling Research and Evaluation
- Title(参考訳): 安定世界モデル-v1:再現可能な世界モデリング研究と評価
- Authors: Lucas Maes, Quentin Le Lidec, Dan Haramati, Nassim Massaudi, Damien Scieur, Yann LeCun, Randall Balestriero,
- Abstract要約: 安定世界モデル(SWM)は,モジュール型,テスト型,文書化された世界モデル研究エコシステムである。
SWMは効率的なデータ収集ツール、標準化された環境、計画アルゴリズム、ベースライン実装を提供する。
DINO-WMにおけるゼロショットロバスト性の研究でSWMの有用性を実証する。
- 参考スコア(独自算出の注目度): 46.55784222514516
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: World Models have emerged as a powerful paradigm for learning compact, predictive representations of environment dynamics, enabling agents to reason, plan, and generalize beyond direct experience. Despite recent interest in World Models, most available implementations remain publication-specific, severely limiting their reusability, increasing the risk of bugs, and reducing evaluation standardization. To mitigate these issues, we introduce stable-worldmodel (SWM), a modular, tested, and documented world-model research ecosystem that provides efficient data-collection tools, standardized environments, planning algorithms, and baseline implementations. In addition, each environment in SWM enables controllable factors of variation, including visual and physical properties, to support robustness and continual learning research. Finally, we demonstrate the utility of SWM by using it to study zero-shot robustness in DINO-WM.
- Abstract(参考訳): 世界モデルは、環境力学のコンパクトで予測的な表現を学ぶための強力なパラダイムとして登場し、エージェントが直接経験を超えて推論、計画、一般化を行えるようになった。
近年のWorld Modelsへの関心にもかかわらず、ほとんどの実装は出版に特化しており、再利用可能性を大幅に制限し、バグのリスクを増大させ、評価の標準化を減らしている。
これらの問題を緩和するために、我々は、効率的なデータ収集ツール、標準化された環境、計画アルゴリズム、ベースライン実装を提供するモジュール式、テスト型、文書化された世界モデル研究エコシステムである、安定世界モデル(SWM)を導入する。
さらに、SWMの各環境は、視覚的・身体的特性を含む変化の制御可能な要因を可能とし、堅牢性と継続的な学習研究を支援する。
最後に、DINO-WMにおけるゼロショットロバスト性の研究でSWMの有用性を実証する。
関連論文リスト
- From Word to World: Can Large Language Models be Implicit Text-based World Models? [82.47317196099907]
エージェント強化学習は、経験駆動のスケーリングにますます依存している。
世界モデルは、シミュレートされた経験を通して学習効率を改善する潜在的方法を提供する。
大規模言語モデルがこの役割を確実に果たせるか,どのような条件でエージェントに有意義な利益をもたらすかを検討する。
論文 参考訳(メタデータ) (2025-12-21T17:28:42Z) - SmallWorlds: Assessing Dynamics Understanding of World Models in Isolated Environments [15.243547292947397]
我々はSmallWorld Benchmarkを紹介した。これは、分離された、正確に制御された動的条件下での世界モデル能力を評価するために設計されたテストベッドである。
我々は、Recurrent State Space Model、Transformer、Diffusion Model、Neural ODEなどの代表的アーキテクチャ上で、完全に観測可能な状態空間で包括的な実験を行う。
実験結果から, これらのモデルが環境構造を効果的に把握し, ロールアウトによる予測がいかに悪化するかが明らかになった。
論文 参考訳(メタデータ) (2025-11-28T18:56:02Z) - World Model Implanting for Test-time Adaptation of Embodied Agents [29.514831254621438]
具体的AIにおいて、永続的な課題は、エージェントが広範なデータ収集や再トレーニングを必要とせずに、新しいドメインへの堅牢な適応を可能にすることである。
本稿では、大規模言語モデルの推論能力と、独立に学習されたドメイン固有世界モデルを組み合わせた世界モデル埋め込みフレームワーク(WorMI)を提案する。
我々は、VirtualHomeとALFWorldのベンチマークでWorMIを評価し、いくつかのLSMベースのアプローチと比較して、ゼロショットと少数ショットのパフォーマンスが優れていることを示した。
論文 参考訳(メタデータ) (2025-09-04T07:32:16Z) - AI in a vat: Fundamental limits of efficient world modelling for agent sandboxing and interpretability [84.52205243353761]
最近の研究は、世界モデルを使用して、AIエージェントをデプロイ前にテストできる制御された仮想環境を生成することを提案する。
評価対象のAIエージェントに非依存な世界モデルを簡単にする方法を検討する。
論文 参考訳(メタデータ) (2025-04-06T20:35:44Z) - Toward Stable World Models: Measuring and Addressing World Instability in Generative Environments [9.870616615997973]
本稿では,世界安定という特性に着目し,世界モデルにおけるコンテンツ保存能力の向上に関する新しい研究について述べる。
近年の拡散型生成モデルでは、強化学習や対話型ゲームエンジンなどの応用において重要な没入型および現実的な環境の合成が進んでいる。
本研究では、世界モデルに一連のアクションを実行させ、その逆で初期視点に戻すことで、世界安定性を測定するための評価フレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-11T07:38:11Z) - Learning from Reward-Free Offline Data: A Case for Planning with Latent Dynamics Models [79.2162092822111]
我々は,一連のナビゲーションタスクにおいて,強化学習(RL)と制御に基づく手法を体系的に評価する。
我々は、JEPA(Joint Embedding Predictive Architecture)を使用して、潜在ダイナミクスモデルを使用し、それを計画に使用します。
その結果,モデルベースプランニングではレイアウトが不明瞭になるのに対して,モデルフリーのRLは高品質なデータから恩恵を受けることがわかった。
論文 参考訳(メタデータ) (2025-02-20T18:39:41Z) - WHALE: Towards Generalizable and Scalable World Models for Embodied Decision-making [40.53824201182517]
本稿では、一般化可能な世界モデルを学ぶためのフレームワークであるWHALEを紹介する。
Whale-STは、拡張一般化性を備えた時空間変圧器を用いたスケーラブルな世界モデルである。
また、Open X-Embodimentデータセットから970K軌道上でトレーニングされた414MパラメータワールドモデルであるWhale-Xを提案する。
論文 参考訳(メタデータ) (2024-11-08T15:01:27Z) - Zero-shot Safety Prediction for Autonomous Robots with Foundation World Models [0.12499537119440243]
世界モデルは、コントローラを訓練し、システムの内部のダイナミックモデルを学ぶことによって安全違反を予測するために代理世界を作成する。
本稿では,観察を意味的かつ因果的に潜伏した表現に組み込む基礎世界モデルを提案する。
これにより、Surrogate dynamicsは、トレーニング不要な大規模言語モデルを活用することで、因果先状態を直接予測できる。
論文 参考訳(メタデータ) (2024-03-30T20:03:49Z) - HarmonyDream: Task Harmonization Inside World Models [93.07314830304193]
モデルベース強化学習(MBRL)は、サンプル効率の学習を約束する。
本稿では,タスク調和性を維持するために損失係数を自動的に調整する,シンプルで効果的なアプローチであるHarmonyDreamを提案する。
論文 参考訳(メタデータ) (2023-09-30T11:38:13Z) - Continual Visual Reinforcement Learning with A Life-Long World Model [55.05017177980985]
視覚力学モデリングのための新しい連続学習手法を提案する。
まず,タスク固有の潜在ダイナミクスを学習する長寿命世界モデルを紹介する。
そして,探索・保守的行動学習手法を用いて,過去の課題に対する価値推定問題に対処する。
論文 参考訳(メタデータ) (2023-03-12T05:08:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。