論文の概要: Toward Stable World Models: Measuring and Addressing World Instability in Generative Environments
- arxiv url: http://arxiv.org/abs/2503.08122v1
- Date: Tue, 11 Mar 2025 07:38:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-12 22:35:51.615542
- Title: Toward Stable World Models: Measuring and Addressing World Instability in Generative Environments
- Title(参考訳): 安定世界モデルに向けて:生成環境における世界不安定度の測定と対応
- Authors: Soonwoo Kwon, Jin-Young Kim, Hyojun Go, Kyungjune Baek,
- Abstract要約: 本稿では,世界安定という特性に着目し,世界モデルにおけるコンテンツ保存能力の向上に関する新しい研究について述べる。
近年の拡散型生成モデルでは、強化学習や対話型ゲームエンジンなどの応用において重要な没入型および現実的な環境の合成が進んでいる。
本研究では、世界モデルに一連のアクションを実行させ、その逆で初期視点に戻すことで、世界安定性を測定するための評価フレームワークを提案する。
- 参考スコア(独自算出の注目度): 9.870616615997973
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a novel study on enhancing the capability of preserving the content in world models, focusing on a property we term World Stability. Recent diffusion-based generative models have advanced the synthesis of immersive and realistic environments that are pivotal for applications such as reinforcement learning and interactive game engines. However, while these models excel in quality and diversity, they often neglect the preservation of previously generated scenes over time--a shortfall that can introduce noise into agent learning and compromise performance in safety-critical settings. In this work, we introduce an evaluation framework that measures world stability by having world models perform a sequence of actions followed by their inverses to return to their initial viewpoint, thereby quantifying the consistency between the starting and ending observations. Our comprehensive assessment of state-of-the-art diffusion-based world models reveals significant challenges in achieving high world stability. Moreover, we investigate several improvement strategies to enhance world stability. Our results underscore the importance of world stability in world modeling and provide actionable insights for future research in this domain.
- Abstract(参考訳): 本稿では,世界安定という特性に着目し,世界モデルにおけるコンテンツ保存能力の向上に関する新しい研究について述べる。
近年の拡散型生成モデルでは、強化学習や対話型ゲームエンジンなどの応用において重要な没入型および現実的な環境の合成が進んでいる。
しかし、これらのモデルは品質と多様性に優れていますが、しばしば、時間とともに生成されたシーンの保存を無視します。
本研究では,世界モデルに一連のアクションを実行させ,その逆のアクションを初期視点に戻すことで世界安定性を計測し,開始点と終了点の一貫性を定量化する評価枠組みを提案する。
最先端の拡散型世界モデルの包括的評価は、高い世界の安定を達成する上で重要な課題であることを示している。
さらに,世界安定度を高めるための改善策について検討した。
本研究の結果は,世界モデリングにおける世界安定の重要性を強調し,今後の研究に有効な知見を提供するものである。
関連論文リスト
- AI in a vat: Fundamental limits of efficient world modelling for agent sandboxing and interpretability [84.52205243353761]
最近の研究は、世界モデルを使用して、AIエージェントをデプロイ前にテストできる制御された仮想環境を生成することを提案する。
評価対象のAIエージェントに非依存な世界モデルを簡単にする方法を検討する。
論文 参考訳(メタデータ) (2025-04-06T20:35:44Z) - Breach in the Shield: Unveiling the Vulnerabilities of Large Language Models [13.216398753024182]
大言語モデル(LLM)と視覚言語モデル(VLM)は、汎用人工知能にとって欠かせないものとなっている。
本稿では,情報幾何学に根ざした統計的手法に着想を得たLSMの新しい安定性尺度を提案する。
提案手法は,入力画像中の有害領域やトークン埋め込みにおける臨界次元の検出に有効であることを示す。
論文 参考訳(メタデータ) (2025-03-28T16:23:59Z) - AdaWorld: Learning Adaptable World Models with Latent Actions [76.50869178593733]
我々は,効率的な適応を実現する革新的な世界モデル学習手法であるAdaWorldを提案する。
主要なアイデアは、世界モデルの事前トレーニング中にアクション情報を統合することである。
次に、これらの潜伏行動を条件とした自己回帰的世界モデルを開発する。
論文 参考訳(メタデータ) (2025-03-24T17:58:15Z) - A Survey of World Models for Autonomous Driving [63.33363128964687]
自律運転の最近の進歩は、堅牢な世界モデリングの進歩によって推進されている。
本稿では、自律運転の世界モデルにおける最近の進歩を体系的にレビューする。
論文 参考訳(メタデータ) (2025-01-20T04:00:02Z) - WHALE: Towards Generalizable and Scalable World Models for Embodied Decision-making [40.53824201182517]
本稿では、一般化可能な世界モデルを学ぶためのフレームワークであるWHALEを紹介する。
Whale-STは、拡張一般化性を備えた時空間変圧器を用いたスケーラブルな世界モデルである。
また、Open X-Embodimentデータセットから970K軌道上でトレーニングされた414MパラメータワールドモデルであるWhale-Xを提案する。
論文 参考訳(メタデータ) (2024-11-08T15:01:27Z) - Exploring the Interplay Between Video Generation and World Models in Autonomous Driving: A Survey [61.39993881402787]
世界モデルとビデオ生成は、自動運転の領域において重要な技術である。
本稿では,この2つの技術の関係について検討する。
映像生成モデルと世界モデルとの相互作用を分析することにより,重要な課題と今後の研究方向性を明らかにする。
論文 参考訳(メタデータ) (2024-11-05T08:58:35Z) - Is Sora a World Simulator? A Comprehensive Survey on General World Models and Beyond [101.15395503285804]
一般世界モデルは、人工知能(AGI)の実現への決定的な道のりを表現している
本調査では,世界モデルの最新動向を包括的に調査する。
我々は,世界モデルの課題と限界について検討し,今後の方向性について考察する。
論文 参考訳(メタデータ) (2024-05-06T14:37:07Z) - Zero-shot Safety Prediction for Autonomous Robots with Foundation World Models [0.12499537119440243]
世界モデルは、コントローラを訓練し、システムの内部のダイナミックモデルを学ぶことによって安全違反を予測するために代理世界を作成する。
本稿では,観察を意味的かつ因果的に潜伏した表現に組み込む基礎世界モデルを提案する。
これにより、Surrogate dynamicsは、トレーニング不要な大規模言語モデルを活用することで、因果先状態を直接予測できる。
論文 参考訳(メタデータ) (2024-03-30T20:03:49Z) - The Essential Role of Causality in Foundation World Models for Embodied AI [102.75402420915965]
身体的なAIエージェントは、さまざまな現実世界環境で新しいタスクを実行する能力を必要とします。
現在の基礎モデルは物理的相互作用を正確にモデル化することができないため、Embodied AIには不十分である。
因果関係の研究は、検証世界モデルの構築に寄与する。
論文 参考訳(メタデータ) (2024-02-06T17:15:33Z) - Improving Generative Imagination in Object-Centric World Models [20.495475118576604]
G-SWM(Generative Structured World Models)を紹介する。
G-SWMは、原則化されたフレームワークにおいて、以前のモデルのキープロパティを統一する。
これは、マルチモーダル不確実性と状況認識という、2つの重要な新しい能力を達成する。
論文 参考訳(メタデータ) (2020-10-05T14:43:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。