論文の概要: Toward Stable World Models: Measuring and Addressing World Instability in Generative Environments
- arxiv url: http://arxiv.org/abs/2503.08122v1
- Date: Tue, 11 Mar 2025 07:38:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-12 15:46:18.668482
- Title: Toward Stable World Models: Measuring and Addressing World Instability in Generative Environments
- Title(参考訳): 安定世界モデルに向けて:生成環境における世界不安定度の測定と対応
- Authors: Soonwoo Kwon, Jin-Young Kim, Hyojun Go, Kyungjune Baek,
- Abstract要約: 本稿では,世界安定という特性に着目し,世界モデルにおけるコンテンツ保存能力の向上に関する新しい研究について述べる。
近年の拡散型生成モデルでは、強化学習や対話型ゲームエンジンなどの応用において重要な没入型および現実的な環境の合成が進んでいる。
本研究では、世界モデルに一連のアクションを実行させ、その逆で初期視点に戻すことで、世界安定性を測定するための評価フレームワークを提案する。
- 参考スコア(独自算出の注目度): 9.870616615997973
- License:
- Abstract: We present a novel study on enhancing the capability of preserving the content in world models, focusing on a property we term World Stability. Recent diffusion-based generative models have advanced the synthesis of immersive and realistic environments that are pivotal for applications such as reinforcement learning and interactive game engines. However, while these models excel in quality and diversity, they often neglect the preservation of previously generated scenes over time--a shortfall that can introduce noise into agent learning and compromise performance in safety-critical settings. In this work, we introduce an evaluation framework that measures world stability by having world models perform a sequence of actions followed by their inverses to return to their initial viewpoint, thereby quantifying the consistency between the starting and ending observations. Our comprehensive assessment of state-of-the-art diffusion-based world models reveals significant challenges in achieving high world stability. Moreover, we investigate several improvement strategies to enhance world stability. Our results underscore the importance of world stability in world modeling and provide actionable insights for future research in this domain.
- Abstract(参考訳): 本稿では,世界安定という特性に着目し,世界モデルにおけるコンテンツ保存能力の向上に関する新しい研究について述べる。
近年の拡散型生成モデルでは、強化学習や対話型ゲームエンジンなどの応用において重要な没入型および現実的な環境の合成が進んでいる。
しかし、これらのモデルは品質と多様性に優れていますが、しばしば、時間とともに生成されたシーンの保存を無視します。
本研究では,世界モデルに一連のアクションを実行させ,その逆のアクションを初期視点に戻すことで世界安定性を計測し,開始点と終了点の一貫性を定量化する評価枠組みを提案する。
最先端の拡散型世界モデルの包括的評価は、高い世界の安定を達成する上で重要な課題であることを示している。
さらに,世界安定度を高めるための改善策について検討した。
本研究の結果は,世界モデリングにおける世界安定の重要性を強調し,今後の研究に有効な知見を提供するものである。
関連論文リスト
- A Survey of World Models for Autonomous Driving [63.33363128964687]
自律運転の最近の進歩は、堅牢な世界モデリングの進歩によって推進されている。
本稿では、自律運転の世界モデルにおける最近の進歩を体系的にレビューする。
論文 参考訳(メタデータ) (2025-01-20T04:00:02Z) - World-Consistent Data Generation for Vision-and-Language Navigation [52.08816337783936]
VLN(Vision-and-Language Navigation)は、自然言語の指示に従って、エージェントがフォトリアリスティックな環境をナビゲートする必要がある課題である。
VLNの主な障害はデータの不足であり、目に見えない環境における一般化性能の低下につながる。
多様性と世界整合性の両方を満たす効率的なデータ拡張フレームワークである世界整合データ生成(WCGEN)を提案する。
論文 参考訳(メタデータ) (2024-12-09T11:40:54Z) - WHALE: Towards Generalizable and Scalable World Models for Embodied Decision-making [40.53824201182517]
本稿では、一般化可能な世界モデルを学ぶためのフレームワークであるWHALEを紹介する。
Whale-STは、拡張一般化性を備えた時空間変圧器を用いたスケーラブルな世界モデルである。
また、Open X-Embodimentデータセットから970K軌道上でトレーニングされた414MパラメータワールドモデルであるWhale-Xを提案する。
論文 参考訳(メタデータ) (2024-11-08T15:01:27Z) - Exploring the Interplay Between Video Generation and World Models in Autonomous Driving: A Survey [61.39993881402787]
世界モデルとビデオ生成は、自動運転の領域において重要な技術である。
本稿では,この2つの技術の関係について検討する。
映像生成モデルと世界モデルとの相互作用を分析することにより,重要な課題と今後の研究方向性を明らかにする。
論文 参考訳(メタデータ) (2024-11-05T08:58:35Z) - Learning World Models for Unconstrained Goal Navigation [4.549550797148707]
本研究では,世界モデル学習のための目標指向探索アルゴリズムであるMUNを紹介する。
MUNは、リプレイバッファ内の任意のサブゴール状態間の状態遷移をモデル化することができる。
その結果、MUNは世界モデルの信頼性を高め、政策の一般化能力を大幅に改善することを示した。
論文 参考訳(メタデータ) (2024-11-03T01:35:06Z) - Model Developmental Safety: A Retention-Centric Method and Applications in Vision-Language Models [75.8161094916476]
本稿では,事前学習された視覚言語モデル,特にCLIPモデルの開発手法について検討する。
自律走行とシーン認識データセットにおける視覚知覚能力の向上に関する実験は,提案手法の有効性を実証するものである。
論文 参考訳(メタデータ) (2024-10-04T22:34:58Z) - Is Sora a World Simulator? A Comprehensive Survey on General World Models and Beyond [101.15395503285804]
一般世界モデルは、人工知能(AGI)の実現への決定的な道のりを表現している
本調査では,世界モデルの最新動向を包括的に調査する。
我々は,世界モデルの課題と限界について検討し,今後の方向性について考察する。
論文 参考訳(メタデータ) (2024-05-06T14:37:07Z) - Zero-shot Safety Prediction for Autonomous Robots with Foundation World Models [0.12499537119440243]
世界モデルは、コントローラを訓練し、システムの内部のダイナミックモデルを学ぶことによって安全違反を予測するために代理世界を作成する。
本稿では,観察を意味的かつ因果的に潜伏した表現に組み込む基礎世界モデルを提案する。
これにより、Surrogate dynamicsは、トレーニング不要な大規模言語モデルを活用することで、因果先状態を直接予測できる。
論文 参考訳(メタデータ) (2024-03-30T20:03:49Z) - The Essential Role of Causality in Foundation World Models for Embodied AI [102.75402420915965]
身体的なAIエージェントは、さまざまな現実世界環境で新しいタスクを実行する能力を必要とします。
現在の基礎モデルは物理的相互作用を正確にモデル化することができないため、Embodied AIには不十分である。
因果関係の研究は、検証世界モデルの構築に寄与する。
論文 参考訳(メタデータ) (2024-02-06T17:15:33Z) - Improving Generative Imagination in Object-Centric World Models [20.495475118576604]
G-SWM(Generative Structured World Models)を紹介する。
G-SWMは、原則化されたフレームワークにおいて、以前のモデルのキープロパティを統一する。
これは、マルチモーダル不確実性と状況認識という、2つの重要な新しい能力を達成する。
論文 参考訳(メタデータ) (2020-10-05T14:43:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。