論文の概要: Mind-Studio: Executable World Models with Lookahead Evaluation for Partially Observable Games
- arxiv url: http://arxiv.org/abs/2606.16070v2
- Date: Tue, 16 Jun 2026 06:37:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 15:01:46.816521
- Title: Mind-Studio: Executable World Models with Lookahead Evaluation for Partially Observable Games
- Title(参考訳): Mind-Studio: 部分的に観察可能なゲームのためのルックアヘッド評価付き実行可能世界モデル
- Authors: Yifei Dong, Mingen Zheng, Linquan Wu, Jeff Z. Pan, Jiaxin Bai,
- Abstract要約: Mind-Studioは、状態-作用-次の状態軌道からパイゲームスタイルの世界モデルを合成するフレームワークである。
モンテズマの復讐では、Mind-Studioは選択された次の状態予測をPoE-Worldの0.3%から48.7%に改善し、8つのサブゴールのうち5つを検証する。
- 参考スコア(独自算出の注目度): 26.359796001522707
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: World-model synthesis aims to turn interaction experience into an internal model of environment dynamics. Existing symbolic approaches often fit observed transitions or mixtures of local rules, but they do not produce a complete executable program that can run independently of the real environment. We present Mind-Studio, a framework that synthesizes executable pygame-style world models from state-action-next-state trajectories using large language models. Mind-Studio combines entropy-selected traces with a lightweight game skill file containing object, action, and static scene information extracted from screenshots. We evaluate synthesis quality with a K-step lookahead fidelity protocol that compares generated world-model rollouts against Real-ALE rollouts from the same state. On Montezuma's Revenge, Mind-Studio improves chosen-action next-state prediction from 0.3% for PoE-World to 48.7% while verifying 5 of 8 subgoals; across Alien, Assault, and Skiing, it achieves stronger branch-level fidelity than prior learned lookahead sources.
- Abstract(参考訳): 世界モデル合成は、インタラクション体験を環境力学の内部モデルに変えることを目的としている。
既存のシンボリックアプローチは、しばしば観測された局所規則の遷移や混合に適合するが、実際の環境とは独立して実行できる完全な実行可能プログラムは生成しない。
我々は、大規模言語モデルを用いて、状態-作用-負状態軌道から実行可能なピガムスタイルの世界モデルを合成するフレームワークであるMind-Studioを提案する。
Mind-Studioは、エントロピー選択されたトレースと、スクリーンショットから抽出されたオブジェクト、アクション、静的シーン情報を含む軽量なゲームスキルファイルを組み合わせる。
生成した実ALEロールアウトと実ALEロールアウトを同一状態から比較したKステップルックアヘッド忠実度プロトコルを用いて合成品質を評価する。
モンテズマの復讐では、Mind-Studioは選択された次の状態予測をPoE-Worldの0.3%から48.7%に改善し、8つのサブゴールのうち5つを検証した。
関連論文リスト
- PatchWorld: Gradient-Free Optimization of Executable World Models [69.05094454437402]
我々は、オフラインのトラジェクトリを実行可能なPythonの世界モデルに変換する、勾配のないフレームワークであるPatchWorldを紹介します。
7つのAgentGym環境の中で、PatchWorld-Simpleはコードベースの計画スコアが最も高い。
人間の特定残差バイアスは, 表面観察精度を向上するが, 判定性は低下する。
論文 参考訳(メタデータ) (2026-05-29T06:11:14Z) - SceneCode: Executable World Programs for Editable Indoor Scenes with Articulated Objects [69.20984454755512]
室内シーンの合成は、AI、ロボット操作、シミュレーションベースのポリシー評価を具体化する。
既存のパイプラインは、生成されたコンテンツを静的メッシュとして表現し、キュレートされたアセットライブラリからのみ調音を継承する。
我々は、自然言語プロンプトを実行可能なコード駆動屋内世界にコンパイルするフレームワークであるSceneCodeを紹介する。
論文 参考訳(メタデータ) (2026-05-19T09:31:04Z) - Ego2World: Compiling Egocentric Cooking Videos into Executable Worlds for Belief-State Planning [55.43343782036886]
Ego2Worldは、エゴセントリックな調理動画を、グラフ遷移ルールによって管理される実行可能な象徴的世界に変換する実行可能なベンチマークである。
評価中、シミュレータは隠された世界グラフを保持し、エージェントはローカルな観測と実行フィードバックのみを使用して、独自の部分的信念グラフを計画する。
この分離により、エージェントは真の世界の状態を観察することなく、メモリとリプランを更新せざるを得なくなる。
論文 参考訳(メタデータ) (2026-05-13T10:53:15Z) - Latent Particle World Models: Self-supervised Object-centric Stochastic Dynamics Modeling [51.40150411616207]
実世界のマルチオブジェクトデータセットに拡張された自己教師型オブジェクト中心の世界モデルであるLatent Particle World Model (LPWM)を紹介する。
LPWMは、ビデオデータから直接キーポイント、バウンディングボックス、オブジェクトマスクを自律的に発見する。
私たちのアーキテクチャは、純粋にビデオからエンドツーエンドにトレーニングされ、アクション、言語、イメージ目標に対するフレキシブルな条件付けをサポートします。
論文 参考訳(メタデータ) (2026-03-04T19:36:08Z) - Infinite-World: Scaling Interactive World Models to 1000-Frame Horizons via Pose-Free Hierarchical Memory [101.2076718776139]
複雑な実環境において,1000フレーム以上のコヒーレントな視覚記憶を維持することのできる,堅牢な対話型世界モデルを提案する。
我々は,歴史的潜水剤を固定予算の幾何学的表現に蒸留するpose-free Memory (HPMC)を導入する。
また,連続動作を三状態論理に識別する不確実性認識型アクションラベルモジュールを提案する。
論文 参考訳(メタデータ) (2026-02-02T17:52:56Z) - A Data-Driven Discretized CS:GO Simulation Environment to Facilitate Strategic Multi-Agent Planning Research [1.1765015608581086]
本稿では,3次元地形における戦略的長期計画を高次離散化シミュレーションに抽象化する,新しいマルチエージェントシミュレータDECOYを提案する。
対決ストライク:Global Offensiveをテストベッドとして、我々のフレームワークは、移動決定のみを戦術的位置決めとして使用して、ゲームプレイを正確にシミュレートする。
論文 参考訳(メタデータ) (2025-09-08T06:02:59Z) - COME: Adding Scene-Centric Forecasting Control to Occupancy World Model [18.815436110557112]
世界モデルは、環境力学をシミュレートし、合成データを生成する自律運転にとって重要である。
既存の方法では、エゴ車の動きを乱すのに苦労している(シーンの進化から振り返る)
本研究では,シーン中心の座標系を利用して環境変化をエゴ運動から分離することを提案する。
論文 参考訳(メタデータ) (2025-06-16T09:01:09Z) - MineWorld: a Real-Time and Open-Source Interactive World Model on Minecraft [21.530000271719803]
我々はMinecraft上でリアルタイムインタラクティブな世界モデルであるMineWorldを提案する。
MineWorldはビジュアルアクション自動回帰トランスフォーマーによって駆動され、ペア化されたゲームシーンと対応するアクションを入力として取り込む。
本研究では,各フレームの空間的冗長トークンを同時に予測する並列デコーディングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2025-04-11T09:41:04Z) - Infusing Commonsense World Models with Graph Knowledge [89.27044249858332]
オープンワールドテキストアドベンチャーゲームにおける物語生成の設定について検討する。
基礎となるゲーム状態のグラフ表現は、接地グラフ表現と自然言語記述とアクションの両方を消費し出力するモデルを訓練するために使用することができる。
論文 参考訳(メタデータ) (2023-01-13T19:58:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。