論文の概要: IMWM: Intuition Models Complement World Models for Latent Planning
- arxiv url: http://arxiv.org/abs/2606.01626v1
- Date: Mon, 01 Jun 2026 03:23:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.89818
- Title: IMWM: Intuition Models Complement World Models for Latent Planning
- Title(参考訳): IMWM:遅延計画のための直観モデルと相補的世界モデル
- Authors: Baoqi Gao, Ruize Han, Miao Wang, Song Wang,
- Abstract要約: 有限予算のサンプルベースプランナーがまだいくつかのタスクで失敗していることを示す。
このギャップに触発されたIMWMを提案する。これは世界モデルと、実証から訓練された直観モデルとを組み合わせて、期待できる行動を認識する。
- 参考スコア(独自算出の注目度): 21.033541866844683
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Planning with a learned latent world model is a promising route to control from raw pixels, but a strong world model alone is not enough. We show this experimentally: even with a perfect world model (operationalized by replacing the learned forward predictor with an idealized rollout of the true environment dynamics), a finite-budget sample-based planner still fails on some tasks, indicating that the bottleneck can lie in search rather than in world-model accuracy. Motivated by this gap, we propose IMWM (Intuition Model + World Model), which pairs the world model with an intuition model trained from demonstrations to recognize promising actions. The two models collaborate through three lightweight components: (i) Retrieval Initialization, which initializes the planner's action proposal from a retrieved demonstration; (ii) Hybrid Cost, which combines the intuition score with the world-model rollout cost; and (iii) a Reliability Gate, which adjusts how much the planner trusts intuition in each setting. Across four pixel-based goal-reaching tasks (Two-Room, Reacher, Push-T, and OGBench-Cube), IMWM has higher mean success than the world-model-only planner on all four, with the largest gains on Two-Room (99.2%, +11.5 percentage points) and OGBench-Cube (94.7%, +28.5 percentage points).
- Abstract(参考訳): 学習された潜在世界モデルによる計画は、生のピクセルから制御するための有望な方法であるが、強い世界モデルだけでは不十分である。
完全世界モデル(学習した前方予測器を真の環境力学の理想的なロールアウトに置き換えて操作する)であっても、有限予算のサンプルベースプランナーは依然としていくつかのタスクで失敗し、このボトルネックが世界モデル精度よりも検索に現れることを示す。
このギャップに触発されたIMWM(Intuition Model + World Model)を提案する。
2つのモデルは、3つの軽量コンポーネントを通して協調する。
一 回収されたデモンストレーションからプランナーの行動提案を初期化する検索初期化
二 直観スコアとワールドモデルロールアウトコストを組み合わせたハイブリッドコスト
三 プランナーが各設定における直観をどの程度信頼するかを調整する信頼性ゲート
4つの画素ベースの目標達成タスク(Two-Room、Reacher、Push-T、OGBench-Cube)の中で、IMWMは世界モデルのみのプランナーよりも平均的な成功であり、Two-Room(99.2%、+11.5ポイント)とOGBench-Cube(94.7%、+28.5ポイント)で最大の利益を得ている。
関連論文リスト
- MotuBrain: An Advanced World Action Model for Robot Control [23.733029557644354]
We present MotuBrain, a unified World Action Model that jointly model video and action under a UniDiffuser formulation。
単一のモデルは、ポリシー学習、世界モデリング、ビデオ生成、逆ダイナミクス、共同ビデオアクション予測をサポートする。
Motus上に構築されているMotuBrainは、言語と相互作用の結合を強くするための独立したテキストストリームである、統一されたマルチビューモデリングも導入している。
我々の推論スタックは、ステップの削減、コンパイル、FP8量子化、DiTキャッシュ、V2Aスタイルのアクション専用推論、リアルタイムチャンククループ実行を組み合わせたものです。
論文 参考訳(メタデータ) (2026-04-30T12:34:44Z) - HY-Embodied-0.5: Embodied Foundation Models for Real-World Agents [71.09493646932046]
本稿では,実世界のエンボディエージェントに特化して設計された基礎モデルのファウンデーションモデルであるHY-Embodied-0.5を紹介する。
HY-Embodied-0.5スイートは、エッジ配置用に設計された2Bアクティベートパラメータを持つ効率的なモデルと、複雑な推論をターゲットとした32Bアクティベートパラメータを持つ強力なモデルである。
私たちのMoT-2Bモデルは16ベンチマークで同等の大きさの最先端モデルより優れていますが、32BはGemini 3.0 Proのようなフロンティアモデルに匹敵するパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2026-04-08T17:59:48Z) - World Action Verifier: Self-Improving World Models via Forward-Inverse Asymmetry [82.93104394404781]
汎用世界モデルは、スケーラブルなポリシー評価、最適化、計画を約束します。
本稿では,世界モデルによる予測誤りと自己改善を識別するフレームワークであるWorld Action Verifier(WAV)を提案する。
論文 参考訳(メタデータ) (2026-04-02T12:48:36Z) - WorldCompass: Reinforcement Learning for Long-Horizon World Models [81.03997753254023]
この研究は、インタラクティブなビデオベースの世界モデルのための新しい強化学習(RL)フレームワークであるWorldを提示する。
本稿では,自己回帰ビデオ生成パラダイムに合わせた3つのコアイノベーションを紹介する。
様々なシナリオにおけるインタラクションの精度と視覚的忠実度を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2026-02-09T18:59:47Z) - Co-Evolving Latent Action World Models [57.48921576959243]
学習済みのビデオモデルを潜在アクションを介して制御可能な世界モデルに適応させることは、ジェネラリストの世界モデルを作成するための有望なステップである。
本稿では,この相乗的パラダイムを初めて実現したCoLA-Worldを提案する。
世界モデルは知識のある家庭教師として機能し、高品質のLAMを形成するための勾配を提供する。
論文 参考訳(メタデータ) (2025-10-30T12:28:40Z) - From Forecasting to Planning: Policy World Model for Collaborative State-Action Prediction [57.56072009935036]
政策世界モデル(PWM)と呼ばれる新しい運転パラダイムを導入する。
PWMは、統一アーキテクチャ内での世界モデリングと軌道計画を統合する。
提案手法は,マルチビューおよびマルチモーダル入力に依存する最先端の手法に適合するか,あるいは超越する。
論文 参考訳(メタデータ) (2025-10-22T14:57:51Z) - Bootstrapping World Models from Dynamics Models in Multimodal Foundation Models [37.774994737939394]
我々は動的モデルを用いて、合成データと推論時間検証を用いて世界モデルをブートストラップする。
GPT4o-as-judgeによると、我々の最良のモデルは、最先端の画像編集モデルと性能を競い合っており、実世界のサブセットでは15%のマージンで改善されている。
論文 参考訳(メタデータ) (2025-06-06T11:50:18Z) - WorldPrediction: A Benchmark for High-level World Modeling and Long-horizon Procedural Planning [52.36434784963598]
我々は、異なるAIモデルのワールドモデリングと手続き計画能力を評価するためのビデオベースのベンチマークであるWorldPredictionを紹介する。
現在のフロンティアモデルでは,WorldPrediction-WMでは57%,WorldPrediction-PPでは38%の精度しか達成できないが,人間は両タスクを完璧に解くことができる。
論文 参考訳(メタデータ) (2025-06-04T18:22:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。