論文の概要: Sparse Imagination for Efficient Visual World Model Planning
- arxiv url: http://arxiv.org/abs/2506.01392v1
- Date: Mon, 02 Jun 2025 07:36:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:34.091412
- Title: Sparse Imagination for Efficient Visual World Model Planning
- Title(参考訳): 効率的なビジュアルワールドモデル構築のためのスパースイマジネーション
- Authors: Junha Chun, Youngjoon Jeong, Taesup Kim,
- Abstract要約: 世界モデルに基づく計画では、エージェントが将来の状態をシミュレートし、情報的選択を行うことにより、複雑な環境における意思決定を大幅に改善した。
しかし、世界モデルの予測精度を確保するには、しばしばかなりの計算資源を必要とする。
フォワード予測時に処理されるトークンの数を削減して計算効率を向上させることで,効率的なビジュアルワールドモデルプランニングのためのスパースイマジネーションを提案する。
- 参考スコア(独自算出の注目度): 4.379304291229695
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: World model based planning has significantly improved decision-making in complex environments by enabling agents to simulate future states and make informed choices. However, ensuring the prediction accuracy of world models often demands substantial computational resources, posing a major challenge for real-time applications. This computational burden is particularly restrictive in robotics, where resources are severely constrained. To address this limitation, we propose a Sparse Imagination for Efficient Visual World Model Planning, which enhances computational efficiency by reducing the number of tokens processed during forward prediction. Our method leverages a sparsely trained vision-based world model based on transformers with randomized grouped attention strategy, allowing the model to adaptively adjust the number of tokens processed based on the computational resource. By enabling sparse imagination (rollout), our approach significantly accelerates planning while maintaining high control fidelity. Experimental results demonstrate that sparse imagination preserves task performance while dramatically improving inference efficiency, paving the way for the deployment of world models in real-time decision-making scenarios.
- Abstract(参考訳): 世界モデルに基づく計画では、エージェントが将来の状態をシミュレートし、情報的選択を行うことにより、複雑な環境における意思決定を大幅に改善した。
しかし、世界モデルの予測精度を確保するには、しばしばかなりの計算資源が必要であり、リアルタイムアプリケーションにとって大きな課題となっている。
この計算負担は、資源が厳しく制約されているロボット工学において特に制限を受ける。
この制限に対処するために、前方予測時に処理されるトークンの数を減らし、計算効率を向上させるスパルス・イマジネーション(Sparse Imagination for Efficient Visual World Model Planning)を提案する。
提案手法は,ランダム化されたグループアテンション戦略を持つトランスフォーマーをベースとした,疎密に訓練された視覚ベースの世界モデルを利用して,計算資源に基づいて処理されたトークンの数を適応的に調整する。
スパース・イマジネーション(ロールアウト)を有効にすることで、高い制御精度を維持しながら計画を大幅に高速化する。
実験結果から,空虚な想像力はタスク性能を保ちつつ,推論効率を劇的に向上させ,世界モデルのリアルタイム意思決定シナリオへの展開の道を開いた。
関連論文リスト
- Deep Active Inference Agents for Delayed and Long-Horizon Environments [1.693200946453174]
AIFエージェントは、遅れた環境で悪化する制限である正確な即時予測と徹底的な計画に依存している。
本稿では,複数段階の遅延遷移を特徴とする生成型政治アーキテクチャを提案する。
我々は,遅延と長期化の設定で現実的な産業シナリオを模倣した環境におけるエージェントの評価を行った。
論文 参考訳(メタデータ) (2025-05-26T11:50:22Z) - Unlocking Smarter Device Control: Foresighted Planning with a World Model-Driven Code Execution Approach [83.21177515180564]
本研究では,自然言語理解と構造化推論を優先し,エージェントの環境に対するグローバルな理解を高める枠組みを提案する。
本手法は,従来の手法,特にタスク成功率の44.4%向上を達成している。
論文 参考訳(メタデータ) (2025-05-22T09:08:47Z) - World Model-Based Learning for Long-Term Age of Information Minimization in Vehicular Networks [53.98633183204453]
本稿では,車載ネットワークにおけるパケット完全性認識情報(CAoI)の年齢を最小化するために,新しい世界モデルに基づく学習フレームワークを提案する。
mmWave V2X環境の動的モデルを共同で学習し、リンクスケジューリングの方法を学ぶための軌跡を想像するために使用する世界モデルフレームワークを提案する。
特に、長期的な政策は環境相互作用の代わりに、異なる想像軌道で学習される。
論文 参考訳(メタデータ) (2025-05-03T06:23:18Z) - Object-Centric World Model for Language-Guided Manipulation [4.008780119020479]
エージェントが自律運転やロボット工学といった分野の将来と計画を予測するためには,世界モデルが不可欠である。
本稿では,言語命令で案内されたスロットアテンションを用いて,オブジェクト中心の表現空間を活用する世界モデルを提案する。
本モデルでは,オブジェクト中心の表現として現在の状態を認識し,この表現空間における将来の状態を自然言語命令で予測する。
論文 参考訳(メタデータ) (2025-03-08T11:17:37Z) - Robotic World Model: A Neural Network Simulator for Robust Policy Optimization in Robotics [50.191655141020505]
この研究は、長期水平予測、エラー蓄積、およびsim-to-real転送の課題に対処することで、モデルに基づく強化学習を前進させる。
スケーラブルでロバストなフレームワークを提供することで、現実のアプリケーションにおいて適応的で効率的なロボットシステムを実現することができる。
論文 参考訳(メタデータ) (2025-01-17T10:39:09Z) - Adaptive Planning with Generative Models under Uncertainty [20.922248169620783]
生成モデルによる計画は、幅広い領域にわたる効果的な意思決定パラダイムとして現れてきた。
最新の環境観測に基づいて決定を下すことができるため、各段階での継続的再計画は直感的に思えるかもしれないが、かなりの計算上の課題をもたらす。
本研究は,長軸状態軌跡を予測できる生成モデルの能力を活用する,シンプルな適応計画手法を導入することで,この問題に対処する。
論文 参考訳(メタデータ) (2024-08-02T18:07:53Z) - DiMSam: Diffusion Models as Samplers for Task and Motion Planning under Partial Observability [58.75803543245372]
タスク・アンド・モーション・プランニング(TAMP)アプローチは多段階自律ロボット操作の計画に適している。
本稿では,TAMPシステムを用いた拡散モデルの構築により,これらの制限を克服することを提案する。
古典的TAMP, 生成モデリング, 潜伏埋め込みの組み合わせによって, 多段階制約に基づく推論が可能となることを示す。
論文 参考訳(メタデータ) (2023-06-22T20:40:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。