論文の概要: Planning in 8 Tokens: A Compact Discrete Tokenizer for Latent World Model
- arxiv url: http://arxiv.org/abs/2603.05438v1
- Date: Thu, 05 Mar 2026 18:00:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-06 22:06:11.360289
- Title: Planning in 8 Tokens: A Compact Discrete Tokenizer for Latent World Model
- Title(参考訳): 8tokensの計画: ラテントワールドモデルのためのコンパクト離散トケナイザ
- Authors: Dongwon Kim, Gawon Seo, Jinsung Lee, Minsu Cho, Suha Kwak,
- Abstract要約: そこで我々は,各観測結果を最大8個のトークンに圧縮し,計算コストを大幅に削減し,計画に必要な情報を保存するためのトークンであるCompACTを提案する。
アクション条件付きワールドモデルは、CompACTトークンライザを占有し、桁違いの高速計画による競合計画性能を達成し、現実世界のワールドモデルの展開に向けた実践的なステップを提供する。
- 参考スコア(独自算出の注目度): 76.30055935418561
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: World models provide a powerful framework for simulating environment dynamics conditioned on actions or instructions, enabling downstream tasks such as action planning or policy learning. Recent approaches leverage world models as learned simulators, but its application to decision-time planning remains computationally prohibitive for real-time control. A key bottleneck lies in latent representations: conventional tokenizers encode each observation into hundreds of tokens, making planning both slow and resource-intensive. To address this, we propose CompACT, a discrete tokenizer that compresses each observation into as few as 8 tokens, drastically reducing computational cost while preserving essential information for planning. An action-conditioned world model that occupies CompACT tokenizer achieves competitive planning performance with orders-of-magnitude faster planning, offering a practical step toward real-world deployment of world models.
- Abstract(参考訳): World Modelは、アクションや命令で条件付けられた環境ダイナミクスをシミュレートするための強力なフレームワークを提供し、アクション計画やポリシー学習といった下流タスクを可能にします。
近年の手法は学習シミュレータとして世界モデルを活用するが、意思決定計画への応用はリアルタイム制御では計算的に禁止されている。
従来のトークンエーザは、各観測結果を数百のトークンにエンコードし、遅さとリソース集約の両方を計画する。
そこで本研究では,各観測結果を最大8個のトークンに圧縮し,計算コストを大幅に削減し,計画に必要な情報を保存する離散トークン化ツールCompACTを提案する。
CompACTトークンライザを占有するアクション条件付き世界モデルは、桁違いの高速計画で競争的な計画性能を達成し、現実的な世界モデルの展開に向けた実践的なステップを提供する。
関連論文リスト
- An Empirical Study of World Model Quantization [34.94388089174202]
DINO-WMを用いた世界モデル量子化の系統的研究を行った。
我々は、幅広いビット幅、量子化の粒度、最大50イテレーションまでの計画地平線を含む様々な視覚的計画タスクについて実験を行う。
その結果,世界モデルにおける量子化効果は,標準精度やビット幅トレードオフを超えていることがわかった。
論文 参考訳(メタデータ) (2026-02-02T13:54:03Z) - From Forecasting to Planning: Policy World Model for Collaborative State-Action Prediction [57.56072009935036]
政策世界モデル(PWM)と呼ばれる新しい運転パラダイムを導入する。
PWMは、統一アーキテクチャ内での世界モデリングと軌道計画を統合する。
提案手法は,マルチビューおよびマルチモーダル入力に依存する最先端の手法に適合するか,あるいは超越する。
論文 参考訳(メタデータ) (2025-10-22T14:57:51Z) - ExoPredicator: Learning Abstract Models of Dynamic Worlds for Robot Planning [77.49815848173613]
本研究では,内因性行動とメカニズムの両方について,シンボル的状態表現と因果過程を共同で学習する抽象世界モデルのためのフレームワークを提案する。
シミュレーションされた5つのテーブルトップロボット環境の中で、学習されたモデルは、より多くのオブジェクトとより複雑な目標を持つ保留タスクに一般化した高速な計画を可能にし、幅広いベースラインを上回ります。
論文 参考訳(メタデータ) (2025-09-30T13:44:34Z) - Sparse Imagination for Efficient Visual World Model Planning [4.379304291229695]
世界モデルに基づく計画では、エージェントが将来の状態をシミュレートし、情報的選択を行うことにより、複雑な環境における意思決定を大幅に改善した。
しかし、世界モデルの予測精度を確保するには、しばしばかなりの計算資源を必要とする。
フォワード予測時に処理されるトークンの数を削減して計算効率を向上させることで,効率的なビジュアルワールドモデルプランニングのためのスパースイマジネーションを提案する。
論文 参考訳(メタデータ) (2025-06-02T07:36:14Z) - Unlocking Smarter Device Control: Foresighted Planning with a World Model-Driven Code Execution Approach [82.27842884709378]
本研究では,自然言語理解と構造化推論を優先し,エージェントの環境に対するグローバルな理解を高める枠組みを提案する。
本手法は,従来の手法,特にタスク成功率の44.4%向上を達成している。
論文 参考訳(メタデータ) (2025-05-22T09:08:47Z) - Closed-Loop Long-Horizon Robotic Planning via Equilibrium Sequence Modeling [21.45039811922009]
我々は、均衡に達するまで計画案を反復的に洗練する自己精製スキームを提唱する。
効率的なクローズドループ計画のためのネスト型平衡系列モデリング手法を考案した。
提案手法はVirtualHome-Envベンチマークで評価され,スケーリングw.r.t.推論時間計算の改善による高度な性能を示す。
論文 参考訳(メタデータ) (2024-10-02T11:42:49Z) - Planning as In-Painting: A Diffusion-Based Embodied Task Planning
Framework for Environments under Uncertainty [56.30846158280031]
具体的AIのためのタスクプランニングは、最も難しい問題の1つだ。
In-paintingとしての計画」というタスク非依存の手法を提案する。
提案するフレームワークは,様々な具体的AIタスクにおいて,有望なパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-12-02T10:07:17Z) - STRIPS Action Discovery [67.73368413278631]
近年のアプローチでは、すべての中間状態が欠如している場合でも、アクションモデルを合成する古典的な計画が成功している。
アクションシグネチャが不明な場合に,従来のプランナーを用いてSTRIPSアクションモデルを教師なしで合成するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-01-30T17:08:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。