論文の概要: FF-JEPA: Long-Horizon Planning in World Models with Latent Planners
- arxiv url: http://arxiv.org/abs/2606.09311v1
- Date: Mon, 08 Jun 2026 10:16:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.923065
- Title: FF-JEPA: Long-Horizon Planning in World Models with Latent Planners
- Title(参考訳): FF-JEPA:レイトプランナーを持つ世界モデルにおける長期計画
- Authors: Sergi Masip, Jonathan Swinnen, Yutong Hu, Renaud Detry, Tinne Tuytelaars,
- Abstract要約: JEPA(Joint Embedding Predictive Architectures)は、将来性のある世界モデリング機能を示している。
2つのフォワードダイナミクスモデルを利用した階層的アプローチであるフォワード・フォワード・JEPA(FF-JEPA)を提案する。
PushTの予備的な結果は、FF-JEPAが平らな世界モデルの長い水平崩壊を乗り越えることに成功したことを示している。
- 参考スコア(独自算出の注目度): 30.722155570120766
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Joint Embedding Predictive Architectures (JEPAs) have shown promising world modeling capabilities, enabling planning in latent space by optimizing action trajectories using methods like the Cross-Entropy Method (CEM). These methods are, however, too computationally expensive and ineffective for long-horizon planning. Furthermore, these methods typically require an explicit image of the goal state, which is not always possible in real-world tasks. In this work, we tackle these limitations by proposing Forward-Forward-JEPA (FF-JEPA), a hierarchical approach leveraging two forward dynamics models. Alongside a standard action-conditioned forward model, we introduce an action-free latent planner that predicts the next subgoal given the current state. This approach removes the need for goal images and enables long-horizon planning by decomposing complex trajectories into a sequence of tractable, short-term optimization problems. Preliminary results on PushT demonstrate that FF-JEPA successfully overcomes flat world models' long-horizon collapse, highlighting this approach as a promising direction for goal-free planning.
- Abstract(参考訳): JEPA(Joint Embedding Predictive Architectures)は、CEM(Cross-Entropy Method)のような手法を用いてアクショントラジェクトリを最適化することで、潜在空間での計画を可能にする、有望な世界モデリング能力を示している。
しかし、これらの手法は計算コストがかかりすぎて、長期計画には効果がない。
さらに、これらの手法は一般にゴール状態の明示的なイメージを必要とするが、これは現実世界のタスクでは必ずしも可能ではない。
本研究では,2つのフォワードダイナミクスモデルを利用した階層的アプローチであるフォワード・フォワード・JEPA(FF-JEPA)を提案する。
標準アクション条件フォワードモデルとともに、現在の状態から次のサブゴールを予測するアクションフリー潜在プランナーを導入する。
このアプローチは、ゴール画像の必要性を排除し、複雑な軌跡をトラクタブルで短期的な最適化問題に分解することで、長期計画を可能にする。
PushTの予備的な結果は、FF-JEPAがフラットワールドモデルの長期的崩壊を乗り越えることに成功し、このアプローチをゴールフリープランニングの有望な方向として強調している。
関連論文リスト
- Hierarchical Planning with Latent World Models [49.82095442483551]
階層的計画は、最大4倍の計画時間計算を必要としながら、より高い成功を達成する。
この階層的なアプローチにより、現実世界の非グリーディロボットタスクをゼロショットで制御できることを実証する。
論文 参考訳(メタデータ) (2026-04-03T17:32:36Z) - Value-guided action planning with JEPA world models [44.84158001773079]
環境を推論できるディープラーニングモデルを構築するには、その基盤となるダイナミクスをキャプチャする必要がある。
JEPA(Joint-Embeded Predictive Architectures)は、そのようなダイナミクスをモデル化するための有望なフレームワークを提供する。
本稿では,JEPAワールドモデルを用いて,表現空間を形作ることで計画を強化する手法を提案する。
論文 参考訳(メタデータ) (2025-12-28T20:17:49Z) - Closing the Train-Test Gap in World Models for Gradient-Based Planning [64.36544881136405]
本研究では,効率的な勾配計画を可能にする世界モデルの学習方法を提案する。
テスト時には,古典的勾配のないクロスエントロピー法よりも優れた手法が提案される。
論文 参考訳(メタデータ) (2025-12-10T18:59:45Z) - Deep Active Inference Agents for Delayed and Long-Horizon Environments [1.693200946453174]
AIFエージェントは、遅れた環境で悪化する制限である正確な即時予測と徹底的な計画に依存している。
本稿では,複数段階の遅延遷移を特徴とする生成型政治アーキテクチャを提案する。
我々は,遅延と長期化の設定で現実的な産業シナリオを模倣した環境におけるエージェントの評価を行った。
論文 参考訳(メタデータ) (2025-05-26T11:50:22Z) - Extendable Long-Horizon Planning via Hierarchical Multiscale Diffusion [62.91968752955649]
本稿では,学習データよりも長い軌道計画を行うための,拡張可能な長期計画支援エージェントの課題に対処する。
より短いものを縫い合わせることで、より長い軌跡を反復的に生成する拡張法を提案する。
HM-ディフューザーは階層構造を用いてこれらの拡張軌道を訓練し、複数の時間スケールにわたるタスクを効率的に処理する。
論文 参考訳(メタデータ) (2025-03-25T22:52:46Z) - Plan-and-Act: Improving Planning of Agents for Long-Horizon Tasks [36.63527489464188]
Plan-and-Actは、大規模言語モデル(LLM)に明示的なプランニングを組み込んだフレームワークである。
Plan-and-Actは、ユーザ目標を達成するための構造化された高レベルのプランを生成するPlannerモデルと、これらのプランを環境固有のアクションに変換するExecutorモデルで構成される。
We present a state-of-the-art 57.58% success rate on the WebArena-Lite benchmark and a text-only state-of-the-art 81.36% success rate on WebVoyager。
論文 参考訳(メタデータ) (2025-03-12T17:40:52Z) - Model-Based Reinforcement Learning via Latent-Space Collocation [110.04005442935828]
我々は、行動だけでなく、状態の順序を計画することで、長期的タスクの解決がより容易であると主張する。
我々は、学習された潜在状態空間モデルを利用して、画像に基づく設定に最適な制御文献における長い水平タスクに対する良い結果を示すコロケーションの概念を適応させる。
論文 参考訳(メタデータ) (2021-06-24T17:59:18Z) - Long-Horizon Visual Planning with Goal-Conditioned Hierarchical
Predictors [124.30562402952319]
未来に予測し、計画する能力は、世界で行動するエージェントにとって基本である。
視覚的予測と計画のための現在の学習手法は、長期的タスクでは失敗する。
本稿では,これらの制約を克服可能な視覚的予測と計画のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-23T17:58:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。