論文の概要: Value-guided action planning with JEPA world models
- arxiv url: http://arxiv.org/abs/2601.00844v1
- Date: Sun, 28 Dec 2025 20:17:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:21.779017
- Title: Value-guided action planning with JEPA world models
- Title(参考訳): JEPAワールドモデルによる価値誘導型アクションプランニング
- Authors: Matthieu Destrade, Oumayma Bounou, Quentin Le Lidec, Jean Ponce, Yann LeCun,
- Abstract要約: 環境を推論できるディープラーニングモデルを構築するには、その基盤となるダイナミクスをキャプチャする必要がある。
JEPA(Joint-Embeded Predictive Architectures)は、そのようなダイナミクスをモデル化するための有望なフレームワークを提供する。
本稿では,JEPAワールドモデルを用いて,表現空間を形作ることで計画を強化する手法を提案する。
- 参考スコア(独自算出の注目度): 44.84158001773079
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Building deep learning models that can reason about their environment requires capturing its underlying dynamics. Joint-Embedded Predictive Architectures (JEPA) provide a promising framework to model such dynamics by learning representations and predictors through a self-supervised prediction objective. However, their ability to support effective action planning remains limited. We propose an approach to enhance planning with JEPA world models by shaping their representation space so that the negative goal-conditioned value function for a reaching cost in a given environment is approximated by a distance (or quasi-distance) between state embeddings. We introduce a practical method to enforce this constraint during training and show that it leads to significantly improved planning performance compared to standard JEPA models on simple control tasks.
- Abstract(参考訳): 環境を推論できるディープラーニングモデルを構築するには、その基盤となるダイナミクスをキャプチャする必要がある。
JEPA(Joint-Embeded Predictive Architectures)は、自己監督的な予測目標を通じて表現と予測子を学ぶことによって、そのようなダイナミクスをモデル化するための有望なフレームワークを提供する。
しかし、効果的な行動計画を支援する能力は依然として限られている。
本稿では,JEPA世界モデルを用いた計画の強化手法を提案し,その表現空間を定式化し,状態埋め込み間の距離(あるいは準距離)によって,所定の環境における到達コストに対する負の目標条件値関数を近似する。
本稿では,この制約をトレーニング中に実施する実践的手法を導入し,単純な制御タスクにおける標準JEPAモデルと比較して,計画性能を著しく向上させることを示す。
関連論文リスト
- From Forecasting to Planning: Policy World Model for Collaborative State-Action Prediction [57.56072009935036]
政策世界モデル(PWM)と呼ばれる新しい運転パラダイムを導入する。
PWMは、統一アーキテクチャ内での世界モデリングと軌道計画を統合する。
提案手法は,マルチビューおよびマルチモーダル入力に依存する最先端の手法に適合するか,あるいは超越する。
論文 参考訳(メタデータ) (2025-10-22T14:57:51Z) - Reinforced Reasoning for Embodied Planning [18.40186665383579]
身体的計画では、エージェントは動的視覚観察と自然言語の目標に基づいて、一貫性のある多段階決定を行う必要がある。
具体的計画にR1スタイルの推論強化をもたらす強化微調整フレームワークを導入する。
論文 参考訳(メタデータ) (2025-05-28T07:21:37Z) - ACT-JEPA: Novel Joint-Embedding Predictive Architecture for Efficient Policy Representation Learning [90.41852663775086]
ACT-JEPAは模倣学習と自己教師型学習を統合する新しいアーキテクチャである。
我々はアクションシーケンスと抽象的な観察シーケンスを予測するポリシーを訓練する。
実験の結果,ACT-JEPAは時間環境の動的学習によって表現の質を向上させることがわかった。
論文 参考訳(メタデータ) (2025-01-24T16:41:41Z) - Adaptive Planning with Generative Models under Uncertainty [20.922248169620783]
生成モデルによる計画は、幅広い領域にわたる効果的な意思決定パラダイムとして現れてきた。
最新の環境観測に基づいて決定を下すことができるため、各段階での継続的再計画は直感的に思えるかもしれないが、かなりの計算上の課題をもたらす。
本研究は,長軸状態軌跡を予測できる生成モデルの能力を活用する,シンプルな適応計画手法を導入することで,この問題に対処する。
論文 参考訳(メタデータ) (2024-08-02T18:07:53Z) - Interactive Joint Planning for Autonomous Vehicles [19.479300967537675]
対話的な運転シナリオでは、あるエージェントの行動が隣人の行動に大きな影響を及ぼす。
本稿では,MPCを学習予測モデルでブリッジする対話型共同計画(Interactive Joint Planning, IJP)を提案する。
IJPは、共同最適化やサンプリングベースの計画を実行することなく、ベースラインを大幅に上回る。
論文 参考訳(メタデータ) (2023-10-27T17:48:25Z) - DiMSam: Diffusion Models as Samplers for Task and Motion Planning under Partial Observability [58.75803543245372]
タスク・アンド・モーション・プランニング(TAMP)アプローチは多段階自律ロボット操作の計画に適している。
本稿では,TAMPシステムを用いた拡散モデルの構築により,これらの制限を克服することを提案する。
古典的TAMP, 生成モデリング, 潜伏埋め込みの組み合わせによって, 多段階制約に基づく推論が可能となることを示す。
論文 参考訳(メタデータ) (2023-06-22T20:40:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。