論文の概要: Temporal Straightening for Latent Planning
- arxiv url: http://arxiv.org/abs/2603.12231v1
- Date: Thu, 12 Mar 2026 17:49:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-13 14:46:26.270182
- Title: Temporal Straightening for Latent Planning
- Title(参考訳): 潜在計画のための時間的ストレートニング
- Authors: Ying Wang, Oumayma Bounou, Gaoyue Zhou, Randall Balestriero, Tim G. J. Rudner, Yann LeCun, Mengye Ren,
- Abstract要約: 潜時計画のための表現学習を改善するために時間的ストレート化を導入する。
曲率の減少は、ラテント空間におけるユークリッド距離が測地線距離のより良いプロキシとなることを示す。
- 参考スコア(独自算出の注目度): 58.131390107122456
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning good representations is essential for latent planning with world models. While pretrained visual encoders produce strong semantic visual features, they are not tailored to planning and contain information irrelevant -- or even detrimental -- to planning. Inspired by the perceptual straightening hypothesis in human visual processing, we introduce temporal straightening to improve representation learning for latent planning. Using a curvature regularizer that encourages locally straightened latent trajectories, we jointly learn an encoder and a predictor. We show that reducing curvature this way makes the Euclidean distance in latent space a better proxy for the geodesic distance and improves the conditioning of the planning objective. We demonstrate empirically that temporal straightening makes gradient-based planning more stable and yields significantly higher success rates across a suite of goal-reaching tasks.
- Abstract(参考訳): 優れた表現を学ぶことは、世界モデルによる潜在計画に不可欠である。
事前訓練されたビジュアルエンコーダは、強力なセマンティックな視覚的特徴を生み出すが、計画に関係のない(あるいは有害な)情報を含むようには適していない。
人間の視覚処理における知覚的ストレートニング仮説に触発されて,潜時計画のための表現学習を改善するために時間的ストレートニングを導入する。
局所的に直線化された潜在軌道を助長する曲率正規化器を用いて,エンコーダと予測器を共同で学習する。
このように曲率を減少させることで、潜在空間におけるユークリッド距離が測地線距離のより良いプロキシとなり、計画目標の条件付けを改善することが示される。
時間的ストレート化により、勾配に基づく計画がより安定し、目標達成タスクのスイート間で成功率が著しく向上することを示す。
関連論文リスト
- Latent Diffusion Planning for Imitation Learning [78.56207566743154]
Latent Diffusion Planning (LDP) は、プランナーと逆ダイナミクスモデルからなるモジュラーアプローチである。
行動予測からプランニングを分離することにより、LDPは最適なデータと行動自由データのより密集した監視信号の恩恵を受けることができる。
シミュレーションされた視覚ロボット操作タスクにおいて、LDPは最先端の模倣学習アプローチより優れている。
論文 参考訳(メタデータ) (2025-04-23T17:53:34Z) - Planning Transformer: Long-Horizon Offline Reinforcement Learning with Planning Tokens [1.8416014644193066]
本稿では,エージェントの将来について,高レベルかつ長期にわたる情報を含むプランニングトークンについて紹介する。
計画トークンは、解釈可能な計画視覚化とアテンションマップを通じて、モデルのポリシーの解釈可能性を向上させることを実証する。
論文 参考訳(メタデータ) (2024-09-14T19:30:53Z) - PALMER: Perception-Action Loop with Memory for Long-Horizon Planning [1.5469452301122177]
PALMERと呼ばれる汎用計画アルゴリズムを導入する。
Palmerは古典的なサンプリングベースの計画アルゴリズムと学習に基づく知覚表現を組み合わせる。
これにより、表現学習、記憶、強化学習、サンプリングベースの計画の間に、緊密なフィードバックループが生成される。
論文 参考訳(メタデータ) (2022-12-08T22:11:49Z) - Trajectory-Constrained Deep Latent Visual Attention for Improved Local
Planning in Presence of Heterogeneous Terrain [35.12388111707609]
本稿では、地図のない局所的な視覚ナビゲーションタスクにおいて、軌跡制約のある視覚的注意を特徴とする報酬予測型モデルに基づくディープラーニング手法を提案する。
提案手法では,車両制御動作による軌跡に追従する潜在画像空間内の位置に視覚的注意を向けることで,計画中の予測精度を向上させる。
我々は,オフロード環境における低乱流,無衝突軌道の計画,滑りやすい地形下でのロック差のある丘登りといった視覚ナビゲーションタスクにおいて,我々のモデルを検証した。
論文 参考訳(メタデータ) (2021-12-09T03:38:28Z) - Model-Based Reinforcement Learning via Latent-Space Collocation [110.04005442935828]
我々は、行動だけでなく、状態の順序を計画することで、長期的タスクの解決がより容易であると主張する。
我々は、学習された潜在状態空間モデルを利用して、画像に基づく設定に最適な制御文献における長い水平タスクに対する良い結果を示すコロケーションの概念を適応させる。
論文 参考訳(メタデータ) (2021-06-24T17:59:18Z) - Long-Horizon Visual Planning with Goal-Conditioned Hierarchical
Predictors [124.30562402952319]
未来に予測し、計画する能力は、世界で行動するエージェントにとって基本である。
視覚的予測と計画のための現在の学習手法は、長期的タスクでは失敗する。
本稿では,これらの制約を克服可能な視覚的予測と計画のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-23T17:58:56Z) - The Importance of Prior Knowledge in Precise Multimodal Prediction [71.74884391209955]
道路にはよく定義された地形、地形、交通規則がある。
本稿では,構造的事前を損失関数として組み込むことを提案する。
実世界の自動運転データセットにおけるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2020-06-04T03:56:11Z) - Plan2Vec: Unsupervised Representation Learning by Latent Plans [106.37274654231659]
Plan2vecは、強化学習にインスパイアされた教師なしの表現学習手法である。
Plan2vecは、近距離を用いて画像データセット上に重み付きグラフを構築し、その局所距離を、計画された経路上の経路積分を蒸留することによって、大域的な埋め込みに外挿する。
1つのシミュレーションと2つの実世界の画像データセットに対する Plan2vec の有効性を実証する。
論文 参考訳(メタデータ) (2020-05-07T17:52:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。