論文の概要: Long-Horizon Visual Planning with Goal-Conditioned Hierarchical
Predictors
- arxiv url: http://arxiv.org/abs/2006.13205v2
- Date: Fri, 27 Nov 2020 22:34:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-17 21:25:09.796065
- Title: Long-Horizon Visual Planning with Goal-Conditioned Hierarchical
Predictors
- Title(参考訳): ゴールコンディション付き階層型予測器を用いた長期視覚計画
- Authors: Karl Pertsch, Oleh Rybkin, Frederik Ebert, Chelsea Finn, Dinesh
Jayaraman, Sergey Levine
- Abstract要約: 未来に予測し、計画する能力は、世界で行動するエージェントにとって基本である。
視覚的予測と計画のための現在の学習手法は、長期的タスクでは失敗する。
本稿では,これらの制約を克服可能な視覚的予測と計画のためのフレームワークを提案する。
- 参考スコア(独自算出の注目度): 124.30562402952319
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The ability to predict and plan into the future is fundamental for agents
acting in the world. To reach a faraway goal, we predict trajectories at
multiple timescales, first devising a coarse plan towards the goal and then
gradually filling in details. In contrast, current learning approaches for
visual prediction and planning fail on long-horizon tasks as they generate
predictions (1) without considering goal information, and (2) at the finest
temporal resolution, one step at a time. In this work we propose a framework
for visual prediction and planning that is able to overcome both of these
limitations. First, we formulate the problem of predicting towards a goal and
propose the corresponding class of latent space goal-conditioned predictors
(GCPs). GCPs significantly improve planning efficiency by constraining the
search space to only those trajectories that reach the goal. Further, we show
how GCPs can be naturally formulated as hierarchical models that, given two
observations, predict an observation between them, and by recursively
subdividing each part of the trajectory generate complete sequences. This
divide-and-conquer strategy is effective at long-term prediction, and enables
us to design an effective hierarchical planning algorithm that optimizes
trajectories in a coarse-to-fine manner. We show that by using both
goal-conditioning and hierarchical prediction, GCPs enable us to solve visual
planning tasks with much longer horizon than previously possible.
- Abstract(参考訳): 未来に予測し、計画する能力は、世界で行動するエージェントにとって基本である。
遠方の目標を達成するために,まず目標に向けて粗い計画を考案し,さらに詳細を徐々に記入する軌道を複数の時間スケールで予測する。
対照的に、視覚的予測と計画のための現在の学習アプローチは、(1)目標情報を考慮せずに予測し、(2)最高の時間分解能では、一度に1ステップずつ、長い水平タスクで失敗する。
本研究では,これらの制約を克服可能な視覚的予測と計画のためのフレームワークを提案する。
まず,目標に向かって予測する問題を定式化し,それに対応する潜在空間目標条件予測器(gcps)を提案する。
GCPは、目標に達する軌道のみに検索スペースを制約することで、計画の効率を大幅に改善する。
さらに,2つの観測から観測結果を予測し,軌道の各部分を再帰的に分割することにより,gcpを階層モデルとして自然に定式化することができることを示す。
この分割・分割戦略は, 長期予測に有効であり, 粗大から細かな方法で軌道を最適化する効率的な階層計画アルゴリズムを設計できる。
目標条件と階層予測の両方を使用することで、GCPは以前よりもはるかに長い視野で視覚的な計画タスクを解決できることを示す。
関連論文リスト
- Propose, Assess, Search: Harnessing LLMs for Goal-Oriented Planning in Instructional Videos [48.15438373870542]
VidAssistは、インストラクショナルビデオにおけるゼロ/フェーショット目標指向の計画のために設計された統合フレームワークである。
最適な計画生成のための幅優先探索アルゴリズムを採用している。
実験によると、VidAssistは異なる目標指向の計画設定のための統一されたフレームワークを提供する。
論文 参考訳(メタデータ) (2024-09-30T17:57:28Z) - Progressive Pretext Task Learning for Human Trajectory Prediction [44.07301075351432]
本稿では,PPT(Progressive Pretext Task Learning)フレームワークについて紹介する。
トランスフォーマーを用いたトラジェクトリ予測器を設計し,高効率な2段階推論を実現する。
論文 参考訳(メタデータ) (2024-07-16T10:48:18Z) - G2LTraj: A Global-to-Local Generation Approach for Trajectory Prediction [23.181232260820373]
軌道予測のためのグローバル・ローカルな生成手法であるG2LTrajを提案する。
私たちは、将来の時間範囲全体を均一にカバーする一連のグローバルなキーステップを生成します。
このようにして、累積誤差が隣接するキーステップを超えて伝播するのを防ぐ。
論文 参考訳(メタデータ) (2024-04-30T07:53:34Z) - Imitating Graph-Based Planning with Goal-Conditioned Policies [72.61631088613048]
本稿では,目標目標条件ポリシにサブゴール条件ポリシを蒸留する自己シミュレーション方式を提案する。
提案手法は,既存の目標条件付きRL手法のサンプル効率を大幅に向上させることができることを実証的に示す。
論文 参考訳(メタデータ) (2023-03-20T14:51:10Z) - PALMER: Perception-Action Loop with Memory for Long-Horizon Planning [1.5469452301122177]
PALMERと呼ばれる汎用計画アルゴリズムを導入する。
Palmerは古典的なサンプリングベースの計画アルゴリズムと学習に基づく知覚表現を組み合わせる。
これにより、表現学習、記憶、強化学習、サンプリングベースの計画の間に、緊密なフィードバックループが生成される。
論文 参考訳(メタデータ) (2022-12-08T22:11:49Z) - DenseTNT: End-to-end Trajectory Prediction from Dense Goal Sets [29.239524389784606]
DenseTNTと呼ばれるアンカーフリーかつエンドツーエンドの軌道予測モデルを提案し、高密度な目標候補から一連の軌道を直接出力する。
DenseTNTは最先端のパフォーマンスを達成し、Argoverseのモーション予測ベンチマークで1位、2021年のオープンモーション予測チャレンジで1位を獲得した。
論文 参考訳(メタデータ) (2021-08-22T05:27:35Z) - Model-Based Reinforcement Learning via Latent-Space Collocation [110.04005442935828]
我々は、行動だけでなく、状態の順序を計画することで、長期的タスクの解決がより容易であると主張する。
我々は、学習された潜在状態空間モデルを利用して、画像に基づく設定に最適な制御文献における長い水平タスクに対する良い結果を示すコロケーションの概念を適応させる。
論文 参考訳(メタデータ) (2021-06-24T17:59:18Z) - From Goals, Waypoints & Paths To Long Term Human Trajectory Forecasting [54.273455592965355]
将来の軌道の不確実性は、(a)エージェントに知られているが、モデルに未知な情報源、例えば長期目標や(b)エージェントとモデルの両方に未知な情報源、例えば他のエージェントの意図や既約乱数不確定性などである。
我々は,長期目標における多モータリティと,経路ポイントや経路における多モータリティによるアレタリック不確実性を通じて,てんかん不確かさをモデル化する。
また,この二分法を実証するために,従来の作業よりも1分間,桁長の予測地平線を有する,新しい長期軌跡予測設定を提案する。
論文 参考訳(メタデータ) (2020-12-02T21:01:29Z) - Goal-driven Long-Term Trajectory Prediction [30.054850639996033]
本稿では,歩行者の目標を決定する仮説的プロセスと,そのプロセスが長期的将来の軌道に与える影響をモデル化することを提案する。
このような直感を実現するデュアルチャネルニューラルネットワークであるゴール駆動軌道予測モデルを設計する。
モデルは様々な環境で、特に大きな予測地平線において、最先端のモデルよりも優れていることが示されている。
論文 参考訳(メタデータ) (2020-11-05T10:47:33Z) - The Importance of Prior Knowledge in Precise Multimodal Prediction [71.74884391209955]
道路にはよく定義された地形、地形、交通規則がある。
本稿では,構造的事前を損失関数として組み込むことを提案する。
実世界の自動運転データセットにおけるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2020-06-04T03:56:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。