論文の概要: LOPR: Latent Occupancy PRediction using Generative Models
- arxiv url: http://arxiv.org/abs/2210.01249v1
- Date: Mon, 3 Oct 2022 22:04:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 15:08:38.327724
- Title: LOPR: Latent Occupancy PRediction using Generative Models
- Title(参考訳): LOPR:ジェネレーティブモデルを用いた潜伏作業適応
- Authors: Bernard Lange, Masha Itkina, Mykel J. Kochenderfer
- Abstract要約: 本稿では,占有格子予測をタスク非依存の低次元表現学習と潜在空間におけるタスク依存の予測に分解するフレームワークを提案する。
我々は,実世界の自動運転データセットであるNuScenesの最先端性能を実証する。
- 参考スコア(独自算出の注目度): 42.99955259272639
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Environment prediction frameworks are essential for autonomous vehicles to
facilitate safe maneuvers in a dynamic environment. Previous approaches have
used occupancy grid maps as a bird's eye-view representation of the scene and
optimized the prediction architectures directly in pixel space. Although these
methods have had some success in spatiotemporal prediction, they are, at times,
hindered by unrealistic and incorrect predictions. We postulate that the
quality and realism of the forecasted occupancy grids can be improved with the
use of generative models. We propose a framework that decomposes occupancy grid
prediction into task-independent low-dimensional representation learning and
task-dependent prediction in the latent space. We demonstrate that our approach
achieves state-of-the-art performance on the real-world autonomous driving
dataset, NuScenes.
- Abstract(参考訳): 環境予測フレームワークは、自動運転車が動的環境における安全な操作を容易にするために不可欠である。
以前のアプローチでは、鳥の視点によるシーンの表現として占有グリッドマップを使用し、ピクセル空間内で直接予測アーキテクチャを最適化した。
これらの手法は時空間予測に多少成功したが、時には非現実的で誤った予測によって妨げられている。
予測された占有グリッドの品質とリアリズムは生成モデルを用いることで改善できると仮定した。
潜在空間におけるタスク非依存な低次元表現学習とタスク依存予測に占有グリッド予測を分解するフレームワークを提案する。
我々は,実世界の自動運転データセットであるNuScenesの最先端性能を実証した。
関連論文リスト
- OPUS: Occupancy Prediction Using a Sparse Set [64.60854562502523]
学習可能なクエリの集合を用いて、占有された場所とクラスを同時に予測するフレームワークを提案する。
OPUSには、モデルパフォーマンスを高めるための非自明な戦略が組み込まれている。
最も軽量なモデルではOcc3D-nuScenesデータセットの2倍 FPS に優れたRayIoUが得られる一方、最も重いモデルは6.1 RayIoUを上回ります。
論文 参考訳(メタデータ) (2024-09-14T07:44:22Z) - Self-supervised Multi-future Occupancy Forecasting for Autonomous Driving [45.886941596233974]
LiDARで生成された占有グリッドマップ(L-OGM)は、シーン表現のための頑丈な鳥眼ビューを提供する。
提案するフレームワークは、生成アーキテクチャの潜在空間においてL-OGM予測を行う。
我々は、リアルタイムに高品質な予測を提供するシングルステップデコーダまたは拡散ベースのバッチデコーダを用いて予測をデコードする。
論文 参考訳(メタデータ) (2024-07-30T18:37:59Z) - Vehicle Motion Forecasting using Prior Information and Semantic-assisted
Occupancy Grid Maps [6.99274104609965]
運動は、センサーデータの不確実性、未来の非決定論的性質、複雑な振る舞いによって、自動運転車にとって困難なタスクである。
本稿では,シーンを動的占有グリッドマップ(DOGM)として表現することで,この問題に対処する。
本研究では,車両の挙動を予測するための時間的および確率的アプローチを組み合わせた新しい枠組みを提案する。
論文 参考訳(メタデータ) (2023-08-08T14:49:44Z) - Conditioned Human Trajectory Prediction using Iterative Attention Blocks [70.36888514074022]
本研究では,都市環境における歩行者位置予測を目的とした,簡易かつ効果的な歩行者軌道予測モデルを提案する。
我々のモデルは、複数のアテンションブロックとトランスフォーマーを反復的に実行できるニューラルネットワークアーキテクチャである。
ソーシャルマスク, 動的モデル, ソーシャルプーリング層, 複雑なグラフのような構造を明示的に導入することなく, SoTAモデルと同等の結果が得られることを示す。
論文 参考訳(メタデータ) (2022-06-29T07:49:48Z) - Predicting Future Occupancy Grids in Dynamic Environment with
Spatio-Temporal Learning [63.25627328308978]
本稿では,将来の占有予測を生成するための時間的予測ネットワークパイプラインを提案する。
現在のSOTAと比較して、我々の手法は3秒の長い水平線での占有を予測している。
我々は、さらなる研究を支援するために、nulisに基づくグリッド占有データセットを公開します。
論文 参考訳(メタデータ) (2022-05-06T13:45:32Z) - SLPC: a VRNN-based approach for stochastic lidar prediction and
completion in autonomous driving [63.87272273293804]
VRNN(Variiational Recurrent Neural Networks)と呼ばれる生成モデルに基づく新しいLiDAR予測フレームワークを提案する。
提案手法は,フレーム内の奥行きマップを空間的に塗り替えることで,スパースデータを扱う際の従来のビデオ予測フレームワークの限界に対処できる。
VRNNのスパースバージョンとラベルを必要としない効果的な自己監督型トレーニング方法を紹介します。
論文 参考訳(メタデータ) (2021-02-19T11:56:44Z) - Spatio-Temporal Graph Dual-Attention Network for Multi-Agent Prediction
and Tracking [23.608125748229174]
異種エージェントを含む多エージェント軌道予測のための汎用生成ニューラルシステムを提案する。
提案システムは, 軌道予測のための3つのベンチマークデータセット上で評価される。
論文 参考訳(メタデータ) (2021-02-18T02:25:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。