論文の概要: Dream to Drive with Predictive Individual World Model
- arxiv url: http://arxiv.org/abs/2501.16733v1
- Date: Tue, 28 Jan 2025 06:18:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-29 16:41:59.147594
- Title: Dream to Drive with Predictive Individual World Model
- Title(参考訳): 予測的世界モデルで運転する夢
- Authors: Yinfeng Gao, Qichao Zhang, Da-wei Ding, Dongbin Zhao,
- Abstract要約: 本稿では,自律運転のための予測的個別世界モデル(PIWM)を用いたモデルベース強化学習(MBRL)手法を提案する。
PIWMは、運転環境を個人レベルで記述し、車両の対話的関係と意図を捉える。
PIWMの想像力で訓練され、意図を意識した潜伏状態を活用する都市運転シーンで効果的にナビゲートする。
- 参考スコア(独自算出の注目度): 12.05377034777257
- License:
- Abstract: It is still a challenging topic to make reactive driving behaviors in complex urban environments as road users' intentions are unknown. Model-based reinforcement learning (MBRL) offers great potential to learn a reactive policy by constructing a world model that can provide informative states and imagination training. However, a critical limitation in relevant research lies in the scene-level reconstruction representation learning, which may overlook key interactive vehicles and hardly model the interactive features among vehicles and their long-term intentions. Therefore, this paper presents a novel MBRL method with a predictive individual world model (PIWM) for autonomous driving. PIWM describes the driving environment from an individual-level perspective and captures vehicles' interactive relations and their intentions via trajectory prediction task. Meanwhile, a behavior policy is learned jointly with PIWM. It is trained in PIWM's imagination and effectively navigates in the urban driving scenes leveraging intention-aware latent states. The proposed method is trained and evaluated on simulation environments built upon real-world challenging interactive scenarios. Compared with popular model-free and state-of-the-art model-based reinforcement learning methods, experimental results show that the proposed method achieves the best performance in terms of safety and efficiency.
- Abstract(参考訳): 道路利用者の意図が分かっていないため、複雑な都市環境において、リアクティブな運転行動を行うことは依然として難しいトピックである。
モデルベース強化学習(MBRL)は、情報的状態と想像力トレーニングを提供する世界モデルを構築することにより、リアクティブなポリシーを学ぶ大きな可能性を提供する。
しかし、関連する研究における重要な制限は、シーンレベルの再構築表現学習であり、重要な対話型車両を見落とし、車両間の対話的特徴とその長期的な意図をモデル化することができない。
そこで本研究では,自律運転のための予測的個別世界モデル(PIWM)を用いた新しいMBRL手法を提案する。
PIWMは、個人レベルでの運転環境を記述し、軌道予測タスクを通じて車両の対話的関係と意図をキャプチャする。
一方、行動方針はPIWMと共同で学習される。
PIWMの想像力で訓練され、意図を意識した潜伏状態を活用する都市運転シーンで効果的にナビゲートする。
提案手法は,現実の対話的シナリオに基づいて構築されたシミュレーション環境上での学習と評価を行う。
モデルフリーおよび最先端のモデルベース強化学習法と比較して,提案手法が安全性と効率の面で最高の性能を発揮することを示す実験結果が得られた。
関連論文リスト
- A Survey of World Models for Autonomous Driving [63.33363128964687]
自律運転の最近の進歩は、堅牢な世界モデリングの進歩によって推進されている。
本稿では、自律運転の世界モデルにおける最近の進歩を体系的にレビューする。
論文 参考訳(メタデータ) (2025-01-20T04:00:02Z) - Probing Multimodal LLMs as World Models for Driving [72.18727651074563]
自律運転におけるMLLM(Multimodal Large Language Models)の適用について検討する。
GPT-4oのようなモデルの開発は進んでいるが、複雑な運転環境における性能は未解明のままである。
論文 参考訳(メタデータ) (2024-05-09T17:52:42Z) - A Cognitive-Based Trajectory Prediction Approach for Autonomous Driving [21.130543517747995]
本稿では,教師による知識蒸留の枠組みを取り入れたHuman-Like Trajectory Prediction (H)モデルを提案する。
教師」モデルは人間の脳、特に後頭葉と側頭葉の機能の視覚的処理を模倣する。
学生」モデルはリアルタイムのインタラクションと意思決定に焦点を合わせ、正確な予測のために重要な知覚的手がかりを捉えます。
論文 参考訳(メタデータ) (2024-02-29T15:22:26Z) - Model-Based Reinforcement Learning with Isolated Imaginations [61.67183143982074]
モデルに基づく強化学習手法であるIso-Dream++を提案する。
我々は、切り離された潜在的想像力に基づいて政策最適化を行う。
これにより、野生の混合力学源を孤立させることで、長い水平振動子制御タスクの恩恵を受けることができる。
論文 参考訳(メタデータ) (2023-03-27T02:55:56Z) - CADRE: A Cascade Deep Reinforcement Learning Framework for Vision-based
Autonomous Urban Driving [43.269130988225605]
複雑な都市環境と運転行動のダイナミクスのため、高密度交通における視覚に基づく自律走行は極めて困難である。
本稿では,モデルフリーな視覚に基づく自律型都市走行を実現するために,新しいCAscade Deep Reinforcement LearningフレームワークCADREを提案する。
論文 参考訳(メタデータ) (2022-02-17T10:07:16Z) - Learning Interactive Driving Policies via Data-driven Simulation [125.97811179463542]
データ駆動シミュレータは、ポリシー学習の駆動に高いデータ効率を約束する。
小さな基盤となるデータセットは、インタラクティブな運転を学ぶための興味深い、挑戦的なエッジケースを欠いていることが多い。
本研究では,ロバストな運転方針の学習に塗装されたアドカーを用いたシミュレーション手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T20:14:02Z) - Objective-aware Traffic Simulation via Inverse Reinforcement Learning [31.26257563160961]
逆強化学習問題として交通シミュレーションを定式化する。
動的ロバストシミュレーション学習のためのパラメータ共有逆強化学習モデルを提案する。
提案モデルでは,実世界の車両の軌道を模倣し,同時に報酬関数を復元することができる。
論文 参考訳(メタデータ) (2021-05-20T07:26:34Z) - Learning to drive from a world on rails [78.28647825246472]
モデルベースアプローチによって,事前記録された運転ログからインタラクティブな視覚ベースの運転方針を学習する。
世界の前方モデルは、あらゆる潜在的な運転経路の結果を予測する運転政策を監督する。
提案手法は,carla リーダボードにまずランク付けし,40 倍少ないデータを用いて25%高い運転スコアを得た。
論文 参考訳(メタデータ) (2021-05-03T05:55:30Z) - Bridging Imagination and Reality for Model-Based Deep Reinforcement
Learning [72.18725551199842]
BrIdging Reality and Dream (BIRD) と呼ばれる新しいモデルに基づく強化学習アルゴリズムを提案する。
虚構と実軌跡の相互情報を最大化し、虚構から学んだ政策改善を実軌跡に容易に一般化できるようにする。
提案手法は, モデルベース計画のサンプル効率を向上し, 挑戦的なビジュアル制御ベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2020-10-23T03:22:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。