論文の概要: Addressing Limitations of State-Aware Imitation Learning for Autonomous
Driving
- arxiv url: http://arxiv.org/abs/2310.20650v1
- Date: Tue, 31 Oct 2023 17:21:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-01 13:49:14.754591
- Title: Addressing Limitations of State-Aware Imitation Learning for Autonomous
Driving
- Title(参考訳): 自律運転における状態認識模倣学習の限界
- Authors: Luca Cultrera, Federico Becattini, Lorenzo Seidenari, Pietro Pala,
Alberto Del Bimbo
- Abstract要約: 状態トークンの伝搬を伴う多段階視覚変換器に基づくマルチタスク学習エージェントを提案する。
我々は、慣性度が大幅に低下し、オフラインとオンラインのメトリクスの間に高い相関関係があることを報告した。
- 参考スコア(独自算出の注目度): 31.207177674869133
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Conditional Imitation learning is a common and effective approach to train
autonomous driving agents. However, two issues limit the full potential of this
approach: (i) the inertia problem, a special case of causal confusion where the
agent mistakenly correlates low speed with no acceleration, and (ii) low
correlation between offline and online performance due to the accumulation of
small errors that brings the agent in a previously unseen state. Both issues
are critical for state-aware models, yet informing the driving agent of its
internal state as well as the state of the environment is of crucial
importance. In this paper we propose a multi-task learning agent based on a
multi-stage vision transformer with state token propagation. We feed the state
of the vehicle along with the representation of the environment as a special
token of the transformer and propagate it throughout the network. This allows
us to tackle the aforementioned issues from different angles: guiding the
driving policy with learned stop/go information, performing data augmentation
directly on the state of the vehicle and visually explaining the model's
decisions. We report a drastic decrease in inertia and a high correlation
between offline and online metrics.
- Abstract(参考訳): 条件付き模倣学習は、自律運転エージェントを訓練するための一般的かつ効果的なアプローチである。
しかし、2つの問題はこのアプローチの完全な可能性を制限する。
(i)慣性問題、エージェントが低速と加速度を誤って関連付ける因果混同の特別な場合、及び
(II) エージェントが未確認状態に陥る小さなエラーの蓄積によるオフラインとオンラインのパフォーマンスの相関が低いこと。
どちらの問題も状態認識モデルにとって重要であるが、内部状態の駆動エージェントと環境の状態を知らせることは非常に重要である。
本稿では,状態トークン伝搬を用いた多段階視覚変換器に基づくマルチタスク学習エージェントを提案する。
我々は、トランスフォーマーの特別なトークンとして環境の表現と共に車両の状態を供給し、それをネットワーク全体に伝播する。
これにより、学習したストップ/ゴー情報で運転方針を導くこと、車両の状態に直接データ拡張を行い、モデルの決定を視覚的に説明すること、など、さまざまな角度から上記の問題に取り組むことができます。
我々は、慣性が大幅に減少し、オフラインとオンラインの指標の相関が高いことを報告した。
関連論文リスト
- Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models [60.87795376541144]
World Model(ワールドモデル)は、エージェントの次の状態を予測できるニューラルネットワークである。
エンド・ツー・エンドのトレーニングでは、人間のデモで観察された状態と整合してエラーから回復する方法を学ぶ。
クローズドループ試験における先行技術に有意な改善がみられた定性的,定量的な結果を示す。
論文 参考訳(メタデータ) (2024-09-25T06:48:25Z) - Reinforcement Learning with Latent State Inference for Autonomous On-ramp Merging under Observation Delay [6.0111084468944]
遅延状態推論・安全制御(L3IS)エージェントを用いたレーンキーピング・レーンチェンジについて紹介する。
L3ISは、周囲の車両の意図や運転スタイルに関する包括的な知識を必要とせずに、オンランプのマージ作業を安全に行うように設計されている。
本稿では,観測遅延を考慮に入れたAL3ISというエージェントを改良し,実環境においてより堅牢な決定を行えるようにした。
論文 参考訳(メタデータ) (2024-03-18T15:02:46Z) - RAG-Driver: Generalisable Driving Explanations with Retrieval-Augmented In-Context Learning in Multi-Modal Large Language Model [22.25903116720301]
説明責任は、信頼できる自律的な意思決定において重要な役割を果たす。
MLLM(Multi-Modal Large Language Model)の最近の進歩は、駆動エージェントとしての説明可能性を高める有望な可能性を示している。
提案するRAG-Driverは,高機能,説明性,一般化可能な自律運転にコンテキスト内学習を活用する,検索強化型多モード大言語モデルである。
論文 参考訳(メタデータ) (2024-02-16T16:57:18Z) - Interactive Autonomous Navigation with Internal State Inference and
Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。
これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。
提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-11-27T18:57:42Z) - Decision Making for Autonomous Driving in Interactive Merge Scenarios
via Learning-based Prediction [39.48631437946568]
本稿では,他のドライバの動作から不確実性が生ずる移動トラフィックにマージする複雑なタスクに焦点を当てる。
我々はこの問題を部分的に観測可能なマルコフ決定プロセス(POMDP)とみなし、モンテカルロ木探索でオンラインに解決する。
POMDPの解決策は、接近する車に道を譲る、前方の車から安全な距離を維持する、あるいは交通に合流するといった、高いレベルの運転操作を行う政策である。
論文 参考訳(メタデータ) (2023-03-29T16:12:45Z) - Penalty-Based Imitation Learning With Cross Semantics Generation Sensor
Fusion for Autonomous Driving [1.2749527861829049]
本稿では,複数の情報モダリティを統合するために,ペナルティに基づく模倣学習手法を提案する。
最新技術(SOTA)モデルであるInterFuserと比較して,運転スコアが12%以上増加していることが観察された。
本モデルでは, 推論速度を7倍に向上し, モデルサイズを約30%削減しながら, この性能向上を実現している。
論文 参考訳(メタデータ) (2023-03-21T14:29:52Z) - Learning energy-efficient driving behaviors by imitating experts [75.12960180185105]
本稿では,コミュニケーション・センシングにおける制御戦略と現実的限界のギャップを埋める上で,模倣学習が果たす役割について考察する。
擬似学習は、車両の5%に採用されれば、局地的な観測のみを用いて、交通条件の異なるネットワークのエネルギー効率を15%向上させる政策を導出できることを示す。
論文 参考訳(メタデータ) (2022-06-28T17:08:31Z) - COOPERNAUT: End-to-End Driving with Cooperative Perception for Networked
Vehicles [54.61668577827041]
本稿では,車間認識を用いたエンドツーエンド学習モデルであるCOOPERNAUTを紹介する。
われわれのAutoCastSim実験は、我々の協調知覚駆動モデルが平均成功率を40%向上させることを示唆している。
論文 参考訳(メタデータ) (2022-05-04T17:55:12Z) - Multi-Modal Fusion Transformer for End-to-End Autonomous Driving [59.60483620730437]
画像表現とLiDAR表現を注目で統合する,新しいマルチモードフュージョントランスフォーマであるTransFuserを提案する。
本手法は, 衝突を76%低減しつつ, 最先端駆動性能を実現する。
論文 参考訳(メタデータ) (2021-04-19T11:48:13Z) - Learning to Communicate and Correct Pose Errors [75.03747122616605]
本稿では、V2VNetで提案された設定について検討し、近くにある自動運転車が共同で物体検出と動き予測を協調的に行う方法を提案する。
本稿では,コミュニケーションを学習し,潜在的な誤りを推定し,それらの誤りについてコンセンサスを得るための新しいニューラルネットワーク推論フレームワークを提案する。
論文 参考訳(メタデータ) (2020-11-10T18:19:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。