論文の概要: Autonomous vehicle decision and control through reinforcement learning
with traffic flow randomization
- arxiv url: http://arxiv.org/abs/2403.02882v1
- Date: Tue, 5 Mar 2024 11:41:43 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-06 15:09:10.453123
- Title: Autonomous vehicle decision and control through reinforcement learning
with traffic flow randomization
- Title(参考訳): 交通流ランダム化による強化学習による自動車両決定と制御
- Authors: Yuan Lin, Antai Xie, Xiao Liu
- Abstract要約: 本研究では, 車両追従モデルのパラメータとルールに基づく微視的交通流の車線変化モデルのパラメータをランダム化することにより, 周囲の車両の運転形態と挙動をランダム化する手法を提案する。
提案手法は, 領域ランダム化されたルールベース微視的トラフィックフローとマージシーンを併用し, ルールベース微視的トラフィックフローと高忠実性微視的トラフィックフローで個別にテストした。
- 参考スコア(独自算出の注目度): 5.863853465875718
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most of the current studies on autonomous vehicle decision-making and control
tasks based on reinforcement learning are conducted in simulated environments.
The training and testing of these studies are carried out under rule-based
microscopic traffic flow, with little consideration of migrating them to real
or near-real environments to test their performance. It may lead to a
degradation in performance when the trained model is tested in more realistic
traffic scenes. In this study, we propose a method to randomize the driving
style and behavior of surrounding vehicles by randomizing certain parameters of
the car-following model and the lane-changing model of rule-based microscopic
traffic flow in SUMO. We trained policies with deep reinforcement learning
algorithms under the domain randomized rule-based microscopic traffic flow in
freeway and merging scenes, and then tested them separately in rule-based
microscopic traffic flow and high-fidelity microscopic traffic flow. Results
indicate that the policy trained under domain randomization traffic flow has
significantly better success rate and calculative reward compared to the models
trained under other microscopic traffic flows.
- Abstract(参考訳): 強化学習に基づく自律走行車の意思決定と制御課題に関する最近の研究のほとんどはシミュレーション環境で行われている。
これらの研究のトレーニングと試験はルールベースの微視的トラフィックフローの下で行われ、実際の環境やほぼ現実の環境に移行して性能をテストすることはほとんどない。
トレーニングされたモデルがより現実的なトラフィックシーンでテストされると、パフォーマンスが低下する可能性がある。
本研究では,SUMOにおける車両追従モデルとルールベース微視的交通流の車線変更モデルのパラメータをランダム化することにより,周囲の車両の運転スタイルと挙動をランダム化する手法を提案する。
提案手法は, 領域ランダム化されたルールベース微視的トラフィックフローとマージシーンを併用し, ルールベース微視的トラフィックフローと高忠実性微視的トラフィックフローで個別にテストした。
その結果、ドメインランダム化トラヒックフローで訓練されたポリシーは、他の微視的トラヒックフローで訓練されたモデルと比較して、成功率と量的報酬が有意に高いことがわかった。
関連論文リスト
- Analyzing Closed-loop Training Techniques for Realistic Traffic Agent Models in Autonomous Highway Driving Simulations [4.486517725808305]
我々は,高速道路走行シミュレーションのための閉ループ手法に着目し,異なる訓練原理の広範な比較分析を行う。
我々は, (i) オープンループ対クローズドループマルチエージェントトレーニング, (ii) 逆逆対決定論的指導トレーニング, (iii) 強化損失の影響, (iv) ログ再生エージェントと併用したトレーニングの影響を実験的に比較し, 現実的なエージェントモデリングに適したトレーニングテクニックを同定した。
論文 参考訳(メタデータ) (2024-10-21T13:16:58Z) - MetaFollower: Adaptable Personalized Autonomous Car Following [63.90050686330677]
適応型パーソナライズされた自動車追従フレームワークであるMetaFollowerを提案する。
まず,モデルに依存しないメタラーニング(MAML)を用いて,様々なCFイベントから共通運転知識を抽出する。
さらに、Long Short-Term Memory (LSTM) と Intelligent Driver Model (IDM) を組み合わせて、時間的不均一性を高い解釈性で反映する。
論文 参考訳(メタデータ) (2024-06-23T15:30:40Z) - A Holistic Framework Towards Vision-based Traffic Signal Control with
Microscopic Simulation [53.39174966020085]
交通信号制御(TSC)は交通渋滞を低減し、交通の流れを円滑にし、アイドリング時間を短縮し、CO2排出量を減らすために重要である。
本研究では,道路交通の流れを視覚的観察によって調節するTSCのコンピュータビジョンアプローチについて検討する。
我々は、視覚ベースのTSCとそのベンチマークに向けて、TrafficDojoと呼ばれる総合的なトラフィックシミュレーションフレームワークを導入する。
論文 参考訳(メタデータ) (2024-03-11T16:42:29Z) - Unified Automatic Control of Vehicular Systems with Reinforcement
Learning [64.63619662693068]
本稿では,車載マイクロシミュレーションの合理化手法について述べる。
最小限の手動設計で高性能な制御戦略を発見する。
この研究は、波動緩和、交通信号、ランプ計測に類似した多くの創発的挙動を明らかにしている。
論文 参考訳(メタデータ) (2022-07-30T16:23:45Z) - Tackling Real-World Autonomous Driving using Deep Reinforcement Learning [63.3756530844707]
本研究では,加速と操舵角度を予測するニューラルネットワークを学習するモデルレスディープ強化学習プランナを提案する。
実際の自動運転車にシステムをデプロイするために、我々は小さなニューラルネットワークで表されるモジュールも開発する。
論文 参考訳(メタデータ) (2022-07-05T16:33:20Z) - Reinforcement Learning for Mixed Autonomy Intersections [4.771833920251869]
シミュレーショントラフィックネットワークにおける混合自律性トラフィックを制御するためのモデルフリー強化学習手法を提案する。
本手法は,任意の数の制御車両に対して,局所的な観測に基づく分散制御が可能なマルチエージェントポリシー分解を利用する。
論文 参考訳(メタデータ) (2021-11-08T18:03:18Z) - Objective-aware Traffic Simulation via Inverse Reinforcement Learning [31.26257563160961]
逆強化学習問題として交通シミュレーションを定式化する。
動的ロバストシミュレーション学習のためのパラメータ共有逆強化学習モデルを提案する。
提案モデルでは,実世界の車両の軌道を模倣し,同時に報酬関数を復元することができる。
論文 参考訳(メタデータ) (2021-05-20T07:26:34Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Sim-to-real reinforcement learning applied to end-to-end vehicle control [0.0]
本研究では車線追従や衝突回避といった車両制御問題のエンドツーエンド強化学習について検討する。
我々の制御ポリシーでは、実際の2車線の道路の右車線を追従するために小型ロボットを制御できますが、その訓練はシミュレーションでのみ行われました。
論文 参考訳(メタデータ) (2020-12-14T12:30:47Z) - Learning from Simulation, Racing in Reality [126.56346065780895]
ミニチュアレースカープラットフォーム上で自律的なレースを行うための強化学習ベースのソリューションを提案する。
シミュレーションで純粋に訓練されたポリシーは、実際のロボットのセットアップにうまく移行できることを示す。
論文 参考訳(メタデータ) (2020-11-26T14:58:49Z) - An End-to-end Deep Reinforcement Learning Approach for the Long-term
Short-term Planning on the Frenet Space [0.0]
本稿では,自動運転車の意思決定と動作計画に向けた,エンドツーエンドの継続的強化学習手法を提案する。
初めて、Frenet空間上の状態と行動空間の両方を定義して、走行挙動を道路曲率に変化させないようにする。
このアルゴリズムは、フィードバックコントローラが追跡するFrenetフレーム上で連続時間軌道を生成する。
論文 参考訳(メタデータ) (2020-11-26T02:40:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。