論文の概要: EnduRL: Enhancing Safety, Stability, and Efficiency of Mixed Traffic Under Real-World Perturbations Via Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2311.12261v2
- Date: Sun, 24 Mar 2024 14:18:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-27 02:25:46.269802
- Title: EnduRL: Enhancing Safety, Stability, and Efficiency of Mixed Traffic Under Real-World Perturbations Via Reinforcement Learning
- Title(参考訳): EnduRL: リアルタイム摂動学習による混在交通の安全性・安定性・効率向上
- Authors: Bibek Poudel, Weizi Li, Kevin Heaslip,
- Abstract要約: 実世界の走行軌道を解析し、幅広い加速度プロファイルを抽出する。
次に、これらのプロファイルを、混雑を軽減するためにRVをトレーニングするためのシミュレーションに組み込む。
RVの安全性は最大66%向上し、効率は最大54%向上し、安定性は最大97%向上した。
- 参考スコア(独自算出の注目度): 1.7273380623090846
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human-driven vehicles (HVs) amplify naturally occurring perturbations in traffic, leading to congestion--a major contributor to increased fuel consumption, higher collision risks, and reduced road capacity utilization. While previous research demonstrates that Robot Vehicles (RVs) can be leveraged to mitigate these issues, most such studies rely on simulations with simplistic models of human car-following behaviors. In this work, we analyze real-world driving trajectories and extract a wide range of acceleration profiles. We then incorporates these profiles into simulations for training RVs to mitigate congestion. We evaluate the safety, efficiency, and stability of mixed traffic via comprehensive experiments conducted in two mixed traffic environments (Ring and Bottleneck) at various traffic densities, configurations, and RV penetration rates. The results show that under real-world perturbations, prior RV controllers experience performance degradation on all three objectives (sometimes even lower than 100% HVs). To address this, we introduce a reinforcement learning based RV that employs a congestion stage classifier to optimize the safety, efficiency, and stability of mixed traffic. Our RVs demonstrate significant improvements: safety by up to 66%, efficiency by up to 54%, and stability by up to 97%.
- Abstract(参考訳): 人力車(HV)は自然に発生する交通渋滞を増幅し、渋滞を招き、燃料消費の増加、衝突リスクの増大、道路容量の削減に寄与する。
以前の研究では、ロボット自動車(RV)がこれらの問題を緩和するために活用できることが示されているが、そのような研究のほとんどは、人間の自動車追従行動の単純化モデルによるシミュレーションに依存している。
本研究では,実世界の走行軌道を解析し,幅広い加速度プロファイルを抽出する。
次に、これらのプロファイルを、混雑を軽減するためにRVをトレーニングするためのシミュレーションに組み込む。
本研究では, 交通密度, 構成, RV浸透率の2つの混合交通環境(リング, ボトルネック)で実施した総合的な実験を通じて, 混合交通の安全性, 効率, 安定性を評価する。
その結果、実世界の摂動下では、従来のRVコントローラは3つの目標(時には100%HV以下)で性能劣化を経験することがわかった。
そこで我々は,混在トラフィックの安全性,効率,安定性を最適化するために,混雑ステージ分類器を用いた強化学習に基づくRVを提案する。
RVの安全性は最大66%向上し、効率は最大54%向上し、安定性は最大97%向上した。
関連論文リスト
- Queue-based Eco-Driving at Roundabouts with Reinforcement Learning [0.0]
我々は、交通の流れと交通効率を高めるために、混在する交通のラウンドアバウンドでエコ運転に対処する。
我々はルールベースと強化学習ベースのエコ自動運転システムという2つのアプローチを開発した。
その結果、どちらのアプローチもベースラインを上回っていることがわかった。
論文 参考訳(メタデータ) (2024-05-01T16:48:28Z) - Reinforcement Learning with Latent State Inference for Autonomous On-ramp Merging under Observation Delay [6.0111084468944]
遅延状態推論・安全制御(L3IS)エージェントを用いたレーンキーピング・レーンチェンジについて紹介する。
L3ISは、周囲の車両の意図や運転スタイルに関する包括的な知識を必要とせずに、オンランプのマージ作業を安全に行うように設計されている。
本稿では,観測遅延を考慮に入れたAL3ISというエージェントを改良し,実環境においてより堅牢な決定を行えるようにした。
論文 参考訳(メタデータ) (2024-03-18T15:02:46Z) - Autonomous and Human-Driven Vehicles Interacting in a Roundabout: A
Quantitative and Qualitative Evaluation [34.67306374722473]
我々は,イタリア・ミラノのラウンドアバウンドにおいて,交通渋滞を最小限に抑え,汚染を最小限に抑える政策を学ぶ。
最先端のコックピットを用いて学習方針を定性的に評価し,実世界に近い環境下での性能を評価する。
以上の結果から,ヒト駆動車両はAVの動態を最適化することの利点が示唆された。
論文 参考訳(メタデータ) (2023-09-15T09:02:16Z) - A Counterfactual Safety Margin Perspective on the Scoring of Autonomous
Vehicles' Riskiness [52.27309191283943]
本稿では,異なるAVの行動のリスクを評価するためのデータ駆動型フレームワークを提案する。
本稿では,衝突を引き起こす可能性のある名目行動から最小限の偏差を示す,対実的安全マージンの概念を提案する。
論文 参考訳(メタデータ) (2023-08-02T09:48:08Z) - Unlocking Carbon Reduction Potential with Reinforcement Learning for the
Three-Dimensional Loading Capacitated Vehicle Routing Problem [54.43397200631224]
効率を上げるためのソリューションとして、協調車両ルーティングが提案されている。
現在の運用研究手法は、問題の大きさを増大させる非線形スケーリングに悩まされている。
約線形時間で3次元負荷容量化車両ルーティング問題を解くための強化学習モデルを開発した。
論文 参考訳(メタデータ) (2023-07-22T18:05:28Z) - iPLAN: Intent-Aware Planning in Heterogeneous Traffic via Distributed
Multi-Agent Reinforcement Learning [57.24340061741223]
本稿では,高密度および不均一な交通シナリオにおける軌跡や意図を予測できる分散マルチエージェント強化学習(MARL)アルゴリズムを提案する。
インテント対応プランニングのアプローチであるiPLANにより、エージェントは近くのドライバーの意図をローカルな観察からのみ推測できる。
論文 参考訳(メタデータ) (2023-06-09T20:12:02Z) - Deep Reinforcement Learning to Maximize Arterial Usage during Extreme
Congestion [4.934817254755007]
本稿では,過度の混雑中における多車線高速道路の交通渋滞を軽減するための深層強化学習(DRL)手法を提案する。
エージェントは、渋滞した高速道路交通に対する適応的な抑止戦略を学ぶために訓練される。
エージェントは、急激な混雑時の非作用と比較して平均交通速度を21%向上させることができる。
論文 参考訳(メタデータ) (2023-05-16T16:53:27Z) - Studying the Impact of Semi-Cooperative Drivers on Overall Highway Flow [76.38515853201116]
半協調行動は、人間ドライバーの本質的な性質であり、自律運転には考慮すべきである。
新たな自律型プランナーは、社会的に準拠した軌道を生成するために、人間のドライバーの社会的価値指向(SVO)を考慮することができる。
エージェントが反復的最適応答のゲーム理論バージョンをデプロイする暗黙的な半協調運転について検討する。
論文 参考訳(メタデータ) (2023-04-23T16:01:36Z) - Learning energy-efficient driving behaviors by imitating experts [75.12960180185105]
本稿では,コミュニケーション・センシングにおける制御戦略と現実的限界のギャップを埋める上で,模倣学習が果たす役割について考察する。
擬似学習は、車両の5%に採用されれば、局地的な観測のみを用いて、交通条件の異なるネットワークのエネルギー効率を15%向上させる政策を導出できることを示す。
論文 参考訳(メタデータ) (2022-06-28T17:08:31Z) - Self-Awareness Safety of Deep Reinforcement Learning in Road Traffic
Junction Driving [20.85562165500152]
道路交通ジャンクションのシナリオでは、車両は通常、輸送環境から部分的な観察を受ける。
本研究では,3つのベースラインDRLモデル(DQN,A2C,PPO)の安全性評価を行った。
提案した自己認識注意-DQNは,交差点およびラウンドアバウンドシナリオにおける安全性を著しく向上させることができる。
論文 参考訳(メタデータ) (2022-01-20T11:21:33Z) - Cautious Adaptation For Reinforcement Learning in Safety-Critical
Settings [129.80279257258098]
都市運転のような現実の安全クリティカルな目標設定における強化学習(RL)は危険である。
非安全クリティカルな「ソース」環境でエージェントが最初に訓練する「安全クリティカル適応」タスクセットを提案する。
多様な環境における事前経験がリスクを見積もるためにエージェントに装備するという直感に基づくソリューションアプローチであるCARLを提案する。
論文 参考訳(メタデータ) (2020-08-15T01:40:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。