論文の概要: RLPG: Reinforcement Learning Approach for Dynamic Intra-Platoon Gap
Adaptation for Highway On-Ramp Merging
- arxiv url: http://arxiv.org/abs/2212.03497v1
- Date: Wed, 7 Dec 2022 07:33:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-19 12:53:45.256104
- Title: RLPG: Reinforcement Learning Approach for Dynamic Intra-Platoon Gap
Adaptation for Highway On-Ramp Merging
- Title(参考訳): RLPG:ハイウェイオンランプマージのための動的プラトン内ギャップ適応のための強化学習アプローチ
- Authors: Sushma Reddy Yadavalli, Lokesh Chandra Das, Myounggyu Won
- Abstract要約: 小隊は、非常に近い距離で一緒に移動する車両のグループを指す。
近年の研究では、高規格道路と高架道路の合流時の交通流に対する極小小小高架区間の影響が明らかにされている。
本稿では,各小隊員の小隊内ギャップを適応的に調整し,交通流を最大化する新しい補強学習フレームワークを提案する。
- 参考スコア(独自算出の注目度): 14.540226579203207
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A platoon refers to a group of vehicles traveling together in very close
proximity. It has received significant attention from the autonomous vehicle
research community due to its strong potential to significantly enhance fuel
efficiency, driving safety, and driver comfort. Despite these advantages,
recent research has revealed a detrimental effect of the extremely small
intra-platoon gap on traffic flow for highway on-ramp merging. While existing
control-based methods allow for adaptation of the intra-platoon gap to improve
traffic flow, making an optimal control decision under the complex dynamics of
traffic conditions remains a significant challenge due to the massive
computational complexity. To this end, we present the design, implementation,
and evaluation of a novel reinforcement learning framework that adaptively
adjusts the intra-platoon gap of an individual platoon member to maximize
traffic flow in response to dynamically changing, complex traffic conditions
for highway on-ramp merging. The state space of the framework is carefully
designed in consultation with the transportation literature to incorporate
critical traffic parameters relevant to merging efficiency. A deep
deterministic policy gradient algorithm is adopted to account for the
continuous action space to ensure precise and continuous adjustment of the
intra-platoon gap. An extensive simulation study demonstrates the effectiveness
of the reinforcement learning-based approach for significantly improving
traffic flow in various highway merging scenarios.
- Abstract(参考訳): 小隊は、非常に近い距離で一緒に移動する車両のグループを指す。
燃料効率、運転安全性、運転者の快適性を大幅に向上させる強い可能性から、自動運転車研究コミュニティから大きな注目を集めている。
これらの利点にもかかわらず、近年の研究では、非常に小さな小隊内ギャップが高速道路のオンランプ合併の交通流に悪影響を及ぼすことが明らかになっている。
既存の制御ベースの手法では、小隊内のギャップを適応して交通の流れを改善することができるが、交通条件の複雑な力学の下で最適な制御を決定することは、膨大な計算複雑性のために大きな課題である。
この目的のために,高速道路のオンランプマージにおける動的に変化する複雑な交通条件に応じて,各小隊員の小隊内ギャップを適応的に調整し,交通の流れを最大化する新しい補強学習フレームワークの設計,実装,評価を行う。
フレームワークの状態空間は、マージ効率に関連する重要な交通パラメータを組み込むために、輸送文献とのコンサルテーションで慎重に設計されている。
小隊内ギャップの正確かつ連続的な調整を確実にするために、連続的な行動空間を考慮した深い決定論的政策勾配アルゴリズムを採用する。
各種高速道路統合シナリオにおける交通流改善のための強化学習に基づく手法の有効性をシミュレーションにより検証した。
関連論文リスト
- DiFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Autonomous Driving [55.53171248839489]
我々は、エンドツーエンドの自動運転のためのエゴ中心の完全スパースパラダイムであるDiFSDを提案する。
特に、DiFSDは主にスパース知覚、階層的相互作用、反復的な運動プランナーから構成される。
nuScenesデータセットで行った実験は、DiFSDの優れた計画性能と優れた効率を示す。
論文 参考訳(メタデータ) (2024-09-15T15:55:24Z) - A Holistic Framework Towards Vision-based Traffic Signal Control with
Microscopic Simulation [53.39174966020085]
交通信号制御(TSC)は交通渋滞を低減し、交通の流れを円滑にし、アイドリング時間を短縮し、CO2排出量を減らすために重要である。
本研究では,道路交通の流れを視覚的観察によって調節するTSCのコンピュータビジョンアプローチについて検討する。
我々は、視覚ベースのTSCとそのベンチマークに向けて、TrafficDojoと呼ばれる総合的なトラフィックシミュレーションフレームワークを導入する。
論文 参考訳(メタデータ) (2024-03-11T16:42:29Z) - Parameterized Decision-making with Multi-modal Perception for Autonomous
Driving [12.21578713219778]
AUTOと呼ばれる深層強化学習に基づくマルチモーダル認識を用いたパラメータ化意思決定フレームワークを提案する。
ハイブリッド報酬関数は、安全、交通効率、乗客の快適性、および最適な行動を生成するためのフレームワークを導く影響を考慮に入れている。
論文 参考訳(メタデータ) (2023-12-19T08:27:02Z) - Unified Automatic Control of Vehicular Systems with Reinforcement
Learning [64.63619662693068]
本稿では,車載マイクロシミュレーションの合理化手法について述べる。
最小限の手動設計で高性能な制御戦略を発見する。
この研究は、波動緩和、交通信号、ランプ計測に類似した多くの創発的挙動を明らかにしている。
論文 参考訳(メタデータ) (2022-07-30T16:23:45Z) - Real-time Cooperative Vehicle Coordination at Unsignalized Road
Intersections [7.860567520771493]
信号のない道路交差点での協調作業は、連結車両と自動車両の安全運転交通スループットを向上させることを目的としている。
我々はモデルフリーなマルコフ決定プロセス(MDP)を導入し、深層強化学習フレームワークにおける双遅延Deep Deterministic Policy(TD3)に基づく戦略によりそれに取り組む。
提案手法は, 準定常調整シナリオにおいて, ほぼ最適性能を達成し, 現実的な連続流れの制御を大幅に改善できることが示唆された。
論文 参考訳(メタデータ) (2022-05-03T02:56:02Z) - Learning to Help Emergency Vehicles Arrive Faster: A Cooperative
Vehicle-Road Scheduling Approach [24.505687255063986]
車両中心のスケジューリングアプローチは、緊急車両の最適経路を推奨する。
道路中心のスケジューリングアプローチは、交通状況を改善し、EVが交差点を通過するための優先度を高めることを目的としている。
本稿では,リアルタイム経路計画モジュールと協調交通信号制御モジュールを含む協調型VehIcle-roaDスケジューリング手法であるLEVIDを提案する。
論文 参考訳(メタデータ) (2022-02-20T10:25:15Z) - Learning Interaction-aware Guidance Policies for Motion Planning in
Dense Traffic Scenarios [8.484564880157148]
本稿では,高密度交通シナリオにおける対話型モーションプランニングのための新しい枠組みを提案する。
我々は,他車両の協調性に関する国際的ガイダンスを提供するインタラクション対応政策であるDeep Reinforcement Learning (RL) を通じて学習することを提案する。
学習されたポリシーは、ローカル最適化ベースのプランナーを推論し、対話的な振る舞いで誘導し、他の車両が収まらない場合に安全を維持しながら、密集したトラフィックに積極的にマージする。
論文 参考訳(メタデータ) (2021-07-09T16:43:12Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Multi-Modal Fusion Transformer for End-to-End Autonomous Driving [59.60483620730437]
画像表現とLiDAR表現を注目で統合する,新しいマルチモードフュージョントランスフォーマであるTransFuserを提案する。
本手法は, 衝突を76%低減しつつ, 最先端駆動性能を実現する。
論文 参考訳(メタデータ) (2021-04-19T11:48:13Z) - MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。
近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。
本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文 参考訳(メタデータ) (2021-01-04T03:06:08Z) - An End-to-end Deep Reinforcement Learning Approach for the Long-term
Short-term Planning on the Frenet Space [0.0]
本稿では,自動運転車の意思決定と動作計画に向けた,エンドツーエンドの継続的強化学習手法を提案する。
初めて、Frenet空間上の状態と行動空間の両方を定義して、走行挙動を道路曲率に変化させないようにする。
このアルゴリズムは、フィードバックコントローラが追跡するFrenetフレーム上で連続時間軌道を生成する。
論文 参考訳(メタデータ) (2020-11-26T02:40:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。