論文の概要: Model-free Learning of Corridor Clearance: A Near-term Deployment
Perspective
- arxiv url: http://arxiv.org/abs/2312.10339v1
- Date: Sat, 16 Dec 2023 06:08:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-19 17:01:34.205506
- Title: Model-free Learning of Corridor Clearance: A Near-term Deployment
Perspective
- Title(参考訳): 廊下クリアランスのモデルフリー学習--短期展開の視点から
- Authors: Dajiang Suo, Vindula Jayawardana, Cathy Wu
- Abstract要約: コネクテッド・アンド・オートマチック・ビークル(CAV)技術の公衆衛生応用は、交通を間接的に調整することで救急医療サービス(EMS)の応答時間を短縮することである。
このトピックに関する既存の研究は、EMS車両の故障が通常の交通に与える影響を見落とし、100%CAVの侵入を仮定し、交差点におけるリアルタイム交通信号タイミングデータと待ち行列長に依存し、最適なモデルに基づくCAV制御戦略を導出する際の交通設定について様々な仮定を行う。
これらの課題を克服し、短期的実世界の適用性を高めるために、深部強化学習(DRL)を用いたCAV制御戦略設計のためのモデルフリーアプローチを提案する。
- 参考スコア(独自算出の注目度): 5.39179984304986
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: An emerging public health application of connected and automated vehicle
(CAV) technologies is to reduce response times of emergency medical service
(EMS) by indirectly coordinating traffic. Therefore, in this work we study the
CAV-assisted corridor clearance for EMS vehicles from a short term deployment
perspective. Existing research on this topic often overlooks the impact of EMS
vehicle disruptions on regular traffic, assumes 100% CAV penetration, relies on
real-time traffic signal timing data and queue lengths at intersections, and
makes various assumptions about traffic settings when deriving optimal
model-based CAV control strategies. However, these assumptions pose significant
challenges for near-term deployment and limit the real-world applicability of
such methods. To overcome these challenges and enhance real-world applicability
in near-term, we propose a model-free approach employing deep reinforcement
learning (DRL) for designing CAV control strategies, showing its reduced
overhead in designing and greater scalability and performance compared to
model-based methods. Our qualitative analysis highlights the complexities of
designing scalable EMS corridor clearance controllers for diverse traffic
settings in which DRL controller provides ease of design compared to the
model-based methods. In numerical evaluations, the model-free DRL controller
outperforms the model-based counterpart by improving traffic flow and even
improving EMS travel times in scenarios when a single CAV is present. Across 19
considered settings, the learned DRL controller excels by 25% in reducing the
travel time in six instances, achieving an average improvement of 9%. These
findings underscore the potential and promise of model-free DRL strategies in
advancing EMS response and traffic flow coordination, with a focus on practical
near-term deployment.
- Abstract(参考訳): コネクテッド・アンド・オートマチック・ビークル(CAV)技術の公衆衛生応用は、交通を間接的に調整することで救急医療サービス(EMS)の応答時間を短縮することである。
そこで本研究では,短期展開の観点から,EMS車両のCAV支援廊下クリアランスについて検討する。
このトピックに関する既存の研究は、EMS車両の故障が通常の交通に与える影響を見落とし、100%CAVの侵入を仮定し、交差点におけるリアルタイム交通信号タイミングデータと待ち行列長に依存し、最適なモデルに基づくCAV制御戦略を導出する際の交通設定について様々な仮定を行う。
しかし、これらの仮定は、短期的な展開と実際の適用可能性の制限に重大な課題をもたらす。
これらの課題を克服し、短期的に実世界の適用性を高めるために、cav制御戦略の設計に深層強化学習(drl)を用いたモデルフリーアプローチを提案する。
我々の定性的分析は、DRLコントローラがモデルベース手法と比較して設計が容易な多様なトラフィック設定のためにスケーラブルなEMS廊下クリアランスコントローラを設計する複雑さを強調している。
数値評価において、モデルフリーDRLコントローラは、トラフィックフローを改善し、単一のCAVが存在する場合のシナリオにおけるEMS走行時間を改善することにより、モデルベースよりも優れる。
19以上の設定を考慮し、学習したDRLコントローラは6インスタンスの移動時間を25%短縮し、平均9%の改善を実現した。
これらの知見は, EMS応答と交通流調整の進展におけるモデルフリーDRL戦略の可能性と将来性を明らかにし, 実用的短期展開に焦点をあてた。
関連論文リスト
- A Holistic Framework Towards Vision-based Traffic Signal Control with
Microscopic Simulation [53.39174966020085]
交通信号制御(TSC)は交通渋滞を低減し、交通の流れを円滑にし、アイドリング時間を短縮し、CO2排出量を減らすために重要である。
本研究では,道路交通の流れを視覚的観察によって調節するTSCのコンピュータビジョンアプローチについて検討する。
我々は、視覚ベースのTSCとそのベンチマークに向けて、TrafficDojoと呼ばれる総合的なトラフィックシミュレーションフレームワークを導入する。
論文 参考訳(メタデータ) (2024-03-11T16:42:29Z) - Generalizing Cooperative Eco-driving via Multi-residual Task Learning [6.864745785996583]
MRTL(Multi-Residual Task Learning)はマルチタスク学習に基づく汎用的な学習フレームワークである。
MRTLは制御を従来の制御法と残留項によって効果的に解決される名目成分に分解する。
我々は、システム制御の手段として自律走行車を用いた混合交通における艦隊レベルの排出削減にMRTLを使用している。
論文 参考訳(メタデータ) (2024-03-07T05:25:34Z) - MOTO: Offline Pre-training to Online Fine-tuning for Model-based Robot
Learning [52.101643259906915]
本研究では,高次元観測による強化学習におけるオフライン事前学習とオンラインファインチューニングの問題について検討する。
既存のモデルベースオフラインRL法は高次元領域におけるオフラインからオンラインへの微調整には適していない。
本稿では,事前データをモデルベース値拡張とポリシー正則化によって効率的に再利用できるオンラインモデルベース手法を提案する。
論文 参考訳(メタデータ) (2024-01-06T21:04:31Z) - Reinforcement Learning with Model Predictive Control for Highway Ramp Metering [14.389086937116582]
この研究は、交通フロー管理を強化するためのモデルベースと学習ベースの戦略の相乗効果について考察する。
制御問題は、適切なステージコスト関数を作成することにより、RLタスクとして定式化される。
RLアルゴリズムの関数近似として MPC 最適問題を利用する MPC ベースの RL アプローチを提案し,オンランプの効率的な制御について検討した。
論文 参考訳(メタデータ) (2023-11-15T09:50:54Z) - Unified Automatic Control of Vehicular Systems with Reinforcement
Learning [64.63619662693068]
本稿では,車載マイクロシミュレーションの合理化手法について述べる。
最小限の手動設計で高性能な制御戦略を発見する。
この研究は、波動緩和、交通信号、ランプ計測に類似した多くの創発的挙動を明らかにしている。
論文 参考訳(メタデータ) (2022-07-30T16:23:45Z) - AI-aided Traffic Control Scheme for M2M Communications in the Internet
of Vehicles [61.21359293642559]
交通のダイナミクスと異なるIoVアプリケーションの異種要求は、既存のほとんどの研究では考慮されていない。
本稿では,ハイブリッド交通制御方式とPPO法を併用して検討する。
論文 参考訳(メタデータ) (2022-03-05T10:54:05Z) - A Deep Reinforcement Learning Approach for Traffic Signal Control
Optimization [14.455497228170646]
非効率な信号制御手法は、交通渋滞やエネルギー浪費などの多くの問題を引き起こす可能性がある。
本稿では,アクター・クリティカル・ポリシー・グラデーション・アルゴリズムを拡張し,マルチエージェント・ディープ・決定性ポリシー・グラデーション(MADDPG)法を提案する。
論文 参考訳(メタデータ) (2021-07-13T14:11:04Z) - Federated Learning on the Road: Autonomous Controller Design for
Connected and Autonomous Vehicles [109.71532364079711]
CAV(コネクテッド・アンド・自律車両)の自律制御設計のための新しい統合学習(FL)フレームワークの提案
CAVの移動性、無線フェーディングチャネル、および不均衡で非独立で同一に分散されたデータを考慮に入れた新しい動的フェデレーション・プロキシ(DFP)アルゴリズムが提案されている。
最適制御器を用いてCAVがどの程度の速度で収束するかを同定するために,提案アルゴリズムに対して厳密な収束解析を行う。
論文 参考訳(メタデータ) (2021-02-05T19:57:47Z) - Optimizing Mixed Autonomy Traffic Flow With Decentralized Autonomous
Vehicles and Multi-Agent RL [63.52264764099532]
本研究では、完全分散制御方式を用いて、混合自律環境でのボトルネックのスループットを向上させる自動運転車の能力について検討する。
この問題にマルチエージェント強化アルゴリズムを適用し、5%の浸透速度で20%から40%の浸透速度で33%までのボトルネックスループットの大幅な改善が達成できることを実証した。
論文 参考訳(メタデータ) (2020-10-30T22:06:05Z) - Leveraging the Capabilities of Connected and Autonomous Vehicles and
Multi-Agent Reinforcement Learning to Mitigate Highway Bottleneck Congestion [2.0010674945048468]
RLをベースとしたマルチエージェントCAV制御モデルを提案する。
その結果、CAVのシェアが10%以下である場合でも、CAVはハイウェイ交通のボトルネックを著しく軽減することができることが示唆された。
論文 参考訳(メタデータ) (2020-10-12T03:52:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。