論文の概要: Unified Automatic Control of Vehicular Systems with Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2208.00268v1
- Date: Sat, 30 Jul 2022 16:23:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-02 14:39:53.117844
- Title: Unified Automatic Control of Vehicular Systems with Reinforcement
Learning
- Title(参考訳): 強化学習による車両システムの統一的自動制御
- Authors: Zhongxia Yan, Abdul Rahman Kreidieh, Eugene Vinitsky, Alexandre M.
Bayen, Cathy Wu
- Abstract要約: 本稿では,車載マイクロシミュレーションの合理化手法について述べる。
最小限の手動設計で高性能な制御戦略を発見する。
この研究は、波動緩和、交通信号、ランプ計測に類似した多くの創発的挙動を明らかにしている。
- 参考スコア(独自算出の注目度): 64.63619662693068
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Emerging vehicular systems with increasing proportions of automated
components present opportunities for optimal control to mitigate congestion and
increase efficiency. There has been a recent interest in applying deep
reinforcement learning (DRL) to these nonlinear dynamical systems for the
automatic design of effective control strategies. Despite conceptual advantages
of DRL being model-free, studies typically nonetheless rely on training setups
that are painstakingly specialized to specific vehicular systems. This is a key
challenge to efficient analysis of diverse vehicular and mobility systems. To
this end, this article contributes a streamlined methodology for vehicular
microsimulation and discovers high performance control strategies with minimal
manual design. A variable-agent, multi-task approach is presented for
optimization of vehicular Partially Observed Markov Decision Processes. The
methodology is experimentally validated on mixed autonomy traffic systems,
where fractions of vehicles are automated; empirical improvement, typically
15-60% over a human driving baseline, is observed in all configurations of six
diverse open or closed traffic systems. The study reveals numerous emergent
behaviors resembling wave mitigation, traffic signaling, and ramp metering.
Finally, the emergent behaviors are analyzed to produce interpretable control
strategies, which are validated against the learned control strategies.
- Abstract(参考訳): 自動部品の比率が増大する車両システムは、混雑を緩和し効率を上げるために最適な制御を行う機会を与える。
近年,これらの非線形力学系に深部強化学習(DRL)を適用し,効果的な制御戦略の自動設計への関心が高まっている。
DRLがモデルのないという概念上の利点にもかかわらず、研究は通常、特定の車両システムに特化している訓練装置に依存している。
これは、様々な車両および移動システムの効率的な分析に欠かせない課題である。
この目的のために, 車両のマイクロシミュレーションの合理化手法を提案し, 最小限の手動設計で高性能な制御戦略を見出した。
車両部分観測マルコフ決定プロセスの最適化のために,可変エージェントマルチタスク方式を提案する。
この手法は、車両のごく一部が自動化されている混合自律交通システムで実験的に検証されており、経験的改善(通常、人間の運転基準より15~60%)は、6つの異なるオープンまたはクローズド交通システムの全ての構成で観察される。
この研究は、波動緩和、交通信号、ランプ計測に類似した多くの創発的挙動を明らかにしている。
最後に、創発行動を分析して解釈可能な制御戦略を生成し、学習した制御戦略に対して検証する。
関連論文リスト
- Generalizing Cooperative Eco-driving via Multi-residual Task Learning [6.864745785996583]
MRTL(Multi-Residual Task Learning)はマルチタスク学習に基づく汎用的な学習フレームワークである。
MRTLは制御を従来の制御法と残留項によって効果的に解決される名目成分に分解する。
我々は、システム制御の手段として自律走行車を用いた混合交通における艦隊レベルの排出削減にMRTLを使用している。
論文 参考訳(メタデータ) (2024-03-07T05:25:34Z) - Modelling, Positioning, and Deep Reinforcement Learning Path Tracking
Control of Scaled Robotic Vehicles: Design and Experimental Validation [3.807917169053206]
スケールされたロボットカーは通常、車両の状態の推定と制御に特化したタスクを含む階層的な制御機構を備えている。
本稿では, (i) フェデレートされた拡張カルマンフィルタ (FEKF) と (ii) エキスパートデモレータを用いて訓練された新しい深部強化学習 (DRL) パストラッキングコントローラを提案する。
実験により検証されたモデルは、(i)FEKFの設計を支援するために使用され、(ii)DRLに基づく経路追跡アルゴリズムをトレーニングするためのデジタルツインとして機能する。
論文 参考訳(メタデータ) (2024-01-10T14:40:53Z) - Model-free Learning of Corridor Clearance: A Near-term Deployment
Perspective [5.39179984304986]
コネクテッド・アンド・オートマチック・ビークル(CAV)技術の公衆衛生応用は、交通を間接的に調整することで救急医療サービス(EMS)の応答時間を短縮することである。
このトピックに関する既存の研究は、EMS車両の故障が通常の交通に与える影響を見落とし、100%CAVの侵入を仮定し、交差点におけるリアルタイム交通信号タイミングデータと待ち行列長に依存し、最適なモデルに基づくCAV制御戦略を導出する際の交通設定について様々な仮定を行う。
これらの課題を克服し、短期的実世界の適用性を高めるために、深部強化学習(DRL)を用いたCAV制御戦略設計のためのモデルフリーアプローチを提案する。
論文 参考訳(メタデータ) (2023-12-16T06:08:53Z) - NeuroFlow: Development of lightweight and efficient model integration
scheduling strategy for autonomous driving system [0.0]
本稿では,自動車システムの独特な制約と特性を考慮した自律運転システムを提案する。
提案システムは、自律運転における複雑なデータフローを体系的に分析し、ディープラーニングモデルに影響を与える様々な要因を動的に調整する機能を提供する。
論文 参考訳(メタデータ) (2023-12-15T07:51:20Z) - FastRLAP: A System for Learning High-Speed Driving via Deep RL and
Autonomous Practicing [71.76084256567599]
本稿では、自律型小型RCカーを強化学習(RL)を用いた視覚的観察から積極的に駆動するシステムを提案する。
我々のシステムであるFastRLAP (faster lap)は、人間の介入なしに、シミュレーションや専門家によるデモンストレーションを必要とせず、現実世界で自律的に訓練する。
結果として得られたポリシーは、タイミングブレーキや回転の加速度などの突発的な運転スキルを示し、ロボットの動きを妨げる領域を避け、トレーニングの途中で同様の1対1のインタフェースを使用して人間のドライバーのパフォーマンスにアプローチする。
論文 参考訳(メタデータ) (2023-04-19T17:33:47Z) - Learning-based Online Optimization for Autonomous Mobility-on-Demand
Fleet Control [8.020856741504794]
自律移動オンデマンドシステムのためのオンライン制御アルゴリズムについて検討する。
我々は、オンラインディスパッチとリバランスポリシーを学習する、新しいハイブリッド強化機械学習パイプラインを開発した。
提案手法は,最先端の欲求とモデル予測制御のアプローチより優れていることを示す。
論文 参考訳(メタデータ) (2023-02-08T09:40:30Z) - Tackling Real-World Autonomous Driving using Deep Reinforcement Learning [63.3756530844707]
本研究では,加速と操舵角度を予測するニューラルネットワークを学習するモデルレスディープ強化学習プランナを提案する。
実際の自動運転車にシステムをデプロイするために、我々は小さなニューラルネットワークで表されるモジュールも開発する。
論文 参考訳(メタデータ) (2022-07-05T16:33:20Z) - Learning energy-efficient driving behaviors by imitating experts [75.12960180185105]
本稿では,コミュニケーション・センシングにおける制御戦略と現実的限界のギャップを埋める上で,模倣学習が果たす役割について考察する。
擬似学習は、車両の5%に採用されれば、局地的な観測のみを用いて、交通条件の異なるネットワークのエネルギー効率を15%向上させる政策を導出できることを示す。
論文 参考訳(メタデータ) (2022-06-28T17:08:31Z) - Isolating and Leveraging Controllable and Noncontrollable Visual
Dynamics in World Models [65.97707691164558]
Iso-DreamはDream-to-Controlフレームワークを2つの側面で改善する。
まず、逆動力学を最適化することにより、世界モデルに制御可能で制御不能な情報源を学習させることを奨励する。
第2に、エージェントの挙動を世界モデルの切り離された潜在的想像力に最適化する。
論文 参考訳(メタデータ) (2022-05-27T08:07:39Z) - Optimizing Mixed Autonomy Traffic Flow With Decentralized Autonomous
Vehicles and Multi-Agent RL [63.52264764099532]
本研究では、完全分散制御方式を用いて、混合自律環境でのボトルネックのスループットを向上させる自動運転車の能力について検討する。
この問題にマルチエージェント強化アルゴリズムを適用し、5%の浸透速度で20%から40%の浸透速度で33%までのボトルネックスループットの大幅な改善が達成できることを実証した。
論文 参考訳(メタデータ) (2020-10-30T22:06:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。