論文の概要: Scalable Multiagent Driving Policies For Reducing Traffic Congestion
- arxiv url: http://arxiv.org/abs/2103.00058v1
- Date: Fri, 26 Feb 2021 21:29:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-03 16:00:57.004580
- Title: Scalable Multiagent Driving Policies For Reducing Traffic Congestion
- Title(参考訳): 交通渋滞低減のためのスケーラブルマルチエージェント運転ポリシー
- Authors: Jiaxun Cui, William Macke, Harel Yedidsion, Aastha Goyal, Daniel
Urielli, Peter Stone
- Abstract要約: 過去の研究では、AVと人間駆動車両の両方で小規模の混合交通シナリオでは、制御されたマルチエージェント運転ポリシーを実行する少数のAVが混雑を緩和できることを示しています。
本稿では,既存のアプローチをスケールアップし,より複雑なシナリオにおいてavのための新しいマルチエージェント駆動ポリシを開発する。
- 参考スコア(独自算出の注目度): 32.08636346620938
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Traffic congestion is a major challenge in modern urban settings. The
industry-wide development of autonomous and automated vehicles (AVs) motivates
the question of how can AVs contribute to congestion reduction. Past research
has shown that in small scale mixed traffic scenarios with both AVs and
human-driven vehicles, a small fraction of AVs executing a controlled
multiagent driving policy can mitigate congestion. In this paper, we scale up
existing approaches and develop new multiagent driving policies for AVs in
scenarios with greater complexity. We start by showing that a congestion metric
used by past research is manipulable in open road network scenarios where
vehicles dynamically join and leave the road. We then propose using a different
metric that is robust to manipulation and reflects open network traffic
efficiency. Next, we propose a modular transfer reinforcement learning
approach, and use it to scale up a multiagent driving policy to outperform
human-like traffic and existing approaches in a simulated realistic scenario,
which is an order of magnitude larger than past scenarios (hundreds instead of
tens of vehicles). Additionally, our modular transfer learning approach saves
up to 80% of the training time in our experiments, by focusing its data
collection on key locations in the network. Finally, we show for the first time
a distributed multiagent policy that improves congestion over human-driven
traffic. The distributed approach is more realistic and practical, as it relies
solely on existing sensing and actuation capabilities, and does not require
adding new communication infrastructure.
- Abstract(参考訳): 交通渋滞は現代の都市環境において大きな課題です。
自動運転と自動運転(AV)の業界全体の開発は、AVが混雑低減にどのように貢献できるかという疑問を喚起します。
過去の研究では、AVと人間駆動車両の両方で小規模の混合交通シナリオでは、制御されたマルチエージェント運転ポリシーを実行する少数のAVが混雑を緩和できることを示しています。
本稿では,既存のアプローチをスケールアップし,より複雑なシナリオにおいてavのための新しいマルチエージェント駆動ポリシを開発する。
我々は、自動車が道路に動的に合流して出発するオープンロードネットワークシナリオにおいて、過去の研究で使用されている渋滞指標が操作可能であることを示すことから始める。
次に、オープンなネットワークトラフィック効率を反映し、操作に頑健な異なるメトリックの使用を提案する。
次に,モジュラトランスファー強化学習手法を提案し,それをマルチエージェント駆動ポリシをスケールアップして,従来のシナリオ(数十台の車両ではなく数百台の車両)よりも桁違いに大きいシミュレーションされた現実的シナリオにおいて,ヒューマンライクなトラフィックと既存のアプローチを上回る。
さらに、モジュラー転送学習アプローチは、ネットワークの重要な場所にデータ収集を集中させることで、実験におけるトレーニング時間の最大80%を節約します。
最後に、人間主導のトラフィックに対する混雑を改善する分散マルチエージェントポリシーを初めて示します。
既存のセンシングとアクティベーション機能のみに依存しており、新しい通信インフラストラクチャを追加する必要はないため、分散アプローチはより現実的で実用的です。
関連論文リスト
- Agent-Agnostic Centralized Training for Decentralized Multi-Agent Cooperative Driving [17.659812774579756]
本研究では,自律走行車における分散型協調運転ポリシーを学習する非対称アクター・批判モデルを提案する。
マスキングを用いたアテンションニューラルネットワークを用いることで,実世界の交通動態と部分観測可能性の効率よく管理できる。
論文 参考訳(メタデータ) (2024-03-18T16:13:02Z) - A Novel Multi-Agent Deep RL Approach for Traffic Signal Control [13.927155702352131]
都市ネットワークにおける複数の交通信号制御のための Friend-Deep Q-network (Friend-DQN) アプローチを提案する。
特に、複数のエージェント間の協調は状態-作用空間を減少させ、収束を加速させる。
論文 参考訳(メタデータ) (2023-06-05T08:20:37Z) - Automatic Intersection Management in Mixed Traffic Using Reinforcement
Learning and Graph Neural Networks [0.5801044612920815]
接続された自動運転は、都市交通効率を大幅に改善する可能性がある。
協調行動計画(cooperative behavior planning)は、複数の車両の動作を協調的に最適化するために用いられる。
本研究は,協調型マルチエージェント計画における強化学習とグラフに基づくシーン表現を活用することを提案する。
論文 参考訳(メタデータ) (2023-01-30T08:21:18Z) - Learning energy-efficient driving behaviors by imitating experts [75.12960180185105]
本稿では,コミュニケーション・センシングにおける制御戦略と現実的限界のギャップを埋める上で,模倣学習が果たす役割について考察する。
擬似学習は、車両の5%に採用されれば、局地的な観測のみを用いて、交通条件の異なるネットワークのエネルギー効率を15%向上させる政策を導出できることを示す。
論文 参考訳(メタデータ) (2022-06-28T17:08:31Z) - Traffic Management of Autonomous Vehicles using Policy Based Deep
Reinforcement Learning and Intelligent Routing [0.26249027950824505]
本稿では,交差点の混雑状況に応じて交通信号を調整するDRLに基づく信号制御システムを提案する。
交差点の後方の道路での渋滞に対処するため,道路ネットワーク上で車両のバランスをとるために再ルート手法を用いた。
論文 参考訳(メタデータ) (2022-06-28T02:46:20Z) - COOPERNAUT: End-to-End Driving with Cooperative Perception for Networked
Vehicles [54.61668577827041]
本稿では,車間認識を用いたエンドツーエンド学習モデルであるCOOPERNAUTを紹介する。
われわれのAutoCastSim実験は、我々の協調知覚駆動モデルが平均成功率を40%向上させることを示唆している。
論文 参考訳(メタデータ) (2022-05-04T17:55:12Z) - Learning a Robust Multiagent Driving Policy for Traffic Congestion
Reduction [35.10619995365986]
本稿では,様々なオープンネットワーク交通条件に頑健な学習型マルチエージェント駆動方式を提案する。
その結果,AV導入率を2%に抑えつつも,シミュレーションされた人為的政策よりも大きな改善が達成された。
論文 参考訳(メタデータ) (2021-12-03T18:53:34Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Multi-Modal Fusion Transformer for End-to-End Autonomous Driving [59.60483620730437]
画像表現とLiDAR表現を注目で統合する,新しいマルチモードフュージョントランスフォーマであるTransFuserを提案する。
本手法は, 衝突を76%低減しつつ, 最先端駆動性能を実現する。
論文 参考訳(メタデータ) (2021-04-19T11:48:13Z) - MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。
近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。
本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文 参考訳(メタデータ) (2021-01-04T03:06:08Z) - Multi-Agent Routing Value Iteration Network [88.38796921838203]
疎結合グラフの学習値に基づいてマルチエージェントルーティングを行うことができるグラフニューラルネットワークに基づくモデルを提案する。
最大25ノードのグラフ上で2つのエージェントでトレーニングしたモデルでは,より多くのエージェントやノードを持つ状況に容易に一般化できることが示されている。
論文 参考訳(メタデータ) (2020-07-09T22:16:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。