論文の概要: IG-RL: Inductive Graph Reinforcement Learning for Massive-Scale Traffic
Signal Control
- arxiv url: http://arxiv.org/abs/2003.05738v6
- Date: Mon, 20 Sep 2021 19:13:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-26 00:53:06.513282
- Title: IG-RL: Inductive Graph Reinforcement Learning for Massive-Scale Traffic
Signal Control
- Title(参考訳): IG-RL:大規模信号制御のためのインダクティブグラフ強化学習
- Authors: Fran\c{c}ois-Xavier Devailly, Denis Larocque, Laurent Charlin
- Abstract要約: 適応的な交通信号制御のスケーリングには、状態と行動空間を扱う必要がある。
本稿では,グラフ畳み込みネットワークに基づくインダクティブグラフ強化学習(IG-RL)を紹介する。
我々のモデルは、新しい道路網、交通分布、交通体制に一般化することができる。
- 参考スコア(独自算出の注目度): 4.273991039651846
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Scaling adaptive traffic-signal control involves dealing with combinatorial
state and action spaces. Multi-agent reinforcement learning attempts to address
this challenge by distributing control to specialized agents. However,
specialization hinders generalization and transferability, and the
computational graphs underlying neural-networks architectures -- dominating in
the multi-agent setting -- do not offer the flexibility to handle an arbitrary
number of entities which changes both between road networks, and over time as
vehicles traverse the network. We introduce Inductive Graph Reinforcement
Learning (IG-RL) based on graph-convolutional networks which adapts to the
structure of any road network, to learn detailed representations of
traffic-controllers and their surroundings. Our decentralized approach enables
learning of a transferable-adaptive-traffic-signal-control policy. After being
trained on an arbitrary set of road networks, our model can generalize to new
road networks, traffic distributions, and traffic regimes, with no additional
training and a constant number of parameters, enabling greater scalability
compared to prior methods. Furthermore, our approach can exploit the
granularity of available data by capturing the (dynamic) demand at both the
lane and the vehicle levels. The proposed method is tested on both road
networks and traffic settings never experienced during training. We compare
IG-RL to multi-agent reinforcement learning and domain-specific baselines. In
both synthetic road networks and in a larger experiment involving the control
of the 3,971 traffic signals of Manhattan, we show that different
instantiations of IG-RL outperform baselines.
- Abstract(参考訳): 適応的な交通信号制御は、組合せ状態と行動空間を扱う。
マルチエージェント強化学習は、特殊エージェントに制御を分散することでこの問題に対処しようとする。
しかし、特殊化は一般化と転送性を妨げ、ニューラルネットワークアーキテクチャの基礎となる計算グラフ -- マルチエージェント設定において支配的な -- は、道路ネットワークと車両がネットワークを横断する時間とともに変化する任意の数のエンティティを扱う柔軟性を提供していない。
道路網の構造に適応するグラフ畳み込みネットワークに基づく誘導グラフ強化学習(IG-RL)を導入し,交通制御装置とその周辺環境の詳細な表現を学習する。
分散アプローチは,転送可能適応型信号制御ポリシの学習を可能にする。
任意の種類の道路網上でトレーニングされた後、新たな道路網、交通分布、交通レジームに一般化し、追加のトレーニングやパラメータの一定数を必要とせず、従来の手法よりも高いスケーラビリティを実現します。
さらに,車線レベルと車両レベルの両方で(動的)需要を捉えることで,利用可能なデータの粒度を活用できる。
提案手法は,トレーニング中に経験したことのない道路網と交通条件の両方で検証される。
IG-RLとマルチエージェント強化学習とドメイン固有ベースラインを比較した。
合成道路網とマンハッタンの3,971の交通信号の制御に関するより大きな実験において、IG-RLの異なるインスタンス化がベースラインより優れていることを示す。
関連論文リスト
- Improving Traffic Flow Predictions with SGCN-LSTM: A Hybrid Model for Spatial and Temporal Dependencies [55.2480439325792]
本稿ではSGCN-LSTM(Signal-Enhanced Graph Convolutional Network Long Short Term Memory)モデルを提案する。
PEMS-BAYロードネットワークトラフィックデータセットの実験は、SGCN-LSTMモデルの有効性を示す。
論文 参考訳(メタデータ) (2024-11-01T00:37:00Z) - Towards Multi-agent Reinforcement Learning based Traffic Signal Control through Spatio-temporal Hypergraphs [19.107744041461316]
交通信号制御システム(TSCS)は、インテリジェントな交通管理に不可欠なものであり、効率的な車両の流れを育んでいる。
従来のアプローチでは、道路網を標準的なグラフに単純化することが多い。
本稿では,インテリジェントトラフィック制御を実現するための新しいTSCSフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-17T02:46:18Z) - A Holistic Framework Towards Vision-based Traffic Signal Control with
Microscopic Simulation [53.39174966020085]
交通信号制御(TSC)は交通渋滞を低減し、交通の流れを円滑にし、アイドリング時間を短縮し、CO2排出量を減らすために重要である。
本研究では,道路交通の流れを視覚的観察によって調節するTSCのコンピュータビジョンアプローチについて検討する。
我々は、視覚ベースのTSCとそのベンチマークに向けて、TrafficDojoと呼ばれる総合的なトラフィックシミュレーションフレームワークを導入する。
論文 参考訳(メタデータ) (2024-03-11T16:42:29Z) - A Deep Reinforcement Learning Approach for Adaptive Traffic Routing in
Next-gen Networks [1.1586742546971471]
次世代ネットワークは、トラフィックダイナミクスに基づいたネットワーク構成を自動化し、適応的に調整する必要がある。
交通政策を決定する伝統的な手法は、通常は手作りのプログラミング最適化とアルゴリズムに基づいている。
我々は適応的なトラフィックルーティングのための深層強化学習(DRL)アプローチを開発する。
論文 参考訳(メタデータ) (2024-02-07T01:48:29Z) - Joint Optimization of Traffic Signal Control and Vehicle Routing in
Signalized Road Networks using Multi-Agent Deep Reinforcement Learning [19.024527400852968]
信号化道路網における交通信号制御と車両ルーティングの協調最適化手法を提案する。
マルチエージェントディープ強化学習(MADRL)を用いた信号タイミングと経路選択を同時に制御することでネットワーク性能を向上させることを目的とする。
本研究は,MADRLを用いて信号制御と車両経路の最適結合ポリシーを導出する最初の試みである。
論文 参考訳(メタデータ) (2023-10-16T22:10:47Z) - A Novel Multi-Agent Deep RL Approach for Traffic Signal Control [13.927155702352131]
都市ネットワークにおける複数の交通信号制御のための Friend-Deep Q-network (Friend-DQN) アプローチを提案する。
特に、複数のエージェント間の協調は状態-作用空間を減少させ、収束を加速させる。
論文 参考訳(メタデータ) (2023-06-05T08:20:37Z) - Improving the generalizability and robustness of large-scale traffic
signal control [3.8028221877086814]
交通信号の制御における深部強化学習(RL)アプローチの堅牢性について検討する。
欠落したデータに対して,近年の手法が脆弱なままであることを示す。
政策アンサンブルによる分散強化学習とバニラ強化学習の組み合わせを提案する。
論文 参考訳(メタデータ) (2023-06-02T21:30:44Z) - Road Network Guided Fine-Grained Urban Traffic Flow Inference [108.64631590347352]
粗いトラフィックからのきめ細かなトラフィックフローの正確な推測は、新たな重要な問題である。
本稿では,道路ネットワークの知識を活かした新しい道路対応交通流磁化器(RATFM)を提案する。
提案手法は,高品質なトラフィックフローマップを作成できる。
論文 参考訳(メタデータ) (2021-09-29T07:51:49Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。
近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。
本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文 参考訳(メタデータ) (2021-01-04T03:06:08Z) - Multi-Agent Routing Value Iteration Network [88.38796921838203]
疎結合グラフの学習値に基づいてマルチエージェントルーティングを行うことができるグラフニューラルネットワークに基づくモデルを提案する。
最大25ノードのグラフ上で2つのエージェントでトレーニングしたモデルでは,より多くのエージェントやノードを持つ状況に容易に一般化できることが示されている。
論文 参考訳(メタデータ) (2020-07-09T22:16:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。