論文の概要: Congested Urban Networks Tend to Be Insensitive to Signal Settings:
Implications for Learning-Based Control
- arxiv url: http://arxiv.org/abs/2008.10989v2
- Date: Fri, 2 Sep 2022 20:07:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-26 22:03:55.717999
- Title: Congested Urban Networks Tend to Be Insensitive to Signal Settings:
Implications for Learning-Based Control
- Title(参考訳): 密集した都市ネットワークは信号設定に敏感である:学習制御における意味
- Authors: Jorge Laval and Hao Zhou
- Abstract要約: 我々は,密度が増加するにつれて,平均的なネットワークフローが信号制御方針から独立する傾向にあることを示す。
この性質は, 密集条件下での訓練では, 深層強化学習法が有効でないことを示している。
- 参考スコア(独自算出の注目度): 14.121892144198084
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper highlights several properties of large urban networks that can
have an impact on machine learning methods applied to traffic signal control.
In particular, we show that the average network flow tends to be independent of
the signal control policy as density increases. This property, which so far has
remained under the radar, implies that deep reinforcement learning (DRL)
methods becomes ineffective when trained under congested conditions, and might
explain DRL's limited success for traffic signal control. Our results apply to
all possible grid networks thanks to a parametrization based on two network
parameters: the ratio of the expected distance between consecutive traffic
lights to the expected green time, and the turning probability at
intersections. Networks with different parameters exhibit very different
responses to traffic signal control. Notably, we found that no control (i.e.
random policy) can be an effective control strategy for a surprisingly large
family of networks. The impact of the turning probability turned out to be very
significant both for baseline and for DRL policies. It also explains the loss
of symmetry observed for these policies, which is not captured by existing
theories that rely on corridor approximations without turns. Our findings also
suggest that supervised learning methods have enormous potential as they
require very little examples to produce excellent policies.
- Abstract(参考訳): 本稿では,交通信号制御に応用した機械学習手法に影響を及ぼす大都市ネットワークの特性について述べる。
特に、密度が増加するにつれて、平均的なネットワークフローは信号制御ポリシーから独立する傾向にあることを示す。
この特性は、これまでレーダーの下に留まっていたが、密集した条件下での訓練において、深層強化学習(DRL)手法が効果を低下させ、DRLが信号制御において限られた成功を収めたことを説明できる。
この結果は、2つのネットワークパラメータに基づくパラメトリゼーションにより、連続する信号機とグリーン時間との所望距離の比率と交差点での旋回確率の比により、すべてのグリッドネットワークに適用できる。
異なるパラメータを持つネットワークは、トラフィック信号制御に対して非常に異なる応答を示す。
特に、驚くほど大きなネットワーク群に対して、制御(すなわちランダムポリシー)が効果的な制御戦略になり得ないことが分かりました。
旋回確率の影響は、ベースラインとDRLポリシーの両方において非常に重要であることが判明した。
また、これらの政策で観察される対称性の喪失についても説明しており、これは回転のない廊下近似に依存する既存の理論では捉えられていない。
また, 教師あり学習手法は, 優れた政策作成に極めて少ない実例を必要とするため, 極めて有意な可能性を示唆した。
関連論文リスト
- Decentralized Learning Strategies for Estimation Error Minimization with Graph Neural Networks [94.2860766709971]
統計的に同一性を持つ無線ネットワークにおける自己回帰的マルコフ過程のサンプリングとリモート推定の課題に対処する。
我々のゴールは、分散化されたスケーラブルサンプリングおよび送信ポリシーを用いて、時間平均推定誤差と/または情報の年齢を最小化することである。
論文 参考訳(メタデータ) (2024-04-04T06:24:11Z) - DenseLight: Efficient Control for Large-scale Traffic Signals with Dense
Feedback [109.84667902348498]
交通信号制御(TSC)は、道路網における車両の平均走行時間を短縮することを目的としている。
従来のTSC手法は、深い強化学習を利用して制御ポリシーを探索する。
DenseLightは、不偏報酬関数を用いてポリシーの有効性をフィードバックする新しいRTLベースのTSC手法である。
論文 参考訳(メタデータ) (2023-06-13T05:58:57Z) - Improving the generalizability and robustness of large-scale traffic
signal control [3.8028221877086814]
交通信号の制御における深部強化学習(RL)アプローチの堅牢性について検討する。
欠落したデータに対して,近年の手法が脆弱なままであることを示す。
政策アンサンブルによる分散強化学習とバニラ強化学習の組み合わせを提案する。
論文 参考訳(メタデータ) (2023-06-02T21:30:44Z) - Reinforcement Learning Approaches for Traffic Signal Control under
Missing Data [5.896742981602458]
現実世界の都市では、センサーの欠如により交通状態の観察が欠如することがある。
本稿では, 適応制御を実現するために, トラフィック状態をインプットし, 適応制御とRLエージェントの訓練を可能にするために, 状態と報酬の両方をインプットする2つの方法を提案する。
論文 参考訳(メタデータ) (2023-04-21T03:26:33Z) - Deep Reinforcement Learning for Traffic Light Control in Intelligent
Transportation Systems [19.318117948342362]
道路網におけるリアルタイム交通状況に基づいて信号機を適応的に制御するための,深部強化学習 (DRL) は有望なアプローチである。
2つのシナリオにおいて、交通信号制御問題に対して2つのDRLアルゴリズムを用いる。
単一の道路交差点とグリッド道路ネットワークの両方で配信されたポリシーは、DRLアルゴリズムのスケーラビリティを示している。
論文 参考訳(メタデータ) (2023-02-04T02:49:12Z) - Lyapunov Function Consistent Adaptive Network Signal Control with Back
Pressure and Reinforcement Learning [9.797994846439527]
本研究では、それぞれ特定のリャプノフ関数を定義するリアプノフ制御理論を用いた統一的なフレームワークを提案する。
Lyapunov理論の知見に基づいて、この研究は強化学習(Reinforcement Learning, RL)に基づくネットワーク信号制御のための報酬関数を設計する。
提案アルゴリズムは, 純旅客車流および貨物を含む異種交通流下での従来のRL法およびRL法と比較した。
論文 参考訳(メタデータ) (2022-10-06T00:22:02Z) - Learning energy-efficient driving behaviors by imitating experts [75.12960180185105]
本稿では,コミュニケーション・センシングにおける制御戦略と現実的限界のギャップを埋める上で,模倣学習が果たす役割について考察する。
擬似学習は、車両の5%に採用されれば、局地的な観測のみを用いて、交通条件の異なるネットワークのエネルギー効率を15%向上させる政策を導出できることを示す。
論文 参考訳(メタデータ) (2022-06-28T17:08:31Z) - AI-aided Traffic Control Scheme for M2M Communications in the Internet
of Vehicles [61.21359293642559]
交通のダイナミクスと異なるIoVアプリケーションの異種要求は、既存のほとんどの研究では考慮されていない。
本稿では,ハイブリッド交通制御方式とPPO法を併用して検討する。
論文 参考訳(メタデータ) (2022-03-05T10:54:05Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。
近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。
本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文 参考訳(メタデータ) (2021-01-04T03:06:08Z) - IG-RL: Inductive Graph Reinforcement Learning for Massive-Scale Traffic
Signal Control [4.273991039651846]
適応的な交通信号制御のスケーリングには、状態と行動空間を扱う必要がある。
本稿では,グラフ畳み込みネットワークに基づくインダクティブグラフ強化学習(IG-RL)を紹介する。
我々のモデルは、新しい道路網、交通分布、交通体制に一般化することができる。
論文 参考訳(メタデータ) (2020-03-06T17:17:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。