論文の概要: Effects of Smart Traffic Signal Control on Air Quality
- arxiv url: http://arxiv.org/abs/2107.02361v1
- Date: Tue, 6 Jul 2021 02:48:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-07 13:56:00.089113
- Title: Effects of Smart Traffic Signal Control on Air Quality
- Title(参考訳): スマート交通信号制御が空気品質に及ぼす影響
- Authors: Paolo Fazzini, Marco Torre, Valeria Rizza and Francesco Petracchini
- Abstract要約: マルチエージェント深部強化学習(MARL)は交通システムにおいて実験的に研究されている。
MA2Cと呼ばれる、確立されたアドバンテージアクター・クリティカル(A2C)アルゴリズムのマルチエージェント版が最近開発され、エージェント間の通信の有望なアイデアを活用している。
この観点から、エージェントは他のエージェントと戦略を共有し、エージェントの数や多様性が増大しても学習プロセスを安定化させる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Adaptive traffic signal control (ATSC) in urban traffic networks poses a
challenging task due to the complicated dynamics arising in traffic systems. In
recent years, several approaches based on multi-agent deep reinforcement
learning (MARL) have been studied experimentally. These approaches propose
distributed techniques in which each signalized intersection is seen as an
agent in a stochastic game whose purpose is to optimize the flow of vehicles in
its vicinity. In this setting, the systems evolves towards an equilibrium among
the agents that shows beneficial for the whole traffic network. A recently
developed multi-agent variant of the well-established advantage actor-critic
(A2C) algorithm, called MA2C (multi-agent A2C) exploits the promising idea of
some communication among the agents. In this view,the agents share their
strategies with other neighbor agents, thereby stabilizing the learning process
even when the agents grow in number and variety. We experimented MA2C in two
traffic networks located in Bologna (Italy) and found that its action
translates into a significant decrease of the amount of pollutants released
into the environment.
- Abstract(参考訳): 都市交通ネットワークにおける適応的交通信号制御(ATSC)は,交通システムに生じる複雑なダイナミクスのため,課題となる。
近年,マルチエージェント深層強化学習(marl)に基づく手法が実験的に研究されている。
これらの手法は,周囲の車両の流れを最適化することを目的とした確率ゲームにおいて,各信号交差点をエージェントとみなす分散手法を提案する。
この設定では、システムはネットワーク全体の利益を示すエージェント間の平衡に向かって進化する。
ma2c(multi-agent a2c)と呼ばれる、確立されたアドバンテージ・アクタ-クリティック(a2c)アルゴリズムのマルチエージェント版が最近開発された。
この観点から、エージェントは他のエージェントと戦略を共有し、エージェントの数や多様性が増大しても学習プロセスを安定化させる。
ボローニャ(イタリア)の2つの交通ネットワークでMA2Cを実験したところ、その作用は環境に放出される汚染物質の量を大幅に減少させることがわかった。
関連論文リスト
- Multi-agent reinforcement learning using echo-state network and its application to pedestrian dynamics [0.0]
本研究は, グリッドワールド環境における道路を考察し, エコー状態ネットワークと最小二乗ポリシー反復法を用いて歩行者をMARLエージェントとして実装した。
この環境下では、これらのエージェントが他のエージェントを避けて前進することを学ぶ能力について検討した。
論文 参考訳(メタデータ) (2023-12-19T04:02:50Z) - Cooperative Multi-Objective Reinforcement Learning for Traffic Signal
Control and Carbon Emission Reduction [3.3454373538792552]
本稿では,多目的多元的深層決定主義政策グラディエントという協調型多目的アーキテクチャを提案する。
MOMA-DDPGは、年齢遅延重みを用いた信号制御最適化のための複数の報酬項を推定する。
以上の結果から,MOMA-DDPGの有効性が示された。
論文 参考訳(メタデータ) (2023-06-16T07:37:05Z) - DenseLight: Efficient Control for Large-scale Traffic Signals with Dense
Feedback [109.84667902348498]
交通信号制御(TSC)は、道路網における車両の平均走行時間を短縮することを目的としている。
従来のTSC手法は、深い強化学習を利用して制御ポリシーを探索する。
DenseLightは、不偏報酬関数を用いてポリシーの有効性をフィードバックする新しいRTLベースのTSC手法である。
論文 参考訳(メタデータ) (2023-06-13T05:58:57Z) - iPLAN: Intent-Aware Planning in Heterogeneous Traffic via Distributed
Multi-Agent Reinforcement Learning [57.24340061741223]
本稿では,高密度および不均一な交通シナリオにおける軌跡や意図を予測できる分散マルチエージェント強化学習(MARL)アルゴリズムを提案する。
インテント対応プランニングのアプローチであるiPLANにより、エージェントは近くのドライバーの意図をローカルな観察からのみ推測できる。
論文 参考訳(メタデータ) (2023-06-09T20:12:02Z) - Latent Interactive A2C for Improved RL in Open Many-Agent Systems [12.41853254173419]
対話的アドバンテージアクター批評家(IA2C)は、分散トレーニングと分散実行に従事している。
本稿では,エンコーダ・デコーダアーキテクチャを用いて隠れ状態と他のエージェントの動作の潜在表現を学習する潜時IA2Cを提案する。
2つのドメイン(それぞれ多くのエージェントが居住している)における実験により、潜伏型IA2Cは分散を低減し、より速く収束することにより、試料効率を著しく向上することが明らかとなった。
論文 参考訳(メタデータ) (2023-05-09T04:03:40Z) - SocialLight: Distributed Cooperation Learning towards Network-Wide
Traffic Signal Control [7.387226437589183]
SocialLightは交通信号制御のための新しいマルチエージェント強化学習手法である。
地元におけるエージェントの個人的限界貢献を推定することにより、協力的な交通規制政策を学習する。
我々は,2つの交通シミュレータの標準ベンチマークにおける最先端の交通信号制御手法に対して,トレーニングネットワークをベンチマークした。
論文 参考訳(メタデータ) (2023-04-20T12:41:25Z) - Traj-MAE: Masked Autoencoders for Trajectory Prediction [69.7885837428344]
軌道予測は、危険を予測して信頼性の高い自動運転システムを構築する上で重要な課題である。
本稿では,運転環境におけるエージェントの複雑な動作をよりよく表現する,軌道予測のための効率的なマスク付きオートエンコーダを提案する。
複数エージェント設定と単一エージェント設定の両方の実験結果から,Traj-MAEが最先端手法と競合する結果が得られることが示された。
論文 参考訳(メタデータ) (2023-03-12T16:23:27Z) - AI-aided Traffic Control Scheme for M2M Communications in the Internet
of Vehicles [61.21359293642559]
交通のダイナミクスと異なるIoVアプリケーションの異種要求は、既存のほとんどの研究では考慮されていない。
本稿では,ハイブリッド交通制御方式とPPO法を併用して検討する。
論文 参考訳(メタデータ) (2022-03-05T10:54:05Z) - A Deep Reinforcement Learning Approach for Traffic Signal Control
Optimization [14.455497228170646]
非効率な信号制御手法は、交通渋滞やエネルギー浪費などの多くの問題を引き起こす可能性がある。
本稿では,アクター・クリティカル・ポリシー・グラデーション・アルゴリズムを拡張し,マルチエージェント・ディープ・決定性ポリシー・グラデーション(MADDPG)法を提案する。
論文 参考訳(メタデータ) (2021-07-13T14:11:04Z) - MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。
近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。
本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文 参考訳(メタデータ) (2021-01-04T03:06:08Z) - Optimizing Mixed Autonomy Traffic Flow With Decentralized Autonomous
Vehicles and Multi-Agent RL [63.52264764099532]
本研究では、完全分散制御方式を用いて、混合自律環境でのボトルネックのスループットを向上させる自動運転車の能力について検討する。
この問題にマルチエージェント強化アルゴリズムを適用し、5%の浸透速度で20%から40%の浸透速度で33%までのボトルネックスループットの大幅な改善が達成できることを実証した。
論文 参考訳(メタデータ) (2020-10-30T22:06:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。