Fugu-MT 論文翻訳(概要): Cooperative Multi-Objective Reinforcement Learning for Traffic Signal Control and Carbon Emission Reduction

論文の概要: Cooperative Multi-Objective Reinforcement Learning for Traffic Signal Control and Carbon Emission Reduction

arxiv url: http://arxiv.org/abs/2306.09662v2
Date: Sun, 16 Jul 2023 07:29:23 GMT
ステータス: 翻訳完了
システム内更新日: 2023-07-19 18:29:06.928056
Title: Cooperative Multi-Objective Reinforcement Learning for Traffic Signal Control and Carbon Emission Reduction
Title（参考訳）: 交通信号制御と炭素排出削減のための協調多目的強化学習
Authors: Cheng Ruei Tang, Jun Wei Hsieh, and Shin You Teng
Abstract要約: 本稿では,多目的多元的深層決定主義政策グラディエントという協調型多目的アーキテクチャを提案する。 MOMA-DDPGは、年齢遅延重みを用いた信号制御最適化のための複数の報酬項を推定する。以上の結果から,MOMA-DDPGの有効性が示された。
参考スコア（独自算出の注目度）: 3.3454373538792552
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Existing traffic signal control systems rely on oversimplified rule-based methods, and even RL-based methods are often suboptimal and unstable. To address this, we propose a cooperative multi-objective architecture called Multi-Objective Multi-Agent Deep Deterministic Policy Gradient (MOMA-DDPG), which estimates multiple reward terms for traffic signal control optimization using age-decaying weights. Our approach involves two types of agents: one focuses on optimizing local traffic at each intersection, while the other aims to optimize global traffic throughput. We evaluate our method using real-world traffic data collected from an Asian country's traffic cameras. Despite the inclusion of a global agent, our solution remains decentralized as this agent is no longer necessary during the inference stage. Our results demonstrate the effectiveness of MOMA-DDPG, outperforming state-of-the-art methods across all performance metrics. Additionally, our proposed system minimizes both waiting time and carbon emissions. Notably, this paper is the first to link carbon emissions and global agents in traffic signal control.
Abstract（参考訳）: 既存の交通信号制御システムは、過度に単純化されたルールベースの方法に依存しており、rlベースの方法でさえしばしば最適で不安定である。そこで我々は,MOMA-DDPG(Multi-Objective Multi-Agent Deep Deterministic Policy Gradient)と呼ばれる協調型多目的アーキテクチャを提案する。 1つは各交差点でのローカルトラフィックの最適化に重点を置き、もう1つはグローバルトラフィックスループットの最適化を目的としています。本手法は,アジアの交通カメラから収集した実世界の交通データを用いて評価する。グローバルエージェントが組み込まれているにもかかわらず、このエージェントは推論段階では不要であるため、ソリューションは分散のままである。以上の結果から,MOMA-DDPGの有効性が示された。さらに,提案システムでは,待ち時間と二酸化炭素排出量を最小化する。特に,本論文は,交通信号制御において炭素排出とグローバルエージェントをリンクする最初の方法である。

関連論文リスト

Human-Centric Traffic Signal Control for Equity: A Multi-Agent Action Branching Deep Reinforcement Learning Approach [5.2437780355984165]
人中心型マルチエージェントアクションブラッチングダブルディープQネットワーク(DQN)フレームワークであるMA2B-DDQNを提案する。我々の重要な貢献は、廊下制御を局所的な区間ごとの動作に分解するアクション分岐離散制御の定式化である。また、歩行者、乗務員、交通機関の乗客を考慮し、廊下で遅れた人の数を罰する人間中心の報酬も設計する。
論文参考訳（メタデータ） (2026-02-03T00:56:03Z)
Improving Traffic Flow Predictions with SGCN-LSTM: A Hybrid Model for Spatial and Temporal Dependencies [55.2480439325792]
本稿ではSGCN-LSTM(Signal-Enhanced Graph Convolutional Network Long Short Term Memory)モデルを提案する。 PEMS-BAYロードネットワークトラフィックデータセットの実験は、SGCN-LSTMモデルの有効性を示す。
論文参考訳（メタデータ） (2024-11-01T00:37:00Z)
Reinforcement Learning Approaches for Traffic Signal Control under Missing Data [5.896742981602458]
現実世界の都市では、センサーの欠如により交通状態の観察が欠如することがある。本稿では, 適応制御を実現するために, トラフィック状態をインプットし, 適応制御とRLエージェントの訓練を可能にするために, 状態と報酬の両方をインプットする2つの方法を提案する。
論文参考訳（メタデータ） (2023-04-21T03:26:33Z)
Unified Automatic Control of Vehicular Systems with Reinforcement Learning [64.63619662693068]
本稿では,車載マイクロシミュレーションの合理化手法について述べる。最小限の手動設計で高性能な制御戦略を発見する。この研究は、波動緩和、交通信号、ランプ計測に類似した多くの創発的挙動を明らかにしている。
論文参考訳（メタデータ） (2022-07-30T16:23:45Z)
Cooperative Reinforcement Learning on Traffic Signal Control [3.759936323189418]
交通信号の制御は、道路交差点での車両の移動を調整することで、全体の走行時間を最小化することを目的とした、現実的な課題である。既存の信号制御システムは、過度に単純化された情報とルールベースの方法に大きく依存している。本稿では,交通信号制御最適化のための複数の報酬項をより正確に推定するために,年齢遅延重み付き協調型多目的アーキテクチャを提案する。
論文参考訳（メタデータ） (2022-05-23T13:25:15Z)
AI-aided Traffic Control Scheme for M2M Communications in the Internet of Vehicles [61.21359293642559]
交通のダイナミクスと異なるIoVアプリケーションの異種要求は、既存のほとんどの研究では考慮されていない。本稿では,ハイブリッド交通制御方式とPPO法を併用して検討する。
論文参考訳（メタデータ） (2022-03-05T10:54:05Z)
A Deep Reinforcement Learning Approach for Traffic Signal Control Optimization [14.455497228170646]
非効率な信号制御手法は、交通渋滞やエネルギー浪費などの多くの問題を引き起こす可能性がある。本稿では,アクター・クリティカル・ポリシー・グラデーション・アルゴリズムを拡張し,マルチエージェント・ディープ・決定性ポリシー・グラデーション(MADDPG)法を提案する。
論文参考訳（メタデータ） (2021-07-13T14:11:04Z)
Effects of Smart Traffic Signal Control on Air Quality [0.0]
マルチエージェント深部強化学習(MARL)は交通システムにおいて実験的に研究されている。 MA2Cと呼ばれる、確立されたアドバンテージアクター・クリティカル(A2C)アルゴリズムのマルチエージェント版が最近開発され、エージェント間の通信の有望なアイデアを活用している。この観点から、エージェントは他のエージェントと戦略を共有し、エージェントの数や多様性が増大しても学習プロセスを安定化させる。
論文参考訳（メタデータ） (2021-07-06T02:48:42Z)
End-to-End Intersection Handling using Multi-Agent Deep Reinforcement Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文参考訳（メタデータ） (2021-04-28T07:54:40Z)
Network-wide traffic signal control optimization using a multi-agent deep reinforcement learning [20.385286762476436]
非効率な交通制御は、交通渋滞やエネルギー廃棄物などの多くの問題を引き起こす可能性がある。本論文では,交通信号間の協調性を高めることで最適制御を実現するマルチエージェント強化学習手法であるKS-DDPGを提案する。
論文参考訳（メタデータ） (2021-04-20T12:53:08Z)
MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文参考訳（メタデータ） (2021-01-04T03:06:08Z)
Optimizing Mixed Autonomy Traffic Flow With Decentralized Autonomous Vehicles and Multi-Agent RL [63.52264764099532]
本研究では、完全分散制御方式を用いて、混合自律環境でのボトルネックのスループットを向上させる自動運転車の能力について検討する。この問題にマルチエージェント強化アルゴリズムを適用し、5%の浸透速度で20%から40%の浸透速度で33%までのボトルネックスループットの大幅な改善が達成できることを実証した。
論文参考訳（メタデータ） (2020-10-30T22:06:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。