論文の概要: Efficiency and Equity are Both Essential: A Generalized Traffic Signal
Controller with Deep Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2003.04046v3
- Date: Sun, 27 Dec 2020 12:26:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-25 08:24:12.681490
- Title: Efficiency and Equity are Both Essential: A Generalized Traffic Signal
Controller with Deep Reinforcement Learning
- Title(参考訳): 効率性と等価性は両立する: 深層強化学習を用いた一般化信号制御器
- Authors: Shengchao Yan, Jingwei Zhang, Daniel B\"uscher, Wolfram Burgard
- Abstract要約: 本稿では,信号制御系に対して,最適化されたトラフィックフローを目的とした深層強化学習を用いた学習ポリシーを提案する。
提案手法は,効率と公平性を同時に考慮した報酬関数の新規な定式化を用いている。
シミュレーションおよび実世界のデータを用いた実験により,提案アルゴリズムが最先端の性能を達成することを示す。
- 参考スコア(独自算出の注目度): 25.21831641893209
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Traffic signal controllers play an essential role in today's traffic system.
However, the majority of them currently is not sufficiently flexible or
adaptive to generate optimal traffic schedules. In this paper we present an
approach to learning policies for signal controllers using deep reinforcement
learning aiming for optimized traffic flow. Our method uses a novel formulation
of the reward function that simultaneously considers efficiency and equity. We
furthermore present a general approach to find the bound for the proposed
equity factor and we introduce the adaptive discounting approach that greatly
stabilizes learning and helps to maintain a high flexibility of green light
duration. The experimental evaluations on both simulated and real-world data
demonstrate that our proposed algorithm achieves state-of-the-art performance
(previously held by traditional non-learning methods) on a wide range of
traffic situations.
- Abstract(参考訳): 交通信号制御装置は、今日の交通システムにおいて重要な役割を果たす。
しかし、その大半は最適な交通スケジュールを生成するのに十分な柔軟性や適応性を持っていない。
本稿では,交通流最適化を目的とした深層強化学習を用いた信号制御装置の学習ポリシーを提案する。
提案手法は,効率と公平性を同時に考慮した報酬関数の新規な定式化を用いる。
さらに、提案するエクイティファクターのバウンドを見つけるための一般的なアプローチを提案し、学習を大幅に安定化させ、グリーン光持続時間の高い柔軟性を維持するための適応型ディスカウント手法を提案する。
シミュレーションと実世界の両方のデータを用いた実験により,提案アルゴリズムは,幅広い交通状況において,従来の非学習手法が保持していた最先端性能を実現することを示す。
関連論文リスト
- MoveLight: Enhancing Traffic Signal Control through Movement-Centric Deep Reinforcement Learning [13.369840354712021]
MoveLightは移動中心の深層強化学習を通じて都市交通管理を強化する新しい交通信号制御システムである。
詳細なリアルタイムデータと高度な機械学習技術を活用することで、MoveLightは従来の信号制御手法の限界を克服する。
論文 参考訳(メタデータ) (2024-07-24T14:17:16Z) - Dual Policy Reinforcement Learning for Real-time Rebalancing in Bike-sharing Systems [13.083156894368532]
自転車シェアリングシステムは、交通渋滞を緩和し、より健康的なライフスタイルを促進する上で重要な役割を担っている。
本研究では,車両群によるリアルタイムリバランス問題に対処するための新しいアプローチを提案する。
在庫とルーティングの決定を分離する、二重ポリシー強化学習アルゴリズムを採用している。
論文 参考訳(メタデータ) (2024-06-02T21:05:23Z) - A Holistic Framework Towards Vision-based Traffic Signal Control with
Microscopic Simulation [53.39174966020085]
交通信号制御(TSC)は交通渋滞を低減し、交通の流れを円滑にし、アイドリング時間を短縮し、CO2排出量を減らすために重要である。
本研究では,道路交通の流れを視覚的観察によって調節するTSCのコンピュータビジョンアプローチについて検討する。
我々は、視覚ベースのTSCとそのベンチマークに向けて、TrafficDojoと呼ばれる総合的なトラフィックシミュレーションフレームワークを導入する。
論文 参考訳(メタデータ) (2024-03-11T16:42:29Z) - Data efficient reinforcement learning and adaptive optimal perimeter
control of network traffic dynamics [0.0]
本研究は、適応最適周波制御のためのマクロトラフィックダイナミクスの学習のための積分強化学習(IRL)に基づくアプローチを提案する。
サンプリングの複雑さを低減し、利用可能なデータをより効率的に利用するために、IRLアルゴリズムに経験再生(ER)技術を導入している。
IRLに基づくアルゴリズムの収束と制御された交通力学の安定性は、リャプノフ理論によって証明される。
論文 参考訳(メタデータ) (2022-09-13T04:28:49Z) - AI-aided Traffic Control Scheme for M2M Communications in the Internet
of Vehicles [61.21359293642559]
交通のダイナミクスと異なるIoVアプリケーションの異種要求は、既存のほとんどの研究では考慮されていない。
本稿では,ハイブリッド交通制御方式とPPO法を併用して検討する。
論文 参考訳(メタデータ) (2022-03-05T10:54:05Z) - Back to Basics: Deep Reinforcement Learning in Traffic Signal Control [3.2880869992413255]
本稿では、自己学習信号に対する強化学習(RL)アプローチの基礎的前提について再検討する。
本稿では、ロバストな性能と、目に見えないトラフィックフローに対する優れた一般化を提供する選択の組み合わせであるRLightを提案する。
実世界のHangzhouトラフィックデータセットを用いた評価によると、RLightは最先端のルールベースおよび深層強化学習アルゴリズムより優れている。
論文 参考訳(メタデータ) (2021-09-15T09:36:23Z) - A Deep Reinforcement Learning Approach for Traffic Signal Control
Optimization [14.455497228170646]
非効率な信号制御手法は、交通渋滞やエネルギー浪費などの多くの問題を引き起こす可能性がある。
本稿では,アクター・クリティカル・ポリシー・グラデーション・アルゴリズムを拡張し,マルチエージェント・ディープ・決定性ポリシー・グラデーション(MADDPG)法を提案する。
論文 参考訳(メタデータ) (2021-07-13T14:11:04Z) - Transferable Deep Reinforcement Learning Framework for Autonomous
Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。
そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。
提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文 参考訳(メタデータ) (2021-05-28T08:45:37Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Real-world Ride-hailing Vehicle Repositioning using Deep Reinforcement
Learning [52.2663102239029]
アイドルヘイリングプラットフォーム上での現実世界の車両の深層強化学習と意思決定時間計画に基づく新しい実用的枠組みを提示する。
本手法は,重み付きバッチ学習アルゴリズムを用いて乗車時の状態値関数を学習する。
配車シミュレーション環境におけるベースラインでアルゴリズムをベンチマークし、収益効率の向上における優位性を実証します。
論文 参考訳(メタデータ) (2021-03-08T05:34:05Z) - MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。
近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。
本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文 参考訳(メタデータ) (2021-01-04T03:06:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。