論文の概要: Back to Basics: Deep Reinforcement Learning in Traffic Signal Control
- arxiv url: http://arxiv.org/abs/2109.07180v1
- Date: Wed, 15 Sep 2021 09:36:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-16 14:56:10.023131
- Title: Back to Basics: Deep Reinforcement Learning in Traffic Signal Control
- Title(参考訳): back to basics: 交通信号制御における深い強化学習
- Authors: Sierk Kanis, Laurens Samson, Daan Bloembergen, Tim Bakker
- Abstract要約: 本稿では、自己学習信号に対する強化学習(RL)アプローチの基礎的前提について再検討する。
本稿では、ロバストな性能と、目に見えないトラフィックフローに対する優れた一般化を提供する選択の組み合わせであるRLightを提案する。
実世界のHangzhouトラフィックデータセットを用いた評価によると、RLightは最先端のルールベースおよび深層強化学習アルゴリズムより優れている。
- 参考スコア(独自算出の注目度): 3.2880869992413255
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper we revisit some of the fundamental premises for a reinforcement
learning (RL) approach to self-learning traffic lights. We propose RLight, a
combination of choices that offers robust performance and good generalization
to unseen traffic flows. In particular, our main contributions are threefold:
our lightweight and cluster-aware state representation leads to improved
performance; we reformulate the MDP such that it skips redundant timesteps of
yellow light, speeding up learning by 30%; and we investigate the action space
and provide insight into the difference in performance between acyclic and
cyclic phase transitions. Additionally, we provide insights into the
generalisation of the methods to unseen traffic. Evaluations using the
real-world Hangzhou traffic dataset show that RLight outperforms
state-of-the-art rule-based and deep reinforcement learning algorithms,
demonstrating the potential of RL-based methods to improve urban traffic flows.
- Abstract(参考訳): 本稿では、自己学習信号に対する強化学習(RL)アプローチの基礎的前提について再検討する。
我々はrlightを提案する。rlightはロバストなパフォーマンスと未認識のトラフィックフローに対する優れた一般化を提供する。
特に,我々の主なコントリビューションは3つある: 軽量かつクラスタ対応の状態表現により性能が向上する; 黄色光の冗長なタイムステップを省略し,学習を30%高速化する; 動作空間を調査し,非周期相転移と循環相転移の相違点について考察する; MDPを再構築する。
さらに,トラフィックを隠蔽する手法の一般化に関する洞察も提供する。
実世界のhanzhou trafficデータセットを用いた評価では、rlightは最先端のルールベースおよび深層強化学習アルゴリズムよりも優れており、rlベースの方法が都市交通フローを改善する可能性を実証している。
関連論文リスト
- Reinforcement Learning for Adaptive Traffic Signal Control: Turn-Based and Time-Based Approaches to Reduce Congestion [2.733700237741334]
本稿では,交差点における信号処理の強化にReinforcement Learning(強化学習)を用いることについて検討する。
本稿では,リアルタイム待ち行列長に基づく信号の動的優先順位付けを行うターンベースエージェントと,交通条件に応じた信号位相長の調整を行うタイムベースエージェントの2つのアルゴリズムを紹介する。
シミュレーションの結果、両RLアルゴリズムは従来の信号制御システムよりも大幅に優れていた。
論文 参考訳(メタデータ) (2024-08-28T12:35:56Z) - MoveLight: Enhancing Traffic Signal Control through Movement-Centric Deep Reinforcement Learning [13.369840354712021]
MoveLightは移動中心の深層強化学習を通じて都市交通管理を強化する新しい交通信号制御システムである。
詳細なリアルタイムデータと高度な機械学習技術を活用することで、MoveLightは従来の信号制御手法の限界を克服する。
論文 参考訳(メタデータ) (2024-07-24T14:17:16Z) - Cross-domain Few-shot In-context Learning for Enhancing Traffic Sign Recognition [49.20086587208214]
交通信号認識の強化を目的としたMLLMに基づくドメイン間数ショットインコンテキスト学習手法を提案する。
記述テキストを使用することで、テンプレートと実際の交通標識のドメイン間差を低減することができる。
提案手法は,大規模交通標識画像やラベルを必要とせず,単純かつ均一なテキスト表示のみを必要とする。
論文 参考訳(メタデータ) (2024-07-08T10:51:03Z) - A Holistic Framework Towards Vision-based Traffic Signal Control with
Microscopic Simulation [53.39174966020085]
交通信号制御(TSC)は交通渋滞を低減し、交通の流れを円滑にし、アイドリング時間を短縮し、CO2排出量を減らすために重要である。
本研究では,道路交通の流れを視覚的観察によって調節するTSCのコンピュータビジョンアプローチについて検討する。
我々は、視覚ベースのTSCとそのベンチマークに向けて、TrafficDojoと呼ばれる総合的なトラフィックシミュレーションフレームワークを導入する。
論文 参考訳(メタデータ) (2024-03-11T16:42:29Z) - Applying Reinforcement Learning to Optimize Traffic Light Cycles [0.0]
本稿では,リアルタイムに信号サイクルを最適化するための強化学習の応用を提案する。
本稿では,シミュレーション都市モビリティシミュレータを用いて,深層Q-Networkアルゴリズムの学習を行う。
論文 参考訳(メタデータ) (2024-02-22T07:37:04Z) - Prioritized Trajectory Replay: A Replay Memory for Data-driven
Reinforcement Learning [52.49786369812919]
本稿では,サンプリング視点をトラジェクトリに拡張するメモリ技術である(Prioritized) Trajectory Replay (TR/PTR)を提案する。
TRは、その後の状態情報の使用を最適化するトラジェクトリの後方サンプリングによって学習効率を向上させる。
D4RL上の既存のオフラインRLアルゴリズムとTRとPTRを統合する利点を実証する。
論文 参考訳(メタデータ) (2023-06-27T14:29:44Z) - INFOrmation Prioritization through EmPOWERment in Visual Model-Based RL [90.06845886194235]
モデルベース強化学習(RL)のための修正目的を提案する。
相互情報に基づく状態空間モデルに,変分エンパワーメントにインスパイアされた用語を統合する。
本研究は,視覚に基づくロボット制御作業における自然な映像背景を用いたアプローチの評価である。
論文 参考訳(メタデータ) (2022-04-18T23:09:23Z) - Road Network Guided Fine-Grained Urban Traffic Flow Inference [108.64631590347352]
粗いトラフィックからのきめ細かなトラフィックフローの正確な推測は、新たな重要な問題である。
本稿では,道路ネットワークの知識を活かした新しい道路対応交通流磁化器(RATFM)を提案する。
提案手法は,高品質なトラフィックフローマップを作成できる。
論文 参考訳(メタデータ) (2021-09-29T07:51:49Z) - MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。
近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。
本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文 参考訳(メタデータ) (2021-01-04T03:06:08Z) - GeneraLight: Improving Environment Generalization of Traffic Signal
Control via Meta Reinforcement Learning [35.351323110536924]
本稿では,Wasserstein生成逆数ネットワークに基づく新しいトラフィックフロー生成手法を提案し,十分な多種多様な品質のトラフィックフローを生成する。
GeneraLightは、フロークラスタリングとモデルに依存しないメタラーニングのアイデアを組み合わせることで、一般化のパフォーマンスを向上する。
論文 参考訳(メタデータ) (2020-09-17T04:14:28Z) - Efficiency and Equity are Both Essential: A Generalized Traffic Signal
Controller with Deep Reinforcement Learning [25.21831641893209]
本稿では,信号制御系に対して,最適化されたトラフィックフローを目的とした深層強化学習を用いた学習ポリシーを提案する。
提案手法は,効率と公平性を同時に考慮した報酬関数の新規な定式化を用いている。
シミュレーションおよび実世界のデータを用いた実験により,提案アルゴリズムが最先端の性能を達成することを示す。
論文 参考訳(メタデータ) (2020-03-09T11:34:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。