Fugu-MT 論文翻訳(概要): DynamicLight: Dynamically Tuning Traffic Signal Duration with DRL

論文の概要: DynamicLight: Dynamically Tuning Traffic Signal Duration with DRL

arxiv url: http://arxiv.org/abs/2211.01025v1
Date: Wed, 2 Nov 2022 10:39:59 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-03 12:37:40.773053
Title: DynamicLight: Dynamically Tuning Traffic Signal Duration with DRL
Title（参考訳）: DynamicLight:DRLによる交通信号の動的調整
Authors: Liang Zhang, Qiang Wu, Jun Shen, Linyuan L\"u, Bo Du, Akbar Telikani, Jianqing Wu, Shubin Xie
Abstract要約: このフレームワークは、Max Queue-Lengthを用いて適切なフェーズを選択し、深層Qラーニングネットワークを用いて、対応するフェーズの持続時間を決定する。また,DynamicLightの設計に基づいて,(1)動的位相時間設定を実現するために19個のパラメータのみを用いることで,第1の課題に対処するDynamicLight-Lite,(2)循環相構造においてフレキシブルな位相期間を実現するために,固定された周期順序で位相の集合を動作させることで第2の課題に取り組むDynamicLight-Cycleという2つのバリエーションを導入する。
参考スコア（独自算出の注目度）: 26.59482399009933
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Deep reinforcement learning (DRL) is becoming increasingly popular in implementing traffic signal control (TSC). However, most existing DRL methods employ fixed control strategies, making traffic signal phase duration less flexible. Additionally, the trend of using more complex DRL models makes real-life deployment more challenging. To address these two challenges, we firstly propose a two-stage DRL framework, named DynamicLight, which uses Max Queue-Length to select the proper phase and employs a deep Q-learning network to determine the duration of the corresponding phase. Based on the design of DynamicLight, we also introduce two variants: (1) DynamicLight-Lite, which addresses the first challenge by using only 19 parameters to achieve dynamic phase duration settings; and (2) DynamicLight-Cycle, which tackles the second challenge by actuating a set of phases in a fixed cyclical order to implement flexible phase duration in the respective cyclical phase structure. Numerical experiments are conducted using both real-world and synthetic datasets, covering four most commonly adopted traffic signal intersections in real life. Experimental results show that: (1) DynamicLight can learn satisfactorily on determining the phase duration and achieve a new state-of-the-art, with improvement up to 6% compared to the baselines in terms of adjusted average travel time; (2) DynamicLight-Lite matches or outperforms most baseline methods with only 19 parameters; and (3) DynamicLight-Cycle demonstrates high performance for current TSC systems without remarkable modification in an actual deployment. Our code is released at Github.
Abstract（参考訳）: 交通信号制御 (TSC) の実装において, 深層強化学習 (DRL) がますます普及しつつある。しかし、既存のDRL法の多くは固定制御方式を採用しており、信号位相の柔軟性が低下している。さらに、より複雑なDRLモデルを使用する傾向は、実際のデプロイメントをより困難にしている。この2つの課題に対処するため,我々はまず,Max Queue-Length を用いて適切な位相を選択するための2段階の DRL フレームワーク DynamicLight を提案する。ダイナミックライトの設計に基づいて,(1)19個のパラメータのみを用いて動的位相持続時間設定を行う,第1の課題に対処するdynamiclight-liteと,(2)周期的位相構造においてフレキシブルな位相持続性を実現するために固定周期順に位相群を動作させることにより第2の課題に取り組むdynamiclight-cycleの2つの変種を導入する。実生活において最も広く採用されている4つの信号交差点をカバーする実世界のデータセットと合成データセットを用いて数値実験を行った。実験結果から, 1) DynamicLightは, 平均走行時間の調整により, ベースラインに比べて最大6%の改善が達成され, 位相長の判断に満足して新たな状態を実現することができること, (2) DynamicLight-Liteマッチングや, および, (3) DynamicLight-Cycleは, 実際の展開において顕著な変更を伴わずに, 現在のTSCシステムの性能を示す。私たちのコードはgithubでリリースされています。

関連論文リスト

VLMLight: Traffic Signal Control via Vision-Language Meta-Control and Dual-Branch Reasoning [3.475835936400513]
VLMLightは、視覚言語メタコントロールとデュアルブランチ推論を統合する新しいフレームワークである。大規模言語モデル(LLM)は、安全優先のメタコントローラとして機能し、ルーチントラフィックの高速なRLポリシーとクリティカルケースの構造化推論ブランチを選択できる。実験によると、VLMLightは緊急車両の待ち時間を、RLのみのシステムよりも最大65%短縮する。
論文参考訳（メタデータ） (2025-05-26T04:12:57Z)
SuperFlow++: Enhanced Spatiotemporal Consistency for Cross-Modal Data Pretraining [62.433137130087445]
SuperFlow++は、連続するカメラペアを使用して事前トレーニングと下流タスクを統合する新しいフレームワークである。 SuperFlow++は様々なタスクや運転条件で最先端のメソッドよりも優れています。強力な一般化性と計算効率により、SuperFlow++は、自動運転におけるデータ効率の高いLiDARベースの認識のための新しいベンチマークを確立する。
論文参考訳（メタデータ） (2025-03-25T17:59:57Z)
Enhancing Traffic Signal Control through Model-based Reinforcement Learning and Policy Reuse [0.9995933996287355]
マルチエージェント強化学習(MARL)は交通信号制御(TSC)において有意な可能性を示した現在のMARLベースの手法は、訓練中に使用する固定された交通パターンと道路網条件により、一般化が不十分な場合が多い。この制限により、新しいトラフィックシナリオへの適応性が低下し、高い再トレーニングコストと複雑なデプロイメントが発生します。我々はPLightとPRLightの2つのアルゴリズムを提案する。PLightはモデルに基づく強化学習アプローチを採用し、事前定義されたソースドメイントラフィックシナリオを用いて制御ポリシーと環境モデルを事前訓練する。PRLightはさらに、事前学習されたPLightエージェントの類似性に基づいて適応性を向上させる。
論文参考訳（メタデータ） (2025-03-11T01:21:13Z)
MTLight: Efficient Multi-Task Reinforcement Learning for Traffic Signal Control [56.545522358606924]
MTLightは、多数の交通指標から学習した潜伏状態のエージェント観測を強化するために提案されている。 CityFlowで行った実験は、MTLightが収束速度と性能をリードしていることを示している。
論文参考訳（メタデータ） (2024-04-01T03:27:46Z)
A Holistic Framework Towards Vision-based Traffic Signal Control with Microscopic Simulation [53.39174966020085]
交通信号制御(TSC)は交通渋滞を低減し、交通の流れを円滑にし、アイドリング時間を短縮し、CO2排出量を減らすために重要である。本研究では,道路交通の流れを視覚的観察によって調節するTSCのコンピュータビジョンアプローチについて検討する。我々は、視覚ベースのTSCとそのベンチマークに向けて、TrafficDojoと呼ばれる総合的なトラフィックシミュレーションフレームワークを導入する。
論文参考訳（メタデータ） (2024-03-11T16:42:29Z)
CycLight: learning traffic signal cooperation with a cycle-level strategy [10.303270722832924]
本研究では,ネットワークレベル適応交通信号制御(NATSC)システムのための新しいサイクルレベル深部強化学習(RL)手法であるCycLightを紹介する。ステップバイステップの決定にフォーカスする従来のRLベースのトラフィックコントローラとは異なり、CycLightはサイクルレベルの戦略を採用し、サイクル長を最適化し、同時に分割する。
論文参考訳（メタデータ） (2024-01-16T05:28:12Z)
Time-to-Green predictions for fully-actuated signal control systems with supervised learning [56.66331540599836]
本稿では,集約信号とループ検出データを用いた時系列予測フレームワークを提案する。我々は、最先端の機械学習モデルを用いて、将来の信号位相の持続時間を予測する。スイスのチューリッヒの信号制御システムから得られた経験的データに基づいて、機械学習モデルが従来の予測手法より優れていることを示す。
論文参考訳（メタデータ） (2022-08-24T07:50:43Z)
DynLight: Realize dynamic phase duration with multi-level traffic signal control [2.773426016230597]
位相決定に最適化手法Max-QueueLength (M-QL) を用いる多層信号制御フレームワークDynLightを提案する。さらに、DynLightのQ-networkをよく訓練したDynLight-Cを提案し、M-QLを固定された循環制御ポリシーで置き換え、周期的な位相構造を実現する。
論文参考訳（メタデータ） (2022-04-07T14:39:38Z)
Leveraging Queue Length and Attention Mechanisms for Enhanced Traffic Signal Control Optimization [3.0309252269809264]
本稿では、待ち行列長を効率的な状態表現として利用する交通信号制御(TSC)について述べる。複数の実世界のデータセットに関する総合的な実験は、我々のアプローチの有効性を実証する。
論文参考訳（メタデータ） (2021-12-30T09:24:09Z)
Expression is enough: Improving traffic signal control with advanced traffic state representation [24.917612761503996]
フレキシブルで簡便な新手法であるアドバンストマックスプレッシャー(Advanced-MP)を提案する。我々はまた、ATSと現在のRLアプローチを組み合わせたRLベースのアルゴリズムテンプレートAdvanced-XLightを開発し、「Advanced-MPLight」と「Advanced-CoLight」の2つのRLアルゴリズムを生成する。複数の実世界のデータセットに関する総合的な実験によると、(1)Advanced-MPは、デプロイに効率的で信頼性の高いベースラインメソッドよりも優れており、(2)Advanced-MPLightとAdvanced-CoLightは、新しい最先端を実現することができる。
論文参考訳（メタデータ） (2021-12-19T10:28:39Z)
ModelLight: Model-Based Meta-Reinforcement Learning for Traffic Signal Control [5.219291917441908]
本稿では,交通信号制御のためのモデルベースメタ強化学習フレームワーク(ModelLight)を提案する。 ModelLight内では、道路交差点のためのモデルのアンサンブルと最適化に基づくメタラーニング法を用いて、RLベースのトラヒックライト制御方式のデータ効率を改善する。実世界のデータセットの実験では、ModelLightが最先端のトラヒックライト制御アルゴリズムより優れていることが示されている。
論文参考訳（メタデータ） (2021-11-15T20:25:08Z)
Learning to Continuously Optimize Wireless Resource in a Dynamic Environment: A Bilevel Optimization Perspective [52.497514255040514]
この研究は、データ駆動メソッドが動的環境でリソース割り当て戦略を継続的に学び、最適化することを可能にする新しいアプローチを開発しています。学習モデルが新たなエピソードに段階的に適応できるように、連続学習の概念を無線システム設計に組み込むことを提案する。我々の設計は、異なるデータサンプルにまたがる公平性を保証する、新しい二段階最適化定式化に基づいている。
論文参考訳（メタデータ） (2021-05-03T07:23:39Z)
Learning to Continuously Optimize Wireless Resource In Episodically Dynamic Environment [55.91291559442884]
この研究は、データ駆動型手法が動的環境で継続的に学習し、最適化できる方法論を開発する。本稿では,無線システム学習のモデリングプロセスに連続学習の概念を構築することを提案する。我々の設計は、異なるデータサンプル間で「一定の公正性を保証する」新しいmin-maxの定式化に基づいている。
論文参考訳（メタデータ） (2020-11-16T08:24:34Z)
First Steps: Latent-Space Control with Semantic Constraints for Quadruped Locomotion [73.37945453998134]
従来の四重化制御のアプローチでは、単純化された手作りのモデルが採用されている。これにより、有効な運動範囲が縮小されているため、ロボットの能力が大幅に低下する。この研究において、これらの課題は、構造化潜在空間における最適化として四重化制御をフレーミングすることによって解決される。深い生成モデルは、実現可能な関節構成の統計的表現を捉え、一方、複雑な動的および終端的制約は高レベルな意味的指標によって表現される。実世界とシミュレーションの両方で最適化された移動軌跡の実現可能性を検証する。
論文参考訳（メタデータ） (2020-07-03T07:04:18Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。