論文の概要: Robust Single-Agent Reinforcement Learning for Regional Traffic Signal Control Under Demand Fluctuations
- arxiv url: http://arxiv.org/abs/2511.00549v1
- Date: Sat, 01 Nov 2025 13:18:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 16:37:26.838542
- Title: Robust Single-Agent Reinforcement Learning for Regional Traffic Signal Control Under Demand Fluctuations
- Title(参考訳): 需要変動下における地域交通信号制御のためのロバスト単一エージェント強化学習
- Authors: Qiang Li, Jin Niu, Lina Yu,
- Abstract要約: 交通渋滞は、主に交差点の待ち行列によって引き起こされ、都市生活水準、安全性、環境品質、経済効率に大きな影響を及ぼす。
本研究では,地域適応型TSCのための新しい単エージェント強化学習フレームワークを提案する。
このフレームワークは堅牢な反ゆらぎ能力を示し、待ち時間を大幅に短縮する。
- 参考スコア(独自算出の注目度): 5.784337914162491
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Traffic congestion, primarily driven by intersection queuing, significantly impacts urban living standards, safety, environmental quality, and economic efficiency. While Traffic Signal Control (TSC) systems hold potential for congestion mitigation, traditional optimization models often fail to capture real-world traffic complexity and dynamics. This study introduces a novel single-agent reinforcement learning (RL) framework for regional adaptive TSC, circumventing the coordination complexities inherent in multi-agent systems through a centralized decision-making paradigm. The model employs an adjacency matrix to unify the encoding of road network topology, real-time queue states derived from probe vehicle data, and current signal timing parameters. Leveraging the efficient learning capabilities of the DreamerV3 world model, the agent learns control policies where actions sequentially select intersections and adjust their signal phase splits to regulate traffic inflow/outflow, analogous to a feedback control system. Reward design prioritizes queue dissipation, directly linking congestion metrics (queue length) to control actions. Simulation experiments conducted in SUMO demonstrate the model's effectiveness: under inference scenarios with multi-level (10%, 20%, 30%) Origin-Destination (OD) demand fluctuations, the framework exhibits robust anti-fluctuation capability and significantly reduces queue lengths. This work establishes a new paradigm for intelligent traffic control compatible with probe vehicle technology. Future research will focus on enhancing practical applicability by incorporating stochastic OD demand fluctuations during training and exploring regional optimization mechanisms for contingency events.
- Abstract(参考訳): 交通渋滞は、主に交差点の待ち行列によって引き起こされ、都市生活水準、安全性、環境品質、経済効率に大きな影響を及ぼす。
交通信号制御(TSC)システムは混雑緩和の可能性を秘めているが、従来の最適化モデルは現実の交通の複雑さやダイナミクスを捉えることができないことが多い。
本研究では,多エージェントシステムに固有の協調複雑性を,集中型意思決定パラダイムを通じて回避する,地域適応型TSCのための新しい単一エージェント強化学習(RL)フレームワークを提案する。
このモデルは、道路ネットワークトポロジの符号化、プローブ車両データから得られたリアルタイムキュー状態、および現在の信号タイミングパラメータを統一するために、隣接行列を用いる。
エージェントは、DreamerV3ワールドモデルの効率的な学習能力を活用し、交差点を順次選択し、信号位相を分割して、フィードバック制御システムに類似したトラフィックの流入/流出を制御する制御ポリシーを学習する。
リワード設計では、キューの送受信を優先し、混雑指標(キューの長さ)を直接リンクしてアクションを制御する。
マルチレベル (10%, 20%, 30%) の需要変動を考慮した推論シナリオの下で, 本フレームワークは頑健な反変動能力を示し, 待ち行列長を大幅に削減する。
この研究は、プローブ車両技術と互換性のあるインテリジェントな交通制御のための新しいパラダイムを確立する。
今後の研究は、訓練中に確率的OD需要変動を取り入れ、即時事象の地域最適化機構を探求することにより、実用性の向上に重点を置いている。
関連論文リスト
- Single-agent Reinforcement Learning Model for Regional Adaptive Traffic Signal Control [5.170416022609791]
本研究は、プローブ車両技術と互換性のある単一エージェントRLに基づく地域交通信号制御モデルを提案する。
RL設計の主要なコンポーネントは状態、アクション、報酬関数の定義である。
実験により,提案手法は協調型多区間制御により,大規模領域の混雑レベルを効果的に緩和することを示した。
論文 参考訳(メタデータ) (2025-11-01T13:29:13Z) - Reinforcement Learning Based Traffic Signal Design to Minimize Queue Lengths [15.439906983758808]
本稿では、RL(Reinforcement Learning)を活用して全信号位相の待ち行列長を最小化する適応型TSCフレームワークを提案する。
提案アルゴリズムは,都市交通シミュレータ(SUMO)を用いて実装されている。
最も優れた構成は、従来のWebster法と比較して平均キュー長を約29%削減する。
論文 参考訳(メタデータ) (2025-09-26T01:23:30Z) - Smart Traffic Signals: Comparing MARL and Fixed-Time Strategies [0.0]
都市交通渋滞、特に交差点での交通渋滞は、旅行時間、燃料消費および排出に大きな影響を及ぼす。
従来の固定時間信号制御システムは、動的トラフィックパターンを効果的に管理する適応性に欠けることが多い。
本研究では,複数交差点間の交通信号調整を最適化するためのマルチエージェント強化学習の適用について検討する。
論文 参考訳(メタデータ) (2025-05-20T15:59:44Z) - Improving Traffic Flow Predictions with SGCN-LSTM: A Hybrid Model for Spatial and Temporal Dependencies [55.2480439325792]
本稿ではSGCN-LSTM(Signal-Enhanced Graph Convolutional Network Long Short Term Memory)モデルを提案する。
PEMS-BAYロードネットワークトラフィックデータセットの実験は、SGCN-LSTMモデルの有効性を示す。
論文 参考訳(メタデータ) (2024-11-01T00:37:00Z) - A Holistic Framework Towards Vision-based Traffic Signal Control with
Microscopic Simulation [53.39174966020085]
交通信号制御(TSC)は交通渋滞を低減し、交通の流れを円滑にし、アイドリング時間を短縮し、CO2排出量を減らすために重要である。
本研究では,道路交通の流れを視覚的観察によって調節するTSCのコンピュータビジョンアプローチについて検討する。
我々は、視覚ベースのTSCとそのベンチマークに向けて、TrafficDojoと呼ばれる総合的なトラフィックシミュレーションフレームワークを導入する。
論文 参考訳(メタデータ) (2024-03-11T16:42:29Z) - Real-Time Network-Level Traffic Signal Control: An Explicit Multiagent
Coordination Method [9.761657423863706]
交通信号の効率的な制御 (TSC) は, 都市交通渋滞の低減に最も有用な方法の1つである。
強化学習(RL)手法を適用した最近の取り組みは、トラフィック状態を信号決定にリアルタイムでマッピングすることでポリシーをクエリすることができる。
本稿では,適応的,リアルタイム,ネットワークレベルのTSCを満足する,EMCに基づくオンライン計画手法を提案する。
論文 参考訳(メタデータ) (2023-06-15T04:08:09Z) - Language-Guided Traffic Simulation via Scene-Level Diffusion [46.47977644226296]
本稿では,シーンレベルの条件拡散モデルであるCTG++について述べる。
まず,現実的で制御可能なトラフィックを生成する時間的バックボーンを備えたシーンレベルの拡散モデルを提案する。
次に、大きな言語モデル(LLM)を用いて、ユーザクエリを、拡散モデルをクエリに準拠した生成に導く損失関数に変換する。
論文 参考訳(メタデータ) (2023-06-10T05:20:30Z) - AI-aided Traffic Control Scheme for M2M Communications in the Internet
of Vehicles [61.21359293642559]
交通のダイナミクスと異なるIoVアプリケーションの異種要求は、既存のほとんどの研究では考慮されていない。
本稿では,ハイブリッド交通制御方式とPPO法を併用して検討する。
論文 参考訳(メタデータ) (2022-03-05T10:54:05Z) - A Deep Reinforcement Learning Approach for Traffic Signal Control
Optimization [14.455497228170646]
非効率な信号制御手法は、交通渋滞やエネルギー浪費などの多くの問題を引き起こす可能性がある。
本稿では,アクター・クリティカル・ポリシー・グラデーション・アルゴリズムを拡張し,マルチエージェント・ディープ・決定性ポリシー・グラデーション(MADDPG)法を提案する。
論文 参考訳(メタデータ) (2021-07-13T14:11:04Z) - Multi-intersection Traffic Optimisation: A Benchmark Dataset and a
Strong Baseline [85.9210953301628]
交通信号の制御は、都市部の交通渋滞の緩和に必要不可欠である。
問題モデリングの複雑さが高いため、現在の作業の実験的な設定はしばしば矛盾する。
エンコーダ・デコーダ構造を用いた深層強化学習に基づく新規で強力なベースラインモデルを提案する。
論文 参考訳(メタデータ) (2021-01-24T03:55:39Z) - MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。
近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。
本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文 参考訳(メタデータ) (2021-01-04T03:06:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。