論文の概要: Momentum Based Reward Design for Low Emission Traffic Signal Control
- arxiv url: http://arxiv.org/abs/2605.29693v1
- Date: Thu, 28 May 2026 09:53:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:56.162129
- Title: Momentum Based Reward Design for Low Emission Traffic Signal Control
- Title(参考訳): 低出力信号制御のためのモーメントベースリワード設計
- Authors: Chinmay Mundane, Amith Manoharan, Arun Singh,
- Abstract要約: 本稿では,渋滞のみをペナルティ化するのではなく,車両の移動を促進させるモメンタム・ベース・リワード機能(MBRF)を提案する。
その結果,提案した報奨は,遅延や待ち行列に基づく報奨よりも,より優れたスループットと安定した学習行動をもたらすことがわかった。
- 参考スコア(独自算出の注目度): 1.8352113484137627
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Urban traffic congestion is a growing global issue contributing significantly to long commute times and environmental pollution. Traditional traffic signal control systems often fail to adapt to dynamic traffic conditions. Adaptive traffic signal control can improve urban traffic without changing road infrastructure. Deep Reinforcement Learning (DRL) has shown strong performance for this task, but existing delay and queue-based rewards often produce short-sighted or unstable policies. This paper proposes a Momentum-Based Reward Function (MBRF) that encourages vehicles to keep moving rather than penalizing congestion alone. The method is evaluated in SUMO (Simulation of Urban MObility) using standard traffic metrics such as waiting time, queue length, throughput, and CO2 emissions. Results show that the proposed reward produces better throughput-emission trade-offs and more stable learning behavior than delay or queue-based rewards, as well as classical controllers such as Max Pressure and LQF.
- Abstract(参考訳): 都市交通渋滞は、長い通勤時間と環境汚染に大きく寄与する世界的な問題である。
従来の信号制御システムは、しばしば動的な交通条件に適応できない。
適応的な交通信号制御は、道路インフラを変更することなく都市交通を改善することができる。
Deep Reinforcement Learning (DRL)は、このタスクに対して強力なパフォーマンスを示しているが、既存の遅延とキューベースの報酬は、しばしば短目または不安定なポリシーを生成する。
本稿では,渋滞のみをペナルティ化するのではなく,車両の移動を促進させるモメンタム・ベース・リワード機能(MBRF)を提案する。
本手法はSUMO(Simulation of Urban Mobility)において,待ち時間,待ち時間,待ち時間,スループット,CO2排出量などの標準的な交通指標を用いて評価する。
その結果、提案した報奨は、最大圧力やLQFのような古典的なコントローラと同様に、遅延や待ち行列に基づく報奨よりも、より優れたスループットと安定した学習行動をもたらすことが示された。
関連論文リスト
- Self-Regulating Cars: Automating Traffic Control in Free Flow Road Networks [5.557442038265024]
本稿では,車両の速度を動的に調整し,スループットを最適化し,混雑を防止することを目的とした,強化学習に基づく交通制御プロトコルである自己規制車を紹介する。
提案手法は,古典的交通流理論,ギャップ受容モデル,微視的シミュレーションを物理インフォームドRLフレームワークに統合する。
また、さまざまなトラフィックパターンをまたいで一般化しながら、スムーズで渋滞に強いフローを実現し、スケーラブルでML駆動のトラフィック管理の可能性を示している。
論文 参考訳(メタデータ) (2025-06-13T17:31:23Z) - Smart Traffic Signals: Comparing MARL and Fixed-Time Strategies [0.0]
都市交通渋滞、特に交差点での交通渋滞は、旅行時間、燃料消費および排出に大きな影響を及ぼす。
従来の固定時間信号制御システムは、動的トラフィックパターンを効果的に管理する適応性に欠けることが多い。
本研究では,複数交差点間の交通信号調整を最適化するためのマルチエージェント強化学習の適用について検討する。
論文 参考訳(メタデータ) (2025-05-20T15:59:44Z) - Large-scale Regional Traffic Signal Control Based on Single-Agent Reinforcement Learning [5.1129002613887105]
本稿では,単一エージェント強化学習(RL)に基づく地域交通信号制御モデルを提案する。
このモデルは、広域交通渋滞を緩和し、総走行時間を最小化することを目的として、広範囲にわたる交通信号を調整することができる。
SUMO交通シミュレーションソフトウェアを用いて実験を行った。
論文 参考訳(メタデータ) (2025-03-12T10:51:29Z) - Improving Traffic Flow Predictions with SGCN-LSTM: A Hybrid Model for Spatial and Temporal Dependencies [55.2480439325792]
本稿ではSGCN-LSTM(Signal-Enhanced Graph Convolutional Network Long Short Term Memory)モデルを提案する。
PEMS-BAYロードネットワークトラフィックデータセットの実験は、SGCN-LSTMモデルの有効性を示す。
論文 参考訳(メタデータ) (2024-11-01T00:37:00Z) - Reinforcement Learning for Adaptive Traffic Signal Control: Turn-Based and Time-Based Approaches to Reduce Congestion [2.733700237741334]
本稿では,交差点における信号処理の強化にReinforcement Learning(強化学習)を用いることについて検討する。
本稿では,リアルタイム待ち行列長に基づく信号の動的優先順位付けを行うターンベースエージェントと,交通条件に応じた信号位相長の調整を行うタイムベースエージェントの2つのアルゴリズムを紹介する。
シミュレーションの結果、両RLアルゴリズムは従来の信号制御システムよりも大幅に優れていた。
論文 参考訳(メタデータ) (2024-08-28T12:35:56Z) - GARLIC: GPT-Augmented Reinforcement Learning with Intelligent Control for Vehicle Dispatching [81.82487256783674]
GARLIC: GPT拡張強化学習のフレームワーク。
本稿では,GPT強化強化学習とインテリジェント制御のフレームワークであるGARLICについて紹介する。
論文 参考訳(メタデータ) (2024-08-19T08:23:38Z) - A Holistic Framework Towards Vision-based Traffic Signal Control with
Microscopic Simulation [53.39174966020085]
交通信号制御(TSC)は交通渋滞を低減し、交通の流れを円滑にし、アイドリング時間を短縮し、CO2排出量を減らすために重要である。
本研究では,道路交通の流れを視覚的観察によって調節するTSCのコンピュータビジョンアプローチについて検討する。
我々は、視覚ベースのTSCとそのベンチマークに向けて、TrafficDojoと呼ばれる総合的なトラフィックシミュレーションフレームワークを導入する。
論文 参考訳(メタデータ) (2024-03-11T16:42:29Z) - DenseLight: Efficient Control for Large-scale Traffic Signals with Dense
Feedback [109.84667902348498]
交通信号制御(TSC)は、道路網における車両の平均走行時間を短縮することを目的としている。
従来のTSC手法は、深い強化学習を利用して制御ポリシーを探索する。
DenseLightは、不偏報酬関数を用いてポリシーの有効性をフィードバックする新しいRTLベースのTSC手法である。
論文 参考訳(メタデータ) (2023-06-13T05:58:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。