論文の概要: Traffic-R1: Reinforced LLMs Bring Human-Like Reasoning to Traffic Signal Control Systems
- arxiv url: http://arxiv.org/abs/2508.02344v1
- Date: Mon, 04 Aug 2025 12:25:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:22.326436
- Title: Traffic-R1: Reinforced LLMs Bring Human-Like Reasoning to Traffic Signal Control Systems
- Title(参考訳): 交通R1:交通信号制御システムに人間ライクな推論をもたらす強化LLM
- Authors: Xingchen Zou, Yuhao Yang, Zheng Chen, Xixuan Hao, Yiqi Chen, Chao Huang, Yuxuan Liang,
- Abstract要約: Traffic-R1は、TSCシステムの人間ライクな推論のための基礎モデルである。
ゼロショットの一般化、新しい道路網への移行、アウト・オブ・ディストリビューションのインシデントを提供する。
モバイルクラスのチップ上でのリアルタイム推論には十分軽量である。
- 参考スコア(独自算出の注目度): 18.61774903574043
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Traffic signal control (TSC) is vital for mitigating congestion and sustaining urban mobility. In this paper, we introduce Traffic-R1, a foundation model with human-like reasoning for TSC systems. Our model is developed through self-exploration and iteration of reinforced large language models (LLMs) with expert guidance in a simulated traffic environment. Compared to traditional reinforcement learning (RL) and recent LLM-based methods, Traffic-R1 offers three significant advantages. First, Traffic-R1 delivers zero-shot generalisation, transferring unchanged to new road networks and out-of-distribution incidents by utilizing its internal traffic control policies and human-like reasoning. Second, its 3B-parameter architecture is lightweight enough for real-time inference on mobile-class chips, enabling large-scale edge deployment. Third, Traffic-R1 provides an explainable TSC process and facilitates multi-intersection communication through its self-iteration and a new synchronous communication network. Extensive benchmarks demonstrate that Traffic-R1 sets a new state of the art, outperforming strong baselines and training-intensive RL controllers. In practice, the model now manages signals for more than 55,000 drivers daily, shortening average queues by over 5% and halving operator workload. Our checkpoint is available at https://huggingface.co/Season998/Traffic-R1.
- Abstract(参考訳): 交通信号制御(TSC)は渋滞の緩和と都市移動の維持に不可欠である。
本稿では,TSCシステムに対する人間ライクな推論に基づく基礎モデルであるTraffic-R1を紹介する。
本モデルは, シミュレーションされた交通環境において, 専門家による指導による強化された大規模言語モデル (LLM) の自己探索と反復によって開発される。
従来の強化学習(RL)や最近のLCMベースの手法と比較して、Traffic-R1には3つの大きな利点がある。
第一に、Traffic-R1はゼロショットの一般化を提供し、内部のトラフィック制御ポリシーと人間のような推論を活用して、新しい道路網やアウト・オブ・ディストリビューションインシデントに異動する。
第二に、その3Bパラメータアーキテクチャは、モバイルクラスのチップ上でのリアルタイム推論に十分軽量であり、大規模なエッジデプロイメントを可能にしている。
第3に、Traffic-R1 は説明可能な TSC プロセスを提供し、その自己設定と新しい同期通信ネットワークによる多区間通信を容易にする。
大規模なベンチマークでは、Traffic-R1が新たな最先端のベースラインとトレーニング集約型RLコントローラを新たに設定していることが示されている。
実際には、このモデルは毎日55,000人以上のドライバーの信号を管理し、平均キューを5%以上短縮し、オペレータのワークロードを半分にする。
私たちのチェックポイントはhttps://huggingface.co/Season998/Traffic-R1.comで利用可能です。
関連論文リスト
- Self-Regulating Cars: Automating Traffic Control in Free Flow Road Networks [5.557442038265024]
本稿では,車両の速度を動的に調整し,スループットを最適化し,混雑を防止することを目的とした,強化学習に基づく交通制御プロトコルである自己規制車を紹介する。
提案手法は,古典的交通流理論,ギャップ受容モデル,微視的シミュレーションを物理インフォームドRLフレームワークに統合する。
また、さまざまなトラフィックパターンをまたいで一般化しながら、スムーズで渋滞に強いフローを実現し、スケーラブルでML駆動のトラフィック管理の可能性を示している。
論文 参考訳(メタデータ) (2025-06-13T17:31:23Z) - Data-Driven Transfer Learning Framework for Estimating Turning Movement Counts [2.5920304684810014]
本研究では,交点における移動数(TMC)の推定に伝達学習を活用する新しい枠組みを提案する。
提案したTLモデルの性能を8つの最先端回帰モデルと比較し,平均絶対誤差とルート平均正方形誤差の最小値を得た。
論文 参考訳(メタデータ) (2024-12-13T05:02:16Z) - Improving Traffic Flow Predictions with SGCN-LSTM: A Hybrid Model for Spatial and Temporal Dependencies [55.2480439325792]
本稿ではSGCN-LSTM(Signal-Enhanced Graph Convolutional Network Long Short Term Memory)モデルを提案する。
PEMS-BAYロードネットワークトラフィックデータセットの実験は、SGCN-LSTMモデルの有効性を示す。
論文 参考訳(メタデータ) (2024-11-01T00:37:00Z) - Reinforcement Learning for Adaptive Traffic Signal Control: Turn-Based and Time-Based Approaches to Reduce Congestion [2.733700237741334]
本稿では,交差点における信号処理の強化にReinforcement Learning(強化学習)を用いることについて検討する。
本稿では,リアルタイム待ち行列長に基づく信号の動的優先順位付けを行うターンベースエージェントと,交通条件に応じた信号位相長の調整を行うタイムベースエージェントの2つのアルゴリズムを紹介する。
シミュレーションの結果、両RLアルゴリズムは従来の信号制御システムよりも大幅に優れていた。
論文 参考訳(メタデータ) (2024-08-28T12:35:56Z) - A Holistic Framework Towards Vision-based Traffic Signal Control with
Microscopic Simulation [53.39174966020085]
交通信号制御(TSC)は交通渋滞を低減し、交通の流れを円滑にし、アイドリング時間を短縮し、CO2排出量を減らすために重要である。
本研究では,道路交通の流れを視覚的観察によって調節するTSCのコンピュータビジョンアプローチについて検討する。
我々は、視覚ベースのTSCとそのベンチマークに向けて、TrafficDojoと呼ばれる総合的なトラフィックシミュレーションフレームワークを導入する。
論文 参考訳(メタデータ) (2024-03-11T16:42:29Z) - DenseLight: Efficient Control for Large-scale Traffic Signals with Dense
Feedback [109.84667902348498]
交通信号制御(TSC)は、道路網における車両の平均走行時間を短縮することを目的としている。
従来のTSC手法は、深い強化学習を利用して制御ポリシーを探索する。
DenseLightは、不偏報酬関数を用いてポリシーの有効性をフィードバックする新しいRTLベースのTSC手法である。
論文 参考訳(メタデータ) (2023-06-13T05:58:57Z) - A Novel Multi-Agent Deep RL Approach for Traffic Signal Control [13.927155702352131]
都市ネットワークにおける複数の交通信号制御のための Friend-Deep Q-network (Friend-DQN) アプローチを提案する。
特に、複数のエージェント間の協調は状態-作用空間を減少させ、収束を加速させる。
論文 参考訳(メタデータ) (2023-06-05T08:20:37Z) - Reinforcement Learning based Cyberattack Model for Adaptive Traffic
Signal Controller in Connected Transportation Systems [61.39400591328625]
接続輸送システムにおいて、適応交通信号制御装置(ATSC)は、車両から受信したリアルタイム車両軌跡データを利用して、グリーンタイムを規制する。
この無線接続されたATSCはサイバー攻撃面を増やし、その脆弱性を様々なサイバー攻撃モードに拡大する。
そのようなモードの1つは、攻撃者がネットワーク内で偽の車両を作成する「シビル」攻撃である。
RLエージェントは、シビル車噴射の最適速度を学習し、アプローチの混雑を生じさせるように訓練される
論文 参考訳(メタデータ) (2022-10-31T20:12:17Z) - Road Network Guided Fine-Grained Urban Traffic Flow Inference [108.64631590347352]
粗いトラフィックからのきめ細かなトラフィックフローの正確な推測は、新たな重要な問題である。
本稿では,道路ネットワークの知識を活かした新しい道路対応交通流磁化器(RATFM)を提案する。
提案手法は,高品質なトラフィックフローマップを作成できる。
論文 参考訳(メタデータ) (2021-09-29T07:51:49Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - IG-RL: Inductive Graph Reinforcement Learning for Massive-Scale Traffic
Signal Control [4.273991039651846]
適応的な交通信号制御のスケーリングには、状態と行動空間を扱う必要がある。
本稿では,グラフ畳み込みネットワークに基づくインダクティブグラフ強化学習(IG-RL)を紹介する。
我々のモデルは、新しい道路網、交通分布、交通体制に一般化することができる。
論文 参考訳(メタデータ) (2020-03-06T17:17:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。