論文の概要: Traffic-R1: Reinforced LLMs Bring Human-Like Reasoning to Traffic Signal Control Systems
- arxiv url: http://arxiv.org/abs/2508.02344v2
- Date: Wed, 22 Oct 2025 07:05:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:08.926624
- Title: Traffic-R1: Reinforced LLMs Bring Human-Like Reasoning to Traffic Signal Control Systems
- Title(参考訳): 交通R1:交通信号制御システムに人間ライクな推論をもたらす強化LLM
- Authors: Xingchen Zou, Yuhao Yang, Zheng Chen, Xixuan Hao, Yiqi Chen, Chao Huang, Yuxuan Liang,
- Abstract要約: 我々は、交通信号制御(TSC)のための人間ライクな推論の基礎モデルであるTraffic-R1を紹介する。
トラヒック-R1は、ゼロショットの一般化、新しい道路網への変更なしの転送、アウト・オブ・ディストリビューションインシデントという3つの大きな利点を提供する。
プロダクション環境では、毎日55,000人以上のドライバーに影響を与える信号を管理し、平均キューの長さを5%以上削減し、オペレータのワークロードを半減する。
- 参考スコア(独自算出の注目度): 38.08537395310505
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We introduce Traffic-R1, a 3B-parameter foundation model with human-like reasoning for Traffic signal control (TSC), developed via self-exploration and iterative reinforcement of LLM with expert guidance in a simulated traffic environment. Compared with traditional reinforcement learning and recent LLM-based methods, Traffic-R1 offers three main advantages: zero-shot generalization, transferring unchanged to new road networks and out-of-distribution incidents by leveraging internal traffic-control policies and reasoning; a compact 3B-parameter design that supports real-time inference on mobile-class chips for edge deployment; and an explainable TSC process that enables multi-intersection coordination through communication and an asynchronous communication network. Extensive benchmarks show Traffic-R1 outperforms strong baselines and training-intensive RL controllers. In production, the model now manages signals affecting over 55,000 drivers daily, reduces average queue lengths by more than 5%, and halves operator workload. Our model is available at https://huggingface.co/Season998/Traffic-R1.
- Abstract(参考訳): 本稿では,交通信号制御のための人間ライクな推論を用いた3Bパラメータ基礎モデルであるTraffic-R1を紹介する。
従来の強化学習と最近のLCMベースの手法と比較して、Traffic-R1は、ゼロショットの一般化、新しい道路網への変更、内部のトラフィック制御ポリシーと推論を活用して配布外インシデント、エッジデプロイメントのためのモバイルクラスチップでのリアルタイム推論をサポートするコンパクトな3Bパラメータ設計、通信と非同期通信ネットワークによるマルチセクション調整を可能にする説明可能なTSCプロセスの3つの利点を提供している。
大規模なベンチマークでは、Traffic-R1は強力なベースラインとトレーニング集約型RLコントローラを上回っている。
運用環境では、毎日55,000人以上のドライバーに影響を与える信号を管理し、平均キューの長さを5%以上削減し、オペレータのワークロードを半減する。
私たちのモデルはhttps://huggingface.co/Season998/Traffic-R1で利用可能です。
関連論文リスト
- Self-Regulating Cars: Automating Traffic Control in Free Flow Road Networks [5.557442038265024]
本稿では,車両の速度を動的に調整し,スループットを最適化し,混雑を防止することを目的とした,強化学習に基づく交通制御プロトコルである自己規制車を紹介する。
提案手法は,古典的交通流理論,ギャップ受容モデル,微視的シミュレーションを物理インフォームドRLフレームワークに統合する。
また、さまざまなトラフィックパターンをまたいで一般化しながら、スムーズで渋滞に強いフローを実現し、スケーラブルでML駆動のトラフィック管理の可能性を示している。
論文 参考訳(メタデータ) (2025-06-13T17:31:23Z) - Data-Driven Transfer Learning Framework for Estimating Turning Movement Counts [2.5920304684810014]
本研究では,交点における移動数(TMC)の推定に伝達学習を活用する新しい枠組みを提案する。
提案したTLモデルの性能を8つの最先端回帰モデルと比較し,平均絶対誤差とルート平均正方形誤差の最小値を得た。
論文 参考訳(メタデータ) (2024-12-13T05:02:16Z) - Improving Traffic Flow Predictions with SGCN-LSTM: A Hybrid Model for Spatial and Temporal Dependencies [55.2480439325792]
本稿ではSGCN-LSTM(Signal-Enhanced Graph Convolutional Network Long Short Term Memory)モデルを提案する。
PEMS-BAYロードネットワークトラフィックデータセットの実験は、SGCN-LSTMモデルの有効性を示す。
論文 参考訳(メタデータ) (2024-11-01T00:37:00Z) - Reinforcement Learning for Adaptive Traffic Signal Control: Turn-Based and Time-Based Approaches to Reduce Congestion [2.733700237741334]
本稿では,交差点における信号処理の強化にReinforcement Learning(強化学習)を用いることについて検討する。
本稿では,リアルタイム待ち行列長に基づく信号の動的優先順位付けを行うターンベースエージェントと,交通条件に応じた信号位相長の調整を行うタイムベースエージェントの2つのアルゴリズムを紹介する。
シミュレーションの結果、両RLアルゴリズムは従来の信号制御システムよりも大幅に優れていた。
論文 参考訳(メタデータ) (2024-08-28T12:35:56Z) - A Holistic Framework Towards Vision-based Traffic Signal Control with
Microscopic Simulation [53.39174966020085]
交通信号制御(TSC)は交通渋滞を低減し、交通の流れを円滑にし、アイドリング時間を短縮し、CO2排出量を減らすために重要である。
本研究では,道路交通の流れを視覚的観察によって調節するTSCのコンピュータビジョンアプローチについて検討する。
我々は、視覚ベースのTSCとそのベンチマークに向けて、TrafficDojoと呼ばれる総合的なトラフィックシミュレーションフレームワークを導入する。
論文 参考訳(メタデータ) (2024-03-11T16:42:29Z) - DenseLight: Efficient Control for Large-scale Traffic Signals with Dense
Feedback [109.84667902348498]
交通信号制御(TSC)は、道路網における車両の平均走行時間を短縮することを目的としている。
従来のTSC手法は、深い強化学習を利用して制御ポリシーを探索する。
DenseLightは、不偏報酬関数を用いてポリシーの有効性をフィードバックする新しいRTLベースのTSC手法である。
論文 参考訳(メタデータ) (2023-06-13T05:58:57Z) - A Novel Multi-Agent Deep RL Approach for Traffic Signal Control [13.927155702352131]
都市ネットワークにおける複数の交通信号制御のための Friend-Deep Q-network (Friend-DQN) アプローチを提案する。
特に、複数のエージェント間の協調は状態-作用空間を減少させ、収束を加速させる。
論文 参考訳(メタデータ) (2023-06-05T08:20:37Z) - Reinforcement Learning based Cyberattack Model for Adaptive Traffic
Signal Controller in Connected Transportation Systems [61.39400591328625]
接続輸送システムにおいて、適応交通信号制御装置(ATSC)は、車両から受信したリアルタイム車両軌跡データを利用して、グリーンタイムを規制する。
この無線接続されたATSCはサイバー攻撃面を増やし、その脆弱性を様々なサイバー攻撃モードに拡大する。
そのようなモードの1つは、攻撃者がネットワーク内で偽の車両を作成する「シビル」攻撃である。
RLエージェントは、シビル車噴射の最適速度を学習し、アプローチの混雑を生じさせるように訓練される
論文 参考訳(メタデータ) (2022-10-31T20:12:17Z) - Road Network Guided Fine-Grained Urban Traffic Flow Inference [108.64631590347352]
粗いトラフィックからのきめ細かなトラフィックフローの正確な推測は、新たな重要な問題である。
本稿では,道路ネットワークの知識を活かした新しい道路対応交通流磁化器(RATFM)を提案する。
提案手法は,高品質なトラフィックフローマップを作成できる。
論文 参考訳(メタデータ) (2021-09-29T07:51:49Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - IG-RL: Inductive Graph Reinforcement Learning for Massive-Scale Traffic
Signal Control [4.273991039651846]
適応的な交通信号制御のスケーリングには、状態と行動空間を扱う必要がある。
本稿では,グラフ畳み込みネットワークに基づくインダクティブグラフ強化学習(IG-RL)を紹介する。
我々のモデルは、新しい道路網、交通分布、交通体制に一般化することができる。
論文 参考訳(メタデータ) (2020-03-06T17:17:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。