論文の概要: CuraLight: Debate-Guided Data Curation for LLM-Centered Traffic Signal Control
- arxiv url: http://arxiv.org/abs/2604.05663v2
- Date: Mon, 13 Apr 2026 08:40:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 14:47:45.599081
- Title: CuraLight: Debate-Guided Data Curation for LLM-Centered Traffic Signal Control
- Title(参考訳): CuraLight: LLM中心の信号制御のための議論誘導型データキュレーション
- Authors: Qing Guo, Xinhang Li, Junyu Chen, Zheng Guo, Shengzhe Xu, Lin Zhang, Lei Li,
- Abstract要約: 交通信号制御はインテリジェントトランスポートシステム(ITS)のコアコンポーネントである
強化学習(RL)と大規模言語モデル(LLM)に基づく最近のアプローチは適応性を改善したが、それでも限定的な解釈性に悩まされている。
本稿では,LL エージェントが LLM ベースの信号制御装置の微調整を支援するフレームワークである CuraLight を提案する。
- 参考スコア(独自算出の注目度): 25.292538507972868
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Traffic signal control (TSC) is a core component of intelligent transportation systems (ITS), aiming to reduce congestion, emissions, and travel time. Recent approaches based on reinforcement learning (RL) and large language models (LLMs) have improved adaptivity, but still suffer from limited interpretability, insufficient interaction data, and weak generalization to heterogeneous intersections. This paper proposes CuraLight, an LLM-centered framework where an RL agent assists the fine-tuning of an LLM-based traffic signal controller. The RL agent explores traffic environments and generates high-quality interaction trajectories, which are converted into prompt-response pairs for imitation fine-tuning. A multi-LLM ensemble deliberation system further evaluates candidate signal timing actions through structured debate, providing preference-aware supervision signals for training. Experiments conducted in SUMO across heterogeneous real-world networks from Jinan, Hangzhou, and Yizhuang demonstrate that CuraLight consistently outperforms state-of-the-art baselines, reducing average travel time by 5.34 percent, average queue length by 5.14 percent, and average waiting time by 7.02 percent. The results highlight the effectiveness of combining RL-assisted exploration with deliberation-based data curation for scalable and interpretable traffic signal control.
- Abstract(参考訳): 交通信号制御 (TSC) は知的交通システム (ITS) の中核的なコンポーネントであり、渋滞、排出、走行時間を削減することを目的としている。
強化学習(RL)と大規模言語モデル(LLM)に基づく最近のアプローチは適応性を向上させるが、それでも限定的な解釈可能性、不十分な相互作用データ、不均一な交叉への弱い一般化に悩まされている。
本稿では,LLM をベースとした信号制御装置の微調整を支援する LLM 中心のフレームワークである CuraLight を提案する。
RLエージェントは交通環境を探索し、高品質な相互作用軌道を生成する。
マルチLLMアンサンブル検討システムは、構造化された討論を通じて候補信号タイミング動作を更に評価し、訓練のための優先対応の監視信号を提供する。
神南省、杭州省、李東省の異質な現実世界ネットワークで行われた実験では、キュラライトは最先端のベースラインを一貫して上回り、平均走行時間を5.34パーセント、平均待ち時間を5.14パーセント、平均待ち時間を7.02パーセント削減している。
その結果、スケーラブルかつ解釈可能な交通信号制御のためのRL支援探索と熟考に基づくデータキュレーションの併用の有効性を強調した。
関連論文リスト
- Robust Single-Agent Reinforcement Learning for Regional Traffic Signal Control Under Demand Fluctuations [5.784337914162491]
交通渋滞は、主に交差点の待ち行列によって引き起こされ、都市生活水準、安全性、環境品質、経済効率に大きな影響を及ぼす。
本研究では,地域適応型TSCのための新しい単エージェント強化学習フレームワークを提案する。
このフレームワークは堅牢な反ゆらぎ能力を示し、待ち時間を大幅に短縮する。
論文 参考訳(メタデータ) (2025-11-01T13:18:50Z) - Smart Traffic Signals: Comparing MARL and Fixed-Time Strategies [0.0]
都市交通渋滞、特に交差点での交通渋滞は、旅行時間、燃料消費および排出に大きな影響を及ぼす。
従来の固定時間信号制御システムは、動的トラフィックパターンを効果的に管理する適応性に欠けることが多い。
本研究では,複数交差点間の交通信号調整を最適化するためのマルチエージェント強化学習の適用について検討する。
論文 参考訳(メタデータ) (2025-05-20T15:59:44Z) - TeLL-Drive: Enhancing Autonomous Driving with Teacher LLM-Guided Deep Reinforcement Learning [61.33599727106222]
TeLL-Driveは、Teacher LLMを統合して、注意に基づく学生DRLポリシーをガイドするハイブリッドフレームワークである。
自己維持機構はDRLエージェントの探索とこれらの戦略を融合させ、政策収束を加速し、堅牢性を高める。
論文 参考訳(メタデータ) (2025-02-03T14:22:03Z) - Improving Traffic Flow Predictions with SGCN-LSTM: A Hybrid Model for Spatial and Temporal Dependencies [55.2480439325792]
本稿ではSGCN-LSTM(Signal-Enhanced Graph Convolutional Network Long Short Term Memory)モデルを提案する。
PEMS-BAYロードネットワークトラフィックデータセットの実験は、SGCN-LSTMモデルの有効性を示す。
論文 参考訳(メタデータ) (2024-11-01T00:37:00Z) - Reinforcement Learning for Adaptive Traffic Signal Control: Turn-Based and Time-Based Approaches to Reduce Congestion [2.733700237741334]
本稿では,交差点における信号処理の強化にReinforcement Learning(強化学習)を用いることについて検討する。
本稿では,リアルタイム待ち行列長に基づく信号の動的優先順位付けを行うターンベースエージェントと,交通条件に応じた信号位相長の調整を行うタイムベースエージェントの2つのアルゴリズムを紹介する。
シミュレーションの結果、両RLアルゴリズムは従来の信号制御システムよりも大幅に優れていた。
論文 参考訳(メタデータ) (2024-08-28T12:35:56Z) - LLM-Assisted Light: Leveraging Large Language Model Capabilities for Human-Mimetic Traffic Signal Control in Complex Urban Environments [3.7788636451616697]
本研究は,大規模言語モデルを交通信号制御システムに統合する革新的なアプローチを導入する。
LLMを知覚と意思決定ツールのスイートで強化するハイブリッドフレームワークが提案されている。
シミュレーションの結果から,交通環境の多種性に適応するシステムの有効性が示された。
論文 参考訳(メタデータ) (2024-03-13T08:41:55Z) - DenseLight: Efficient Control for Large-scale Traffic Signals with Dense
Feedback [109.84667902348498]
交通信号制御(TSC)は、道路網における車両の平均走行時間を短縮することを目的としている。
従来のTSC手法は、深い強化学習を利用して制御ポリシーを探索する。
DenseLightは、不偏報酬関数を用いてポリシーの有効性をフィードバックする新しいRTLベースのTSC手法である。
論文 参考訳(メタデータ) (2023-06-13T05:58:57Z) - Reinforcement Learning Based Vehicle-cell Association Algorithm for
Highly Mobile Millimeter Wave Communication [53.47785498477648]
本稿では,ミリ波通信網における車とセルの関連性について検討する。
まず、ユーザ状態(VU)問題を離散的な非車両関連最適化問題として定式化する。
提案手法は,複数のベースライン設計と比較して,ユーザの複雑性とVUEの20%削減の合計で最大15%のゲインが得られる。
論文 参考訳(メタデータ) (2020-01-22T08:51:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。