論文の概要: LATS: Large Language Model Assisted Teacher-Student Framework for Multi-Agent Reinforcement Learning in Traffic Signal Control
- arxiv url: http://arxiv.org/abs/2603.24361v1
- Date: Wed, 25 Mar 2026 14:42:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 21:06:11.337314
- Title: LATS: Large Language Model Assisted Teacher-Student Framework for Multi-Agent Reinforcement Learning in Traffic Signal Control
- Title(参考訳): LATS:交通信号制御におけるマルチエージェント強化学習を支援する大規模言語モデル
- Authors: Yifeng Zhang, Peizhuo Li, Tingguang Zhou, Mingfeng Fan, Guillaume Sartoretti,
- Abstract要約: 大規模言語モデル(LLM)とマルチエージェント強化学習(MARL)を統合したLATSという新しい学習パラダイムを提案する。
LLMは意味表現、推論、分析に優れるが、幻覚や推論速度の遅さは意思決定タスクへの直接的な適用を妨げることが多い。
訓練された埋め込みLDMは、各交差点のトポロジ構造とトラフィックダイナミクスをキャプチャするリッチなセマンティックな特徴を生成する教師として機能する。
- 参考スコア(独自算出の注目度): 12.562136225497937
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Adaptive Traffic Signal Control (ATSC) aims to optimize traffic flow and minimize delays by adjusting traffic lights in real time. Recent advances in Multi-agent Reinforcement Learning (MARL) have shown promise for ATSC, yet existing approaches still suffer from limited representational capacity, often leading to suboptimal performance and poor generalization in complex and dynamic traffic environments. On the other hand, Large Language Models (LLMs) excel at semantic representation, reasoning, and analysis, yet their propensity for hallucination and slow inference speeds often hinder their direct application to decision-making tasks. To address these challenges, we propose a novel learning paradigm named LATS that integrates LLMs and MARL, leveraging the former's strong prior knowledge and inductive abilities to enhance the latter's decision-making process. Specifically, we introduce a plug-and-play teacher-student learning module, where a trained embedding LLM serves as a teacher to generate rich semantic features that capture each intersection's topology structures and traffic dynamics. A much simpler (student) neural network then learns to emulate these features through knowledge distillation in the latent space, enabling the final model to operate independently from the LLM for downstream use in the RL decision-making process. This integration significantly enhances the overall model's representational capacity across diverse traffic scenarios, thus leading to more efficient and generalizable control strategies. Extensive experiments across diverse traffic datasets empirically demonstrate that our method enhances the representation learning capability of RL models, thereby leading to improved overall performance and generalization over both traditional RL and LLM-only approaches. [...]
- Abstract(参考訳): Adaptive Traffic Signal Control (ATSC) は、信号機をリアルタイムで調整することで、交通の流れを最適化し、遅延を最小限にすることを目的としている。
近年のMARL(Multi-agent Reinforcement Learning)の進歩はATSCを約束しているが、既存のアプローチは表現能力の限界に悩まされているため、複雑な交通環境や動的交通環境における準最適性能や一般化の低さを招いている。
一方、Large Language Models (LLM) は意味表現、推論、分析に優れるが、幻覚や推論速度の遅さは、意思決定タスクへの直接的な適用を妨げることが多い。
これらの課題に対処するために,LLMとMARLを統合したLATSという新しい学習パラダイムを提案する。
具体的には,各交差点のトポロジ構造と交通動態をキャプチャするリッチなセマンティックな特徴を生成するために,教師として訓練された組込みLDMが機能するプラグイン・アンド・プレイ型学習モジュールを提案する。
より単純な(学生の)ニューラルネットワークは、潜伏空間の知識蒸留を通じてこれらの特徴をエミュレートすることを学び、最終モデルはLLMから独立して、RL決定プロセスで下流での使用を可能にする。
この統合により、さまざまなトラフィックシナリオにわたるモデル全体の表現能力が大幅に向上し、より効率的で一般化可能な制御戦略がもたらされる。
多様なトラフィックデータセットにわたる大規模な実験により、我々の手法はRLモデルの表現学習能力を向上し、従来のRLとLLMのみのアプローチよりも全体的な性能と一般化を向上させることが実証された。
[...]
関連論文リスト
- COVLM-RL: Critical Object-Oriented Reasoning for Autonomous Driving Using VLM-Guided Reinforcement Learning [55.83415345423854]
批判的オブジェクト指向(CO)推論と強化学習(RL)を統合した新しいエンドツーエンド駆動フレームワークCOVLM-RLを提案する。
CARLAシミュレータで行った実験により、COVLM-RLはトレーニング運転環境における成功率を30%向上することが示された。
論文 参考訳(メタデータ) (2025-12-10T06:18:16Z) - Traffic-MLLM: A Spatio-Temporal MLLM with Retrieval-Augmented Generation for Causal Inference in Traffic [8.754321713184483]
本稿では,詳細なトラフィック解析に適した多モーダル大規模言語モデルであるTraffic-LMを提案する。
我々のモデルは、高品質な交通特化マルチモーダルデータセットを活用し、軽量な微調整にLowRanktemporal Adaptation (LoRA) を用いる。
また、検索ロッドジェネレーション(LoRAG)による最先端推論を融合した革新的な知識モジュールも導入する。
論文 参考訳(メタデータ) (2025-09-14T08:53:06Z) - ViaRL: Adaptive Temporal Grounding via Visual Iterated Amplification Reinforcement Learning [68.76048244253582]
ビデオ理解におけるフレーム選択の最適化にルールベース強化学習(RL)を利用する最初のフレームワークであるViaRLを紹介する。
ViaRLは、下流モデルの応答精度を報奨信号として利用し、試行錯誤によってフレームセレクタを訓練する。
ViaRLは、多様なビデオ理解タスクに対して、時間的基盤性能と堅牢な一般化を一貫して提供します。
論文 参考訳(メタデータ) (2025-05-21T12:29:40Z) - Navigating Motion Agents in Dynamic and Cluttered Environments through LLM Reasoning [69.5875073447454]
本稿では,大規模言語モデル(LLM)によって強化された動作エージェントを,動的・乱雑な環境における自律的なナビゲーションに向けて前進させる。
トレーニング不要なフレームワークは、マルチエージェント調整、クローズドループ計画、動的障害物回避を、リトレーニングや微調整なしでサポートしています。
論文 参考訳(メタデータ) (2025-03-10T13:39:09Z) - TeLL-Drive: Enhancing Autonomous Driving with Teacher LLM-Guided Deep Reinforcement Learning [61.33599727106222]
TeLL-Driveは、Teacher LLMを統合して、注意に基づく学生DRLポリシーをガイドするハイブリッドフレームワークである。
自己維持機構はDRLエージェントの探索とこれらの戦略を融合させ、政策収束を加速し、堅牢性を高める。
論文 参考訳(メタデータ) (2025-02-03T14:22:03Z) - Traj-LLM: A New Exploration for Empowering Trajectory Prediction with Pre-trained Large Language Models [12.687494201105066]
本稿では,Traj-LLMを提案する。Large Language Models (LLMs) を用いて,エージェントの過去の/観測された軌跡やシーンセマンティクスから将来の動きを生成する可能性について検討する。
LLMの強力な理解能力は、ハイレベルなシーン知識とインタラクティブな情報のスペクトルを捉えている。
人為的な車線焦点認知機能を模倣し,先駆的なMambaモジュールを用いた車線認識確率論的学習を導入する。
論文 参考訳(メタデータ) (2024-05-08T09:28:04Z) - LLMLight: Large Language Models as Traffic Signal Control Agents [25.438040499152745]
交通信号制御(TSC)は都市交通管理において重要な要素であり、道路網の効率を最適化し渋滞を軽減することを目的としている。
本稿では,大規模言語モデル (LLM) を用いた新しいフレームワーク LLMLight について述べる。
論文 参考訳(メタデータ) (2023-12-26T13:17:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。