論文の概要: TrafficClaw: Generalizable Urban Traffic Control via Unified Physical Environment Modeling
- arxiv url: http://arxiv.org/abs/2604.17456v1
- Date: Sun, 19 Apr 2026 14:17:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.534262
- Title: TrafficClaw: Generalizable Urban Traffic Control via Unified Physical Environment Modeling
- Title(参考訳): TrafficClaw:Unified Physical Environment Modelingによる一般都市交通制御
- Authors: Siqi Lai, Pan Zhang, Yuping Zhou, Jindong Han, Yansong Ning, Hao Liu,
- Abstract要約: TrafficClawは、統一されたランタイム環境上に構築された一般的な都市交通制御のためのフレームワークである。
我々は,サブシステム間の統一診断を支援するために,実行可能推論と再利用可能な手続き記憶を備えたエージェントを開発した。
実験によると、TrafficClawは、目に見えないトラフィックシナリオ、ダイナミックス、タスク設定にわたって、堅牢で、転送可能で、システム対応のパフォーマンスを実現している。
- 参考スコア(独自算出の注目度): 15.57539332792164
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Urban traffic control is a system-level coordination problem spanning heterogeneous subsystems, including traffic signals, freeways, public transit, and taxi services. Existing optimization-based, reinforcement learning (RL), and emerging LLM-based approaches are largely designed for isolated tasks, limiting both cross-task generalization and the ability to capture coupled physical dynamics across subsystems. We argue that effective system-level control requires a unified physical environment in which subsystems share infrastructure, mobility demand, and spatiotemporal constraints, allowing local interventions to propagate through the network. To this end, we propose TrafficClaw, a framework for general urban traffic control built upon a unified runtime environment. TrafficClaw integrates heterogeneous subsystems into a shared dynamical system, enabling explicit modeling of cross-subsystem interactions and closed-loop agent-environment feedback. Within this environment, we develop an LLM agent with executable spatiotemporal reasoning and reusable procedural memory, supporting unified diagnostics across subsystems and continual strategy refinement. Furthermore, we introduce a multi-stage training pipeline with supervised initialization and agentic RL with system-level optimization, further enabling coordinated and system-aware performance. Experiments demonstrate that TrafficClaw achieves robust, transferable, and system-aware performance across unseen traffic scenarios, dynamics, and task configurations. Our project is available at https://github.com/usail-hkust/TrafficClaw.
- Abstract(参考訳): 都市交通制御は、交通信号、高速道路、公共交通機関、タクシーサービスを含む異種サブシステムにまたがるシステムレベルの調整問題である。
既存の最適化ベース、強化学習(RL)、新しいLLMベースのアプローチは、タスクを分離するために主に設計されており、タスク間の一般化とサブシステム間で結合された物理力学をキャプチャする能力の両方を制限している。
システムレベルを効果的に制御するには、サブシステムがインフラ、移動需要、時空間的制約を共有できる統合された物理的環境が必要であると我々は主張する。
そこで我々は,統合実行環境上に構築された一般都市交通制御のためのフレームワークであるTrafficClawを提案する。
TrafficClawは異種サブシステムを共有動的システムに統合し、クロスサブシステムインタラクションとクローズドループエージェント環境フィードバックの明示的なモデリングを可能にする。
この環境下では、持続的時空間推論と再利用可能な手続き記憶を備えたLCMエージェントを開発し、サブシステム間の統一診断と継続的な戦略改善を支援する。
さらに、教師付き初期化とエージェントRL、システムレベルの最適化を備えたマルチステージトレーニングパイプラインを導入し、さらに協調およびシステム認識性能を実現した。
実験によると、TrafficClawは、目に見えないトラフィックシナリオ、ダイナミックス、タスク設定にわたって、堅牢で、転送可能で、システム対応のパフォーマンスを実現している。
私たちのプロジェクトはhttps://github.com/usail-hkust/TrafficClaw.comで利用可能です。
関連論文リスト
- CROSS: A Mixture-of-Experts Reinforcement Learning Framework for Generalizable Large-Scale Traffic Signal Control [11.628278541732513]
汎用適応型信号制御(ATSC)のための新しいMixture-of-Experts(MoE)ベースの分散RLフレームワークであるCROSSを提案する。
まず、予測コントラストクラスタリング(PCC)モジュールを導入し、短期状態遷移を予測して潜在トラフィックパターンを特定し、続いてクラスタリングとコントラスト学習を行い、パターンレベルの表現を強化する。
さらに、複数の専門家と共有ポリシーを強化するScenario-Adaptive MoEモジュールを設計し、適応的な特殊化とより柔軟なシナリオ固有の戦略を可能にします。
論文 参考訳(メタデータ) (2026-03-26T01:48:15Z) - Robust Single-Agent Reinforcement Learning for Regional Traffic Signal Control Under Demand Fluctuations [5.784337914162491]
交通渋滞は、主に交差点の待ち行列によって引き起こされ、都市生活水準、安全性、環境品質、経済効率に大きな影響を及ぼす。
本研究では,地域適応型TSCのための新しい単エージェント強化学習フレームワークを提案する。
このフレームワークは堅牢な反ゆらぎ能力を示し、待ち時間を大幅に短縮する。
論文 参考訳(メタデータ) (2025-11-01T13:18:50Z) - Exploring the Roles of Large Language Models in Reshaping Transportation Systems: A Survey, Framework, and Roadmap [51.198001060683296]
大型言語モデル(LLM)は、輸送上の課題に対処するための変革的な可能性を提供する。
LLM4TRは,交通におけるLSMの役割を体系的に分類する概念的枠組みである。
それぞれの役割について,交通予測や自律運転,安全分析,都市移動最適化など,さまざまな応用について検討した。
論文 参考訳(メタデータ) (2025-03-27T11:56:27Z) - CoLLMLight: Cooperative Large Language Model Agents for Network-Wide Traffic Signal Control [7.0964925117958515]
交通信号制御(TSC)は,交通流の最適化と混雑緩和によって都市交通管理において重要な役割を担っている。
既存のアプローチでは、エージェント間の調整に必要な問題に対処できない。
TSCのための協調LLMエージェントフレームワークであるCoLLMLightを提案する。
論文 参考訳(メタデータ) (2025-03-14T15:40:39Z) - Navigating Motion Agents in Dynamic and Cluttered Environments through LLM Reasoning [69.5875073447454]
本稿では,大規模言語モデル(LLM)によって強化された動作エージェントを,動的・乱雑な環境における自律的なナビゲーションに向けて前進させる。
トレーニング不要なフレームワークは、マルチエージェント調整、クローズドループ計画、動的障害物回避を、リトレーニングや微調整なしでサポートしています。
論文 参考訳(メタデータ) (2025-03-10T13:39:09Z) - LLM-Assisted Light: Leveraging Large Language Model Capabilities for Human-Mimetic Traffic Signal Control in Complex Urban Environments [3.7788636451616697]
本研究は,大規模言語モデルを交通信号制御システムに統合する革新的なアプローチを導入する。
LLMを知覚と意思決定ツールのスイートで強化するハイブリッドフレームワークが提案されている。
シミュレーションの結果から,交通環境の多種性に適応するシステムの有効性が示された。
論文 参考訳(メタデータ) (2024-03-13T08:41:55Z) - A Holistic Framework Towards Vision-based Traffic Signal Control with
Microscopic Simulation [53.39174966020085]
交通信号制御(TSC)は交通渋滞を低減し、交通の流れを円滑にし、アイドリング時間を短縮し、CO2排出量を減らすために重要である。
本研究では,道路交通の流れを視覚的観察によって調節するTSCのコンピュータビジョンアプローチについて検討する。
我々は、視覚ベースのTSCとそのベンチマークに向けて、TrafficDojoと呼ばれる総合的なトラフィックシミュレーションフレームワークを導入する。
論文 参考訳(メタデータ) (2024-03-11T16:42:29Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。
近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。
本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文 参考訳(メタデータ) (2021-01-04T03:06:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。