Fugu-MT 論文翻訳(概要): AMM: Adaptive Modularized Reinforcement Model for Multi-city Traffic Signal Control

論文の概要: AMM: Adaptive Modularized Reinforcement Model for Multi-city Traffic Signal Control

arxiv url: http://arxiv.org/abs/2501.02548v1
Date: Sun, 05 Jan 2025 13:59:08 GMT
ステータス: 翻訳完了
システム内更新日: 2025-01-07 16:36:51.482123
Title: AMM: Adaptive Modularized Reinforcement Model for Multi-city Traffic Signal Control
Title（参考訳）: AMM:多都市交通信号制御のための適応型モジュール化強化モデル
Authors: Zherui Huang, Yicheng Liu, Chumeng Liang, Guanjie Zheng,
Abstract要約: 交通信号制御(TSC)は重要かつ広く研究されている方向である。実世界の交通環境における実験の膨大なコストのため, 実世界への強化学習(RL)手法の適用は困難である。 1つの可能な解決策は、トレーニングされたモデルをターゲット環境に適応させるTSCドメイン適応である。
参考スコア（独自算出の注目度）: 9.885854146962624
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Traffic signal control (TSC) is an important and widely studied direction. Recently, reinforcement learning (RL) methods have been used to solve TSC problems and achieve superior performance over conventional TSC methods. However, applying RL methods to the real world is challenging due to the huge cost of experiments in real-world traffic environments. One possible solution is TSC domain adaptation, which adapts trained models to target environments and reduces the number of interactions and the training cost. However, existing TSC domain adaptation methods still face two major issues: the lack of consideration for differences across cities and the low utilization of multi-city data. To solve aforementioned issues, we propose an approach named Adaptive Modularized Model (AMM). By modularizing TSC problems and network models, we overcome the challenge of possible changes in environmental observations. We also aggregate multi-city experience through meta-learning. We conduct extensive experiments on different cities and show that AMM can achieve excellent performance with limited interactions in target environments and outperform existing methods. We also demonstrate the feasibility and generalizability of our method.
Abstract（参考訳）: 交通信号制御(TSC)は重要かつ広く研究されている方向である。近年、強化学習(RL)法は、従来のTSC法よりも優れた性能を達成し、TSCの問題を解決するために用いられている。しかし、実世界の交通環境における実験の膨大なコストのため、実世界へのRL手法の適用は困難である。これは、トレーニングされたモデルをターゲット環境に適応させ、インタラクションの数とトレーニングコストを削減します。しかし、既存のTSCドメイン適応手法は、都市間の違いに対する考慮の欠如と、マルチシティデータの低利用という2つの大きな問題に直面している。上記の問題を解決するために,適応モジュール化モデル (AMM) という手法を提案する。 TSC問題とネットワークモデルをモジュール化することにより、環境観測における変化の可能性の課題を克服する。メタラーニングを通じて、マルチシティ体験を集約する。我々は、異なる都市で広範な実験を行い、AMMがターゲット環境における限られた相互作用を達成し、既存の手法より優れた性能を発揮することを示す。また,本手法の有効性と一般化性を示す。

関連論文リスト

Scalable and Reliable Multi-agent Reinforcement Learning for Traffic Assignment [11.758301752971505]
本稿では,交通代入問題に対する新しいMARLフレームワークであるMARL-OD-DAを紹介する。実験により,提案したMARLフレームワークは,都市レベルのOD需要が多岐にわたる中規模ネットワークを効果的に処理できることを示した。 SiouxFallsネットワークに実装されると、MARL-OD-DAは従来の方法よりも94.99%低い相対的なギャップを持つ10ステップでより良い代入ソリューションを達成する。
論文参考訳（メタデータ） (2025-06-20T14:25:23Z)
Topology-Assisted Spatio-Temporal Pattern Disentangling for Scalable MARL in Large-scale Autonomous Traffic Control [14.929720580977152]
本稿では,動的グラフニューラルネットワーク(DGNN)とトポロジカルデータ解析(TDA)を統合した新しいMARLフレームワークを提案する。大規模言語モデル (LLMs) におけるMixture of Experts (MoE) アーキテクチャに着想を得て, 位相支援型空間パターンアンタングリング (TSD) 強化型MoEを提案する。実世界の交通シナリオにおいて行われた大規模な実験は、包括的な理論的分析とともに、提案フレームワークの優れた性能を検証した。
論文参考訳（メタデータ） (2025-06-14T11:18:12Z)
PATS: Process-Level Adaptive Thinking Mode Switching [53.53401063490537]
現在の大言語モデル(LLM)は、通常、難易度に関わらず、すべての質問に対して、単純または複雑に固定された推論戦略を採用する。このようなタスクと推論プロセスの複雑さの変化の無視は、パフォーマンスと効率のバランスを損なう。既存の手法では, 難易度が異なる問題に対処するために, 学習不要な高速スロー思考システムを導入しようとするが, 厳密な解レベルの戦略調整によって制限される。プロセスレベル適応思考モードスイッチング(PATS)という新しい推論パラダイムを提案し,各ステップの難易度に基づいてLLMが推論戦略を動的に調整し,そのバランスを最適化する。
論文参考訳（メタデータ） (2025-05-25T17:58:50Z)
CoLLMLight: Cooperative Large Language Model Agents for Network-Wide Traffic Signal Control [7.0964925117958515]
交通信号制御(TSC)は,交通流の最適化と混雑緩和によって都市交通管理において重要な役割を担っている。既存のアプローチでは、エージェント間の調整に必要な問題に対処できない。 TSCのための協調LLMエージェントフレームワークであるCoLLMLightを提案する。
論文参考訳（メタデータ） (2025-03-14T15:40:39Z)
Meta-Federated Learning: A Novel Approach for Real-Time Traffic Flow Management [0.0]
本稿では,フェデレートラーニング(FL)とメタラーニング(ML)を組み合わせて,分散型でスケーラブルで適応的なトラフィック管理システムを構築する,新しいアプローチを提案する。スマートトラヒックデバイスのシミュレーションネットワークにモデルを実装し,予測精度と応答時間の観点から,Meta-Federated Learningが従来のモデルより大幅に優れていることを示す。当社のアプローチは,交通パターンの急激な変化に対する顕著な適応性を示し,スマートシティにおけるリアルタイムトラフィック管理のスケーラブルなソリューションを提案する。
論文参考訳（メタデータ） (2025-01-28T07:24:24Z)
Collaborative Imputation of Urban Time Series through Cross-city Meta-learning [54.438991949772145]
メタ学習型暗黙的ニューラル表現(INR)を利用した新しい協調的計算パラダイムを提案する。次に,モデルに依存しないメタ学習による都市間協調学習手法を提案する。 20のグローバル都市から得られた多様な都市データセットの実験は、我々のモデルの優れた計算性能と一般化可能性を示している。
論文参考訳（メタデータ） (2025-01-20T07:12:40Z)
Instance-Conditioned Adaptation for Large-scale Generalization of Neural Routing Solver [15.842155380912002]
本稿では,ニューラル・ルーティング・ソルバの大規模一般化のための新しいインスタンス・コンディション・アダプタ・モデルを提案する。提案手法は,非常に高速な推論時間で有望な結果が得られることを示す。
論文参考訳（メタデータ） (2024-05-03T08:00:19Z)
LLM-Assisted Light: Leveraging Large Language Model Capabilities for Human-Mimetic Traffic Signal Control in Complex Urban Environments [3.7788636451616697]
本研究は,大規模言語モデルを交通信号制御システムに統合する革新的なアプローチを導入する。 LLMを知覚と意思決定ツールのスイートで強化するハイブリッドフレームワークが提案されている。シミュレーションの結果から,交通環境の多種性に適応するシステムの有効性が示された。
論文参考訳（メタデータ） (2024-03-13T08:41:55Z)
Unleashing Network Potentials for Semantic Scene Completion [50.95486458217653]
本稿では,新しいSSCフレームワーク - Adrial Modality Modulation Network (AMMNet)を提案する。 AMMNetは、モダリティ間の勾配流の相互依存性を可能にするクロスモーダル変調と、動的勾配競争を利用するカスタマイズされた逆トレーニングスキームの2つのコアモジュールを導入している。 AMMNetは最先端のSSC法よりも大きなマージンで優れていた。
論文参考訳（メタデータ） (2024-03-12T11:48:49Z)
Model-free Learning of Corridor Clearance: A Near-term Deployment Perspective [5.39179984304986]
コネクテッド・アンド・オートマチック・ビークル(CAV)技術の公衆衛生応用は、交通を間接的に調整することで救急医療サービス(EMS)の応答時間を短縮することである。このトピックに関する既存の研究は、EMS車両の故障が通常の交通に与える影響を見落とし、100%CAVの侵入を仮定し、交差点におけるリアルタイム交通信号タイミングデータと待ち行列長に依存し、最適なモデルに基づくCAV制御戦略を導出する際の交通設定について様々な仮定を行う。これらの課題を克服し、短期的実世界の適用性を高めるために、深部強化学習(DRL)を用いたCAV制御戦略設計のためのモデルフリーアプローチを提案する。
論文参考訳（メタデータ） (2023-12-16T06:08:53Z)
MARLIN: Soft Actor-Critic based Reinforcement Learning for Congestion Control in Real Networks [63.24965775030673]
そこで本研究では,汎用的な渋滞制御(CC)アルゴリズムを設計するための新しい強化学習(RL)手法を提案する。我々の解であるMARLINは、Soft Actor-Criticアルゴリズムを用いてエントロピーとリターンの両方を最大化する。我々は,MARLINを実ネットワーク上で訓練し,実ミスマッチを克服した。
論文参考訳（メタデータ） (2023-02-02T18:27:20Z)
Cycle-Consistent World Models for Domain Independent Latent Imagination [0.0]
高いコストとリスクは、現実世界での自動運転車の訓練を困難にします。本稿では,Cycleconsistent World Modelsと呼ばれる新しいモデルに基づく強化学習手法を提案する。
論文参考訳（メタデータ） (2021-10-02T13:55:50Z)
Reinforcement Learning for Adaptive Mesh Refinement [63.7867809197671]
マルコフ決定過程としてのAMRの新規な定式化を提案し,シミュレーションから直接改良政策を訓練するために深部強化学習を適用した。これらのポリシーアーキテクチャのモデルサイズはメッシュサイズに依存しないため、任意に大きく複雑なシミュレーションにスケールします。
論文参考訳（メタデータ） (2021-03-01T22:55:48Z)
MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文参考訳（メタデータ） (2021-01-04T03:06:08Z)
A Decentralized Policy Gradient Approach to Multi-task Reinforcement Learning [13.733491423871383]
マルチタスク強化学習問題を解決するためのフレームワークを開発する。目標は、異なる環境で効果的に機能する共通ポリシーを学ぶことである。 MTRLの2つの基本的な課題に注目する。
論文参考訳（メタデータ） (2020-06-08T03:28:19Z)
GACEM: Generalized Autoregressive Cross Entropy Method for Multi-Modal Black Box Constraint Satisfaction [69.94831587339539]
本稿では,マスク付き自己回帰ニューラルネットワークを用いて解空間上の均一分布をモデル化するクロスエントロピー法(CEM)を提案する。我々のアルゴリズムは複雑な解空間を表現でき、様々な異なる解領域を追跡できる。
論文参考訳（メタデータ） (2020-02-17T20:21:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。