論文の概要: Towards Autonomous Railway Operations: A Semi-Hierarchical Deep Reinforcement Learning Approach to the Vehicle Rescheduling Problem
- arxiv url: http://arxiv.org/abs/2605.10257v1
- Date: Mon, 11 May 2026 09:23:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.691087
- Title: Towards Autonomous Railway Operations: A Semi-Hierarchical Deep Reinforcement Learning Approach to the Vehicle Rescheduling Problem
- Title(参考訳): 自動車再スケジュール問題に対する半階層的深部強化学習アプローチ
- Authors: Alberto Castagna, Stefan Zahlner, Adrian Egli, Christian Eichenberger, Daniel Boos, Manuel Meyer, Anton Fuxjager,
- Abstract要約: 鉄道交通管理における混乱の管理は大きな課題である。
交通密度の増加とインフラの制限は複雑さを増す。
ほとんどのディスパッチは、問題の指数的な複雑さのため、人間の専門知識に依存している。
本稿では, 運転制約に合わせた半階層的RL定式化を提案する。
- 参考スコア(独自算出の注目度): 1.0348904561315861
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Managing disruptions in railway traffic management is a major challenge. Rising traffic density and infrastructure limits increase complexity, making the Vehicle Routing and Scheduling Problem (VRSP) difficult to solve reliably and in real time. While Operational Research (OR) methods are widely used, most dispatching still relies on human expertise due to the problem's exponential combinatorial complexity. Reinforcement Learning (RL) has gained attention for its potential in multi-agent coordination, but existing RL approaches often underperform OR methods and struggle to scale in dense rail networks. This paper addresses this gap from a machine learning perspective by introducing a semi-hierarchical RL formulation tailored to operational railway constraints. The method separates dispatching from routing through dedicated action and observation spaces, enabling policies to specialise in distinct decision scopes and addressing the imbalance between rare dispatch decisions and frequent routing updates. The approach is evaluated on the Flatland-RL simulator across five difficulty levels and 50 random seeds, with 7 to 80 trains. Results show substantially improved coordination, resource utilisation, and robustness compared with heuristic baselines and monolithic RL, nearly doubling the number of trains reaching their destinations, while keeping deadlock rates below 5% and adaptively sequencing, delaying, or cancelling trains under heavy congestion.
- Abstract(参考訳): 鉄道交通管理における混乱の管理は大きな課題である。
交通密度の増大とインフラの制限は複雑さを増し、車両ルーティングとスケジューリングの問題(VRSP)を確実にリアルタイムに解決することが困難になる。
オペレーショナルリサーチ(OR)の手法は広く使われているが、ほとんどのディスパッチは、問題の指数的組合せの複雑さのため、人間の専門知識に依存している。
強化学習(Reinforcement Learning, RL)は、マルチエージェント協調においてその可能性に注目されているが、既存のRLアプローチはOR法を過小評価し、高密度鉄道網でのスケーリングに苦慮することが多い。
本稿では, 運転制約に合わせた半階層的RL定式化を導入することにより, 機械学習の観点からのこのギャップを解消する。
この方法では、専用のアクションと観測空間を通したルーティングからディスパッチを分離し、ポリシーが決定範囲を専門化し、稀なディスパッチ決定と頻繁なルーティング更新の不均衡に対処できるようにする。
この手法はFlatland-RLシミュレーターで5つの難易度と50個のランダムシードの7~80本の列車で評価されている。
その結果、ヒューリスティックなベースラインやモノリシックなRLに比べて、調整、資源利用、ロバスト性が大幅に改善され、目的地に着く列車の数はほぼ倍増し、デッドロックレートは5%以下に抑えられ、激しい混雑下での列車のシークエンシング、遅延、キャンセルが適応的に維持された。
関連論文リスト
- Multi-Agent DRL for V2X Resource Allocation: Disentangling Challenges and Benchmarking Solutions [51.22818149833102]
マルチエージェント強化学習(MARL)は、車間通信(C-V2X)ネットワークにおける無線リソース割り当ての有望なアプローチとして登場した。
しかし、MARLに固有の多面的課題はしばしば絡み合っており、車載環境における個々の影響を理解することは困難である。
我々は, C-V2X RRA を, 複雑さが徐々に増大する多エージェント干渉ゲーム列として定式化し, このギャップを埋める。
論文 参考訳(メタデータ) (2026-02-18T14:46:56Z) - Human-Centric Traffic Signal Control for Equity: A Multi-Agent Action Branching Deep Reinforcement Learning Approach [5.2437780355984165]
人中心型マルチエージェントアクションブラッチングダブルディープQネットワーク(DQN)フレームワークであるMA2B-DDQNを提案する。
我々の重要な貢献は、廊下制御を局所的な区間ごとの動作に分解するアクション分岐離散制御の定式化である。
また、歩行者、乗務員、交通機関の乗客を考慮し、廊下で遅れた人の数を罰する人間中心の報酬も設計する。
論文 参考訳(メタデータ) (2026-02-03T00:56:03Z) - Accelerating Vehicle Routing via AI-Initialized Genetic Algorithms [53.75036695728983]
車両ルーティング問題 (VRP) は進化的最適化における基本的なNPハード問題である。
本稿では、強化学習エージェントを事前のインスタンスで訓練し、初期解を迅速に生成する最適化フレームワークを提案する。
このフレームワークは、様々な時間予算において、現在の最先端のソルバよりも一貫して優れています。
論文 参考訳(メタデータ) (2025-04-08T15:21:01Z) - TeLL-Drive: Enhancing Autonomous Driving with Teacher LLM-Guided Deep Reinforcement Learning [61.33599727106222]
TeLL-Driveは、Teacher LLMを統合して、注意に基づく学生DRLポリシーをガイドするハイブリッドフレームワークである。
自己維持機構はDRLエージェントの探索とこれらの戦略を融合させ、政策収束を加速し、堅牢性を高める。
論文 参考訳(メタデータ) (2025-02-03T14:22:03Z) - Generalizing Cooperative Eco-driving via Multi-residual Task Learning [6.864745785996583]
MRTL(Multi-Residual Task Learning)はマルチタスク学習に基づく汎用的な学習フレームワークである。
MRTLは制御を従来の制御法と残留項によって効果的に解決される名目成分に分解する。
我々は、システム制御の手段として自律走行車を用いた混合交通における艦隊レベルの排出削減にMRTLを使用している。
論文 参考訳(メタデータ) (2024-03-07T05:25:34Z) - Decentralized Cooperative Lane Changing at Freeway Weaving Areas Using
Multi-Agent Deep Reinforcement Learning [1.6752182911522522]
マージやウィービングエリアなどの高速道路ボトルネックにおける渋滞時の車線変化は、さらに道路の容量を減少させる。
ディープ・リテンション・ラーニング(RL)とコネクテッド・アンド・オートマチック・カー・テクノロジーの出現は、協調車線変更による高速道路のボトルネックにおけるモビリティとエネルギー効率を改善するための解決策となる。
本研究では,多エージェント深部RLパラダイムを用いた分散協調車線切替制御器を開発した。
本研究では, 交通量, 車両速度, 車両当たりの停止数, 燃料効率, 排出エミッションの観点から, 多エージェント深部RLによる協調車線変更は, 運転者にとって優れた性能を示すことを示した。
論文 参考訳(メタデータ) (2021-10-05T18:29:13Z) - Flatland Competition 2020: MAPF and MARL for Efficient Train
Coordination on a Grid World [49.80905654161763]
車両再スケジュール問題(vrsp)の解法開発を目的としたフラットランドコンペティション
VRSPは、交通ネットワークにおける旅行のスケジュールと、故障が発生した場合の車両の再スケジュールに関するものである。
現代の鉄道網の複雑化は、交通の動的リアルタイムスケジューリングを事実上不可能にします。
論文 参考訳(メタデータ) (2021-03-30T17:13:29Z) - Solving the single-track train scheduling problem via Deep Reinforcement
Learning [0.0]
引き起こされた遅延がネットワークを通じて伝播し、需要のミスマッチと商品や乗客の供給につながった。
人間の交通管制官は、交通への影響を最小限に抑えるために最善を尽くす。
本稿では,この問題に対処するための機械学習に基づく手法について検討し,二つの異なるQ-Learning手法を提案する。
論文 参考訳(メタデータ) (2020-09-01T14:03:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。