論文の概要: Solving the single-track train scheduling problem via Deep Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2009.00433v2
- Date: Tue, 13 Jun 2023 08:01:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-14 19:12:35.598859
- Title: Solving the single-track train scheduling problem via Deep Reinforcement
Learning
- Title(参考訳): 深部強化学習による単線列車スケジューリング問題の解法
- Authors: Valerio Agasucci, Giorgio Grani, Leonardo Lamorgese
- Abstract要約: 引き起こされた遅延がネットワークを通じて伝播し、需要のミスマッチと商品や乗客の供給につながった。
人間の交通管制官は、交通への影響を最小限に抑えるために最善を尽くす。
本稿では,この問題に対処するための機械学習に基づく手法について検討し,二つの異なるQ-Learning手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Every day, railways experience disturbances and disruptions, both on the
network and the fleet side, that affect the stability of rail traffic. Induced
delays propagate through the network, which leads to a mismatch in demand and
offer for goods and passengers, and, in turn, to a loss in service quality. In
these cases, it is the duty of human traffic controllers, the so-called
dispatchers, to do their best to minimize the impact on traffic. However,
dispatchers inevitably have a limited depth of perception of the knock-on
effect of their decisions, particularly how they affect areas of the network
that are outside their direct control. In recent years, much work in Decision
Science has been devoted to developing methods to solve the problem
automatically and support the dispatchers in this challenging task. This paper
investigates Machine Learning-based methods for tackling this problem,
proposing two different Deep Q-Learning methods(Decentralized and Centralized).
Numerical results show the superiority of these techniques with respect to the
classical linear Q-Learning based on matrices. Moreover, the Centralized
approach is compared with a MILP formulation showing interesting results. The
experiments are inspired by data provided by a U.S. Class 1 railroad.
- Abstract(参考訳): 鉄道は毎日、ネットワークと艦隊側の両方で、鉄道交通の安定性に影響を及ぼす混乱や混乱を経験している。
引き起こされる遅延はネットワークを通じて伝播し、需要のミスマッチと商品や乗客の供給、そしてサービス品質の損失につながる。
このような場合、交通への影響を最小限に抑えるため、いわゆる派遣者である人的交通管制官が最善を尽くす義務がある。
しかし、ディスペンサーは必然的に、その決定のノックオン効果に対する認識の限界、特に直接制御外にあるネットワークの領域にどのように影響するかを認識できる。
近年、意思決定科学における多くの研究が、この問題を自動的に解決し、ディスペンサーを支援する方法の開発に費やされている。
本稿では,この問題を解決するための機械学習に基づく手法について検討し,二つの異なるQ-Learning手法を提案する。
数値計算の結果,行列に基づく古典的線形Q-Learningに対して,これらの手法の優位性を示した。
さらに, 集中型手法とMILPの定式化を比較し, 興味深い結果を得た。
この実験は、アメリカのクラス1鉄道が提供するデータにインスパイアされている。
関連論文リスト
- Deep Reinforcement Learning for Autonomous Vehicle Intersection
Navigation [0.24578723416255746]
強化学習アルゴリズムは、これらの課題に対処するための有望なアプローチとして登場した。
そこで本研究では,低コスト単一エージェントアプローチを用いて,T断面積を効率よく安全にナビゲートする問題に対処する。
提案手法により,AVはT断面積を効果的にナビゲートし,走行遅延,衝突最小化,総コストの面で従来の手法より優れていることがわかった。
論文 参考訳(メタデータ) (2023-09-30T10:54:02Z) - Using Reinforcement Learning for the Three-Dimensional Loading Capacitated Vehicle Routing Problem [40.50169360761464]
効率を上げるためのソリューションとして、協調車両ルーティングが提案されている。
現在の運用研究手法は、問題の大きさを増大させる非線形スケーリングに悩まされている。
約線形時間で3次元負荷容量化車両ルーティング問題を解くための強化学習モデルを開発した。
論文 参考訳(メタデータ) (2023-07-22T18:05:28Z) - Rethinking Closed-loop Training for Autonomous Driving [82.61418945804544]
本研究は,学習エージェントの成功に対する異なるトレーニングベンチマーク設計の影響を分析した最初の実証的研究である。
複数ステップのルックアヘッドで計画を行うRLベースの駆動エージェントであるtrajectory value learning (TRAVL)を提案する。
実験の結果,TRAVLはすべてのベースラインと比較してより速く学習でき,安全な操作が可能であることがわかった。
論文 参考訳(メタデータ) (2023-06-27T17:58:39Z) - Detecting train driveshaft damages using accelerometer signals and
Differential Convolutional Neural Networks [67.60224656603823]
本稿では,高度2次元畳み込みニューラルネットワーク(CNN)アーキテクチャに基づく鉄道軸状態監視システムの開発を提案する。
その結果,鉄道軸受振動信号を時間周波数領域表現,すなわち分光図に変換し,そのひび割れに応じて2次元CNNを訓練する。
論文 参考訳(メタデータ) (2022-11-15T15:04:06Z) - On partitioning of an SHM problem and parallels with transfer learning [0.0]
構造的健康モニタリング問題に対して,伝達学習を動機とする問題分割手法とスキームを適用した。
この場合の特定の問題は、航空機の翼の損傷の局所化である。
論文 参考訳(メタデータ) (2022-03-03T11:22:30Z) - To Supervise or Not: How to Effectively Learn Wireless Interference
Management Models? [43.317056712257994]
機械学習は、無線干渉管理問題の解決に成功している。
このような干渉管理モデルには、教師あり学習と教師なし学習の2つの一般的な訓練パラダイムがある。
特殊な電力制御問題に対して、教師なし学習は教師なし学習よりもはるかに悪い性能を発揮することを示す。
論文 参考訳(メタデータ) (2021-12-28T06:29:08Z) - Error-Aware Imitation Learning from Teleoperation Data for Mobile
Manipulation [54.31414116478024]
移動操作(MM)では、ロボットは環境内を移動して操作することができる。
本研究では,MMタスクに対する連続的なビジュオモダポリシの学習に模倣学習(IL)を適用する方法について検討する。
論文 参考訳(メタデータ) (2021-12-09T23:54:59Z) - A Deep Value-network Based Approach for Multi-Driver Order Dispatching [55.36656442934531]
そこで本研究では,注文発送のための深層強化学習に基づくソリューションを提案する。
DiDiの配車プラットフォーム上で大規模なオンラインA/Bテストを実施している。
その結果,CVNetは近年提案されているディスパッチ手法よりも一貫して優れていた。
論文 参考訳(メタデータ) (2021-06-08T16:27:04Z) - Step-Ahead Error Feedback for Distributed Training with Compressed
Gradient [99.42912552638168]
集中型分散トレーニングにおける局所的エラーフィードバックによって,新たな"段階的ミスマッチ"問題が発生することを示す。
本稿では, 厳密な理論的解析を施した2つの新しい手法, 1) 一歩前進, 2) 誤差平均化を提案する。
論文 参考訳(メタデータ) (2020-08-13T11:21:07Z) - Tomography Based Learning for Load Distribution through Opaque Networks [9.923523030849836]
オーバー・ザ・トップ(OTT)サービスプロバイダにとって重要なタスクは、遅延を最小限に抑えるため、ネットワークを通してトラフィックを送信することだ。
この問題は、トラフィックがブラックボックスネットワークに入る一連の入力をトラフィックソースが選択できる一般的な設定で検討する。
この問題を解決するための主要な技術的課題は、問題の高次元性と、ネットワークに固有の制約を扱うことである。
論文 参考訳(メタデータ) (2020-07-18T21:52:21Z) - Deep Learning for Ultra-Reliable and Low-Latency Communications in 6G
Networks [84.2155885234293]
まず,データ駆動型教師付き深層学習と深部強化学習をURLLCに適用する方法を概説する。
このようなオープンな問題に対処するために、デバイスインテリジェンス、エッジインテリジェンス、およびURLLCのためのクラウドインテリジェンスを可能にするマルチレベルアーキテクチャを開発した。
論文 参考訳(メタデータ) (2020-02-22T14:38:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。