論文の概要: Solving the single-track train scheduling problem via Deep Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2009.00433v1
- Date: Tue, 1 Sep 2020 14:03:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-23 01:47:25.933228
- Title: Solving the single-track train scheduling problem via Deep Reinforcement
Learning
- Title(参考訳): 深部強化学習による単線列車スケジューリング問題の解法
- Authors: Valerio Agasucci, Giorgio Grani, Leonardo Lamorgese
- Abstract要約: 意思決定科学は、人間のオペレーターの能力を改善するために、問題を解決する方法の開発に注力してきた。
本稿では,列車発送問題に対処する際の2つの異なるQ-Learning手法について検討する。
数値計算の結果,行列に基づく古典的線形Q-Learningに対して,これらの手法の優位性を示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Every day, railways experience small inconveniences, both on the network and
the fleet side, affecting the stability of rail traffic. When a disruption
occurs, delays propagate through the network, resulting in demand mismatching
and, in the long run, demand loss. When a critical situation arises, human
dispatchers distributed over the line have the duty to do their best to
minimize the impact of the disruptions. Unfortunately, human operators have a
limited depth of perception of how what happens in distant areas of the network
may affect their control zone. In recent years, decision science has focused on
developing methods to solve the problem automatically, to improve the
capabilities of human operators. In this paper, machine learning-based methods
are investigated when dealing with the train dispatching problem. In
particular, two different Deep Q-Learning methods are proposed. Numerical
results show the superiority of these techniques respect to the classical
linear Q-Learning based on matrices.
- Abstract(参考訳): 毎日、鉄道は、鉄道交通の安定性に影響を与えるネットワークと艦隊の両方において、小さな不便を経験する。
障害が発生した場合、遅延はネットワークを伝播し、要求の不一致と、長期的には需要の損失をもたらす。
重大な事態が発生した場合、人間の派遣者は破壊の影響を最小限に抑えるために最善を尽くす義務がある。
残念なことに、人間のオペレーターは、ネットワークの遠い領域で何が起こるかがコントロールゾーンにどう影響するかを限定的に認識している。
近年、意思決定科学は、人間のオペレーターの能力を改善するために、問題を自動解決する手法の開発に注力している。
本稿では,列車発車問題に対処する際の機械学習手法について検討する。
特に2つの異なるQ-Learning法が提案されている。
数値計算の結果,行列に基づく古典線形Q-Learningに対して,これらの手法の優位性を示した。
関連論文リスト
- Deep Reinforcement Learning for Autonomous Vehicle Intersection
Navigation [0.24578723416255746]
強化学習アルゴリズムは、これらの課題に対処するための有望なアプローチとして登場した。
そこで本研究では,低コスト単一エージェントアプローチを用いて,T断面積を効率よく安全にナビゲートする問題に対処する。
提案手法により,AVはT断面積を効果的にナビゲートし,走行遅延,衝突最小化,総コストの面で従来の手法より優れていることがわかった。
論文 参考訳(メタデータ) (2023-09-30T10:54:02Z) - Using Reinforcement Learning for the Three-Dimensional Loading Capacitated Vehicle Routing Problem [40.50169360761464]
効率を上げるためのソリューションとして、協調車両ルーティングが提案されている。
現在の運用研究手法は、問題の大きさを増大させる非線形スケーリングに悩まされている。
約線形時間で3次元負荷容量化車両ルーティング問題を解くための強化学習モデルを開発した。
論文 参考訳(メタデータ) (2023-07-22T18:05:28Z) - Rethinking Closed-loop Training for Autonomous Driving [82.61418945804544]
本研究は,学習エージェントの成功に対する異なるトレーニングベンチマーク設計の影響を分析した最初の実証的研究である。
複数ステップのルックアヘッドで計画を行うRLベースの駆動エージェントであるtrajectory value learning (TRAVL)を提案する。
実験の結果,TRAVLはすべてのベースラインと比較してより速く学習でき,安全な操作が可能であることがわかった。
論文 参考訳(メタデータ) (2023-06-27T17:58:39Z) - Detecting train driveshaft damages using accelerometer signals and
Differential Convolutional Neural Networks [67.60224656603823]
本稿では,高度2次元畳み込みニューラルネットワーク(CNN)アーキテクチャに基づく鉄道軸状態監視システムの開発を提案する。
その結果,鉄道軸受振動信号を時間周波数領域表現,すなわち分光図に変換し,そのひび割れに応じて2次元CNNを訓練する。
論文 参考訳(メタデータ) (2022-11-15T15:04:06Z) - On partitioning of an SHM problem and parallels with transfer learning [0.0]
構造的健康モニタリング問題に対して,伝達学習を動機とする問題分割手法とスキームを適用した。
この場合の特定の問題は、航空機の翼の損傷の局所化である。
論文 参考訳(メタデータ) (2022-03-03T11:22:30Z) - To Supervise or Not: How to Effectively Learn Wireless Interference
Management Models? [43.317056712257994]
機械学習は、無線干渉管理問題の解決に成功している。
このような干渉管理モデルには、教師あり学習と教師なし学習の2つの一般的な訓練パラダイムがある。
特殊な電力制御問題に対して、教師なし学習は教師なし学習よりもはるかに悪い性能を発揮することを示す。
論文 参考訳(メタデータ) (2021-12-28T06:29:08Z) - Error-Aware Imitation Learning from Teleoperation Data for Mobile
Manipulation [54.31414116478024]
移動操作(MM)では、ロボットは環境内を移動して操作することができる。
本研究では,MMタスクに対する連続的なビジュオモダポリシの学習に模倣学習(IL)を適用する方法について検討する。
論文 参考訳(メタデータ) (2021-12-09T23:54:59Z) - A Deep Value-network Based Approach for Multi-Driver Order Dispatching [55.36656442934531]
そこで本研究では,注文発送のための深層強化学習に基づくソリューションを提案する。
DiDiの配車プラットフォーム上で大規模なオンラインA/Bテストを実施している。
その結果,CVNetは近年提案されているディスパッチ手法よりも一貫して優れていた。
論文 参考訳(メタデータ) (2021-06-08T16:27:04Z) - Step-Ahead Error Feedback for Distributed Training with Compressed
Gradient [99.42912552638168]
集中型分散トレーニングにおける局所的エラーフィードバックによって,新たな"段階的ミスマッチ"問題が発生することを示す。
本稿では, 厳密な理論的解析を施した2つの新しい手法, 1) 一歩前進, 2) 誤差平均化を提案する。
論文 参考訳(メタデータ) (2020-08-13T11:21:07Z) - Tomography Based Learning for Load Distribution through Opaque Networks [9.923523030849836]
オーバー・ザ・トップ(OTT)サービスプロバイダにとって重要なタスクは、遅延を最小限に抑えるため、ネットワークを通してトラフィックを送信することだ。
この問題は、トラフィックがブラックボックスネットワークに入る一連の入力をトラフィックソースが選択できる一般的な設定で検討する。
この問題を解決するための主要な技術的課題は、問題の高次元性と、ネットワークに固有の制約を扱うことである。
論文 参考訳(メタデータ) (2020-07-18T21:52:21Z) - Deep Learning for Ultra-Reliable and Low-Latency Communications in 6G
Networks [84.2155885234293]
まず,データ駆動型教師付き深層学習と深部強化学習をURLLCに適用する方法を概説する。
このようなオープンな問題に対処するために、デバイスインテリジェンス、エッジインテリジェンス、およびURLLCのためのクラウドインテリジェンスを可能にするマルチレベルアーキテクチャを開発した。
論文 参考訳(メタデータ) (2020-02-22T14:38:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。