論文の概要: Deep Reinforcement Learning based Dynamic Optimization of Bus Timetable
- arxiv url: http://arxiv.org/abs/2107.07066v1
- Date: Thu, 15 Jul 2021 01:22:49 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-16 14:03:45.271945
- Title: Deep Reinforcement Learning based Dynamic Optimization of Bus Timetable
- Title(参考訳): バスタイムテーブルの動的最適化による深層強化学習
- Authors: Guanqun Ai, Xingquan Zuo, Gang chen, and Binglin Wu
- Abstract要約: 深層強化学習に基づくバス時刻動的最適化法(DRL-TO)を提案する。
DQN(Deep Q-Network)は、サービス期間中にバスサービスをディスパッチするかどうかを決定する決定モデルとして使用される。
DRL-TOは、リアルタイムの乗客フローに基づいて出発間隔を動的に決定し、車両の8$%を節約し、乗客の待ち時間の平均17$%を削減できる。
- 参考スコア(独自算出の注目度): 4.337939117851783
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Bus timetable optimization is a key issue to reduce operational cost of bus
companies and improve the service quality. Existing methods use exact or
heuristic algorithms to optimize the timetable in an offline manner. In
practice, the passenger flow may change significantly over time. Timetables
determined in offline cannot adjust the departure interval to satisfy the
changed passenger flow. Aiming at improving the online performance of bus
timetable, we propose a Deep Reinforcement Learning based bus Timetable dynamic
Optimization method (DRL-TO). In this method, the timetable optimization is
considered as a sequential decision problem. A Deep Q-Network (DQN) is employed
as the decision model to determine whether to dispatch a bus service during
each minute of the service period. Therefore, the departure intervals of bus
services are determined in real time in accordance with passenger demand. We
identify several new and useful state features for the DQN, including the load
factor, carrying capacity utilization rate, and the number of stranding
passengers. Taking into account both the interests of the bus company and
passengers, a reward function is designed, which includes the indicators of
full load rate, empty load rate, passengers' waiting time, and the number of
stranding passengers. Building on an existing method for calculating the
carrying capacity, we develop a new technique to enhance the matching degree at
each bus station. Experiments demonstrate that compared with the timetable
generated by the state-of-the-art bus timetable optimization approach based on
a memetic algorithm (BTOA-MA), Genetic Algorithm (GA) and the manual method,
DRL-TO can dynamically determine the departure intervals based on the real-time
passenger flow, saving 8$\%$ of vehicles and reducing 17$\%$ of passengers'
waiting time on average.
- Abstract(参考訳): バスのタイムテーブル最適化は、バス会社の運用コストを削減し、サービス品質を改善する上で重要な課題である。
既存の方法は、正確なまたはヒューリスティックなアルゴリズムを使用して、オフラインでタイムテーブルを最適化する。
実際には、乗客の流れは時間とともに大きく変化する可能性がある。
オフラインで決定された時刻表は、変更した乗客の流れを満たすために出発間隔を調整できない。
バスタイムテーブルのオンライン性能向上を目的とした,深層強化学習に基づくバスタイムテーブル動的最適化手法(DRL-TO)を提案する。
本手法では,逐次決定問題として時刻表最適化を考える。
DQN(Deep Q-Network)は、サービス期間中にバスサービスをディスパッチするかどうかを決定する決定モデルとして使用される。
そのため、旅客需要に応じて、バスの出発間隔をリアルタイムで決定する。
そこで本研究では,DQNの負荷係数,キャパシティ利用率,ストランド乗客数など,いくつかの新しい,有用な状態特徴を明らかにした。
バス会社と乗客の双方の利益を考慮して、全荷率、空荷率、乗客の待ち時間、ストライディング乗客数などの指標を含む報酬機能を設計する。
本研究では,既存の輸送能力計算手法に基づいて,各バス駅におけるマッチング度を向上する手法を開発した。
実験により,メメティックアルゴリズム(BTOA-MA),遺伝的アルゴリズム(GA),手動手法に基づく最先端のバス時刻表最適化手法によって生成される時刻表と比較して,DRL-TOはリアルタイムの乗客フローに基づいて出発間隔を動的に決定し,車両の8$\%を節約し,乗客の待ち時間の平均17$\%を削減できることがわかった。
関連論文リスト
- Rethinking Optimal Transport in Offline Reinforcement Learning [64.56896902186126]
オフラインの強化学習では、データはさまざまな専門家によって提供され、一部は準最適である。
効率的なポリシを抽出するには、データセットから最高の振る舞いを強調する必要がある。
本稿では,各状態に対する最善の専門家行動の公平な分布に状態をマッピングするポリシーを見つけることを目的としたアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-17T22:36:43Z) - RL-MSA: a Reinforcement Learning-based Multi-line bus Scheduling
Approach [0.0]
既存のアプローチは、通常、オフラインでバススケジューリングスキームを生成し、そのスキームに従ってバスをスケジュールする。
本稿では,MLBSPをマルコフ決定過程(MDP)としてモデル化する。
RL-MSA(Reinforcement Learning-based Multi-line bus Scheduling Approach)は,オフラインとオンラインの両フェーズでバススケジューリングを行うための手法である。
論文 参考訳(メタデータ) (2024-03-11T07:07:05Z) - Short Run Transit Route Planning Decision Support System Using a Deep
Learning-Based Weighted Graph [0.0]
本稿では,公共交通機関の計画立案者が短期間の経路改善を迅速に特定できるような,意思決定支援システムのための新しいディープラーニング手法を提案する。
本手法は,日中の2つの停留所間の経路をシームレスに調整することにより,時間を短縮し,PTサービスを増強する。
本研究では,道路セグメントの遅延値を予測するためのディープラーニングモデルを訓練し,これらの遅延値を輸送グラフのエッジ重みとして利用することにより,効率的な経路探索を実現する。
論文 参考訳(メタデータ) (2023-08-24T14:37:55Z) - Deployment of Leader-Follower Automated Vehicle Systems for Smart Work
Zone Applications with a Queuing-based Traffic Assignment Approach [1.0355894890759376]
本論文は,ネットワーク上でのATMA車両の経路最適化に焦点をあて,低速動作に伴うシステムコストを最小化することを目的とする。
ATMAシステムによるシステムコストを特定するために,待ち行列に基づくトラフィック割り当て手法を提案する。
本手法は,小型ネットワークと大規模ネットワークを用いて検証し,キャパシティドロップモデリングとQBTD走行時間関数の利点を分析するための2つのベンチマークモデルと比較した。
論文 参考訳(メタデータ) (2023-07-23T16:35:05Z) - Real-Time Bus Arrival Prediction: A Deep Learning Approach for Enhanced
Urban Mobility [2.1374208474242815]
一般的な課題は、実際のバス到着時刻と予定された時刻とのミスマッチであり、固定されたスケジュールの混乱につながる。
本研究は,様々な交通機関(駅)におけるバス到着時刻を予測するための,革新的なAIに基づくデータ駆動手法を提案する。
完全に接続されたニューラルネットワークの展開により,公共バスの交通システムの精度と効率が向上する。
論文 参考訳(メタデータ) (2023-03-27T16:45:22Z) - A Deep-Learning Based Optimization Approach to Address Stop-Skipping
Strategy in Urban Rail Transit Lines [0.0]
都市鉄道路線における最適なストップスキップパターンを決定するための高度なデータ駆動最適化手法を提案する。
我々は、ピーク時のステーションレベルの需要率を予測するために、LSTM(Long Short-Term Memory)ディープラーニングモデルを用いている。
この問題の指数関数的性質を考慮し,適切な時間で解決するAnt Colony Optimization手法を提案する。
論文 参考訳(メタデータ) (2021-09-17T23:52:19Z) - A Deep Value-network Based Approach for Multi-Driver Order Dispatching [55.36656442934531]
そこで本研究では,注文発送のための深層強化学習に基づくソリューションを提案する。
DiDiの配車プラットフォーム上で大規模なオンラインA/Bテストを実施している。
その結果,CVNetは近年提案されているディスパッチ手法よりも一貫して優れていた。
論文 参考訳(メタデータ) (2021-06-08T16:27:04Z) - Delay-Tolerant Constrained OCO with Application to Network Resource
Allocation [44.67787270821051]
マルチスロットフィードバック遅延によるオンライン凸最適化(OCO)を検討します。
エージェントは、時間変動凸損失関数の蓄積を最小限に抑えるために、一連のオンライン決定を行う。
情報フィードバックと意思決定の更新の非同期性に取り組むために,二重正規化による新たな制約ペナルティを用いた遅延耐性制約OCOを提案する。
論文 参考訳(メタデータ) (2021-05-09T19:32:33Z) - Tracking Performance of Online Stochastic Learners [57.14673504239551]
オンラインアルゴリズムは、大規模なバッチにデータを保存したり処理したりすることなく、リアルタイムで更新を計算できるため、大規模な学習環境で人気がある。
一定のステップサイズを使用すると、これらのアルゴリズムはデータやモデル特性などの問題パラメータのドリフトに適応し、適切な精度で最適解を追跡する能力を持つ。
定常仮定に基づく定常状態性能とランダムウォークモデルによるオンライン学習者の追跡性能の関連性を確立する。
論文 参考訳(メタデータ) (2020-04-04T14:16:27Z) - DADA: Differentiable Automatic Data Augmentation [58.560309490774976]
コストを大幅に削減する微分可能自動データ拡張(DADA)を提案する。
CIFAR-10, CIFAR-100, SVHN, ImageNetのデータセットについて広範な実験を行った。
その結果,DADAは最先端技術よりも1桁以上高速であり,精度は極めて高いことがわかった。
論文 参考訳(メタデータ) (2020-03-08T13:23:14Z) - Stacked Auto Encoder Based Deep Reinforcement Learning for Online
Resource Scheduling in Large-Scale MEC Networks [44.40722828581203]
オンラインリソーススケジューリングフレームワークは、IoT(Internet of Things)の全ユーザに対して、重み付けされたタスクレイテンシの総和を最小化するために提案されている。
以下を含む深層強化学習(DRL)に基づく解法を提案する。
DRLがポリシーネットワークをトレーニングし、最適なオフロードポリシーを見つけるのを支援するために、保存および優先されたエクスペリエンスリプレイ(2p-ER)を導入する。
論文 参考訳(メタデータ) (2020-01-24T23:01:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。