論文の概要: Optimising Stochastic Routing for Taxi Fleets with Model Enhanced
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2010.11738v1
- Date: Thu, 22 Oct 2020 13:55:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-04 08:37:46.864044
- Title: Optimising Stochastic Routing for Taxi Fleets with Model Enhanced
Reinforcement Learning
- Title(参考訳): モデル強化強化学習を用いたタクシー車両の最適確率経路
- Authors: Shen Ren, Qianxiao Li, Liye Zhang, Zheng Qin and Bo Yang
- Abstract要約: 我々は、道路配車サービスのための大規模な車両群のためのルーティングポリシーを最適化することを目指している。
モデルベースディスパッチアルゴリズム,モデルフリー強化学習アルゴリズム,新しいハイブリッドアルゴリズムが提案されている。
- 参考スコア(独自算出の注目度): 32.322091943124555
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The future of mobility-as-a-Service (Maas)should embrace an integrated system
of ride-hailing, street-hailing and ride-sharing with optimised intelligent
vehicle routing in response to a real-time, stochastic demand pattern. We aim
to optimise routing policies for a large fleet of vehicles for street-hailing
services, given a stochastic demand pattern in small to medium-sized road
networks. A model-based dispatch algorithm, a high performance model-free
reinforcement learning based algorithm and a novel hybrid algorithm combining
the benefits of both the top-down approach and the model-free reinforcement
learning have been proposed to route the \emph{vacant} vehicles. We design our
reinforcement learning based routing algorithm using proximal policy
optimisation and combined intrinsic and extrinsic rewards to strike a balance
between exploration and exploitation. Using a large-scale agent-based
microscopic simulation platform to evaluate our proposed algorithms, our
model-free reinforcement learning and hybrid algorithm show excellent
performance on both artificial road network and community-based Singapore road
network with empirical demands, and our hybrid algorithm can significantly
accelerate the model-free learner in the process of learning.
- Abstract(参考訳): モビリティ・アズ・ア・サービス(maas: mobility-as-a-service)の将来は、リアルタイムかつ確率的な需要パターンに応じて、最適化されたインテリジェントな車両ルーティングによるライドシェアリング、ストリート配車、ライドシェアリングの統合システムを採用するだろう。
我々は,小中規模の道路網における確率的需要パターンを考慮し,道路配車サービスのための大型車両群における経路政策の最適化を目指す。
モデルベースディスパッチアルゴリズム、高性能モデルフリー強化学習ベースアルゴリズム、およびトップダウンアプローチとモデルフリー強化学習の両方の利点を組み合わせた新しいハイブリッドアルゴリズムが、 \emph{vacant} 車両をルートするために提案されている。
我々は,探索と搾取のバランスをとるために,近似ポリシー最適化と内在報酬と外在報酬を組み合わせた強化学習に基づくルーティングアルゴリズムを設計する。
提案したアルゴリズムを評価するために,大規模エージェントベース顕微鏡シミュレーションプラットフォームを用いたモデルフリー強化学習とハイブリッドアルゴリズムを用いて,人工道路ネットワークとコミュニティベースシンガポール道路ネットワークの両方において,実験的な要求により優れた性能を示す。
関連論文リスト
- Auto-Train-Once: Controller Network Guided Automatic Network Pruning from Scratch [72.26822499434446]
オートトレインオース (Auto-Train-Once, ATO) は、DNNの計算コストと記憶コストを自動的に削減するために設計された、革新的なネットワークプルーニングアルゴリズムである。
総合的な収束解析と広範な実験を行い,本手法が様々なモデルアーキテクチャにおける最先端性能を実現することを示す。
論文 参考訳(メタデータ) (2024-03-21T02:33:37Z) - Eco-Driving Control of Connected and Automated Vehicles using Neural
Network based Rollout [0.0]
接続された自動運転車は、エネルギー消費を最小化する可能性がある。
既存の決定論的手法は、一般に高い計算とメモリ要求に悩まされる。
本研究ではニューラルネットワークを介して実装された階層型マルチ水平最適化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-16T23:13:51Z) - Online Relocating and Matching of Ride-Hailing Services: A Model-Based
Modular Approach [7.992568451498863]
本研究は、配車プラットフォームにおける注文マッチングと車両の移動を動的に最適化する革新的モデルベースモジュラーアプローチ(MMA)を提案する。
MMAはバッチマッチングや強化学習に基づく手法よりも優れた系統的性能を達成することができる。
論文 参考訳(メタデータ) (2023-10-13T12:45:52Z) - Combinatorial Optimization enriched Machine Learning to solve the
Dynamic Vehicle Routing Problem with Time Windows [5.4807970361321585]
最適化層を組み込んだ新しい機械学習パイプラインを提案する。
最近,EURO Meets NeurIPS Competition at NeurIPS 2022において,このパイプラインを波による動的車両ルーティング問題に適用した。
提案手法は,提案した動的車両経路問題の解法において,他の全ての手法よりも優れていた。
論文 参考訳(メタデータ) (2023-04-03T08:23:09Z) - MARLIN: Soft Actor-Critic based Reinforcement Learning for Congestion
Control in Real Networks [63.24965775030673]
そこで本研究では,汎用的な渋滞制御(CC)アルゴリズムを設計するための新しい強化学習(RL)手法を提案する。
我々の解であるMARLINは、Soft Actor-Criticアルゴリズムを用いてエントロピーとリターンの両方を最大化する。
我々は,MARLINを実ネットワーク上で訓練し,実ミスマッチを克服した。
論文 参考訳(メタデータ) (2023-02-02T18:27:20Z) - Fast and computationally efficient generative adversarial network
algorithm for unmanned aerial vehicle-based network coverage optimization [1.2853186701496802]
移動ネットワークにおける動的な交通需要の課題は、無人航空機をベースとした移動セルに対処されている。
将来,無人航空機の膨大な可能性を考えると,カバー範囲最適化のための新しいアルゴリズムを提案する。
提案アルゴリズムは,一意の多層和プーリング損失関数を持つ条件付き生成逆ニューラルネットワークに基づいて実装された。
論文 参考訳(メタデータ) (2022-03-25T12:13:21Z) - Real-world Ride-hailing Vehicle Repositioning using Deep Reinforcement
Learning [52.2663102239029]
アイドルヘイリングプラットフォーム上での現実世界の車両の深層強化学習と意思決定時間計画に基づく新しい実用的枠組みを提示する。
本手法は,重み付きバッチ学習アルゴリズムを用いて乗車時の状態値関数を学習する。
配車シミュレーション環境におけるベースラインでアルゴリズムをベンチマークし、収益効率の向上における優位性を実証します。
論文 参考訳(メタデータ) (2021-03-08T05:34:05Z) - Edge Federated Learning Via Unit-Modulus Over-The-Air Computation
(Extended Version) [64.76619508293966]
本稿では,効率の良いエッジフェデレーション学習を実現するために,UM-AirCompフレームワークを提案する。
ローカルモデルパラメータを同時にアップロードし、アナログビームフォーミングを通じてグローバルモデルパラメータを更新する。
車両間自動運転シミュレーションプラットフォームにおけるUM-AirCompの実装を実演する。
論文 参考訳(メタデータ) (2021-01-28T15:10:22Z) - Reconfigurable Intelligent Surface Assisted Mobile Edge Computing with
Heterogeneous Learning Tasks [53.1636151439562]
モバイルエッジコンピューティング(MEC)は、AIアプリケーションに自然なプラットフォームを提供します。
再構成可能なインテリジェントサーフェス(RIS)の助けを借りて、MECで機械学習タスクを実行するインフラストラクチャを提示します。
具体的には,モバイルユーザの送信パワー,基地局のビームフォーミングベクトル,risの位相シフト行列を共同で最適化することにより,参加ユーザの学習誤差を最小化する。
論文 参考訳(メタデータ) (2020-12-25T07:08:50Z) - Information Theoretic Model Predictive Q-Learning [64.74041985237105]
本稿では,情報理論的MPCとエントロピー正規化RLとの新たな理論的関連性を示す。
バイアスモデルを利用したQ-ラーニングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2019-12-31T00:29:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。