論文の概要: Real-time Control of Electric Autonomous Mobility-on-Demand Systems via
Graph Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2311.05780v1
- Date: Thu, 9 Nov 2023 22:57:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-13 16:21:30.988225
- Title: Real-time Control of Electric Autonomous Mobility-on-Demand Systems via
Graph Reinforcement Learning
- Title(参考訳): グラフ強化学習による自律移動型電動システムのリアルタイム制御
- Authors: Aaryan Singhal, Daniele Gammelli, Justin Luke, Karthik Gopalakrishnan,
Dominik Helmreich, Marco Pavone
- Abstract要約: エレクトロニック・モビリティ・オン・デマンド(E-AMoD)は、いくつかのリアルタイムな意思決定を行う必要がある。
強化学習のレンズによるE-AMoD制御問題を提案する。
本稿では,拡張性を大幅に向上し,性能の最適化に優れるグラフネットワークベースのフレームワークを提案する。
- 参考スコア(独自算出の注目度): 14.912597226152089
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Operators of Electric Autonomous Mobility-on-Demand (E-AMoD) fleets need to
make several real-time decisions such as matching available cars to ride
requests, rebalancing idle cars to areas of high demand, and charging vehicles
to ensure sufficient range. While this problem can be posed as a linear program
that optimizes flows over a space-charge-time graph, the size of the resulting
optimization problem does not allow for real-time implementation in realistic
settings. In this work, we present the E-AMoD control problem through the lens
of reinforcement learning and propose a graph network-based framework to
achieve drastically improved scalability and superior performance over
heuristics. Specifically, we adopt a bi-level formulation where we (1) leverage
a graph network-based RL agent to specify a desired next state in the
space-charge graph, and (2) solve more tractable linear programs to best
achieve the desired state while ensuring feasibility. Experiments using
real-world data from San Francisco and New York City show that our approach
achieves up to 89% of the profits of the theoretically-optimal solution while
achieving more than a 100x speedup in computational time. Furthermore, our
approach outperforms the best domain-specific heuristics with comparable
runtimes, with an increase in profits by up to 3x. Finally, we highlight
promising zero-shot transfer capabilities of our learned policy on tasks such
as inter-city generalization and service area expansion, thus showing the
utility, scalability, and flexibility of our framework.
- Abstract(参考訳): 電動自動運転モビリティ・オン・デマンド(e-amod)車両のオペレーターは、車両の乗車要求のマッチング、アイドル車両の高需要領域へのリバランス、十分な航続距離を確保するための充電など、いくつかのリアルタイム決定を行う必要がある。
この問題は、空間電荷時間グラフ上のフローを最適化する線形プログラムとして表すことができるが、結果の最適化問題のサイズは現実的な設定でのリアルタイム実装を許さない。
本研究では,強化学習のレンズによるE-AMoD制御問題を提案するとともに,拡張性を大幅に向上し,ヒューリスティックスよりも優れた性能を実現するためのグラフネットワークベースのフレームワークを提案する。
具体的には,(1)グラフネットワークベースのrlエージェントを利用して空間チャージグラフの所望の次状態を特定し,(2)より扱いやすい線形プログラムを解き,実現可能性を確保しつつ所望の状態を達成する2段階の定式化を行う。
サンフランシスコとニューヨークにおける実世界のデータを用いた実験により、我々の手法は理論上最適解の利益の最大89%を達成し、計算時間の100倍以上のスピードアップを達成した。
さらに、我々のアプローチは、同等のランタイムで最高のドメイン固有のヒューリスティックを上回り、利益を最大3倍に増やします。
最後に,都市間汎化やサービス領域拡大といったタスクにおける学習方針のゼロショット転送機能を強調し,フレームワークの実用性,スケーラビリティ,柔軟性を示す。
関連論文リスト
- Efficient Motion Prediction: A Lightweight & Accurate Trajectory Prediction Model With Fast Training and Inference Speed [56.27022390372502]
我々は,1つのGPU上で数時間のトレーニングをしながら,競争力の高いベンチマーク結果を実現する,新しい効率的な動き予測モデルを提案する。
その低推論レイテンシは、特に限られたコンピューティングリソースを持つ自律アプリケーションへのデプロイに適している。
論文 参考訳(メタデータ) (2024-09-24T14:58:27Z) - A Graph-based Adversarial Imitation Learning Framework for Reliable & Realtime Fleet Scheduling in Urban Air Mobility [5.19664437943693]
本稿では,艦隊スケジューリング問題の包括的最適化について述べる。
また、代替ソリューションのアプローチの必要性も認識している。
新しい模倣アプローチは、目に見えない最悪のシナリオにおいて、パフォーマンスと顕著な改善を実現する。
論文 参考訳(メタデータ) (2024-07-16T18:51:24Z) - Adaptive Resource Allocation for Virtualized Base Stations in O-RAN with
Online Learning [60.17407932691429]
基地局(vBS)を備えたオープンラジオアクセスネットワークシステムは、柔軟性の向上、コスト削減、ベンダーの多様性、相互運用性のメリットを提供する。
本研究では,予期せぬ「混み合う」環境下であっても,効率的なスループットとvBSエネルギー消費のバランスをとるオンライン学習アルゴリズムを提案する。
提案手法は, 課題のある環境においても, 平均最適性ギャップをゼロにすることで, サブ線形後悔を実現する。
論文 参考訳(メタデータ) (2023-09-04T17:30:21Z) - DClEVerNet: Deep Combinatorial Learning for Efficient EV Charging
Scheduling in Large-scale Networked Facilities [5.78463306498655]
電気自動車(EV)は配電ネットワークを著しくストレスし、性能を劣化させ、安定性を損なう可能性がある。
現代の電力網は、EV充電スケジューリングをスケーラブルで効率的な方法で最適化できる、コーディネートまたはスマートな充電戦略を必要とする。
ネットワークの利用可能な電力容量とステーションの占有限度を考慮しつつ、EV利用者の総福祉利益を最大化する時間結合二元最適化問題を定式化する。
論文 参考訳(メタデータ) (2023-05-18T14:03:47Z) - An ASP Framework for Efficient Urban Traffic Optimization [0.0]
本稿では,数百台の車両による大規模道路網における交通流を効率的にシミュレートし,最適化する枠組みを提案する。
このフレームワークは、Answer Set Programming (ASP)エンコーディングを利用して、ネットワーク内の車両の動きを正式に記述する。
これにより、ネットワーク内の車両の経路を最適化し、関連するメトリクスの幅を減らすことができる。
論文 参考訳(メタデータ) (2022-08-05T10:50:38Z) - Scalable Vehicle Re-Identification via Self-Supervision [66.2562538902156]
自動車再同定は、都市規模の車両分析システムにおいて重要な要素の1つである。
車両再設計のための最先端のソリューションの多くは、既存のre-idベンチマークの精度向上に重点を置いており、計算の複雑さを無視することが多い。
推論時間に1つのネットワークのみを使用する自己教師型学習によって、シンプルで効果的なハイブリッドソリューションを提案する。
論文 参考訳(メタデータ) (2022-05-16T12:14:42Z) - Multi-Exit Semantic Segmentation Networks [78.44441236864057]
本稿では,最先端セグメンテーションモデルをMESSネットワークに変換するフレームワークを提案する。
パラメトリド早期出口を用いた特別訓練されたCNNは、より簡単なサンプルの推測時に、その深さに沿って保存する。
接続されたセグメンテーションヘッドの数、配置、アーキテクチャとエグジットポリシーを併用して、デバイス機能とアプリケーション固有の要件に適応する。
論文 参考訳(メタデータ) (2021-06-07T11:37:03Z) - JUMBO: Scalable Multi-task Bayesian Optimization using Offline Data [86.8949732640035]
追加データをクエリすることで制限をサイドステップするMBOアルゴリズムであるJUMBOを提案する。
GP-UCBに類似した条件下では, 応答が得られないことを示す。
実世界の2つの最適化問題に対する既存手法に対する性能改善を実証的に示す。
論文 参考訳(メタデータ) (2021-06-02T05:03:38Z) - Reinforcement Learning-based Dynamic Service Placement in Vehicular
Networks [4.010371060637208]
さまざまなタイプのサービスの要求におけるトラフィックモビリティパターンとダイナミックスの複雑さは、サービスの配置を困難なタスクにしました。
トラフィックモビリティやサービスのダイナミクスを考慮していないため、典型的な静的配置ソリューションは効果的ではありません。
本稿では,エッジサーバに最適なサービス配置を見つけるために,強化学習に基づく動的(RL-Dynamic)サービス配置フレームワークを提案する。
論文 参考訳(メタデータ) (2021-05-31T15:01:35Z) - Value Function is All You Need: A Unified Learning Framework for Ride
Hailing Platforms [57.21078336887961]
DiDi、Uber、Lyftなどの大型配車プラットフォームは、都市内の数万台の車両を1日中数百万の乗車要求に接続している。
両課題に対処するための統合価値に基づく動的学習フレームワーク(V1D3)を提案する。
論文 参考訳(メタデータ) (2021-05-18T19:22:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。