論文の概要: Real-time Control of Electric Autonomous Mobility-on-Demand Systems via
Graph Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2311.05780v1
- Date: Thu, 9 Nov 2023 22:57:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-13 16:21:30.988225
- Title: Real-time Control of Electric Autonomous Mobility-on-Demand Systems via
Graph Reinforcement Learning
- Title(参考訳): グラフ強化学習による自律移動型電動システムのリアルタイム制御
- Authors: Aaryan Singhal, Daniele Gammelli, Justin Luke, Karthik Gopalakrishnan,
Dominik Helmreich, Marco Pavone
- Abstract要約: エレクトロニック・モビリティ・オン・デマンド(E-AMoD)は、いくつかのリアルタイムな意思決定を行う必要がある。
強化学習のレンズによるE-AMoD制御問題を提案する。
本稿では,拡張性を大幅に向上し,性能の最適化に優れるグラフネットワークベースのフレームワークを提案する。
- 参考スコア(独自算出の注目度): 14.912597226152089
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Operators of Electric Autonomous Mobility-on-Demand (E-AMoD) fleets need to
make several real-time decisions such as matching available cars to ride
requests, rebalancing idle cars to areas of high demand, and charging vehicles
to ensure sufficient range. While this problem can be posed as a linear program
that optimizes flows over a space-charge-time graph, the size of the resulting
optimization problem does not allow for real-time implementation in realistic
settings. In this work, we present the E-AMoD control problem through the lens
of reinforcement learning and propose a graph network-based framework to
achieve drastically improved scalability and superior performance over
heuristics. Specifically, we adopt a bi-level formulation where we (1) leverage
a graph network-based RL agent to specify a desired next state in the
space-charge graph, and (2) solve more tractable linear programs to best
achieve the desired state while ensuring feasibility. Experiments using
real-world data from San Francisco and New York City show that our approach
achieves up to 89% of the profits of the theoretically-optimal solution while
achieving more than a 100x speedup in computational time. Furthermore, our
approach outperforms the best domain-specific heuristics with comparable
runtimes, with an increase in profits by up to 3x. Finally, we highlight
promising zero-shot transfer capabilities of our learned policy on tasks such
as inter-city generalization and service area expansion, thus showing the
utility, scalability, and flexibility of our framework.
- Abstract(参考訳): 電動自動運転モビリティ・オン・デマンド(e-amod)車両のオペレーターは、車両の乗車要求のマッチング、アイドル車両の高需要領域へのリバランス、十分な航続距離を確保するための充電など、いくつかのリアルタイム決定を行う必要がある。
この問題は、空間電荷時間グラフ上のフローを最適化する線形プログラムとして表すことができるが、結果の最適化問題のサイズは現実的な設定でのリアルタイム実装を許さない。
本研究では,強化学習のレンズによるE-AMoD制御問題を提案するとともに,拡張性を大幅に向上し,ヒューリスティックスよりも優れた性能を実現するためのグラフネットワークベースのフレームワークを提案する。
具体的には,(1)グラフネットワークベースのrlエージェントを利用して空間チャージグラフの所望の次状態を特定し,(2)より扱いやすい線形プログラムを解き,実現可能性を確保しつつ所望の状態を達成する2段階の定式化を行う。
サンフランシスコとニューヨークにおける実世界のデータを用いた実験により、我々の手法は理論上最適解の利益の最大89%を達成し、計算時間の100倍以上のスピードアップを達成した。
さらに、我々のアプローチは、同等のランタイムで最高のドメイン固有のヒューリスティックを上回り、利益を最大3倍に増やします。
最後に,都市間汎化やサービス領域拡大といったタスクにおける学習方針のゼロショット転送機能を強調し,フレームワークの実用性,スケーラビリティ,柔軟性を示す。
関連論文リスト
- Eco-Driving Control of Connected and Automated Vehicles using Neural
Network based Rollout [0.0]
接続された自動運転車は、エネルギー消費を最小化する可能性がある。
既存の決定論的手法は、一般に高い計算とメモリ要求に悩まされる。
本研究ではニューラルネットワークを介して実装された階層型マルチ水平最適化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-16T23:13:51Z) - Adaptive Resource Allocation for Virtualized Base Stations in O-RAN with
Online Learning [60.17407932691429]
基地局(vBS)を備えたオープンラジオアクセスネットワークシステムは、柔軟性の向上、コスト削減、ベンダーの多様性、相互運用性のメリットを提供する。
本研究では,予期せぬ「混み合う」環境下であっても,効率的なスループットとvBSエネルギー消費のバランスをとるオンライン学習アルゴリズムを提案する。
提案手法は, 課題のある環境においても, 平均最適性ギャップをゼロにすることで, サブ線形後悔を実現する。
論文 参考訳(メタデータ) (2023-09-04T17:30:21Z) - DClEVerNet: Deep Combinatorial Learning for Efficient EV Charging
Scheduling in Large-scale Networked Facilities [5.78463306498655]
電気自動車(EV)は配電ネットワークを著しくストレスし、性能を劣化させ、安定性を損なう可能性がある。
現代の電力網は、EV充電スケジューリングをスケーラブルで効率的な方法で最適化できる、コーディネートまたはスマートな充電戦略を必要とする。
ネットワークの利用可能な電力容量とステーションの占有限度を考慮しつつ、EV利用者の総福祉利益を最大化する時間結合二元最適化問題を定式化する。
論文 参考訳(メタデータ) (2023-05-18T14:03:47Z) - An ASP Framework for Efficient Urban Traffic Optimization [0.0]
本稿では,数百台の車両による大規模道路網における交通流を効率的にシミュレートし,最適化する枠組みを提案する。
このフレームワークは、Answer Set Programming (ASP)エンコーディングを利用して、ネットワーク内の車両の動きを正式に記述する。
これにより、ネットワーク内の車両の経路を最適化し、関連するメトリクスの幅を減らすことができる。
論文 参考訳(メタデータ) (2022-08-05T10:50:38Z) - Scalable Vehicle Re-Identification via Self-Supervision [66.2562538902156]
自動車再同定は、都市規模の車両分析システムにおいて重要な要素の1つである。
車両再設計のための最先端のソリューションの多くは、既存のre-idベンチマークの精度向上に重点を置いており、計算の複雑さを無視することが多い。
推論時間に1つのネットワークのみを使用する自己教師型学習によって、シンプルで効果的なハイブリッドソリューションを提案する。
論文 参考訳(メタデータ) (2022-05-16T12:14:42Z) - Learning Model Predictive Controllers for Real-Time Ride-Hailing Vehicle
Relocation and Pricing Decisions [15.80796896560034]
大規模配車システムは、個々の要求レベルでのリアルタイムルーティングと、動的価格設定と車両の移動のためのマクロなモデル予測制御(MPC)の最適化を組み合わせることが多い。
本稿では、MPC最適化を学習することで、これらの計算課題に対処する。
結果の機械学習モデルは最適化プロキシとして機能し、その最適解を予測する。
論文 参考訳(メタデータ) (2021-11-05T00:52:15Z) - Data-Driven Offline Optimization For Architecting Hardware Accelerators [89.68870139177785]
PRIMEと呼ばれるハードウェアアクセラレータを設計するための,データ駆動型オフライン最適化手法を開発した。
PRIMEは、最先端のシミュレーション駆動方式の性能を約1.54倍と1.20倍に改善し、必要な総シミュレーション時間をそれぞれ93%と99%削減する。
さらにPRIMEは、ゼロショット設定で見えないアプリケーションのための効果的なアクセラレーターを設計し、シミュレーションベースの手法を1.26倍に向上させた。
論文 参考訳(メタデータ) (2021-10-20T17:06:09Z) - Multi-Exit Semantic Segmentation Networks [78.44441236864057]
本稿では,最先端セグメンテーションモデルをMESSネットワークに変換するフレームワークを提案する。
パラメトリド早期出口を用いた特別訓練されたCNNは、より簡単なサンプルの推測時に、その深さに沿って保存する。
接続されたセグメンテーションヘッドの数、配置、アーキテクチャとエグジットポリシーを併用して、デバイス機能とアプリケーション固有の要件に適応する。
論文 参考訳(メタデータ) (2021-06-07T11:37:03Z) - JUMBO: Scalable Multi-task Bayesian Optimization using Offline Data [86.8949732640035]
追加データをクエリすることで制限をサイドステップするMBOアルゴリズムであるJUMBOを提案する。
GP-UCBに類似した条件下では, 応答が得られないことを示す。
実世界の2つの最適化問題に対する既存手法に対する性能改善を実証的に示す。
論文 参考訳(メタデータ) (2021-06-02T05:03:38Z) - Value Function is All You Need: A Unified Learning Framework for Ride
Hailing Platforms [57.21078336887961]
DiDi、Uber、Lyftなどの大型配車プラットフォームは、都市内の数万台の車両を1日中数百万の乗車要求に接続している。
両課題に対処するための統合価値に基づく動的学習フレームワーク(V1D3)を提案する。
論文 参考訳(メタデータ) (2021-05-18T19:22:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。