Fugu-MT 論文翻訳(概要): Real-time Control of Electric Autonomous Mobility-on-Demand Systems via Graph Reinforcement Learning

論文の概要: Real-time Control of Electric Autonomous Mobility-on-Demand Systems via Graph Reinforcement Learning

arxiv url: http://arxiv.org/abs/2311.05780v1
Date: Thu, 9 Nov 2023 22:57:21 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-13 16:21:30.988225
Title: Real-time Control of Electric Autonomous Mobility-on-Demand Systems via Graph Reinforcement Learning
Title（参考訳）: グラフ強化学習による自律移動型電動システムのリアルタイム制御
Authors: Aaryan Singhal, Daniele Gammelli, Justin Luke, Karthik Gopalakrishnan, Dominik Helmreich, Marco Pavone
Abstract要約: エレクトロニック・モビリティ・オン・デマンド(E-AMoD)は、いくつかのリアルタイムな意思決定を行う必要がある。強化学習のレンズによるE-AMoD制御問題を提案する。本稿では,拡張性を大幅に向上し,性能の最適化に優れるグラフネットワークベースのフレームワークを提案する。
参考スコア（独自算出の注目度）: 14.912597226152089
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Operators of Electric Autonomous Mobility-on-Demand (E-AMoD) fleets need to make several real-time decisions such as matching available cars to ride requests, rebalancing idle cars to areas of high demand, and charging vehicles to ensure sufficient range. While this problem can be posed as a linear program that optimizes flows over a space-charge-time graph, the size of the resulting optimization problem does not allow for real-time implementation in realistic settings. In this work, we present the E-AMoD control problem through the lens of reinforcement learning and propose a graph network-based framework to achieve drastically improved scalability and superior performance over heuristics. Specifically, we adopt a bi-level formulation where we (1) leverage a graph network-based RL agent to specify a desired next state in the space-charge graph, and (2) solve more tractable linear programs to best achieve the desired state while ensuring feasibility. Experiments using real-world data from San Francisco and New York City show that our approach achieves up to 89% of the profits of the theoretically-optimal solution while achieving more than a 100x speedup in computational time. Furthermore, our approach outperforms the best domain-specific heuristics with comparable runtimes, with an increase in profits by up to 3x. Finally, we highlight promising zero-shot transfer capabilities of our learned policy on tasks such as inter-city generalization and service area expansion, thus showing the utility, scalability, and flexibility of our framework.
Abstract（参考訳）: 電動自動運転モビリティ・オン・デマンド(e-amod)車両のオペレーターは、車両の乗車要求のマッチング、アイドル車両の高需要領域へのリバランス、十分な航続距離を確保するための充電など、いくつかのリアルタイム決定を行う必要がある。この問題は、空間電荷時間グラフ上のフローを最適化する線形プログラムとして表すことができるが、結果の最適化問題のサイズは現実的な設定でのリアルタイム実装を許さない。本研究では,強化学習のレンズによるE-AMoD制御問題を提案するとともに,拡張性を大幅に向上し,ヒューリスティックスよりも優れた性能を実現するためのグラフネットワークベースのフレームワークを提案する。具体的には,(1)グラフネットワークベースのrlエージェントを利用して空間チャージグラフの所望の次状態を特定し,(2)より扱いやすい線形プログラムを解き,実現可能性を確保しつつ所望の状態を達成する2段階の定式化を行う。サンフランシスコとニューヨークにおける実世界のデータを用いた実験により、我々の手法は理論上最適解の利益の最大89%を達成し、計算時間の100倍以上のスピードアップを達成した。さらに、我々のアプローチは、同等のランタイムで最高のドメイン固有のヒューリスティックを上回り、利益を最大3倍に増やします。最後に,都市間汎化やサービス領域拡大といったタスクにおける学習方針のゼロショット転送機能を強調し,フレームワークの実用性,スケーラビリティ,柔軟性を示す。

関連論文リスト

Scalable Ride-Sourcing Vehicle Rebalancing with Service Accessibility Guarantee: A Constrained Mean-Field Reinforcement Learning Approach [42.070187224580344]
連続状態平均場制御(MFC)と平均場強化学習(MFRL)モデルを導入する。 MFCとMFRLは、個々の車両ではなく、車両分布との相互作用を通じて各車両の挙動をモデル化することで、スケーラブルなソリューションを提供する。我々のアプローチは数万台の車両にスケールし、トレーニング時間は1つの線形プログラミングリバランスの決定時間に匹敵する。
論文参考訳（メタデータ） (2025-03-31T15:00:11Z)
Efficient Motion Prediction: A Lightweight & Accurate Trajectory Prediction Model With Fast Training and Inference Speed [56.27022390372502]
我々は,1つのGPU上で数時間のトレーニングをしながら,競争力の高いベンチマーク結果を実現する,新しい効率的な動き予測モデルを提案する。その低推論レイテンシは、特に限られたコンピューティングリソースを持つ自律アプリケーションへのデプロイに適している。
論文参考訳（メタデータ） (2024-09-24T14:58:27Z)
A Graph-based Adversarial Imitation Learning Framework for Reliable & Realtime Fleet Scheduling in Urban Air Mobility [5.19664437943693]
本稿では,艦隊スケジューリング問題の包括的最適化について述べる。また、代替ソリューションのアプローチの必要性も認識している。新しい模倣アプローチは、目に見えない最悪のシナリオにおいて、パフォーマンスと顕著な改善を実現する。
論文参考訳（メタデータ） (2024-07-16T18:51:24Z)
Dynamic Scheduling for Vehicle-to-Vehicle Communications Enhanced Federated Learning [14.942677904783759]
車両のエネルギー制約と移動性を考慮して,VFL訓練性能を最適化する最適化問題を定式化する。本稿では,V2Vを拡張した動的スケジューリングアルゴリズムを提案する。提案アルゴリズムは,CIFAR-10データセットの画像分類精度を4.20%向上し,Argoverse軌道予測データセットの平均変位誤差を9.82%削減する。
論文参考訳（メタデータ） (2024-06-25T11:15:53Z)
Adaptive Resource Allocation for Virtualized Base Stations in O-RAN with Online Learning [60.17407932691429]
基地局(vBS)を備えたオープンラジオアクセスネットワークシステムは、柔軟性の向上、コスト削減、ベンダーの多様性、相互運用性のメリットを提供する。本研究では,予期せぬ「混み合う」環境下であっても,効率的なスループットとvBSエネルギー消費のバランスをとるオンライン学習アルゴリズムを提案する。提案手法は, 課題のある環境においても, 平均最適性ギャップをゼロにすることで, サブ線形後悔を実現する。
論文参考訳（メタデータ） (2023-09-04T17:30:21Z)
DClEVerNet: Deep Combinatorial Learning for Efficient EV Charging Scheduling in Large-scale Networked Facilities [5.78463306498655]
電気自動車(EV)は配電ネットワークを著しくストレスし、性能を劣化させ、安定性を損なう可能性がある。現代の電力網は、EV充電スケジューリングをスケーラブルで効率的な方法で最適化できる、コーディネートまたはスマートな充電戦略を必要とする。ネットワークの利用可能な電力容量とステーションの占有限度を考慮しつつ、EV利用者の総福祉利益を最大化する時間結合二元最適化問題を定式化する。
論文参考訳（メタデータ） (2023-05-18T14:03:47Z)
An ASP Framework for Efficient Urban Traffic Optimization [0.0]
本稿では,数百台の車両による大規模道路網における交通流を効率的にシミュレートし,最適化する枠組みを提案する。このフレームワークは、Answer Set Programming (ASP)エンコーディングを利用して、ネットワーク内の車両の動きを正式に記述する。これにより、ネットワーク内の車両の経路を最適化し、関連するメトリクスの幅を減らすことができる。
論文参考訳（メタデータ） (2022-08-05T10:50:38Z)
Scalable Vehicle Re-Identification via Self-Supervision [66.2562538902156]
自動車再同定は、都市規模の車両分析システムにおいて重要な要素の1つである。車両再設計のための最先端のソリューションの多くは、既存のre-idベンチマークの精度向上に重点を置いており、計算の複雑さを無視することが多い。推論時間に1つのネットワークのみを使用する自己教師型学習によって、シンプルで効果的なハイブリッドソリューションを提案する。
論文参考訳（メタデータ） (2022-05-16T12:14:42Z)
Multi-Exit Semantic Segmentation Networks [78.44441236864057]
本稿では,最先端セグメンテーションモデルをMESSネットワークに変換するフレームワークを提案する。パラメトリド早期出口を用いた特別訓練されたCNNは、より簡単なサンプルの推測時に、その深さに沿って保存する。接続されたセグメンテーションヘッドの数、配置、アーキテクチャとエグジットポリシーを併用して、デバイス機能とアプリケーション固有の要件に適応する。
論文参考訳（メタデータ） (2021-06-07T11:37:03Z)
JUMBO: Scalable Multi-task Bayesian Optimization using Offline Data [86.8949732640035]
追加データをクエリすることで制限をサイドステップするMBOアルゴリズムであるJUMBOを提案する。 GP-UCBに類似した条件下では, 応答が得られないことを示す。実世界の2つの最適化問題に対する既存手法に対する性能改善を実証的に示す。
論文参考訳（メタデータ） (2021-06-02T05:03:38Z)
Reinforcement Learning-based Dynamic Service Placement in Vehicular Networks [4.010371060637208]
さまざまなタイプのサービスの要求におけるトラフィックモビリティパターンとダイナミックスの複雑さは、サービスの配置を困難なタスクにしました。トラフィックモビリティやサービスのダイナミクスを考慮していないため、典型的な静的配置ソリューションは効果的ではありません。本稿では,エッジサーバに最適なサービス配置を見つけるために,強化学習に基づく動的(RL-Dynamic)サービス配置フレームワークを提案する。
論文参考訳（メタデータ） (2021-05-31T15:01:35Z)
Value Function is All You Need: A Unified Learning Framework for Ride Hailing Platforms [57.21078336887961]
DiDi、Uber、Lyftなどの大型配車プラットフォームは、都市内の数万台の車両を1日中数百万の乗車要求に接続している。両課題に対処するための統合価値に基づく動的学習フレームワーク(V1D3)を提案する。
論文参考訳（メタデータ） (2021-05-18T19:22:24Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。