論文の概要: Fleet Rebalancing for Expanding Shared e-Mobility Systems: A Multi-agent
Deep Reinforcement Learning Approach
- arxiv url: http://arxiv.org/abs/2211.06136v1
- Date: Fri, 11 Nov 2022 11:25:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-14 15:46:30.237995
- Title: Fleet Rebalancing for Expanding Shared e-Mobility Systems: A Multi-agent
Deep Reinforcement Learning Approach
- Title(参考訳): 共有e-Mobilityシステムの拡張のためのFleet Rebalancing: マルチエージェントディープ強化学習アプローチ
- Authors: Man Luo, Bowen Du, Wenzhe Zhang, Tianyou Song, Kun Li, Hongming Zhu,
Mark Birkin, Hongkai Wen
- Abstract要約: 共有e-mobilityシステムの運用における重要な課題は、フリートリバランシングである。
まず,実世界のe-mobilityシステムから収集したリッチなデータ集合を1年間調査する。
学習した知識により、EV共有の重要な操作詳細を抽象化できる高忠実度シミュレータを設計する。
次に, マルチエージェント強化学習(MARL)問題として, 連続的拡張下での共有e-mobilityシステムの再バランスタスクをモデル化する。
- 参考スコア(独自算出の注目度): 17.193480676611358
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The electrification of shared mobility has become popular across the globe.
Many cities have their new shared e-mobility systems deployed, with
continuously expanding coverage from central areas to the city edges. A key
challenge in the operation of these systems is fleet rebalancing, i.e., how EVs
should be repositioned to better satisfy future demand. This is particularly
challenging in the context of expanding systems, because i) the range of the
EVs is limited while charging time is typically long, which constrain the
viable rebalancing operations; and ii) the EV stations in the system are
dynamically changing, i.e., the legitimate targets for rebalancing operations
can vary over time. We tackle these challenges by first investigating rich sets
of data collected from a real-world shared e-mobility system for one year,
analyzing the operation model, usage patterns and expansion dynamics of this
new mobility mode. With the learned knowledge we design a high-fidelity
simulator, which is able to abstract key operation details of EV sharing at
fine granularity. Then we model the rebalancing task for shared e-mobility
systems under continuous expansion as a Multi-Agent Reinforcement Learning
(MARL) problem, which directly takes the range and charging properties of the
EVs into account. We further propose a novel policy optimization approach with
action cascading, which is able to cope with the expansion dynamics and solve
the formulated MARL. We evaluate the proposed approach extensively, and
experimental results show that our approach outperforms the state-of-the-art,
offering significant performance gain in both satisfied demand and net revenue.
- Abstract(参考訳): 共有モビリティの電化は世界中で人気を集めている。
多くの都市は、新しいe-mobilityシステムを展開しており、中央地域から市境まで継続的に範囲を広げている。
これらのシステムの運用において重要な課題は、将来の需要を満たすためにEVをどのように再配置すべきかという、艦隊の再バランスである。
これは、システム拡大の文脈において特に難しいことです。
一 充電時間が典型的には長い間、EVの範囲が限られており、かつ、実行可能な再バランス作業が制限されていること。
二 システムのEVステーションが動的に変化していること、即ち、再バランス運用の正当な目標が経時的に変化しうること。
まず,実世界の共有e-mobilityシステムから収集したリッチなデータ集合を1年間調査し,この新しいモビリティモードの運用モデル,利用パターン,拡張ダイナミクスを分析した。
学習した知識で我々は、EV共有の重要な操作詳細を粒度で抽象化できる高忠実度シミュレータを設計する。
次に,複数エージェント強化学習(marl)問題として,連続展開下での共有e-mobilityシステムのリバランスタスクをモデル化し,evsの範囲と充電特性を直接考慮する。
さらに, 拡張力学に対処し, 定式化されたMARLを解く, アクションカスケードを用いた新しいポリシー最適化手法を提案する。
提案手法を広範に評価し,本手法が現状よりも優れており,満足需要と純収益の両方において大きなパフォーマンス向上をもたらすことを示した。
関連論文リスト
- MetaTrading: An Immersion-Aware Model Trading Framework for Vehicular Metaverse Services [94.61039892220037]
本稿では,車載メタバースにおける拡張現実(AR)サービスの学習モデルを支援するために,メタバースユーザ(MU)にインセンティブを与える新しい没入型モデルトレーディングフレームワークを提案する。
動的ネットワーク条件とプライバシの懸念を考慮して、マルチエージェントマルコフ決定プロセスとしてMSPの報酬決定を定式化する。
実験により,提案フレームワークは,実AR関連車両データセット上でのARサービスにおいて,オブジェクト検出と分類のための高価値モデルを効果的に提供できることが示されている。
論文 参考訳(メタデータ) (2024-10-25T16:20:46Z) - FoMo: A Foundation Model for Mobile Traffic Forecasting with Diffusion Model [5.96737388771505]
モバイルトラフィック予測のための革新的なファンデーションモデル(FoMo)を提案する。
FoMoは、ネットワーク計画と最適化をサポートするために、複数の都市にまたがる短期・長期予測と分布生成の多様な予測タスクを処理する。
9つの実世界のデータセットに対する大規模な実験により、FoMoは多様な予測タスクやゼロ/フェーショット学習に関する現在のモデルより優れています。
論文 参考訳(メタデータ) (2024-10-20T07:32:16Z) - A Reinforcement Learning Approach for Dynamic Rebalancing in
Bike-Sharing System [11.237099288412558]
自転車シェアリングシステムはエコフレンドリーな都市移動を提供し、交通渋滞と健康的な生活様式の緩和に貢献している。
駅間で自転車を再分配するための車両を用いた効果的な再バランス戦略の開発は、オペレーターにとって非常に重要である。
本稿では,複数の車両との動的再バランス問題に対する時間的強化学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-02-05T23:46:42Z) - HAZARD Challenge: Embodied Decision Making in Dynamically Changing
Environments [93.94020724735199]
HAZARDは、火災、洪水、風などの3つの予期せぬ災害シナリオで構成されている。
このベンチマークにより、さまざまなパイプラインで自律エージェントの意思決定能力を評価することができる。
論文 参考訳(メタデータ) (2024-01-23T18:59:43Z) - Rethinking Urban Mobility Prediction: A Super-Multivariate Time Series
Forecasting Approach [71.67506068703314]
長期の都市移動予測は、都市施設やサービスの効果的管理において重要な役割を担っている。
伝統的に、都市移動データはビデオとして構成され、経度と緯度を基本的なピクセルとして扱う。
本研究では,都市におけるモビリティ予測の新たな視点について紹介する。
都市移動データを従来のビデオデータとして単純化するのではなく、複雑な時系列と見なす。
論文 参考訳(メタデータ) (2023-12-04T07:39:05Z) - Model-Based Reinforcement Learning with Isolated Imaginations [61.67183143982074]
モデルに基づく強化学習手法であるIso-Dream++を提案する。
我々は、切り離された潜在的想像力に基づいて政策最適化を行う。
これにより、野生の混合力学源を孤立させることで、長い水平振動子制御タスクの恩恵を受けることができる。
論文 参考訳(メタデータ) (2023-03-27T02:55:56Z) - Graph Attention Multi-Agent Fleet Autonomy for Advanced Air Mobility [7.533471021886634]
本研究では,航空車両群を協調させるために,部分的に観測可能な高度空力ゲームの概念を導入する。
本稿では,新しいグラフアテンションデコーダ(HetGAT Enc-Dec)ネットワークニューラルベースポリシーを提案する。
学習方針は,様々な艦隊構成,需要パターン,観測トポロジに一般化されていることを示す。
論文 参考訳(メタデータ) (2023-02-14T20:48:00Z) - Towards More Efficient Shared Autonomous Mobility: A Learning-Based
Fleet Repositioning Approach [0.0]
本稿では,SAMSフリートをマルコフ決定プロセスとして定式化し,ISR(Integrated System-Adnt Repositioning)と呼ばれる強化学習型再配置(RLR)アプローチを提案する。
ISRは、需要予測を明示せずに、需要パターンの進化に対応することを学び、最適化に基づく乗客と車両の割り当てに協力する。
その結果, RLR アプローチは JO アプローチと比較して, 乗客待ち時間を大幅に削減し, 50% 以上を達成できた。
論文 参考訳(メタデータ) (2022-10-16T23:30:46Z) - Learning energy-efficient driving behaviors by imitating experts [75.12960180185105]
本稿では,コミュニケーション・センシングにおける制御戦略と現実的限界のギャップを埋める上で,模倣学習が果たす役割について考察する。
擬似学習は、車両の5%に採用されれば、局地的な観測のみを用いて、交通条件の異なるネットワークのエネルギー効率を15%向上させる政策を導出できることを示す。
論文 参考訳(メタデータ) (2022-06-28T17:08:31Z) - Event-Aware Multimodal Mobility Nowcasting [11.540605108140538]
イベント認識型時間ネットワークEAST-Netは、ソーシャルデータセットの多種多様な実世界のデータセットで評価される。
その結果、最先端のベースラインと比較して、我々のアプローチの優位性を検証した。
論文 参考訳(メタデータ) (2021-12-14T12:35:20Z) - Value Function is All You Need: A Unified Learning Framework for Ride
Hailing Platforms [57.21078336887961]
DiDi、Uber、Lyftなどの大型配車プラットフォームは、都市内の数万台の車両を1日中数百万の乗車要求に接続している。
両課題に対処するための統合価値に基づく動的学習フレームワーク(V1D3)を提案する。
論文 参考訳(メタデータ) (2021-05-18T19:22:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。