論文の概要: Towards More Efficient Shared Autonomous Mobility: A Learning-Based
Fleet Repositioning Approach
- arxiv url: http://arxiv.org/abs/2210.08659v3
- Date: Thu, 8 Feb 2024 17:19:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-09 19:58:24.576156
- Title: Towards More Efficient Shared Autonomous Mobility: A Learning-Based
Fleet Repositioning Approach
- Title(参考訳): より効率的な共有自律移動を目指して--学習に基づくフリート再構成アプローチ
- Authors: Monika Filipovska, Michael Hyland, Haimanti Bala
- Abstract要約: 本稿では,SAMSフリートをマルコフ決定プロセスとして定式化し,ISR(Integrated System-Adnt Repositioning)と呼ばれる強化学習型再配置(RLR)アプローチを提案する。
ISRは、需要予測を明示せずに、需要パターンの進化に対応することを学び、最適化に基づく乗客と車両の割り当てに協力する。
その結果, RLR アプローチは JO アプローチと比較して, 乗客待ち時間を大幅に削減し, 50% 以上を達成できた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Shared-use autonomous mobility services (SAMS) present new opportunities for
improving accessible and demand-responsive mobility. A fundamental challenge
that SAMS face is appropriate positioning of idle fleet vehicles to meet future
demand - a problem that strongly impacts service quality and efficiency. This
paper formulates SAMS fleet repositioning as a Markov Decision Process and
presents a reinforcement learning-based repositioning (RLR) approach called
integrated system-agent repositioning (ISR). The ISR learns a scalable fleet
repositioning strategy in an integrated manner: learning to respond to evolving
demand patterns without explicit demand forecasting and to cooperate with
optimization-based passenger-to-vehicle assignment. Numerical experiments are
conducted using New York City taxi data and an agent-based simulation tool. The
ISR is compared to an alternative RLR approach named externally guided
repositioning (EGR) and a benchmark joint optimization (JO) for
passenger-to-vehicle assignment and repositioning. The results demonstrate the
RLR approaches' substantial reductions in passenger wait times, over 50%,
relative to the JO approach. The ISR's ability to bypass demand forecasting is
also demonstrated as it maintains comparable performance to EGR in terms of
average metrics. The results also demonstrate the model's transferability to
evolving conditions, including unseen demand patterns, extended operational
periods, and changes in the assignment strategy.
- Abstract(参考訳): 共有利用自律移動サービス(SAMS)は、アクセシビリティと需要レスモビリティを改善する新たな機会を提供する。
SAMSが直面する根本的な課題は、将来の需要を満たすためにアイドル車の適切な位置決めである。
本稿では,SAMS艦隊再配置をマルコフ決定過程として定式化し,統合システムエージェント再配置(ISR)と呼ばれる強化学習ベース再配置(RLR)アプローチを提案する。
ISRは、需要予測を明示せずに、需要パターンの進化に対応することを学習し、最適化に基づく乗務員配置に協力する、スケーラブルな艦隊配置戦略を統合的に学習する。
ニューヨーク市のタクシーデータとエージェントベースシミュレーションツールを用いて数値実験を行った。
ISRは、外部誘導再配置(EGR)と呼ばれる代替RLRアプローチと、乗用車間配置と再配置のためのベンチマーク共同最適化(JO)と比較される。
その結果, RLR アプローチは JO アプローチと比較して, 乗客待ち時間を大幅に削減し, 50% 以上を達成できた。
ISRの需要予測を回避できる能力は、平均的な指標でEGRに匹敵するパフォーマンスを維持するためにも証明されている。
また, 需要パターンの未確認, 運用期間の延長, 割り当て戦略の変更など, モデルが進化する条件に移行可能であることを示す。
関連論文リスト
- MetaTrading: An Immersion-Aware Model Trading Framework for Vehicular Metaverse Services [94.61039892220037]
本稿では,車載メタバースにおける拡張現実(AR)サービスの学習モデルを支援するために,メタバースユーザ(MU)にインセンティブを与える新しい没入型モデルトレーディングフレームワークを提案する。
動的ネットワーク条件とプライバシの懸念を考慮して、マルチエージェントマルコフ決定プロセスとしてMSPの報酬決定を定式化する。
実験により,提案フレームワークは,実AR関連車両データセット上でのARサービスにおいて,オブジェクト検出と分類のための高価値モデルを効果的に提供できることが示されている。
論文 参考訳(メタデータ) (2024-10-25T16:20:46Z) - Physics Enhanced Residual Policy Learning (PERPL) for safety cruising in mixed traffic platooning under actuator and communication delay [8.172286651098027]
線形制御モデルは、その単純さ、使いやすさ、安定性解析のサポートにより、車両制御に広範囲に応用されている。
一方、強化学習(RL)モデルは適応性を提供するが、解釈可能性や一般化能力の欠如に悩まされる。
本稿では,物理インフォームドポリシによって強化されたRL制御系の開発を目標とする。
論文 参考訳(メタデータ) (2024-09-23T23:02:34Z) - A methodological framework for Resilience as a Service (RaaS) in multimodal urban transportation networks [0.0]
本研究は,サービス戦略としてのレジリエンスを通じて公共交通の混乱を管理することを目的としている。
効率よく資源を割り当て、オペレーターと乗客のコストを最小限に抑える最適化モデルを開発する。
提案手法はイル・ド・フランス、パリ、郊外のケーススタディに適用された。
論文 参考訳(メタデータ) (2024-08-30T12:22:34Z) - MetaFollower: Adaptable Personalized Autonomous Car Following [63.90050686330677]
適応型パーソナライズされた自動車追従フレームワークであるMetaFollowerを提案する。
まず,モデルに依存しないメタラーニング(MAML)を用いて,様々なCFイベントから共通運転知識を抽出する。
さらに、Long Short-Term Memory (LSTM) と Intelligent Driver Model (IDM) を組み合わせて、時間的不均一性を高い解釈性で反映する。
論文 参考訳(メタデータ) (2024-06-23T15:30:40Z) - i-Rebalance: Personalized Vehicle Repositioning for Supply Demand Balance [11.720716530010323]
深部強化学習(DRL)を用いた個別車両再配置手法i-Rebalanceを提案する。
i-Re Balanceは、99人のリアルドライバーを含む実地ユーザスタディを通じて、リポジションレコメンデーションを受け入れる際のドライバーの判断を推定する。
実世界の軌道データの評価では、i-リバランスはドライバーの受け入れ率を38.07%、ドライバーの総収入を9.97%改善している。
論文 参考訳(メタデータ) (2024-01-09T08:51:56Z) - Safe Model-Based Multi-Agent Mean-Field Reinforcement Learning [48.667697255912614]
平均場強化学習は、同一エージェントの無限集団と相互作用する代表エージェントのポリシーに対処する。
モデルベースの平均場強化学習アルゴリズムであるSafe-M$3$-UCRLを提案する。
本アルゴリズムは,低需要領域におけるサービスアクセシビリティを確保しつつ,重要な領域における需要を効果的に満たす。
論文 参考訳(メタデータ) (2023-06-29T15:57:07Z) - Efficient Model-based Multi-agent Reinforcement Learning via Optimistic
Equilibrium Computation [93.52573037053449]
H-MARL (Hallucinated Multi-Agent Reinforcement Learning) は,環境と数回交流した後の平衡政策を学習する。
自律運転シミュレーションベンチマークにおいて,本手法を実験的に実証した。
論文 参考訳(メタデータ) (2022-03-14T17:24:03Z) - A Modular and Transferable Reinforcement Learning Framework for the
Fleet Rebalancing Problem [2.299872239734834]
モデルフリー強化学習(RL)に基づく艦隊再バランスのためのモジュラーフレームワークを提案する。
動作領域のグリッド上の分布としてRL状態とアクション空間を定式化し,フレームワークをスケーラブルにする。
実世界の旅行データとネットワークデータを用いた数値実験は、このアプローチがベースライン法よりもいくつかの異なる利点があることを実証している。
論文 参考訳(メタデータ) (2021-05-27T16:32:28Z) - Model-based Multi-agent Policy Optimization with Adaptive Opponent-wise
Rollouts [52.844741540236285]
マルチエージェント強化学習(MARL)におけるモデルベース手法について検討する。
AORPO(Adaptive Opponent-wise Rollout Policy)と呼ばれる新しい分散型モデルベースのMARL法を提案する。
論文 参考訳(メタデータ) (2021-05-07T16:20:22Z) - Equilibrium Inverse Reinforcement Learning for Ride-hailing Vehicle
Network [1.599072005190786]
疎結合グラフにおける客車マッチングの問題を定式化する。
マルチエージェント環境における平衡ポリシを導出するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-13T03:18:44Z) - Vehicular Cooperative Perception Through Action Branching and Federated
Reinforcement Learning [101.64598586454571]
強化学習に基づく車両関連、リソースブロック(RB)割り当て、協調認識メッセージ(CPM)のコンテンツ選択を可能にする新しいフレームワークが提案されている。
車両全体のトレーニングプロセスをスピードアップするために、フェデレーションRLアプローチが導入されます。
その結果、フェデレーションRLはトレーニングプロセスを改善し、非フェデレーションアプローチと同じ時間内により良いポリシーを達成できることが示された。
論文 参考訳(メタデータ) (2020-12-07T02:09:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。