論文の概要: Surge Routing: Event-informed Multiagent Reinforcement Learning for
Autonomous Rideshare
- arxiv url: http://arxiv.org/abs/2307.02637v2
- Date: Wed, 24 Jan 2024 16:36:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-25 17:41:19.395413
- Title: Surge Routing: Event-informed Multiagent Reinforcement Learning for
Autonomous Rideshare
- Title(参考訳): Surge Routing: 自律ライダーのためのイベントインフォームドマルチエージェント強化学習
- Authors: Daniel Garces and Stephanie Gil
- Abstract要約: 本稿では,インターネットからのイベントデータを活用して需要急増を予測し,協調的なルーティングポリシを生成する,自律型タクシー群のための学習フレームワークを提案する。
i) イベント記述とレビューの形式でテキストイベント情報を使用してストリート交差点上でのイベント駆動型需要急増を予測する需要予測フレームワーク,(ii) 需要予測を活用してワンエージェント・アット・ア・タイム・ロールアウトを使用するスケーラブルなマルチエージェント強化学習フレームワークの2つを組み合わせてこれを実現している。
- 参考スコア(独自算出の注目度): 11.159056906971983
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large events such as conferences, concerts and sports games, often cause
surges in demand for ride services that are not captured in average demand
patterns, posing unique challenges for routing algorithms. We propose a
learning framework for an autonomous fleet of taxis that leverages event data
from the internet to predict demand surges and generate cooperative routing
policies. We achieve this through a combination of two major components: (i) a
demand prediction framework that uses textual event information in the form of
events' descriptions and reviews to predict event-driven demand surges over
street intersections, and (ii) a scalable multiagent reinforcement learning
framework that leverages demand predictions and uses one-agent-at-a-time
rollout combined with limited sampling certainty equivalence to learn
intersection-level routing policies. For our experimental results we consider
real NYC ride share data for the year 2022 and information for more than 2000
events across 300 unique venues in Manhattan. We test our approach with a fleet
of 100 taxis on a map with 2235 street intersections. Our experimental results
demonstrate that our method learns routing policies that reduce wait time
overhead per serviced request by 25% to 75%, while picking up 1% to 4% more
requests than other model-based RL frameworks and classical methods in
operations research.
- Abstract(参考訳): カンファレンス、コンサート、スポーツゲームのような大規模なイベントは、平均的な需要パターンで捉えられていない乗車サービスの需要が急増し、ルーティングアルゴリズムに固有の課題を生じさせる。
本稿では,インターネットからのイベントデータを活用して需要急増を予測し,協調的なルーティングポリシを生成する自律型タクシーの学習フレームワークを提案する。
これを2つの主要なコンポーネントの組み合わせで達成します。
(i)道路交差点におけるイベント駆動需要の急増を予測するために、イベントの記述やレビューの形でテキストによるイベント情報を利用する需要予測フレームワーク
(ii)需要予測を活用したスケーラブルなマルチエージェント強化学習フレームワークで、ワンエージェント・アット・ア・タイムロールアウトと限られたサンプリング確実性等価性を組み合わせて、交差点レベルのルーティングポリシを学習する。
実験結果として、2022年のニューヨーク市の実際のライドシェアデータと、マンハッタンの300のユニークな会場で2000以上のイベントに関する情報について検討した。
2235の交差点を持つ地図上の100台のタクシーで我々のアプローチをテストする。
実験の結果,提案手法は,サービス要求毎の待ち時間オーバーヘッドを25%から75%削減するルーティングポリシーを学習し,他のモデルベースRLフレームワークやオペレーション研究における古典的手法よりも1%から4%多く要求を収集した。
関連論文リスト
- Bench2Drive: Towards Multi-Ability Benchmarking of Closed-Loop End-To-End Autonomous Driving [59.705635382104454]
本稿では,E2E-ADシステムのマルチ能力をクローズドループで評価するための最初のベンチマークであるBench2Driveを紹介する。
我々は最先端のE2E-ADモデルを実装し、Bench2Driveで評価し、現状と今後の方向性について洞察を提供する。
論文 参考訳(メタデータ) (2024-06-06T09:12:30Z) - Deep reinforcement learning for the dynamic vehicle dispatching problem:
An event-based approach [0.0]
この問題を半マルコフ決定プロセスとしてモデル化することで、時間を連続的に扱うことができます。
イベントベースのアプローチは決定空間の複雑さを大幅に減らし、離散時間モデルの他の制限を克服する、と我々は主張する。
その結果、我々の政策は平均待ち時間、キャンセル率、サービス全体の時間に優れており、他のテスト済みのポリシーと比較して最大50%の削減が期待できることがわかった。
論文 参考訳(メタデータ) (2023-07-13T16:29:25Z) - DeepAccident: A Motion and Accident Prediction Benchmark for V2X
Autonomous Driving [76.29141888408265]
本研究では,現実の運転において頻繁に発生する多様な事故シナリオを含む大規模データセットを提案する。
提案したDeepAccidentデータセットには57Kの注釈付きフレームと285Kの注釈付きサンプルが含まれており、これは大規模なnuScenesデータセットの約7倍である。
論文 参考訳(メタデータ) (2023-04-03T17:37:00Z) - Multiagent Reinforcement Learning for Autonomous Routing and Pickup
Problem with Adaptation to Variable Demand [1.8505047763172104]
都市の地図に現れる要求に対処する自律走行車両群に対して、ルーティング/ピックポリシーを生成するための学習枠組みを導出する。
当社は、車両間の協調を促す政策に焦点を合わせ、要求の待ち時間を短縮する。
本稿では、現在の需要が元の妥当性領域外にある場合に、トレーニング済みのオフライン近似を切り替えるメカニズムを提案する。
論文 参考訳(メタデータ) (2022-11-28T01:11:11Z) - Value Function is All You Need: A Unified Learning Framework for Ride
Hailing Platforms [57.21078336887961]
DiDi、Uber、Lyftなどの大型配車プラットフォームは、都市内の数万台の車両を1日中数百万の乗車要求に接続している。
両課題に対処するための統合価値に基づく動的学習フレームワーク(V1D3)を提案する。
論文 参考訳(メタデータ) (2021-05-18T19:22:24Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Equilibrium Inverse Reinforcement Learning for Ride-hailing Vehicle
Network [1.599072005190786]
疎結合グラフにおける客車マッチングの問題を定式化する。
マルチエージェント環境における平衡ポリシを導出するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-13T03:18:44Z) - Joint predictions of multi-modal ride-hailing demands: a deep multi-task
multigraph learning-based approach [64.18639899347822]
本稿では、複数のマルチグラフ畳み込み(MGC)ネットワークを組み合わせて、異なるサービスモードの要求を予測する深層マルチタスクマルチグラフ学習手法を提案する。
提案手法は,様々な配車モードの予測精度において,ベンチマークアルゴリズムよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-11T07:10:50Z) - A Distributed Model-Free Ride-Sharing Approach for Joint Matching,
Pricing, and Dispatching using Deep Reinforcement Learning [32.0512015286512]
我々は、動的で需要に敏感で、価格に基づく車両通行者マッチングとルート計画フレームワークを提案する。
我々の枠組みはニューヨーク市税のデータセットを用いて検証されている。
実験の結果,実時間および大規模設定におけるアプローチの有効性が示された。
論文 参考訳(メタデータ) (2020-10-05T03:13:47Z) - Balancing Taxi Distribution in A City-Scale Dynamic Ridesharing Service:
A Hybrid Solution Based on Demand Learning [0.0]
本研究では,動的なライドシェアリングサービスにおいて,都市間のタクシー配電のバランスをとる上での課題について検討する。
本稿では,Correlated Pooling が関連ライダーの要求を収集し,Adjacency Ride-Matching が要求学習に基づくタクシーをライダーに割り当て,Greedy Idle Movement が現在利用者が必要な地域への配車なしでタクシーを誘導することを目的としたハイブリッドソリューションを提案する。
論文 参考訳(メタデータ) (2020-07-27T07:08:02Z) - SMART: Simultaneous Multi-Agent Recurrent Trajectory Prediction [72.37440317774556]
本稿では,将来の軌道予測における2つの重要な課題に対処する手法を提案する。
エージェントの数に関係なく、トレーニングデータと予測と一定時間の推測の両方において、マルチモーダリティ。
論文 参考訳(メタデータ) (2020-07-26T08:17:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。