論文の概要: Data-Driven Simulation of Ride-Hailing Services using Imitation and
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2104.02661v1
- Date: Tue, 6 Apr 2021 16:49:26 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-07 15:42:06.967438
- Title: Data-Driven Simulation of Ride-Hailing Services using Imitation and
Reinforcement Learning
- Title(参考訳): 模倣と強化学習を用いた配車サービスのデータ駆動シミュレーション
- Authors: Haritha Jayasinghe, Tarindu Jayatilaka, Ravin Gunawardena,
Uthayasanker Thayasivam
- Abstract要約: 本稿では,配車サービスにおけるユーザ,特にドライバの振る舞いを模倣し,予測する枠組みを提案する。
データ駆動型ハイブリッド強化学習と模倣学習アプローチを使っています。
私たちのフレームワークは、配車プラットフォームがプラットフォーム固有のパラメータを実験してドライバーの行動パターンを予測するための理想的な遊び場を提供します。
- 参考スコア(独自算出の注目度): 1.5293427903448025
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid growth of ride-hailing platforms has created a highly competitive
market where businesses struggle to make profits, demanding the need for better
operational strategies. However, real-world experiments are risky and expensive
for these platforms as they deal with millions of users daily. Thus, a need
arises for a simulated environment where they can predict users' reactions to
changes in the platform-specific parameters such as trip fares and incentives.
Building such a simulation is challenging, as these platforms exist within
dynamic environments where thousands of users regularly interact with one
another. This paper presents a framework to mimic and predict user,
specifically driver, behaviors in ride-hailing services. We use a data-driven
hybrid reinforcement learning and imitation learning approach for this. First,
the agent utilizes behavioral cloning to mimic driver behavior using a
real-world data set. Next, reinforcement learning is applied on top of the
pre-trained agents in a simulated environment, to allow them to adapt to
changes in the platform. Our framework provides an ideal playground for
ride-hailing platforms to experiment with platform-specific parameters to
predict drivers' behavioral patterns.
- Abstract(参考訳): 配車プラットフォームの急速な成長は、ビジネスが利益を得るのに苦しむ競争の激しい市場を生み出し、より良い運営戦略の必要性を要求している。
しかし、現実世界の実験は、毎日数百万のユーザーを扱うため、これらのプラットフォームにとって危険で費用がかかる。
これにより、旅行料金やインセンティブといったプラットフォーム固有のパラメータの変更に対するユーザの反応を予測できるシミュレーション環境の必要性が生まれます。
このようなシミュレーションの構築は、何千人ものユーザが定期的に対話する動的な環境に存在するため、難しい。
本稿では,配車サービスにおけるユーザ,特にドライバの振る舞いを模倣し,予測する枠組みを提案する。
データ駆動型ハイブリッド強化学習と模倣学習アプローチを使っています。
まず、エージェントは、実世界のデータセットを用いてドライバの動作を模倣するために行動クローニングを利用する。
次に、模擬環境における事前学習エージェントの上に強化学習を適用し、プラットフォームの変化に適応できるようにする。
当社のフレームワークは,ドライバの行動パターンを予測するために,プラットフォーム固有のパラメータを実験するための,配車プラットフォームのための理想的な遊び場を提供する。
関連論文リスト
- ReGentS: Real-World Safety-Critical Driving Scenario Generation Made Stable [88.08120417169971]
機械学習に基づく自律運転システムは、現実世界のデータでは稀な安全クリティカルなシナリオで課題に直面していることが多い。
この研究は、軌道最適化によって複雑な現実世界の通常のシナリオを変更することによって、安全クリティカルな運転シナリオを生成することを検討する。
提案手法は、頑健なプランナーの訓練には役に立たない非現実的な発散軌道と避けられない衝突シナリオに対処する。
論文 参考訳(メタデータ) (2024-09-12T08:26:33Z) - Waymax: An Accelerated, Data-Driven Simulator for Large-Scale Autonomous
Driving Research [76.93956925360638]
Waymaxは、マルチエージェントシーンにおける自動運転のための新しいデータ駆動シミュレータである。
TPU/GPUなどのハードウェアアクセラレータで完全に動作し、トレーニング用のグラフ内シミュレーションをサポートする。
我々は、一般的な模倣と強化学習アルゴリズムのスイートをベンチマークし、異なる設計決定に関するアブレーション研究を行った。
論文 参考訳(メタデータ) (2023-10-12T20:49:15Z) - A multi-functional simulation platform for on-demand ride service
operations [15.991607428235257]
配車システムのためのマルチファンクショナルでオープンソースなシミュレーションプラットフォームを提案する。
実際の輸送ネットワーク上で様々なエージェントの挙動と動きをシミュレートすることができる。
ユーザーが様々な最適化アルゴリズムを訓練し、テストするためのいくつかのアクセス可能なポータルを提供する。
論文 参考訳(メタデータ) (2023-03-22T06:25:19Z) - TrafficBots: Towards World Models for Autonomous Driving Simulation and
Motion Prediction [149.5716746789134]
我々は,データ駆動型交通シミュレーションを世界モデルとして定式化できることを示した。
動作予測とエンドツーエンドの運転に基づくマルチエージェントポリシーであるTrafficBotsを紹介する。
オープンモーションデータセットの実験は、TrafficBotsが現実的なマルチエージェント動作をシミュレートできることを示している。
論文 参考訳(メタデータ) (2023-03-07T18:28:41Z) - Learning Interactive Driving Policies via Data-driven Simulation [125.97811179463542]
データ駆動シミュレータは、ポリシー学習の駆動に高いデータ効率を約束する。
小さな基盤となるデータセットは、インタラクティブな運転を学ぶための興味深い、挑戦的なエッジケースを欠いていることが多い。
本研究では,ロバストな運転方針の学習に塗装されたアドカーを用いたシミュレーション手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T20:14:02Z) - Towards Optimal Strategies for Training Self-Driving Perception Models
in Simulation [98.51313127382937]
合成ドメインのみにおけるラベルの使用に焦点を当てる。
提案手法では,ニューラル不変表現の学習方法と,シミュレータからデータをサンプリングする方法に関する理論的にインスピレーションを得た視点を導入する。
マルチセンサーデータを用いた鳥眼視車両分割作業におけるアプローチについて紹介する。
論文 参考訳(メタデータ) (2021-11-15T18:37:43Z) - Building Safer Autonomous Agents by Leveraging Risky Driving Behavior
Knowledge [1.52292571922932]
本研究は,モデルフリーな学習エージェントを作成するために,重交通や予期せぬランダムな行動を伴うリスクやすいシナリオの作成に重点を置いている。
ハイウェイ-envシミュレーションパッケージに新しいカスタムマルコフ決定プロセス(MDP)環境イテレーションを作成することにより、複数の自動運転シナリオを生成します。
リスクの高い運転シナリオを補足したモデル自由学習エージェントを訓練し,その性能をベースラインエージェントと比較する。
論文 参考訳(メタデータ) (2021-03-16T23:39:33Z) - TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors [74.67698916175614]
リアル交通シミュレーションのためのマルチエージェント行動モデルであるTrafficSimを提案する。
特に、暗黙の潜在変数モデルを利用して、共同アクターポリシーをパラメータ化する。
TrafficSimは、多様なベースラインと比較して、より現実的で多様なトラフィックシナリオを生成します。
論文 参考訳(メタデータ) (2021-01-17T00:29:30Z) - A Customizable Dynamic Scenario Modeling and Data Generation Platform
for Autonomous Driving [13.183176525300563]
本稿では,動的かつインタラクティブなシナリオをモデル化し,ラベル付きセンサデータの異なるモードでシミュレーションのシナリオを生成し,この情報をデータ拡張のために収集するプラットフォームを提案する。
私たちの知る限り、これは自動運転ドメインに特化したこれらのタスクのための最初の統合プラットフォームです。
論文 参考訳(メタデータ) (2020-11-30T05:11:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。