論文の概要: Pro-Routing: Proactive Routing of Autonomous Multi-Capacity Robots for Pickup-and-Delivery Tasks
- arxiv url: http://arxiv.org/abs/2503.24325v1
- Date: Mon, 31 Mar 2025 17:14:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-01 14:33:20.896262
- Title: Pro-Routing: Proactive Routing of Autonomous Multi-Capacity Robots for Pickup-and-Delivery Tasks
- Title(参考訳): Pro-Routing:ピックアップ・アンド・デリバリタスクのための自律型多機能ロボットの能動的ルーティング
- Authors: Daniel Garces, Stephanie Gil,
- Abstract要約: 本稿では,リアルタイムな要求に適応するプロアクティブなロールアウトベースのルーティングフレームワークを提案する。
我々は,艦隊規模のアルゴリズムを提案することにより,提案手法の信頼性保証を導出する。
私たちのフレームワークは,十分に大きな艦隊サイズを使用すると,安定性を維持します。
- 参考スコア(独自算出の注目度): 9.445880844584027
- License:
- Abstract: We consider a multi-robot setting, where we have a fleet of multi-capacity autonomous robots that must service spatially distributed pickup-and-delivery requests with fixed maximum wait times. Requests can be either scheduled ahead of time or they can enter the system in real-time. In this setting, stability for a routing policy is defined as the cost of the policy being uniformly bounded over time. Most previous work either solve the problem offline to theoretically maintain stability or they consider dynamically arriving requests at the expense of the theoretical guarantees on stability. In this paper, we aim to bridge this gap by proposing a novel proactive rollout-based routing framework that adapts to real-time demand while still provably maintaining the stability of the learned routing policy. We derive provable stability guarantees for our method by proposing a fleet sizing algorithm that obtains a sufficiently large fleet that ensures stability by construction. To validate our theoretical results, we consider a case study on real ride requests for Harvard's evening Van System. We also evaluate the performance of our framework using the currently deployed smaller fleet size. In this smaller setup, we compare against the currently deployed routing algorithm, greedy heuristics, and Monte-Carlo-Tree-Search-based algorithms. Our empirical results show that our framework maintains stability when we use the sufficiently large fleet size found in our theoretical results. For the smaller currently deployed fleet size, our method services 6% more requests than the closest baseline while reducing median passenger wait times by 33%.
- Abstract(参考訳): 我々は、空間的に分散したピックアップ・アンド・デリバリ要求を一定時間待ち時間で処理しなくてはならないマルチキャパシティ・自律ロボット群を多数備えたマルチロボット・セッティングについて検討する。
リクエストは事前にスケジュールするか、あるいはリアルタイムでシステムに入ることができる。
この設定では、ルーティングポリシーの安定性は、ポリシーのコストが時間とともに均一に拘束されるものとして定義される。
従来の作業の多くは、安定性を理論的に維持するためにオフラインで解決するか、あるいは安定性に関する理論的保証を犠牲にして動的に到着する要求を検討するかのいずれかである。
本稿では,このギャップを埋めるために,学習されたルーティングポリシーの安定性を確実に維持しつつ,リアルタイムの需要に適応する,プロアクティブなロールアウトベースのルーティングフレームワークを提案する。
提案手法は,建設時の安定性を確保するのに十分な大きさの艦隊を確保できる,艦隊規模のアルゴリズムを提案することによって,提案手法の信頼性を保証するものである。
理論的結果を検証するため、ハーバード大学の夕方のバンシステムにおける実際の乗車要求に関するケーススタディを考察する。
また、現在デプロイされているより小型のフリートサイズを使用して、フレームワークのパフォーマンスを評価します。
この小さな設定では、現在デプロイされているルーティングアルゴリズム、欲求的ヒューリスティックス、モンテカルロ-Tree-Searchベースのアルゴリズムと比較する。
実験結果から,我々のフレームワークは,理論的な結果に見出される十分な大きさの艦隊を使用する場合に,安定性を維持していることが示された。
現在展開されている小規模の車両では、我々の手法は最も近いベースラインよりも6%多くのリクエストを処理し、中央値の乗客待ち時間を33%削減しています。
関連論文リスト
- Approximate Multiagent Reinforcement Learning for On-Demand Urban Mobility Problem on a Large Map (extended version) [8.537183852577686]
大規模都市環境における自律型マルチエージェントタクシー経路問題について検討する。
最近の理論では、安定なベースポリシーを持つロールアウトアルゴリズムは、ほぼ最適に近い安定ポリシーを生成することが示されている。
本稿では,計算コストを削減できる近似マルチエージェントロールアウト方式の2相アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-11-02T18:33:32Z) - $\beta$-DARTS++: Bi-level Regularization for Proxy-robust Differentiable
Architecture Search [96.99525100285084]
DARTSに基づくNAS探索プロセス($beta$-DARTS)を正規化するための正規化手法であるBeta-Decayを提案する。
どのように動作するのか、なぜ動作するのかに関する詳細な理論的分析が提供される。
論文 参考訳(メタデータ) (2023-01-16T12:30:32Z) - Multiagent Reinforcement Learning for Autonomous Routing and Pickup
Problem with Adaptation to Variable Demand [1.8505047763172104]
都市の地図に現れる要求に対処する自律走行車両群に対して、ルーティング/ピックポリシーを生成するための学習枠組みを導出する。
当社は、車両間の協調を促す政策に焦点を合わせ、要求の待ち時間を短縮する。
本稿では、現在の需要が元の妥当性領域外にある場合に、トレーニング済みのオフライン近似を切り替えるメカニズムを提案する。
論文 参考訳(メタデータ) (2022-11-28T01:11:11Z) - Scheduling Servers with Stochastic Bilinear Rewards [7.519872646378837]
システム最適化問題は、マルチクラス、マルチサーバキューシステムスケジューリングで発生する。
本稿では,報酬の限界コストを付加した重み付き比例フェアアロケーション基準に基づくスケジューリングアルゴリズムを提案する。
我々のアルゴリズムは,時間的地平線に関して,サブ線形後悔とサブ線形平均保持コスト(および待ち時間境界)を考慮し,待ち行列システムの安定性を保証する。
論文 参考訳(メタデータ) (2021-12-13T00:37:20Z) - Estimating the Robustness of Public Transport Systems Using Machine
Learning [62.997667081978825]
公共交通機関の計画は、多くのステップを含む非常に複雑なプロセスである。
乗客の観点からの堅牢性の統合により、作業はさらに困難になる。
本稿では,機械学習の手法を用いたシナリオベースロバストネス近似の新しい手法を提案する。
論文 参考訳(メタデータ) (2021-06-10T05:52:56Z) - A Deep Value-network Based Approach for Multi-Driver Order Dispatching [55.36656442934531]
そこで本研究では,注文発送のための深層強化学習に基づくソリューションを提案する。
DiDiの配車プラットフォーム上で大規模なオンラインA/Bテストを実施している。
その結果,CVNetは近年提案されているディスパッチ手法よりも一貫して優れていた。
論文 参考訳(メタデータ) (2021-06-08T16:27:04Z) - Better than the Best: Gradient-based Improper Reinforcement Learning for
Network Scheduling [60.48359567964899]
パケット遅延を最小限に抑えるため,制約付き待ち行列ネットワークにおけるスケジューリングの問題を考える。
我々は、利用可能な原子ポリシーよりも優れたスケジューラを生成するポリシー勾配に基づく強化学習アルゴリズムを使用する。
論文 参考訳(メタデータ) (2021-05-01T10:18:34Z) - Real-world Ride-hailing Vehicle Repositioning using Deep Reinforcement
Learning [52.2663102239029]
アイドルヘイリングプラットフォーム上での現実世界の車両の深層強化学習と意思決定時間計画に基づく新しい実用的枠組みを提示する。
本手法は,重み付きバッチ学習アルゴリズムを用いて乗車時の状態値関数を学習する。
配車シミュレーション環境におけるベースラインでアルゴリズムをベンチマークし、収益効率の向上における優位性を実証します。
論文 参考訳(メタデータ) (2021-03-08T05:34:05Z) - Dynamic Resource Management for Providing QoS in Drone Delivery Systems [2.578242050187029]
ドローン配送システムの動的UAV割り当て問題について,QoS(Qasurable Quality of Service)保証の提供を目標として検討する。
我々は、UAVの再配置のための動的ポリシーを得るために、深層強化学習アプローチを採用する。
本稿では,Bernolli,Time-Varying Bernoulli,Markov-Modulated Bernoulliの3つの広範到着クラスを考慮し,提案アルゴリズムの性能を評価する。
論文 参考訳(メタデータ) (2021-03-06T03:11:07Z) - MUSBO: Model-based Uncertainty Regularized and Sample Efficient Batch
Optimization for Deployment Constrained Reinforcement Learning [108.79676336281211]
データ収集とオンライン学習のための新しいポリシーの継続的展開はコスト非効率か非現実的かのどちらかである。
モデルベース不確実性正規化とサンプル効率的なバッチ最適化という新しいアルゴリズム学習フレームワークを提案する。
本フレームワークは,各デプロイメントの新規で高品質なサンプルを発見し,効率的なデータ収集を実現する。
論文 参考訳(メタデータ) (2021-02-23T01:30:55Z) - Equilibrium Inverse Reinforcement Learning for Ride-hailing Vehicle
Network [1.599072005190786]
疎結合グラフにおける客車マッチングの問題を定式化する。
マルチエージェント環境における平衡ポリシを導出するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-13T03:18:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。