論文の概要: Dynamic Resource Management for Providing QoS in Drone Delivery Systems
- arxiv url: http://arxiv.org/abs/2103.04015v1
- Date: Sat, 6 Mar 2021 03:11:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-09 15:09:17.672148
- Title: Dynamic Resource Management for Providing QoS in Drone Delivery Systems
- Title(参考訳): ドローン配送システムにおけるQoS提供のための動的資源管理
- Authors: Behzad Khamidehi, Majid Raeis, Elvino S. Sousa
- Abstract要約: ドローン配送システムの動的UAV割り当て問題について,QoS(Qasurable Quality of Service)保証の提供を目標として検討する。
我々は、UAVの再配置のための動的ポリシーを得るために、深層強化学習アプローチを採用する。
本稿では,Bernolli,Time-Varying Bernoulli,Markov-Modulated Bernoulliの3つの広範到着クラスを考慮し,提案アルゴリズムの性能を評価する。
- 参考スコア(独自算出の注目度): 2.578242050187029
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Drones have been considered as an alternative means of package delivery to
reduce the delivery cost and time. Due to the battery limitations, the drones
are best suited for last-mile delivery, i.e., the delivery from the package
distribution centers (PDCs) to the customers. Since a typical delivery system
consists of multiple PDCs, each having random and time-varying demands, the
dynamic drone-to-PDC allocation would be of great importance in meeting the
demand in an efficient manner. In this paper, we study the dynamic UAV
assignment problem for a drone delivery system with the goal of providing
measurable Quality of Service (QoS) guarantees. We adopt a queueing theoretic
approach to model the customer-service nature of the problem. Furthermore, we
take a deep reinforcement learning approach to obtain a dynamic policy for the
re-allocation of the UAVs. This policy guarantees a probabilistic upper-bound
on the queue length of the packages waiting in each PDC, which is beneficial
from both the service provider's and the customers' viewpoints. We evaluate the
performance of our proposed algorithm by considering three broad arrival
classes, including Bernoulli, Time-Varying Bernoulli, and Markov-Modulated
Bernoulli arrivals. Our results show that the proposed method outperforms the
baselines, particularly in scenarios with Time-Varying and Markov-Modulated
Bernoulli arrivals, which are more representative of real-world demand
patterns. Moreover, our algorithm satisfies the QoS constraints in all the
studied scenarios while minimizing the average number of UAVs in use.
- Abstract(参考訳): ドローンは配送コストと時間を削減するための代替のパッケージ配送手段だと考えられてきた。
バッテリーの制限のため、ドローンは最終マイルの配送、すなわちパッケージ配布センター(PDC)から顧客への配送に最も適している。
典型的な配送システムは複数のPDCで構成されており、それぞれがランダムでタイムバリーな要求を持つため、ダイナミックなドローンからPDCへの割り当ては、効率的な方法で需要を満たす上で非常に重要です。
本稿では,QoS(Quality of Service)の保証を実現することを目的とした,ドローン配送システムにおける動的UAV割り当て問題について検討する。
私たちは、問題の顧客-サービスの性質をモデル化するキュー理論アプローチを採用しています。
さらに,UAVの再配置のための動的方針を得るために,深層強化学習アプローチを採用する。
このポリシーは、サービスプロバイダーと顧客の視点の両方から有益である各PDCで待っているパッケージのキュー長の確率的な上限を保証します。
本稿では,Bernolli,Time-Varying Bernoulli,Markov-Modulated Bernoulliの3つの広範到着クラスを考慮し,提案アルゴリズムの性能を評価する。
提案手法は,特に実世界の需要パターンを表わすタイムバリアリングやマルコフ変調ベルヌーイ到着のシナリオにおいて,ベースラインよりも優れていることを示す。
さらに,本アルゴリズムは,使用中のUAVの平均数を最小化しながら,研究シナリオのすべてにおいてQoS制約を満たす。
関連論文リスト
- Dynamic Demand Management for Parcel Lockers [0.0]
本研究では,逐次決定分析と強化学習に根ざしたアルゴリズム手法を編成するソリューションフレームワークを開発する。
これらのテクニックを組み合わせるための革新的なアプローチは、この2つの意思決定タイプ間の強い相互関係に対処する上で有効です。
本手法は筋電図のベンチマークを13.7%上回り、業界に触発された政策を12.6%上回る結果となった。
論文 参考訳(メタデータ) (2024-09-08T11:38:48Z) - Testing Quantum and Simulated Annealers on the Drone Delivery Packing Problem [6.246837813122577]
ドローン配送パッキング問題(DDPP)は、人的介入を減らす必要性に加えて、配送プロセスの需要の増加に対応するロジスティクスの文脈で発生する。
本稿では,2次非制約二元最適化(QUBO)問題としてDDPPの2つの定式化を提案する。
我々は、この最適化問題に対する量子アニールの利点と限界を示す広範な実験を行う。
論文 参考訳(メタデータ) (2024-06-12T17:16:02Z) - Differentially Private Deep Q-Learning for Pattern Privacy Preservation
in MEC Offloading [76.0572817182483]
攻撃者は、エッジサーバ(ES)のキュー情報とユーザの使用パターンを推測するために、オフロードの決定を盗み取ることができる。
パターンプライバシ(PP)を維持しつつ,レイテンシ,ESのエネルギー消費,タスク削減率を両立させるオフロード戦略を提案する。
そこで我々はDP-DQOアルゴリズムを開発し,PP問題にノイズを注入することでこの問題に対処する。
論文 参考訳(メタデータ) (2023-02-09T12:50:18Z) - Multiscale Adaptive Scheduling and Path-Planning for Power-Constrained
UAV-Relays via SMDPs [0.0]
回転翼UAVリレーの分散群集の編成について述べるとともに,地上基地局の網羅・サービス能力の向上について述べる。
我々のゴールは、Poisson到着時の地上ユーザーからの送信要求を処理するのに、平均的なサービス遅延を最小限にすることである。
我々のフレームワークは、平均的なサービスレイテンシとUAVあたりの電力消費に優れたパフォーマンスを提供する。
論文 参考訳(メタデータ) (2022-09-16T00:21:58Z) - Dealing with Sparse Rewards in Continuous Control Robotics via
Heavy-Tailed Policies [64.2210390071609]
本稿では,連続制御問題におけるスパース報酬の課題に対処するため,HT-PSG(Heavy-Tailed Policy Gradient)アルゴリズムを提案する。
高平均累積報酬の観点から,全タスクに一貫したパフォーマンス向上を示す。
論文 参考訳(メタデータ) (2022-06-12T04:09:39Z) - Off-line approximate dynamic programming for the vehicle routing problem
with stochastic customers and demands via decentralized decision-making [0.0]
本稿では,顧客の位置と需要が不確実な車両経路問題(VRP)の変種について検討する。
目的は、車両の容量と時間制限を満たしながら、提供された要求を最大化することである。
本稿では,Replay MemoryやDouble Q Networkといった最先端のアクセラレーション技術を用いたQラーニングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-09-21T14:28:09Z) - A Deep Reinforcement Learning Approach for Constrained Online Logistics
Route Assignment [4.367543599338385]
物流業界にとって、各出荷区画に適切な物流ルートを割り当てる方法が不可欠である。
このオンライン経路割り当て問題は、制約付きオンライン意思決定問題とみなすことができる。
我々はPPO-RAと呼ばれるモデルフリーDRLアプローチを開発し、経路割当(RA)の課題に対処する専用の技術を用いてPPO(Pximal Policy Optimization)を改善した。
論文 参考訳(メタデータ) (2021-09-08T07:27:39Z) - Efficient UAV Trajectory-Planning using Economic Reinforcement Learning [65.91405908268662]
UAV間でタスクを分散するための経済取引に触発された新しい強化学習アルゴリズムであるREPlannerを紹介します。
エージェントが協力し、リソースを競うことができるマルチエージェント経済ゲームとして、パス計画問題を策定します。
UAV協力によるタスク分布の計算を行うため、Swarmサイズの変化に対して非常に耐性が高い。
論文 参考訳(メタデータ) (2021-03-03T20:54:19Z) - Modular Deep Reinforcement Learning for Continuous Motion Planning with
Temporal Logic [59.94347858883343]
本稿では,マルコフ決定過程(MDP)をモデルとした自律動的システムの運動計画について検討する。
LDGBA と MDP の間に組込み製品 MDP (EP-MDP) を設計することである。
モデルフリー強化学習(RL)のためのLDGBAベースの報酬形成と割引スキームは、EP-MDP状態にのみ依存する。
論文 参考訳(メタデータ) (2021-02-24T01:11:25Z) - MUSBO: Model-based Uncertainty Regularized and Sample Efficient Batch
Optimization for Deployment Constrained Reinforcement Learning [108.79676336281211]
データ収集とオンライン学習のための新しいポリシーの継続的展開はコスト非効率か非現実的かのどちらかである。
モデルベース不確実性正規化とサンプル効率的なバッチ最適化という新しいアルゴリズム学習フレームワークを提案する。
本フレームワークは,各デプロイメントの新規で高品質なサンプルを発見し,効率的なデータ収集を実現する。
論文 参考訳(メタデータ) (2021-02-23T01:30:55Z) - Dynamic Bicycle Dispatching of Dockless Public Bicycle-sharing Systems
using Multi-objective Reinforcement Learning [79.61517670541863]
ドッキングレスPBS(DL-PBS)に欠かせない動的自転車レンタル需要に基づく効率的な自転車配車ソリューションを実現するためのAIの活用
DL-PBSに最適な自転車ディスパッチソリューションを提供するために、マルチオブジェクト強化学習(MORL-BD)に基づく動的自転車ディスパッチアルゴリズムを提案します。
論文 参考訳(メタデータ) (2021-01-19T03:09:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。