論文の概要: Location-Routing Planning for Last-Mile Deliveries Using Mobile Parcel
Lockers: A Hybrid Q-Learning Network Approach
- arxiv url: http://arxiv.org/abs/2209.04265v1
- Date: Fri, 9 Sep 2022 11:59:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-12 12:48:43.758761
- Title: Location-Routing Planning for Last-Mile Deliveries Using Mobile Parcel
Lockers: A Hybrid Q-Learning Network Approach
- Title(参考訳): モバイルパーセルロッカーを用いたラストミル配送の位置情報ルーティング計画:ハイブリッドQラーニングネットワークアプローチ
- Authors: Yubin Liu, Qiming Ye, Jose Escribano-Macias, Yuxiang Feng, Panagiotis
Angeloudis
- Abstract要約: 本研究はモバイルパーセルロッカー問題(MPLP)を定式化する。
MPLPは、一日を通してMPLの最適な停止場所を決定し、対応する配送ルートを計画する。
Q-Learning-Network-based Method (HQM) を開発した。
- 参考スコア(独自算出の注目度): 1.856181262236876
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Mobile parcel lockers (MPLs) have been recently proposed by logistics
operators as a technology that could help reduce traffic congestion and
operational costs in urban freight distribution. Given their ability to
relocate throughout their area of deployment, they hold the potential to
improve customer accessibility and convenience. In this study, we formulate the
Mobile Parcel Locker Problem (MPLP), a special case of the Location-Routing
Problem (LRP) which determines the optimal stopover location for MPLs
throughout the day and plans corresponding delivery routes. A Hybrid
Q-Learning-Network-based Method (HQM) is developed to resolve the computational
complexity of the resulting large problem instances while escaping local
optima. In addition, the HQM is integrated with global and local search
mechanisms to resolve the dilemma of exploration and exploitation faced by
classic reinforcement learning (RL) methods. We examine the performance of HQM
under different problem sizes (up to 200 nodes) and benchmarked it against the
Genetic Algorithm (GA). Our results indicate that the average reward obtained
by HQM is 1.96 times greater than GA, which demonstrates that HQM has a better
optimisation ability. Finally, we identify critical factors that contribute to
fleet size requirements, travel distances, and service delays. Our findings
outline that the efficiency of MPLs is mainly contingent on the length of time
windows and the deployment of MPL stopovers.
- Abstract(参考訳): 移動式パーセルロッカー (MPL) は近年, 都市貨物流通における交通渋滞の低減と運用コストの低減を支援する技術として, 物流事業者によって提案されている。
デプロイメントの領域全体を移動できる能力を考えると、顧客のアクセシビリティと利便性を向上させる可能性を秘めている。
本研究では,MPLP (Mobile Parcel Locker Problem) を定式化し,LRP (Location-Routing Problem) の特殊な事例として,MPL の終日停止位置を最適に決定し,それに対応する配送経路を計画する。
局所的オプティマを脱出しながら生じる大規模問題インスタンスの計算複雑性を解決するために,ハイブリッドq-learning-network-based method (hqm) を開発した。
さらに、HQMは、古典的な強化学習(RL)手法が直面する探索と搾取のジレンマを解決するために、グローバルおよびローカル検索機構と統合されている。
異なる問題サイズ(最大200ノード)でhqmの性能を調べ、遺伝的アルゴリズム(ga)に対してベンチマークを行った。
その結果,HQM の平均報酬は GA の 1.96 倍であり,HQM の最適化能力が向上していることが示された。
最後に,フリートサイズの要求,移動距離,サービス遅延に寄与する重要な要因を明らかにする。
以上の結果から,MPL の効率は,時間窓の長さや MPL の停止時間に大きく左右されることが明らかとなった。
関連論文リスト
- A Graph-based Adversarial Imitation Learning Framework for Reliable & Realtime Fleet Scheduling in Urban Air Mobility [5.19664437943693]
本稿では,艦隊スケジューリング問題の包括的最適化について述べる。
また、代替ソリューションのアプローチの必要性も認識している。
新しい模倣アプローチは、目に見えない最悪のシナリオにおいて、パフォーマンスと顕著な改善を実現する。
論文 参考訳(メタデータ) (2024-07-16T18:51:24Z) - Decentralized Online Learning in Task Assignment Games for Mobile
Crowdsensing [55.07662765269297]
モバイルクラウドセンシングプラットフォーム(MCSP)は、センサオファーをMCSPに送り返してタスクに参加する意思を示すための、利用可能なモバイルユニット(MU)に順次、センシングタスクを発行する。
安定したタスク割り当ては、MCSPとMUの相反する目標、およびMUの要求する努力と嗜好の不確実性という2つの課題に対処する必要がある。
これらの課題を克服するために,衝突回避型マルチアームバンディットと戦略的自由センシング(CA-MAB-SFS)という,マッチング理論とオンライン学習を組み合わせた新たな分散アプローチを提案する。
論文 参考訳(メタデータ) (2023-09-19T13:07:15Z) - Joint Service Caching, Communication and Computing Resource Allocation in Collaborative MEC Systems: A DRL-based Two-timescale Approach [15.16859210403316]
端末の厳格なQuality of Service(QoS)要件を満たすため、Multi Access Edge Computing(MEC)システムに課題が課されている。
エッジサーバ間のリソース共有を容易にする協調的なフレームワークを提案する。
提案アルゴリズムは,平均スイッチングおよびキャッシュコストにおいて,ベースラインアルゴリズムよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-07-19T00:27:49Z) - MARLIN: Soft Actor-Critic based Reinforcement Learning for Congestion
Control in Real Networks [63.24965775030673]
そこで本研究では,汎用的な渋滞制御(CC)アルゴリズムを設計するための新しい強化学習(RL)手法を提案する。
我々の解であるMARLINは、Soft Actor-Criticアルゴリズムを用いてエントロピーとリターンの両方を最大化する。
我々は,MARLINを実ネットワーク上で訓練し,実ミスマッチを克服した。
論文 参考訳(メタデータ) (2023-02-02T18:27:20Z) - Multi-Resource Allocation for On-Device Distributed Federated Learning
Systems [79.02994855744848]
本研究は,デバイス上の分散フェデレーション学習(FL)システムにおいて,レイテンシとエネルギー消費の重み付け和を最小化する分散マルチリソース割り当て方式を提案する。
システム内の各モバイルデバイスは、指定された領域内でモデルトレーニングプロセスを実行し、それぞれパラメータの導出とアップロードを行うための計算と通信資源を割り当てる。
論文 参考訳(メタデータ) (2022-11-01T14:16:05Z) - DC-MRTA: Decentralized Multi-Robot Task Allocation and Navigation in
Complex Environments [55.204450019073036]
本稿では,倉庫環境における移動ロボットのためのタスク割り当てと分散ナビゲーションアルゴリズムを提案する。
本稿では,共同分散タスク割り当てとナビゲーションの問題について考察し,それを解決するための2段階のアプローチを提案する。
ロボットの衝突のない軌道の計算では,タスク完了時間において最大14%の改善と最大40%の改善が観察される。
論文 参考訳(メタデータ) (2022-09-07T00:35:27Z) - Fast Continuous and Integer L-shaped Heuristics Through Supervised
Learning [4.521119623956821]
混合整数線形二段階プログラムの解を高速化する手法を提案する。
我々は,第2段階の要求の高い問題を解決することを目的としている。
私たちの中核となる考え方は、オンラインソリューションの時間を大幅に削減し、第一段階ソリューションの精度を小さくすることです。
論文 参考訳(メタデータ) (2022-05-02T13:15:32Z) - Collaborative Intelligent Reflecting Surface Networks with Multi-Agent
Reinforcement Learning [63.83425382922157]
インテリジェント・リフレクション・サーフェス(IRS)は将来の無線ネットワークに広く応用されることが想定されている。
本稿では,エネルギー収穫能力を備えた協調型IRSデバイスを用いたマルチユーザ通信システムについて検討する。
論文 参考訳(メタデータ) (2022-03-26T20:37:14Z) - Location-routing Optimisation for Urban Logistics Using Mobile Parcel
Locker Based on Hybrid Q-Learning Algorithm [0.0]
パーセルロッカー(MPL)は、交通渋滞と運用コストを低減する手段として、都市物流事業者によって導入されている。
本稿では,MPLのロケーションルーティング問題を解くための整数プログラミングモデルを提案する。
論文 参考訳(メタデータ) (2021-10-29T01:27:12Z) - Combining Propositional Logic Based Decision Diagrams with Decision
Making in Urban Systems [10.781866671930851]
我々は不確実性と部分的可観測性を考慮したマルチエージェントパスフィンディングの課題に取り組む。
我々は命題論理を用いて、RLの高速なシミュレーションを可能にするために、RLアルゴリズムとそれらを統合する。
論文 参考訳(メタデータ) (2020-11-09T13:13:54Z) - Reinforcement Learning Based Vehicle-cell Association Algorithm for
Highly Mobile Millimeter Wave Communication [53.47785498477648]
本稿では,ミリ波通信網における車とセルの関連性について検討する。
まず、ユーザ状態(VU)問題を離散的な非車両関連最適化問題として定式化する。
提案手法は,複数のベースライン設計と比較して,ユーザの複雑性とVUEの20%削減の合計で最大15%のゲインが得られる。
論文 参考訳(メタデータ) (2020-01-22T08:51:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。