論文の概要: Using Reinforcement Learning for the Three-Dimensional Loading Capacitated Vehicle Routing Problem
- arxiv url: http://arxiv.org/abs/2307.12136v2
- Date: Tue, 11 Jun 2024 09:57:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-13 01:18:21.078765
- Title: Using Reinforcement Learning for the Three-Dimensional Loading Capacitated Vehicle Routing Problem
- Title(参考訳): 三次元載荷キャパシタ付き車両ルーティング問題に対する強化学習の利用
- Authors: Stefan Schoepf, Stephen Mak, Julian Senoner, Liming Xu, Netland Torbjörn, Alexandra Brintrup,
- Abstract要約: 効率を上げるためのソリューションとして、協調車両ルーティングが提案されている。
現在の運用研究手法は、問題の大きさを増大させる非線形スケーリングに悩まされている。
約線形時間で3次元負荷容量化車両ルーティング問題を解くための強化学習モデルを開発した。
- 参考スコア(独自算出の注目度): 40.50169360761464
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Heavy goods vehicles are vital backbones of the supply chain delivery system but also contribute significantly to carbon emissions with only 60% loading efficiency in the United Kingdom. Collaborative vehicle routing has been proposed as a solution to increase efficiency, but challenges remain to make this a possibility. One key challenge is the efficient computation of viable solutions for co-loading and routing. Current operations research methods suffer from non-linear scaling with increasing problem size and are therefore bound to limited geographic areas to compute results in time for day-to-day operations. This only allows for local optima in routing and leaves global optimisation potential untouched. We develop a reinforcement learning model to solve the three-dimensional loading capacitated vehicle routing problem in approximately linear time. While this problem has been studied extensively in operations research, no publications on solving it with reinforcement learning exist. We demonstrate the favourable scaling of our reinforcement learning model and benchmark our routing performance against state-of-the-art methods. The model performs within an average gap of 3.83% to 8.10% compared to established methods. Our model not only represents a promising first step towards large-scale logistics optimisation with reinforcement learning but also lays the foundation for this research stream. GitHub: https://github.com/if-loops/3L-CVRP
- Abstract(参考訳): 重貨物車両はサプライチェーンの輸送システムにおいて重要なバックボーンであるが、英国における負荷効率は60%に過ぎず、二酸化炭素排出量に大きく貢献している。
効率を上げるためのソリューションとして、協調的な車両ルーティングが提案されているが、この可能性を秘めている。
重要な課題の1つは、コローディングとルーティングのための実行可能なソリューションの効率的な計算である。
現在の運用研究手法は,問題の大きさの増大に伴う非線形スケーリングに悩まされており,地理的に限られた領域に縛られ,日々の運用に要する時間に計算結果が計算される。
これはルーティングにおける局所的な最適化のみを可能にし、グローバルな最適化の可能性は未対応のままである。
約線形時間で3次元負荷容量化車両ルーティング問題を解くための強化学習モデルを開発した。
この問題は、運用研究において広く研究されているが、強化学習による問題解決に関する出版物は存在しない。
我々は、強化学習モデルの好適なスケーリングを実証し、最先端の手法に対してルーティング性能をベンチマークする。
このモデルは、確立された方法と比較して平均ギャップ3.83%から8.10%の範囲で実行される。
我々のモデルは、強化学習による大規模ロジスティクス最適化に向けた有望な第一歩であるだけでなく、この研究の流れの基盤でもある。
GitHub:https://github.com/if-loops/3L-CVRP
関連論文リスト
- Reinforcement Learning for Solving Stochastic Vehicle Routing Problem [0.09831489366502298]
本研究では、車両ルーティング問題(SVRP)解決における強化学習(RL)と機械学習(ML)技術の利用のギャップを解消する。
本稿では,SVRPのキーソースを包括的に扱う新しいエンドツーエンドフレームワークを提案する。
提案モデルでは,広く採用されている最先端のメユーリスティックよりも優れた性能を示し,旅行コストの3.43%削減を実現している。
論文 参考訳(メタデータ) (2023-11-13T19:46:22Z) - Fair collaborative vehicle routing: A deep multi-agent reinforcement
learning approach [49.00137468773683]
協力的な車両ルーティングは、キャリアがそれぞれの輸送要求を共有し、互いに代表して輸送要求を実行することで協力するときに発生する。
従来のゲーム理論解の概念は、特性関数がエージェントの数とともに指数関数的にスケールするので、計算に費用がかかる。
我々は,この問題を,深層マルチエージェント強化学習を用いて解決した連立交渉ゲームとしてモデル化することを提案する。
論文 参考訳(メタデータ) (2023-10-26T15:42:29Z) - Towards Omni-generalizable Neural Methods for Vehicle Routing Problems [14.210085924625705]
本稿では,VRPにおけるサイズと分布の両面での一般化を考慮した,挑戦的かつ現実的な設定について検討する。
提案するメタラーニングフレームワークは,推論中に新しいタスクに迅速に適応する能力を持つモデルを効果的に学習することを可能にする。
論文 参考訳(メタデータ) (2023-05-31T06:14:34Z) - Learning to Optimize Permutation Flow Shop Scheduling via Graph-based
Imitation Learning [70.65666982566655]
置換フローショップスケジューリング(PFSS)は製造業で広く使われている。
我々は,より安定かつ正確に収束を加速する専門家主導の模倣学習を通じてモデルを訓練することを提案する。
我々のモデルのネットワークパラメータはわずか37%に減少し、エキスパートソリューションに対する我々のモデルの解のギャップは平均6.8%から1.3%に減少する。
論文 参考訳(メタデータ) (2022-10-31T09:46:26Z) - DL-DRL: A double-level deep reinforcement learning approach for
large-scale task scheduling of multi-UAV [65.07776277630228]
分割・征服フレームワーク(DCF)に基づく二重レベル深層強化学習(DL-DRL)手法を提案する。
特に,上層部DRLモデルにおけるエンコーダ・デコーダ構成ポリシネットワークを設計し,タスクを異なるUAVに割り当てる。
また、低レベルDRLモデルにおける別の注意に基づくポリシーネットワークを利用して、各UAVの経路を構築し、実行されたタスク数を最大化する。
論文 参考訳(メタデータ) (2022-08-04T04:35:53Z) - Learning Vehicle Routing Problems using Policy Optimisation [4.093722933440819]
最先端のアプローチは強化学習を使ってポリシーを学習し、学習ポリシーは擬似解法として機能する。
これらのアプローチは、あるケースでは優れた性能を示しているが、ルーティング問題に典型的な大きな検索空間を考えると、ポリシーの貧弱さに早すぎる可能性がある。
より多くのポリシーを提供することで探索を支援するエントロピー正規化強化学習(ERRL)を提案する。
論文 参考訳(メタデータ) (2020-12-24T14:18:56Z) - A Three-Stage Algorithm for the Large Scale Dynamic Vehicle Routing
Problem with an Industry 4.0 Approach [3.6317403990273402]
業界 4.0 はモビリティとリアルタイム統合に焦点を当てたコンセプトである。
本研究の目的は,大規模DVRP(LSDVRP)の解決である。
論文 参考訳(メタデータ) (2020-08-26T10:39:36Z) - 2nd Place Scheme on Action Recognition Track of ECCV 2020 VIPriors
Challenges: An Efficient Optical Flow Stream Guided Framework [57.847010327319964]
我々は、小さなデータセットでモデルをスクラッチからトレーニングできるデータ効率フレームワークを提案する。
具体的には、3D中心差分畳み込み演算を導入することで、新しいC3Dニューラルネットワークベースの2ストリームフレームワークを提案する。
提案手法は,大規模データセット上で事前学習したモデルがなくても,有望な結果が得られることを実証した。
論文 参考訳(メタデータ) (2020-08-10T09:50:28Z) - Batch-Augmented Multi-Agent Reinforcement Learning for Efficient Traffic
Signal Optimization [9.456254189014127]
提案手法は,現在使用されている固定時間信号機に比べて,待ち時間において交通渋滞を36%削減する。
提案手法は,現在使用されている固定時間信号計画と比較して,待ち時間において渋滞を36%低減することを示す。
論文 参考訳(メタデータ) (2020-05-19T17:53:05Z) - Data Freshness and Energy-Efficient UAV Navigation Optimization: A Deep
Reinforcement Learning Approach [88.45509934702913]
我々は、移動基地局(BS)が配備される複数の無人航空機(UAV)のナビゲーションポリシーを設計する。
我々は、地上BSにおけるデータの鮮度を確保するために、エネルギーや情報年齢(AoI)の制約などの異なる文脈情報を組み込んだ。
提案したトレーニングモデルを適用することで、UAV-BSに対する効果的なリアルタイム軌道ポリシーは、時間とともに観測可能なネットワーク状態をキャプチャする。
論文 参考訳(メタデータ) (2020-02-21T07:29:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。