論文の概要: Deep Reinforcement Learning for Solving the Fleet Size and Mix Vehicle Routing Problem
- arxiv url: http://arxiv.org/abs/2512.24251v1
- Date: Tue, 30 Dec 2025 14:26:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-01 23:27:28.398041
- Title: Deep Reinforcement Learning for Solving the Fleet Size and Mix Vehicle Routing Problem
- Title(参考訳): フリートサイズと混合車両経路問題の解法のための深部強化学習
- Authors: Pengfu Wan, Jiawei Chen, Gangyan Xu,
- Abstract要約: FSMVRP(Fleet Size and Mix Vehicle Routing Problem)は、VRP(Fleet Size and Mix Vehicle Routing Problem)の変種である。
本稿では,FSMVRPを解くための深層強化学習(DRL)に基づく手法を提案する。
本手法は,特に大規模かつ時間制約のあるシナリオにおいて,計算効率とスケーラビリティにおいて顕著な優位性を示す。
- 参考スコア(独自算出の注目度): 8.127336287332783
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Fleet Size and Mix Vehicle Routing Problem (FSMVRP) is a prominent variant of the Vehicle Routing Problem (VRP), extensively studied in operations research and computational science. FSMVRP requires simultaneous decisions on fleet composition and routing, making it highly applicable to real-world scenarios such as short-term vehicle rental and on-demand logistics. However, these requirements also increase the complexity of FSMVRP, posing significant challenges, particularly in large-scale and time-constrained environments. In this paper, we propose a deep reinforcement learning (DRL)-based approach for solving FSMVRP, capable of generating near-optimal solutions within a few seconds. Specifically, we formulate the problem as a Markov Decision Process (MDP) and develop a novel policy network, termed FRIPN, that seamlessly integrates fleet composition and routing decisions. Our method incorporates specialized input embeddings designed for distinctdecision objectives, including a remaining graph embedding to facilitate effective vehicle employment decisions. Comprehensive experiments are conducted on both randomly generated instances and benchmark datasets. The experimental results demonstrate that our method exhibits notable advantages in terms of computational efficiency and scalability, particularly in large-scale and time-constrained scenarios. These strengths highlight the potential of our approach for practical applications and provide valuable inspiration for extending DRL-based techniques to other variants of VRP.
- Abstract(参考訳): FSMVRP(Fleet Size and Mix Vehicle Routing Problem)は、車両ルーティング問題(VRP)の顕著な変種である。
FSMVRPは艦隊の構成とルーティングを同時に決定する必要があるため、短期車両のレンタルやオンデマンドのロジスティクスといった現実のシナリオに非常に適用可能である。
しかし、これらの要件はまたFSMVRPの複雑さを増大させ、特に大規模で時間に制約のある環境では大きな課題を生んでいる。
本稿では,FSMVRPを解くための深層強化学習(DRL)に基づく手法を提案する。
具体的には、マルコフ決定プロセス(MDP)として問題を定式化し、艦隊構成と経路決定をシームレスに統合する新しいポリシーネットワークであるFRIPNを開発する。
本手法は,車両の効率的な雇用決定を容易にするためのグラフ埋め込みを含む,識別目的のための特殊な入力埋め込みを組み込む。
ランダムに生成されたインスタンスとベンチマークデータセットの両方で、包括的な実験が行われる。
実験により,本手法は計算効率とスケーラビリティ,特に大規模かつ時間制約のあるシナリオにおいて顕著な優位性を示すことが示された。
これらの強みは、我々の実践的応用の可能性を強調し、DRLベースの技術を他のVRPに拡張するための貴重なインスピレーションを提供する。
関連論文リスト
- Multi-Task Vehicle Routing Solver via Mixture of Specialized Experts under State-Decomposable MDP [57.28979643999352]
本稿では,VRPの変種間で共有成分の性質を認識可能な統合解法フレームワークを提案する。
状態空間を基底状態空間のカルテアン積として表現することにより、VRPを再構成する状態分解型MDP(SDMDP)を導入する。
The Latent Space-based SDMDP extension is developed by the both the optimal basis policy and a learnable mix function。
論文 参考訳(メタデータ) (2025-10-24T13:31:31Z) - Intelligent Offloading in Vehicular Edge Computing: A Comprehensive Review of Deep Reinforcement Learning Approaches and Architectures [9.21746609806009]
インテリジェントトランスポーテーションシステム(ITS)の複雑さは、エッジサーバ、車両ノード、UAVなどの外部インフラストラクチャへの計算オフロードに大きな関心を惹き付けている。
深部強化学習(DRL)による車両エッジコンピューティング(VEC)用オフロードの最近の進歩
学習パラダイム(シングルエージェント、マルチエージェントなど)、システムアーキテクチャ(集中型、分散型、階層型)、最適化目標(レイテンシ、エネルギー、公正性など)に基づいて、既存の作業の分類と比較を行う。
論文 参考訳(メタデータ) (2025-02-10T19:02:20Z) - TeLL-Drive: Enhancing Autonomous Driving with Teacher LLM-Guided Deep Reinforcement Learning [61.33599727106222]
TeLL-Driveは、Teacher LLMを統合して、注意に基づく学生DRLポリシーをガイドするハイブリッドフレームワークである。
自己維持機構はDRLエージェントの探索とこれらの戦略を融合させ、政策収束を加速し、堅牢性を高める。
論文 参考訳(メタデータ) (2025-02-03T14:22:03Z) - DeepMDV: Global Spatial Matching for Multi-depot Vehicle Routing Problems [2.218667838700643]
オンライン小売と電子商取引の急速な成長は、効果的かつ効率的な車両ルーティング問題(VRP)ソリューションを不可欠にしてきた。
需要の増加に対応するために、企業はより多くのデポを追加し、VRP問題をMulti-Depot VRPの複雑な最適化タスクに変更した。
本稿では,これらの相互依存に対処するMDVRPの解法を提案する。
論文 参考訳(メタデータ) (2024-11-26T03:41:01Z) - Learn to Solve Vehicle Routing Problems ASAP: A Neural Optimization Approach for Time-Constrained Vehicle Routing Problems with Finite Vehicle Fleet [0.0]
車両の車両サイズが有限である時間制約付静電容量VRPを解くためのNCO手法を提案する。
この手法は、柔軟性と堅牢な一般化の両方を示す、適切で費用効率のよい解を見つけることができる。
論文 参考訳(メタデータ) (2024-11-07T15:16:36Z) - Aquatic Navigation: A Challenging Benchmark for Deep Reinforcement Learning [53.3760591018817]
ゲームエンジンとDeep Reinforcement Learningの統合の最近の進歩を利用して,水上ナビゲーションのための新しいベンチマーク環境を提案する。
具体的には、最も広く受け入れられているアルゴリズムの一つであるPPOに着目し、先進的なトレーニング手法を提案する。
実験により,これらの成分をうまく組み合わせることで,有望な結果が得られることが示された。
論文 参考訳(メタデータ) (2024-05-30T23:20:23Z) - Reinforcement Learning for Solving Stochastic Vehicle Routing Problem [0.09831489366502298]
本研究では、車両ルーティング問題(SVRP)解決における強化学習(RL)と機械学習(ML)技術の利用のギャップを解消する。
本稿では,SVRPのキーソースを包括的に扱う新しいエンドツーエンドフレームワークを提案する。
提案モデルでは,広く採用されている最先端のメユーリスティックよりも優れた性能を示し,旅行コストの3.43%削減を実現している。
論文 参考訳(メタデータ) (2023-11-13T19:46:22Z) - Flexible Job Shop Scheduling via Dual Attention Network Based
Reinforcement Learning [73.19312285906891]
フレキシブルなジョブショップスケジューリング問題(FJSP)では、複数のマシンで操作を処理でき、操作とマシンの間の複雑な関係が生じる。
近年, 深層強化学習(DRL)を用いて, FJSP解決のための優先派遣規則(PDR)を学習している。
本稿では,Deep機能抽出のための自己注意モデルと,スケーラブルな意思決定のためのDRLの利点を生かした,エンドツーエンド学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-09T01:35:48Z) - Towards Deployment-Efficient Reinforcement Learning: Lower Bound and
Optimality [141.89413461337324]
展開効率は、強化学習(RL)の多くの実世界の応用にとって重要な基準である
本稿では,「制約付き最適化」の観点から,デプロイ効率の高いRL(DE-RL)の理論的定式化を提案する。
論文 参考訳(メタデータ) (2022-02-14T01:31:46Z) - Deep Reinforcement Learning for Solving the Heterogeneous Capacitated
Vehicle Routing Problem [13.389057146418056]
現実のシナリオにおける車両は、その能力(または走行速度)に影響を与える異なる特徴を持つ異種である可能性が高い
異種艦隊制約を考慮した車両選択デコーダと経路構成を考慮したノード選択デコーダとを併用した注意機構に基づくDRL手法を提案し,各ステップで車両とノードの両方を自動的に選択して解を構築することを学習する。
論文 参考訳(メタデータ) (2021-10-06T10:05:19Z) - Reinforcement Learning for Adaptive Mesh Refinement [63.7867809197671]
マルコフ決定過程としてのAMRの新規な定式化を提案し,シミュレーションから直接改良政策を訓練するために深部強化学習を適用した。
これらのポリシーアーキテクチャのモデルサイズはメッシュサイズに依存しないため、任意に大きく複雑なシミュレーションにスケールします。
論文 参考訳(メタデータ) (2021-03-01T22:55:48Z) - Learning Vehicle Routing Problems using Policy Optimisation [4.093722933440819]
最先端のアプローチは強化学習を使ってポリシーを学習し、学習ポリシーは擬似解法として機能する。
これらのアプローチは、あるケースでは優れた性能を示しているが、ルーティング問題に典型的な大きな検索空間を考えると、ポリシーの貧弱さに早すぎる可能性がある。
より多くのポリシーを提供することで探索を支援するエントロピー正規化強化学習(ERRL)を提案する。
論文 参考訳(メタデータ) (2020-12-24T14:18:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。