論文の概要: Deep Reinforcement Learning for Solving the Fleet Size and Mix Vehicle Routing Problem
- arxiv url: http://arxiv.org/abs/2512.24251v1
- Date: Tue, 30 Dec 2025 14:26:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-01 23:27:28.398041
- Title: Deep Reinforcement Learning for Solving the Fleet Size and Mix Vehicle Routing Problem
- Title(参考訳): フリートサイズと混合車両経路問題の解法のための深部強化学習
- Authors: Pengfu Wan, Jiawei Chen, Gangyan Xu,
- Abstract要約: FSMVRP(Fleet Size and Mix Vehicle Routing Problem)は、VRP(Fleet Size and Mix Vehicle Routing Problem)の変種である。
本稿では,FSMVRPを解くための深層強化学習(DRL)に基づく手法を提案する。
本手法は,特に大規模かつ時間制約のあるシナリオにおいて,計算効率とスケーラビリティにおいて顕著な優位性を示す。
- 参考スコア(独自算出の注目度): 8.127336287332783
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Fleet Size and Mix Vehicle Routing Problem (FSMVRP) is a prominent variant of the Vehicle Routing Problem (VRP), extensively studied in operations research and computational science. FSMVRP requires simultaneous decisions on fleet composition and routing, making it highly applicable to real-world scenarios such as short-term vehicle rental and on-demand logistics. However, these requirements also increase the complexity of FSMVRP, posing significant challenges, particularly in large-scale and time-constrained environments. In this paper, we propose a deep reinforcement learning (DRL)-based approach for solving FSMVRP, capable of generating near-optimal solutions within a few seconds. Specifically, we formulate the problem as a Markov Decision Process (MDP) and develop a novel policy network, termed FRIPN, that seamlessly integrates fleet composition and routing decisions. Our method incorporates specialized input embeddings designed for distinctdecision objectives, including a remaining graph embedding to facilitate effective vehicle employment decisions. Comprehensive experiments are conducted on both randomly generated instances and benchmark datasets. The experimental results demonstrate that our method exhibits notable advantages in terms of computational efficiency and scalability, particularly in large-scale and time-constrained scenarios. These strengths highlight the potential of our approach for practical applications and provide valuable inspiration for extending DRL-based techniques to other variants of VRP.
- Abstract(参考訳): FSMVRP(Fleet Size and Mix Vehicle Routing Problem)は、車両ルーティング問題(VRP)の顕著な変種である。
FSMVRPは艦隊の構成とルーティングを同時に決定する必要があるため、短期車両のレンタルやオンデマンドのロジスティクスといった現実のシナリオに非常に適用可能である。
しかし、これらの要件はまたFSMVRPの複雑さを増大させ、特に大規模で時間に制約のある環境では大きな課題を生んでいる。
本稿では,FSMVRPを解くための深層強化学習(DRL)に基づく手法を提案する。
具体的には、マルコフ決定プロセス(MDP)として問題を定式化し、艦隊構成と経路決定をシームレスに統合する新しいポリシーネットワークであるFRIPNを開発する。
本手法は,車両の効率的な雇用決定を容易にするためのグラフ埋め込みを含む,識別目的のための特殊な入力埋め込みを組み込む。
ランダムに生成されたインスタンスとベンチマークデータセットの両方で、包括的な実験が行われる。
実験により,本手法は計算効率とスケーラビリティ,特に大規模かつ時間制約のあるシナリオにおいて顕著な優位性を示すことが示された。
これらの強みは、我々の実践的応用の可能性を強調し、DRLベースの技術を他のVRPに拡張するための貴重なインスピレーションを提供する。
関連論文リスト
- Intelligent Offloading in Vehicular Edge Computing: A Comprehensive Review of Deep Reinforcement Learning Approaches and Architectures [9.21746609806009]
インテリジェントトランスポーテーションシステム(ITS)の複雑さは、エッジサーバ、車両ノード、UAVなどの外部インフラストラクチャへの計算オフロードに大きな関心を惹き付けている。
深部強化学習(DRL)による車両エッジコンピューティング(VEC)用オフロードの最近の進歩
学習パラダイム(シングルエージェント、マルチエージェントなど)、システムアーキテクチャ(集中型、分散型、階層型)、最適化目標(レイテンシ、エネルギー、公正性など)に基づいて、既存の作業の分類と比較を行う。
論文 参考訳(メタデータ) (2025-02-10T19:02:20Z) - TeLL-Drive: Enhancing Autonomous Driving with Teacher LLM-Guided Deep Reinforcement Learning [61.33599727106222]
TeLL-Driveは、Teacher LLMを統合して、注意に基づく学生DRLポリシーをガイドするハイブリッドフレームワークである。
自己維持機構はDRLエージェントの探索とこれらの戦略を融合させ、政策収束を加速し、堅牢性を高める。
論文 参考訳(メタデータ) (2025-02-03T14:22:03Z) - Learn to Solve Vehicle Routing Problems ASAP: A Neural Optimization Approach for Time-Constrained Vehicle Routing Problems with Finite Vehicle Fleet [0.0]
車両の車両サイズが有限である時間制約付静電容量VRPを解くためのNCO手法を提案する。
この手法は、柔軟性と堅牢な一般化の両方を示す、適切で費用効率のよい解を見つけることができる。
論文 参考訳(メタデータ) (2024-11-07T15:16:36Z) - Reinforcement Learning for Solving Stochastic Vehicle Routing Problem [0.09831489366502298]
本研究では、車両ルーティング問題(SVRP)解決における強化学習(RL)と機械学習(ML)技術の利用のギャップを解消する。
本稿では,SVRPのキーソースを包括的に扱う新しいエンドツーエンドフレームワークを提案する。
提案モデルでは,広く採用されている最先端のメユーリスティックよりも優れた性能を示し,旅行コストの3.43%削減を実現している。
論文 参考訳(メタデータ) (2023-11-13T19:46:22Z) - Flexible Job Shop Scheduling via Dual Attention Network Based
Reinforcement Learning [73.19312285906891]
フレキシブルなジョブショップスケジューリング問題(FJSP)では、複数のマシンで操作を処理でき、操作とマシンの間の複雑な関係が生じる。
近年, 深層強化学習(DRL)を用いて, FJSP解決のための優先派遣規則(PDR)を学習している。
本稿では,Deep機能抽出のための自己注意モデルと,スケーラブルな意思決定のためのDRLの利点を生かした,エンドツーエンド学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-09T01:35:48Z) - Deep Reinforcement Learning for Solving the Heterogeneous Capacitated
Vehicle Routing Problem [13.389057146418056]
現実のシナリオにおける車両は、その能力(または走行速度)に影響を与える異なる特徴を持つ異種である可能性が高い
異種艦隊制約を考慮した車両選択デコーダと経路構成を考慮したノード選択デコーダとを併用した注意機構に基づくDRL手法を提案し,各ステップで車両とノードの両方を自動的に選択して解を構築することを学習する。
論文 参考訳(メタデータ) (2021-10-06T10:05:19Z) - Reinforcement Learning for Adaptive Mesh Refinement [63.7867809197671]
マルコフ決定過程としてのAMRの新規な定式化を提案し,シミュレーションから直接改良政策を訓練するために深部強化学習を適用した。
これらのポリシーアーキテクチャのモデルサイズはメッシュサイズに依存しないため、任意に大きく複雑なシミュレーションにスケールします。
論文 参考訳(メタデータ) (2021-03-01T22:55:48Z) - Learning Vehicle Routing Problems using Policy Optimisation [4.093722933440819]
最先端のアプローチは強化学習を使ってポリシーを学習し、学習ポリシーは擬似解法として機能する。
これらのアプローチは、あるケースでは優れた性能を示しているが、ルーティング問題に典型的な大きな検索空間を考えると、ポリシーの貧弱さに早すぎる可能性がある。
より多くのポリシーを提供することで探索を支援するエントロピー正規化強化学習(ERRL)を提案する。
論文 参考訳(メタデータ) (2020-12-24T14:18:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。