論文の概要: Vehicle-as-Prompt: A Unified Deep Reinforcement Learning Framework for Heterogeneous Fleet Vehicle Routing Problem
- arxiv url: http://arxiv.org/abs/2604.05195v1
- Date: Mon, 06 Apr 2026 21:48:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-08 17:42:09.505174
- Title: Vehicle-as-Prompt: A Unified Deep Reinforcement Learning Framework for Heterogeneous Fleet Vehicle Routing Problem
- Title(参考訳): Vehicle-as-Prompt: 異種艦隊車両ルーティング問題のための統合された深部強化学習フレームワーク
- Authors: Shihong Huang, Shengjie Wang, Lei Gao, Hong Ma, Zhanluo Zhang, Feng Zhang, Weihua Zhou,
- Abstract要約: 不均一艦隊車両ルーティング問題 (HFVRP) には、異種固定コスト、可変走行コスト、容量制約が含まれる。
我々は,様々な異なる設定で問題を解くことができる,統合された深層強化学習フレームワークを開発した。
- 参考スコア(独自算出の注目度): 12.469727665338603
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unlike traditional homogeneous routing problems, the Heterogeneous Fleet Vehicle Routing Problem (HFVRP) involves heterogeneous fixed costs, variable travel costs, and capacity constraints, rendering solution quality highly sensitive to vehicle selection. Furthermore, real-world logistics applications often impose additional complex constraints, markedly increasing computational complexity. However, most existing Deep Reinforcement Learning (DRL)-based methods are restricted to homogeneous scenarios, leading to suboptimal performance when applied to HFVRP and its complex variants. To bridge this gap, we investigate HFVRP under complex constraints and develop a unified DRL framework capable of solving the problem across various variant settings. We introduce the Vehicle-as-Prompt (VaP) mechanism, which formulates the problem as a single-stage autoregressive decision process. Building on this, we propose VaP-CSMV, a framework featuring a cross-semantic encoder and a multi-view decoder that effectively addresses various problem variants and captures the complex mapping relationships between vehicle heterogeneity and customer node attributes. Extensive experimental results demonstrate that VaP-CSMV significantly outperforms existing state-of-the-art DRL-based neural solvers and achieves competitive solution quality compared to traditional heuristic solvers, while reducing inference time to mere seconds. Furthermore, the framework exhibits strong zero-shot generalization capabilities on large-scale and previously unseen problem variants, while ablation studies validate the vital contribution of each component.
- Abstract(参考訳): 従来の均一なルーティング問題とは異なり、異種艦隊車両ルーティング問題(HFVRP)には、異種固定コスト、可変走行コスト、容量制限が含まれており、車両選択に非常に敏感なソリューション品質をレンダリングする。
さらに、現実世界のロジスティクスアプリケーションは、しばしばより複雑な制約を課し、計算の複雑さが著しく増大する。
しかし、既存のDeep Reinforcement Learning(DRL)ベースのほとんどの手法は均質なシナリオに制限されており、HFVRPとその複雑な変種に適用した場合、準最適性能をもたらす。
このギャップを埋めるために、複雑な制約の下でHFVRPを調査し、様々な異なる設定で問題を解決可能な統合DRLフレームワークを開発する。
単段自動回帰決定プロセスとして問題を定式化するVaP(VaP)機構を導入する。
そこで我々は,VaP-CSMVを提案する。VaP-CSMVはクロスセマンティックエンコーダとマルチビューデコーダを備えたフレームワークで,様々な問題に効果的に対処し,車両の不均一性と顧客ノード属性の複雑なマッピング関係を捉える。
広汎な実験結果から,VaP-CSMVは既存の最先端のDRLベースのニューラルソルバを著しく上回り,従来のヒューリスティック・ソルバに比べて競争力のあるソリューション品質を実現し,推論時間をほんの数秒に短縮した。
さらに、このフレームワークは、大規模かつ以前は見えなかった問題バリアントに対して強力なゼロショット一般化能力を示し、アブレーション研究は各コンポーネントの不可欠な寄与を検証している。
関連論文リスト
- Multi-Agent DRL for V2X Resource Allocation: Disentangling Challenges and Benchmarking Solutions [51.22818149833102]
マルチエージェント強化学習(MARL)は、車間通信(C-V2X)ネットワークにおける無線リソース割り当ての有望なアプローチとして登場した。
しかし、MARLに固有の多面的課題はしばしば絡み合っており、車載環境における個々の影響を理解することは困難である。
我々は, C-V2X RRA を, 複雑さが徐々に増大する多エージェント干渉ゲーム列として定式化し, このギャップを埋める。
論文 参考訳(メタデータ) (2026-02-18T14:46:56Z) - Deep Reinforcement Learning for Solving the Fleet Size and Mix Vehicle Routing Problem [8.127336287332783]
FSMVRP(Fleet Size and Mix Vehicle Routing Problem)は、VRP(Fleet Size and Mix Vehicle Routing Problem)の変種である。
本稿では,FSMVRPを解くための深層強化学習(DRL)に基づく手法を提案する。
本手法は,特に大規模かつ時間制約のあるシナリオにおいて,計算効率とスケーラビリティにおいて顕著な優位性を示す。
論文 参考訳(メタデータ) (2025-12-30T14:26:33Z) - An Agentic Framework with LLMs for Solving Complex Vehicle Routing Problems [66.60904891478687]
複雑な車両ルーティング問題を解決するために,LLM (AFL) を用いたエージェントフレームワークを提案する。
AFLは生の入力から知識を直接抽出し、自己完結型コード生成を可能にする。
AFLは、コード信頼性とソリューション実現性の両方において、既存のLCMベースのベースラインを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2025-10-19T03:59:25Z) - Accelerating Vehicle Routing via AI-Initialized Genetic Algorithms [53.75036695728983]
車両ルーティング問題 (VRP) は進化的最適化における基本的なNPハード問題である。
本稿では、強化学習エージェントを事前のインスタンスで訓練し、初期解を迅速に生成する最適化フレームワークを提案する。
このフレームワークは、様々な時間予算において、現在の最先端のソルバよりも一貫して優れています。
論文 参考訳(メタデータ) (2025-04-08T15:21:01Z) - CaDA: Cross-Problem Routing Solver with Constraint-Aware Dual-Attention [21.554370739508528]
本稿では,車両経路問題に対する制約対応デュアルアテンションモデル(CaDA)を提案する。
CaDAは、異なる問題変種を効率的に表現する制約プロンプトを組み込んでいる。
より広範なグラフ情報を取得するためのグローバルブランチを備えたデュアルアテンション機構を備えている。
論文 参考訳(メタデータ) (2024-11-30T04:11:36Z) - Scalable Vehicle Re-Identification via Self-Supervision [66.2562538902156]
自動車再同定は、都市規模の車両分析システムにおいて重要な要素の1つである。
車両再設計のための最先端のソリューションの多くは、既存のre-idベンチマークの精度向上に重点を置いており、計算の複雑さを無視することが多い。
推論時間に1つのネットワークのみを使用する自己教師型学習によって、シンプルで効果的なハイブリッドソリューションを提案する。
論文 参考訳(メタデータ) (2022-05-16T12:14:42Z) - Deep Reinforcement Learning for Solving the Heterogeneous Capacitated
Vehicle Routing Problem [13.389057146418056]
現実のシナリオにおける車両は、その能力(または走行速度)に影響を与える異なる特徴を持つ異種である可能性が高い
異種艦隊制約を考慮した車両選択デコーダと経路構成を考慮したノード選択デコーダとを併用した注意機構に基づくDRL手法を提案し,各ステップで車両とノードの両方を自動的に選択して解を構築することを学習する。
論文 参考訳(メタデータ) (2021-10-06T10:05:19Z) - Reinforcement Learning for Adaptive Mesh Refinement [63.7867809197671]
マルコフ決定過程としてのAMRの新規な定式化を提案し,シミュレーションから直接改良政策を訓練するために深部強化学習を適用した。
これらのポリシーアーキテクチャのモデルサイズはメッシュサイズに依存しないため、任意に大きく複雑なシミュレーションにスケールします。
論文 参考訳(メタデータ) (2021-03-01T22:55:48Z) - A Quantum Annealing Approach for Dynamic Multi-Depot Capacitated Vehicle
Routing Problem [5.057312718525522]
本稿では,AQC(Adiabatic Quantum Computation)の原理に基づく量子コンピューティングアルゴリズムを提案する。
従来のアルゴリズムと比較して、車両ルーティング問題(VRP)のような最適化問題の解法において、計算上の利点が顕著に示された。
これは、輸送、物流、サプライチェーン管理の分野における実世界の応用におけるNPハード最適化問題である。
論文 参考訳(メタデータ) (2020-05-26T01:47:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。