論文の概要: An End-to-End Learning Approach for Solving Capacitated Location-Routing Problems
- arxiv url: http://arxiv.org/abs/2511.02525v1
- Date: Tue, 04 Nov 2025 12:23:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 18:47:05.984642
- Title: An End-to-End Learning Approach for Solving Capacitated Location-Routing Problems
- Title(参考訳): 終端学習による容量化位置追従問題の解法
- Authors: Changhao Miao, Yuntian Zhang, Tongyu Wu, Fang Deng, Chen Chen,
- Abstract要約: CLRP(capacitated location-routing problem)に対するエンドツーエンド学習手法を提案する。
特に、CLRPを様々な決定に合わせたマルコフ決定プロセスとして再構成する。
また、様々な意思決定段階に動的に適応するように設計された、新しい異種クエリアテンション機構も導入する。
- 参考スコア(独自算出の注目度): 8.616895584914579
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The capacitated location-routing problems (CLRPs) are classical problems in combinatorial optimization, which require simultaneously making location and routing decisions. In CLRPs, the complex constraints and the intricate relationships between various decisions make the problem challenging to solve. With the emergence of deep reinforcement learning (DRL), it has been extensively applied to address the vehicle routing problem and its variants, while the research related to CLRPs still needs to be explored. In this paper, we propose the DRL with heterogeneous query (DRLHQ) to solve CLRP and open CLRP (OCLRP), respectively. We are the first to propose an end-to-end learning approach for CLRPs, following the encoder-decoder structure. In particular, we reformulate the CLRPs as a markov decision process tailored to various decisions, a general modeling framework that can be adapted to other DRL-based methods. To better handle the interdependency across location and routing decisions, we also introduce a novel heterogeneous querying attention mechanism designed to adapt dynamically to various decision-making stages. Experimental results on both synthetic and benchmark datasets demonstrate superior solution quality and better generalization performance of our proposed approach over representative traditional and DRL-based baselines in solving both CLRP and OCLRP.
- Abstract(参考訳): CLRP(capacitated location-routing problem)は、組合せ最適化における古典的な問題であり、位置決定とルーティング決定を同時に行う必要がある。
CLRPでは、様々な決定の間の複雑な制約と複雑な関係が問題を解くのを難しくしている。
深部強化学習(DRL)の出現に伴い、車両経路問題とその変種への対処に広く応用されているが、CLRPに関する研究はいまだに検討する必要がある。
本稿では、CLRP と Open CLRP (OCLRP) をそれぞれ解くために、DRLHQ を用いたDRLを提案する。
我々は,エンコーダ・デコーダ構造に従ってCLRPのエンドツーエンド学習手法を提案する。
特に、CLRPを様々な決定に合わせたマルコフ決定プロセスとして再構成し、他のDRLベースの手法に適応可能な一般的なモデリングフレームワークとする。
また、位置決定とルーティング決定の相互依存性をよりよく扱うために、様々な意思決定段階に動的に適応するように設計された、新しい異種クエリアテンション機構を導入する。
その結果, CLRP と OCLRP の双方を解く上で, 従来の DRL ベースラインよりも優れた解品質と最適化性能が得られた。
関連論文リスト
- Deep Reinforcement Learning for Solving the Fleet Size and Mix Vehicle Routing Problem [8.127336287332783]
FSMVRP(Fleet Size and Mix Vehicle Routing Problem)は、VRP(Fleet Size and Mix Vehicle Routing Problem)の変種である。
本稿では,FSMVRPを解くための深層強化学習(DRL)に基づく手法を提案する。
本手法は,特に大規模かつ時間制約のあるシナリオにおいて,計算効率とスケーラビリティにおいて顕著な優位性を示す。
論文 参考訳(メタデータ) (2025-12-30T14:26:33Z) - Multi-Task Vehicle Routing Solver via Mixture of Specialized Experts under State-Decomposable MDP [57.28979643999352]
本稿では,VRPの変種間で共有成分の性質を認識可能な統合解法フレームワークを提案する。
状態空間を基底状態空間のカルテアン積として表現することにより、VRPを再構成する状態分解型MDP(SDMDP)を導入する。
The Latent Space-based SDMDP extension is developed by the both the optimal basis policy and a learnable mix function。
論文 参考訳(メタデータ) (2025-10-24T13:31:31Z) - Preference Optimization for Combinatorial Optimization Problems [54.87466279363487]
強化学習(Reinforcement Learning, RL)は、ニューラルネットワーク最適化のための強力なツールとして登場した。
大幅な進歩にもかかわらず、既存のRLアプローチは報酬信号の減少や大規模な行動空間における非効率な探索といった課題に直面している。
統計的比較モデルを用いて定量的報酬信号を定性的選好信号に変換する新しい手法であるPreference Optimizationを提案する。
論文 参考訳(メタデータ) (2025-05-13T16:47:00Z) - CAMP: Collaborative Attention Model with Profiles for Vehicle Routing Problems [15.136899433821894]
プロファイル車両ルーティング問題(PVRP)は、異種静電容量車両ルーティング問題(HCVRP)の一般化である。
マルチエージェント強化学習を用いてPVRPの効率的な解法を学習する新しい手法を提案する。
論文 参考訳(メタデータ) (2025-01-06T12:37:56Z) - Design Optimization of NOMA Aided Multi-STAR-RIS for Indoor Environments: A Convex Approximation Imitated Reinforcement Learning Approach [51.63921041249406]
非直交多重アクセス(Noma)により、複数のユーザが同じ周波数帯域を共有でき、同時に再構成可能なインテリジェントサーフェス(STAR-RIS)を送信および反射することができる。
STAR-RISを屋内に展開することは、干渉緩和、電力消費、リアルタイム設定における課題を提示する。
複数のアクセスポイント(AP)、STAR-RIS、NOMAを利用した新しいネットワークアーキテクチャが屋内通信のために提案されている。
論文 参考訳(メタデータ) (2024-06-19T07:17:04Z) - Leveraging Constraint Programming in a Deep Learning Approach for Dynamically Solving the Flexible Job-Shop Scheduling Problem [1.3927943269211593]
本稿では,制約プログラミング(CP)をディープラーニング(DL)ベースの方法論に統合し,両者の利点を活用することを目的とする。
本稿では,CP が生成する最適解を用いて DL モデルを訓練し,高品質なデータからモデルを学習する手法を提案する。
我々のハイブリッドアプローチは3つの公開FJSSPベンチマークで広範囲にテストされ、5つの最先端DRLアプローチよりも優れた性能を示している。
論文 参考訳(メタデータ) (2024-03-14T10:16:57Z) - Towards Generalizable Neural Solvers for Vehicle Routing Problems via Ensemble with Transferrable Local Policy [24.91781032046481]
車両ルーティング問題(VRP)のための多くのニューラルネットワーク構築手法は、特定のノード分布と限られたスケールを持つ合成問題インスタンスに焦点を当てている。
我々は,局所移動可能な局所的特徴から学習する補助的政策を設計し,それを典型的な建設方針と統合し,アンサンブル政策を形成する。
共同トレーニングでは、集約されたポリシが協調的かつ補完的に実行され、一般化が促進される。
論文 参考訳(メタデータ) (2023-08-27T13:22:50Z) - MARLIN: Soft Actor-Critic based Reinforcement Learning for Congestion
Control in Real Networks [63.24965775030673]
そこで本研究では,汎用的な渋滞制御(CC)アルゴリズムを設計するための新しい強化学習(RL)手法を提案する。
我々の解であるMARLINは、Soft Actor-Criticアルゴリズムを用いてエントロピーとリターンの両方を最大化する。
我々は,MARLINを実ネットワーク上で訓練し,実ミスマッチを克服した。
論文 参考訳(メタデータ) (2023-02-02T18:27:20Z) - GEC: A Unified Framework for Interactive Decision Making in MDP, POMDP,
and Beyond [101.5329678997916]
対話型意思決定の一般的な枠組みの下で, サンプル高能率強化学習(RL)について検討した。
本稿では,探索とエクスプロイトの基本的なトレードオフを特徴付ける,新しい複雑性尺度である一般化エルダー係数(GEC)を提案する。
低 GEC の RL 問題は非常にリッチなクラスであり、これは低ベルマン楕円体次元問題、双線型クラス、低証人ランク問題、PO-双線型クラス、一般化正規PSR を仮定する。
論文 参考訳(メタデータ) (2022-11-03T16:42:40Z) - Learning Collaborative Policies to Solve NP-hard Routing Problems [13.13675711285772]
本稿では,学習協調政策(LCP)と呼ばれる新しい階層的問題解決戦略を提案する。
2つの反復DRLポリシー(シードとリバイザ)を使って、ほぼ最適解を効果的に見つけることができる。
広汎な実験により,提案した2都市連携方式は,NP-ハードルーティング問題に対する単都市DRLフレームワークよりも改善されることが示された。
論文 参考訳(メタデータ) (2021-10-26T19:46:21Z) - Hierarchical Deep CNN Feature Set-Based Representation Learning for
Robust Cross-Resolution Face Recognition [59.29808528182607]
クロスリゾリューション顔認識(CRFR)は、インテリジェントな監視およびバイオメトリックフォレンジックにおいて重要である。
既存の浅層学習と深層学習に基づく手法は、HR-LR対を共同特徴空間にマッピングすることに焦点を当てている。
本研究では,多レベル深層畳み込みニューラルネットワーク(CNN)の機能を完全に活用し,堅牢なCRFRを実現することを目的とする。
論文 参考訳(メタデータ) (2021-03-25T14:03:42Z) - Reinforcement Learning for Adaptive Mesh Refinement [63.7867809197671]
マルコフ決定過程としてのAMRの新規な定式化を提案し,シミュレーションから直接改良政策を訓練するために深部強化学習を適用した。
これらのポリシーアーキテクチャのモデルサイズはメッシュサイズに依存しないため、任意に大きく複雑なシミュレーションにスケールします。
論文 参考訳(メタデータ) (2021-03-01T22:55:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。