論文の概要: Deep Learning--Accelerated Multi-Start Large Neighborhood Search for Real-time Freight Bundling
- arxiv url: http://arxiv.org/abs/2512.11187v1
- Date: Fri, 12 Dec 2025 00:29:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-15 15:48:11.606287
- Title: Deep Learning--Accelerated Multi-Start Large Neighborhood Search for Real-time Freight Bundling
- Title(参考訳): リアルタイム重み付けのための深層学習型マルチスター大型近傍探索
- Authors: Haohui Zhang, Wouter van Heeswijk, Xinyu Hu, Neil Yorke-Smith, Martijn Mes,
- Abstract要約: 我々はOFEXバンドル問題をマルチコモディティ・ワン・ワン・ワン・ピックアップ・アンド・デリバリ選択販売者問題(m1-PDSTSP)としてモデル化する。
主な課題は、バンドルの選択とピックアップ・アンド・デリバリのルーティングをサブ秒で結合することだ。
本稿では,トランスフォーマーニューラルネットワークに基づく構築ポリシーと,ローリングホライゾンスキームにおける革新的マルチスター大型近傍探索(LNMSS)メタヒューリスティックを組み合わせた学習促進ハイブリッド探索パイプラインを提案する。
- 参考スコア(独自算出の注目度): 10.477771954122625
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online Freight Exchange Systems (OFEX) play a crucial role in modern freight logistics by facilitating real-time matching between shippers and carrier. However, efficient combinatorial bundling of transporation jobs remains a bottleneck. We model the OFEX combinatorial bundling problem as a multi-commodity one-to-one pickup-and-delivery selective traveling salesperson problem (m1-PDSTSP), which optimizes revenue-driven freight bundling under capacity, precedence, and route-length constraints. The key challenge is to couple combinatorial bundle selection with pickup-and-delivery routing under sub-second latency. We propose a learning--accelerated hybrid search pipeline that pairs a Transformer Neural Network-based constructive policy with an innovative Multi-Start Large Neighborhood Search (MSLNS) metaheuristic within a rolling-horizon scheme in which the platform repeatedly freezes the current marketplace into a static snapshot and solves it under a short time budget. This pairing leverages the low-latency, high-quality inference of the learning-based constructor alongside the robustness of improvement search; the multi-start design and plausible seeds help LNS to explore the solution space more efficiently. Across benchmarks, our method outperforms state-of-the-art neural combinatorial optimization and metaheuristic baselines in solution quality with comparable time, achieving an optimality gap of less than 2\% in total revenue relative to the best available exact baseline method. To our knowledge, this is the first work to establish that a Deep Neural Network-based constructor can reliably provide high-quality seeds for (multi-start) improvement heuristics, with applicability beyond the \textit{m1-PDSTSP} to a broad class of selective traveling salesperson problems and pickup and delivery problems.
- Abstract(参考訳): オンライン貨物取引システム(OFEX)は、運送業者と運送業者のリアルタイムマッチングを促進することで、現代の貨物物流において重要な役割を担っている。
しかし、効率的な合成ジョブの結合はいまだにボトルネックとなっている。
我々は,OFEX組合せバンドル問題を,容量,優先性,ルート長制約を最適化したマルチコモディティ・ワン・ワン・ワン・ピックアップ・アンド・デリバリー選択販売者問題 (m1-PDSTSP) としてモデル化する。
鍵となる課題は、組み合わせバンドルの選択とピックアップ・アンド・デリバリのルーティングをサブ秒のレイテンシで結合することである。
本稿では,トランスフォーマーニューラルネットワークに基づく構築ポリシーと,マルチスタート大規模近傍探索(MSLNS)メタヒューリスティック(メタヒューリスティック)を組み合わせた学習促進型ハイブリッド探索パイプラインを提案する。
このペアリングは、学習ベースコンストラクタの低レイテンシで高品質な推論と改善探索の堅牢性を活用する。
提案手法は, 最新のニューラルネットワーク最適化とメタヒューリスティックベースラインを同等の時間で実現し, 最適な正確なベースライン法と比較して, 総収益の2倍未満の最適性ギャップを達成している。
我々の知る限り、これはDeep Neural Networkベースのコンストラクタが、(マルチスタート)改善ヒューリスティックスのために高品質なシードを確実に提供できることを保証する最初の試みである。
関連論文リスト
- Solving the Min-Max Multiple Traveling Salesmen Problem via Learning-Based Path Generation and Optimal Splitting [8.941535841606584]
Min-Max Multiple Traveling Salesmen Problemは、複数のセールスマンのツアーをコーディネートすることで、最長ツアーの長さを最小化することを目的としている。
NPハードの性質のため、正確な解法は$P ne NP$という仮定の下で非現実的になる。
我々は,強化学習と最適分割アルゴリズムを統合した2段階のフレームワークである textbfGenerate-and-Split (GaS) を提案する。
論文 参考訳(メタデータ) (2025-08-23T17:00:57Z) - Pinet: Optimizing hard-constrained neural networks with orthogonal projection layers [5.227723778971733]
凸制約の満足度を確保するために,ネットワークの出力層を導入する。
我々のアプローチである$Pi$netは、フォワードパスの高速かつ信頼性の高い投影に演算子分割を利用する。
論文 参考訳(メタデータ) (2025-08-14T09:32:09Z) - How to Train Your LLM Web Agent: A Statistical Diagnosis [96.86317871461834]
LLMウェブエージェントのポストトレーニングにおける計算割当に関する統計学的基礎研究について述べる。
提案手法では,Llama 3.1 8Bの学生を対象に,教師付き微調整(SFT)とオンライン強化学習を用いて,Llama 3.3 70Bの教師を模倣する2段階のパイプラインを用いた。
以上の結果から,SFTとオンラインRLの組み合わせは,WorkArenaとMiniWob++のいずれにおいても,単独でのアプローチよりも一貫して優れていた。
論文 参考訳(メタデータ) (2025-07-05T17:12:33Z) - Accelerating Vehicle Routing via AI-Initialized Genetic Algorithms [53.75036695728983]
車両ルーティング問題 (VRP) は進化的最適化における基本的なNPハード問題である。
本稿では、強化学習エージェントを事前のインスタンスで訓練し、初期解を迅速に生成する最適化フレームワークを提案する。
このフレームワークは、様々な時間予算において、現在の最先端のソルバよりも一貫して優れています。
論文 参考訳(メタデータ) (2025-04-08T15:21:01Z) - Learning to Solve the Min-Max Mixed-Shelves Picker-Routing Problem via Hierarchical and Parallel Decoding [0.3867363075280544]
混合棚ピッカールーティング問題(MSPRP)はロジスティクスにおける基本的な課題であり、ピッカーはSKUを効率的に回収するために混合棚環境をナビゲートする必要がある。
マルチエージェント強化学習により,MSPRPのmin-max変異を解くための新しい階層的並列デコーディング手法を提案する。
実験では、特に大規模およびアウト・オブ・ディストリビューションインスタンスにおいて、ソリューションの品質と推論速度の両方で最先端のパフォーマンスを示す。
論文 参考訳(メタデータ) (2025-02-14T15:42:30Z) - Fast T2T: Optimization Consistency Speeds Up Diffusion-Based Training-to-Testing Solving for Combinatorial Optimization [83.65278205301576]
雑音レベルから与えられたインスタンスの最適解への直接写像を学習し、最小限のショットで高品質な生成を容易にすることを提案する。
これは、サンプル間の差を最小限に抑える最適化一貫性トレーニングプロトコルによって達成される。
The Traveling Salesman Problem (TSP) と Maximal Independent Set (MIS) は、ソリューションの品質と効率の両方に関して、Fast T2Tの優位性を実証している。
論文 参考訳(メタデータ) (2025-02-05T07:13:43Z) - Diversity Optimization for Travelling Salesman Problem via Deep Reinforcement Learning [29.551883712536295]
既存のトラベリングセールスマン問題(TSP)のニューラルメソッドは主に、単一の最適解を見つけることを目的としている。
本稿では,主にエンコーダ-デコーダ構造ポリシを特徴とする,深層強化学習に基づくニューラルソルバを提案する。
論文 参考訳(メタデータ) (2025-01-01T16:08:40Z) - Low-Latency Federated Learning over Wireless Channels with Differential
Privacy [142.5983499872664]
フェデレートラーニング(FL)では、モデルトレーニングはクライアントに分散し、ローカルモデルは中央サーバによって集約される。
本稿では,各クライアントの差分プライバシ(DP)要件だけでなく,全体としてのトレーニング性能に制約された無線チャネル上でのFLトレーニング遅延を最小限に抑えることを目的とする。
論文 参考訳(メタデータ) (2021-06-20T13:51:18Z) - Deep Reinforcement Learning for Resource Constrained Multiclass
Scheduling in Wireless Networks [0.0]
セットアップでは、ランダムに到着するサービス要求に対応するために、利用可能な限られた帯域幅のリソースを割り当てます。
本稿では,Deep Setsと組み合わせた分布型Deep Deterministic Policy Gradient (DDPG)アルゴリズムを提案する。
提案アルゴリズムは, 合成データと実データの両方で検証し, 従来手法に対する一貫した利得を示す。
論文 参考訳(メタデータ) (2020-11-27T09:49:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。