Fugu-MT 論文翻訳(概要): Neural Approximate Dynamic Programming for the Ultra-fast Order Dispatching Problem

論文の概要: Neural Approximate Dynamic Programming for the Ultra-fast Order Dispatching Problem

arxiv url: http://arxiv.org/abs/2311.12975v1
Date: Tue, 21 Nov 2023 20:23:58 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-23 17:10:15.473535
Title: Neural Approximate Dynamic Programming for the Ultra-fast Order Dispatching Problem
Title（参考訳）: 超高速順序ディスパッチ問題に対するニューラルネットワーク近似動的計画法
Authors: Arash Dehghan and Mucahit Cevik and Merve Bodur
Abstract要約: 我々は,集中倉庫における宅配業者への注文のマッチングと送達を含む超高速オーダーディスパッチ問題(ODP)に焦点を当てる。我々は、より現実的な操作表現を提供し、納品効率を向上させるために、注文ポリシーや明示的なクーリエ割り当てなどの超高速ODPに重要な拡張を導入する。我々は,ODPに適した4つの異なる現実的データセットを用いて提案手法を検証し,NeurADPの性能を筋電図およびDRLベースラインと比較した。
参考スコア（独自算出の注目度）: 1.519321208145928
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Same-Day Delivery (SDD) services aim to maximize the fulfillment of online orders while minimizing delivery delays but are beset by operational uncertainties such as those in order volumes and courier planning. Our work aims to enhance the operational efficiency of SDD by focusing on the ultra-fast Order Dispatching Problem (ODP), which involves matching and dispatching orders to couriers within a centralized warehouse setting, and completing the delivery within a strict timeline (e.g., within minutes). We introduce important extensions to ultra-fast ODP such as order batching and explicit courier assignments to provide a more realistic representation of dispatching operations and improve delivery efficiency. As a solution method, we primarily focus on NeurADP, a methodology that combines Approximate Dynamic Programming (ADP) and Deep Reinforcement Learning (DRL), and our work constitutes the first application of NeurADP outside of the ride-pool matching problem. NeurADP is particularly suitable for ultra-fast ODP as it addresses complex one-to-many matching and routing intricacies through a neural network-based VFA that captures high-dimensional problem dynamics without requiring manual feature engineering as in generic ADP methods. We test our proposed approach using four distinct realistic datasets tailored for ODP and compare the performance of NeurADP against myopic and DRL baselines by also making use of non-trivial bounds to assess the quality of the policies. Our numerical results indicate that the inclusion of order batching and courier queues enhances the efficiency of delivery operations and that NeurADP significantly outperforms other methods. Detailed sensitivity analysis with important parameters confirms the robustness of NeurADP under different scenarios, including variations in courier numbers, spatial setup, vehicle capacity, and permitted delay time.
Abstract（参考訳）: 同日配達(SDD)サービスは、配送遅延を最小限にしつつ、オンライン注文の履行を最大化することを目的としている。本研究の目的は,集中型倉庫環境下での宅配業者への注文のマッチングとディスパッチを行い,厳格なスケジュール(例えば数分以内)で配送を完了する超高速注文派遣問題(ODP)に焦点を当て,SDDの運用効率を向上させることである。オーダバッチや明示的なクーリエ割り当てといった超高速 odp への重要な拡張を導入し,ディスパッチ操作をよりリアルに表現し,デリバリ効率を向上させる。解法として、我々は主にADP(Approximate Dynamic Programming)とDRL(Deep Reinforcement Learning)を組み合わせた方法論であるNeurADPに焦点をあてる。 NeurADPは、ニューラルネットワークベースのVFAを通して複雑な一対多のマッチングとルーティングの複雑さに対処するため、特に超高速なODPに適している。我々は,ODPに適した4つの異なる現実的データセットを用いて提案手法を検証し,NeurADPの性能を筋電図やDRLベースラインと比較した。以上の結果から,注文バッチ処理やクーリエキューの導入により,配送作業の効率が向上し,NeurADPが他の手法よりも優れていたことが示唆された。重要なパラメータを用いた詳細な感度解析により、クーリエ数、空間設定、車両容量、許容遅延時間などの異なるシナリオ下でのNeurADPの堅牢性を確認する。

関連論文リスト

Learning to Solve the Min-Max Mixed-Shelves Picker-Routing Problem via Hierarchical and Parallel Decoding [0.3867363075280544]
混合棚ピッカールーティング問題(MSPRP)はロジスティクスにおける基本的な課題であり、ピッカーはSKUを効率的に回収するために混合棚環境をナビゲートする必要がある。マルチエージェント強化学習により,MSPRPのmin-max変異を解くための新しい階層的並列デコーディング手法を提案する。実験では、特に大規模およびアウト・オブ・ディストリビューションインスタンスにおいて、ソリューションの品質と推論速度の両方で最先端のパフォーマンスを示す。
論文参考訳（メタデータ） (2025-02-14T15:42:30Z)
Dependency-Aware CAV Task Scheduling via Diffusion-Based Reinforcement Learning [12.504232513881828]
動的無人航空機支援型コネクテッド自動運転車(CAV)のための新しい依存性を考慮したタスクスケジューリング手法を提案する。平均タスク完了時間を最小化することを目的として,共同スケジューリング優先度とサブタスク割り当て最適化問題を定式化する。本稿では,Synthetic DDQNをベースとしたSubtasks Schedulingという拡散型強化学習アルゴリズムを提案する。
論文参考訳（メタデータ） (2024-11-27T11:07:31Z)
SCoTT: Wireless-Aware Path Planning with Vision Language Models and Strategic Chains-of-Thought [78.53885607559958]
複雑な無線環境における経路計画を実現するために,視覚言語モデル(VLM)を用いた新しい手法を提案する。この目的のために、実世界の無線レイトレーシングデータを用いたデジタルツインからの洞察を探索する。その結果, SCoTT はDP-WA* と比較して非常に近い平均経路ゲインを実現し, 同時に一貫した経路長が得られることがわかった。
論文参考訳（メタデータ） (2024-11-27T10:45:49Z)
Online Parallel Multi-Task Relationship Learning via Alternating Direction Method of Multipliers [37.859185005986056]
オンラインマルチタスク学習(OMTL)は、複数のタスク間の固有の関係を活用することで、ストリーミングデータ処理を強化する。本研究では、分散コンピューティング環境に適した最近の最適化である交互方向乗算器法(ADMM)に基づく新しいOMTLフレームワークを提案する。
論文参考訳（メタデータ） (2024-11-09T10:20:13Z)
Denoising Pre-Training and Customized Prompt Learning for Efficient Multi-Behavior Sequential Recommendation [69.60321475454843]
マルチビヘイビアシークエンシャルレコメンデーションに適した,最初の事前学習および迅速な学習パラダイムであるDPCPLを提案する。事前学習段階において,複数の時間スケールでノイズを除去する新しい行動マイナ (EBM) を提案する。次に,提案するCustomized Prompt Learning (CPL)モジュールを用いて,事前学習したモデルを高効率にチューニングすることを提案する。
論文参考訳（メタデータ） (2024-08-21T06:48:38Z)
Deep Reinforcement Learning for Dynamic Order Picking in Warehouse Operations [0.6116681488656472]
本研究は動的順序決定問題に対処する。固定順序集合を仮定する伝統的な手法は、この動的環境において不足する。顧客の要求に固有の不確実性を扱うためのソリューション手法として,Deep Reinforcement Learning (DRL) を利用する。
論文参考訳（メタデータ） (2024-08-03T03:56:46Z)
Sparser is Faster and Less is More: Efficient Sparse Attention for Long-Range Transformers [58.5711048151424]
SPARSEK Attention(SPARSEK Attention)は、計算およびメモリ障害を克服するために設計された、新しいスパースアテンション機構である。提案手法では,各クエリに対して一定数のKVペアを選択するために,スコアリングネットワークと差別化可能なトップkマスク演算子であるSPARSEKを統合する。実験結果から,SPARSEK注意は従来のスパースアテンション法よりも優れていた。
論文参考訳（メタデータ） (2024-06-24T15:55:59Z)
Harvesting Efficient On-Demand Order Pooling from Skilled Couriers: Enhancing Graph Representation Learning for Refining Real-time Many-to-One Assignments [11.0829498096027]
オンデマンドフードデリバリー(OFD)サービスでは、注文後数十分以内に配送のフルフィルメントを提供する。 OFDでは、リアルタイムの順序割り当てで同時配信のために複数の順序をプールすることは、重要な効率源である。オーダー割り当ての複雑さとリアルタイムの性質は、広範囲な計算を非現実的にし、オーダー統合の可能性を大幅に制限する。 SC配信ネットワーク(SC Delivery Network, SCDN)は、OFDに適した非均一なネットワーク埋め込みを改良した手法に基づいて構築される。
論文参考訳（メタデータ） (2024-06-20T18:03:27Z)
An Efficient Learning-based Solver Comparable to Metaheuristics for the Capacitated Arc Routing Problem [67.92544792239086]
我々は,高度メタヒューリスティックスとのギャップを著しく狭めるため,NNベースの解法を導入する。まず,方向対応型注意モデル(DaAM)を提案する。第2に、教師付き事前学習を伴い、堅牢な初期方針を確立するための教師付き強化学習スキームを設計する。
論文参考訳（メタデータ） (2024-03-11T02:17:42Z)
Distribution-Aware Continual Test-Time Adaptation for Semantic Segmentation [33.75630514826721]
実世界の応用において, セマンティックセグメンテーションCTTAを効率的かつ実用的なものにするための分散対応チューニング(DAT)手法を提案する。 DATは、連続的な適応プロセス中にデータ分布に基づいて、トレーニング可能なパラメータの2つの小さなグループを適応的に選択し、更新する。我々は2つの広く使われているセマンティックセマンティックセマンティクスCTTAベンチマークで実験を行い、従来の最先端手法と比較して有望な性能を実現した。
論文参考訳（メタデータ） (2023-09-24T10:48:20Z)
A Multi-Head Ensemble Multi-Task Learning Approach for Dynamical Computation Offloading [62.34538208323411]
共有バックボーンと複数の予測ヘッド(PH)を組み合わせたマルチヘッドマルチタスク学習(MEMTL)手法を提案する。 MEMTLは、追加のトレーニングデータを必要とせず、推測精度と平均平方誤差の両方でベンチマーク手法より優れている。
論文参考訳（メタデータ） (2023-09-02T11:01:16Z)
Gradient Sparsification for Efficient Wireless Federated Learning with Differential Privacy [25.763777765222358]
フェデレートラーニング(FL)により、分散クライアントは、生データを互いに共有することなく、機械学習モデルを協調的にトレーニングできる。モデルのサイズが大きくなるにつれて、送信帯域の制限によるトレーニングのレイテンシが低下し、個人情報が劣化すると同時に、差分プライバシ(DP)保護を使用する。我々は、収束性能を犠牲にすることなく、トレーニング効率を向上させるために、FLフレームワーク無線チャネルのスペース化を提案する。
論文参考訳（メタデータ） (2023-04-09T05:21:15Z)
Neural Stochastic Dual Dynamic Programming [99.80617899593526]
我々は、問題インスタンスを断片的線形値関数にマッピングすることを学ぶトレーニング可能なニューラルモデルを導入する。 $nu$-SDDPは、ソリューションの品質を犠牲にすることなく、問題解決コストを大幅に削減できる。
論文参考訳（メタデータ） (2021-12-01T22:55:23Z)
Optimization-driven Deep Reinforcement Learning for Robust Beamforming in IRS-assisted Wireless Communications [54.610318402371185]
Intelligent Reflecting Surface (IRS)は、マルチアンテナアクセスポイント(AP)から受信機へのダウンリンク情報伝達を支援する有望な技術である。我々は、APのアクティブビームフォーミングとIRSのパッシブビームフォーミングを共同最適化することで、APの送信電力を最小化する。過去の経験からビームフォーミング戦略に適応できる深層強化学習(DRL)手法を提案する。
論文参考訳（メタデータ） (2020-05-25T01:42:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。