論文の概要: A Deep Reinforcement Learning Approach for the Meal Delivery Problem
- arxiv url: http://arxiv.org/abs/2104.12000v1
- Date: Sat, 24 Apr 2021 19:01:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-27 14:53:05.560823
- Title: A Deep Reinforcement Learning Approach for the Meal Delivery Problem
- Title(参考訳): 食事配送問題に対する深層強化学習アプローチ
- Authors: Hadi Jahanshahi, Aysun Bozanta, Mucahit Cevik, Eray Mert Kavuk,
Ay\c{s}e Tosun, Sibel B. Sonuc, Bilgin Kosucu, Ay\c{s}e Ba\c{s}ar
- Abstract要約: 一日に一組の宅配業者に与えられた動的顧客要求を満たす食事配達サービスについて検討する。
私たちはこのサービスをマルコフ決定プロセスとしてモデル化し、ソリューションアプローチとして深層強化学習を使用します。
本研究は,ある日に異なる順序周波数のクーリエの割り当てプロセスと最適なクーリエ数の両方について有意な知見を与える。
- 参考スコア(独自算出の注目度): 1.5391321019692434
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider a meal delivery service fulfilling dynamic customer requests
given a set of couriers over the course of a day. A courier's duty is to
pick-up an order from a restaurant and deliver it to a customer. We model this
service as a Markov decision process and use deep reinforcement learning as the
solution approach. We experiment with the resulting policies on synthetic and
real-world datasets and compare those with the baseline policies. We also
examine the courier utilization for different numbers of couriers. In our
analysis, we specifically focus on the impact of the limited available
resources in the meal delivery problem. Furthermore, we investigate the effect
of intelligent order rejection and re-positioning of the couriers. Our
numerical experiments show that, by incorporating the geographical locations of
the restaurants, customers, and the depot, our model significantly improves the
overall service quality as characterized by the expected total reward and the
delivery times. Our results present valuable insights on both the courier
assignment process and the optimal number of couriers for different order
frequencies on a given day. The proposed model also shows a robust performance
under a variety of scenarios for real-world implementation.
- Abstract(参考訳): 一日に一組の宅配業者に与えられた動的顧客要求を満たす食事配達サービスについて検討する。
宅配業者の義務は、レストランから注文を受け取り、顧客に届けることである。
私たちはこのサービスをマルコフ決定プロセスとしてモデル化し、ソリューションアプローチとして深層強化学習を使用します。
合成および実世界のデータセットに対する結果のポリシーを実験し、ベースラインポリシーと比較する。
また,異なる数のクーリエの利用状況についても検討した。
本分析では,食事提供問題における限られた資源の影響に着目した。
さらに,インテリジェントな注文拒否と配送業者の再配置の効果について検討した。
数値実験により,飲食店,顧客,デポの地理的位置を組み込むことにより,期待される総報酬と配送時間によって特徴付けられる総合的なサービス品質が大幅に向上することを示した。
本研究は,ある日に異なる順序周波数のクーリエの割り当てプロセスと最適なクーリエ数の両方について有意な知見を与える。
提案モデルはまた,実世界の実装における様々なシナリオ下での堅牢な性能を示す。
関連論文リスト
- Fairness in Serving Large Language Models [47.79139320220292]
本稿では,処理された入出力トークンの数を考慮したコスト関数に基づくサービスフェアネスの定義を提案する。
本稿では,新たなスケジューリングアルゴリズムであるVirtual Counter Token (VTC)を提案する。
サービススケジューラの2倍の厳しい上限を証明し、作業保守の要件に準拠します。
論文 参考訳(メタデータ) (2023-12-31T21:15:54Z) - Towards Fairness in Online Service with k Servers and its Application on
Fair Food Delivery [6.729646573556134]
我々は k-FOOD 問題という仮定を使わずに k- の現実的な一般化を導入する。
k-FOOD問題は、フードデリバリー、ライドシェアリング、クイックコマースなど、さまざまな現実世界のユースケースをモデル化する汎用性を提供する。
オンラインプラットフォームにおける公平性の必要性に感銘を受けて、最大値の目的を持つFAIR k-FOOD問題を導入する。
論文 参考訳(メタデータ) (2023-12-18T15:22:03Z) - Algorithmic Persuasion Through Simulation [54.96278605678665]
本研究では,受信側が受信側を説得し,二元的行動を起こそうとするベイズ的説得問題について考察する。
顧客調査やユーザスタディ、最近のジェネレーティブAIの進歩に動機付けられ、送信側は受信者についてより深く学ぶことができる。
論文 参考訳(メタデータ) (2023-11-29T23:01:33Z) - Learning Dynamic Selection and Pricing of Out-of-Home Deliveries [1.3812010983144802]
宅配の失敗、交通渋滞、そして比較的大きな処理時間は、ラストマイル・ロジスティクスの収益性に悪影響を及ぼす。
本稿では、畳み込みニューラルネットワークへの入力として、新しい時空間状態符号化を用いたアルゴリズムパイプラインであるOOH(DSPO)の動的選択と価格設定を提案する。
実世界のデータによって導かれた我々の広範な数値研究により、DSPOはOOH位置のない状況と比較して20.8%のコストを節約できることが明らかとなった。
論文 参考訳(メタデータ) (2023-11-23T12:55:10Z) - Beyond Greedy Search: Tracking by Multi-Agent Reinforcement
Learning-based Beam Search [103.53249725360286]
既存のトラッカーは通常、フレーム毎のトラッキング結果として最大スコアの場所または提案を選択する。
本稿では,この問題に対処するために,新しいマルチエージェント強化学習に基づくビームサーチ戦略(BeamTracking と呼ばれる)を提案する。
論文 参考訳(メタデータ) (2022-05-19T16:35:36Z) - Approaching sales forecasting using recurrent neural networks and
transformers [57.43518732385863]
深層学習技術を用いて,日・店・店レベルでの顧客販売予測問題に対処する3つの方法を開発した。
実験結果から,データ前処理を最小限に抑えた単純なシーケンスアーキテクチャを用いて,優れた性能を実現することができることを示す。
提案した解は約0.54の RMSLE を達成し、Kaggle コンペティションで提案された問題に対する他のより具体的な解と競合する。
論文 参考訳(メタデータ) (2022-04-16T12:03:52Z) - Delivery Issues Identification from Customer Feedback Data [0.0]
本稿では、テキストコメントやアップロードされた画像から顧客からのフィードバックを用いて、これらの問題を見つける方法を示す。
テキストモデルとイメージモデルの両方でトランスファーラーニングを使用して、数千のラベル付きサンプルの需要を最小限にしました。
論文 参考訳(メタデータ) (2021-12-26T12:41:10Z) - A Deep Reinforcement Learning Approach for Constrained Online Logistics
Route Assignment [4.367543599338385]
物流業界にとって、各出荷区画に適切な物流ルートを割り当てる方法が不可欠である。
このオンライン経路割り当て問題は、制約付きオンライン意思決定問題とみなすことができる。
我々はPPO-RAと呼ばれるモデルフリーDRLアプローチを開発し、経路割当(RA)の課題に対処する専用の技術を用いてPPO(Pximal Policy Optimization)を改善した。
論文 参考訳(メタデータ) (2021-09-08T07:27:39Z) - Information Directed Reward Learning for Reinforcement Learning [64.33774245655401]
我々は、標準rlアルゴリズムが可能な限り少数の専門家クエリで高い期待値を達成することができる報酬関数のモデルを学ぶ。
特定のタイプのクエリ用に設計された以前のアクティブな報酬学習方法とは対照的に、IDRLは自然に異なるクエリタイプに対応します。
我々は,複数の環境における広範囲な評価と,異なるタイプのクエリでこの結果を支持する。
論文 参考訳(メタデータ) (2021-02-24T18:46:42Z) - Fully-Automated Packaging Structure Recognition in Logistics
Environments [60.56493342808093]
包装構造認識の完全自動化手法を提案する。
我々のアルゴリズムは深層学習モデルに基づいており、より正確に畳み込みニューラルネットワークを用いて画像のセグメント化を行う。
テストケースの約85%でパッケージ構造を正しく認識することができ、さらに一般的なパッケージタイプに注目する場合(91%)にさらに多くのパッケージ構造を認識できることを示す。
論文 参考訳(メタデータ) (2020-08-11T10:57:23Z) - Same-Day Delivery with Fairness [5.904739807133708]
2016年、一部のマイノリティ地区はアマゾンの同日配達(SDD)サービスを受け取れなかった。
本稿では,顧客に対して公正なSDDサービスを提供することの問題点について考察する。
我々は、レートから実際のサービスへの学習の新たな変換を導入し、安定的で効率的な学習プロセスを創出する。
論文 参考訳(メタデータ) (2020-07-19T00:25:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。