論文の概要: A Deep Reinforcement Learning Approach for the Meal Delivery Problem
- arxiv url: http://arxiv.org/abs/2104.12000v1
- Date: Sat, 24 Apr 2021 19:01:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-27 14:53:05.560823
- Title: A Deep Reinforcement Learning Approach for the Meal Delivery Problem
- Title(参考訳): 食事配送問題に対する深層強化学習アプローチ
- Authors: Hadi Jahanshahi, Aysun Bozanta, Mucahit Cevik, Eray Mert Kavuk,
Ay\c{s}e Tosun, Sibel B. Sonuc, Bilgin Kosucu, Ay\c{s}e Ba\c{s}ar
- Abstract要約: 一日に一組の宅配業者に与えられた動的顧客要求を満たす食事配達サービスについて検討する。
私たちはこのサービスをマルコフ決定プロセスとしてモデル化し、ソリューションアプローチとして深層強化学習を使用します。
本研究は,ある日に異なる順序周波数のクーリエの割り当てプロセスと最適なクーリエ数の両方について有意な知見を与える。
- 参考スコア(独自算出の注目度): 1.5391321019692434
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider a meal delivery service fulfilling dynamic customer requests
given a set of couriers over the course of a day. A courier's duty is to
pick-up an order from a restaurant and deliver it to a customer. We model this
service as a Markov decision process and use deep reinforcement learning as the
solution approach. We experiment with the resulting policies on synthetic and
real-world datasets and compare those with the baseline policies. We also
examine the courier utilization for different numbers of couriers. In our
analysis, we specifically focus on the impact of the limited available
resources in the meal delivery problem. Furthermore, we investigate the effect
of intelligent order rejection and re-positioning of the couriers. Our
numerical experiments show that, by incorporating the geographical locations of
the restaurants, customers, and the depot, our model significantly improves the
overall service quality as characterized by the expected total reward and the
delivery times. Our results present valuable insights on both the courier
assignment process and the optimal number of couriers for different order
frequencies on a given day. The proposed model also shows a robust performance
under a variety of scenarios for real-world implementation.
- Abstract(参考訳): 一日に一組の宅配業者に与えられた動的顧客要求を満たす食事配達サービスについて検討する。
宅配業者の義務は、レストランから注文を受け取り、顧客に届けることである。
私たちはこのサービスをマルコフ決定プロセスとしてモデル化し、ソリューションアプローチとして深層強化学習を使用します。
合成および実世界のデータセットに対する結果のポリシーを実験し、ベースラインポリシーと比較する。
また,異なる数のクーリエの利用状況についても検討した。
本分析では,食事提供問題における限られた資源の影響に着目した。
さらに,インテリジェントな注文拒否と配送業者の再配置の効果について検討した。
数値実験により,飲食店,顧客,デポの地理的位置を組み込むことにより,期待される総報酬と配送時間によって特徴付けられる総合的なサービス品質が大幅に向上することを示した。
本研究は,ある日に異なる順序周波数のクーリエの割り当てプロセスと最適なクーリエ数の両方について有意な知見を与える。
提案モデルはまた,実世界の実装における様々なシナリオ下での堅牢な性能を示す。
関連論文リスト
- CoPS: Empowering LLM Agents with Provable Cross-Task Experience Sharing [70.25689961697523]
クロスタスク体験の共有と選択によるシーケンシャル推論を強化する一般化可能なアルゴリズムを提案する。
我々の研究は、既存のシーケンシャルな推論パラダイムのギャップを埋め、タスク間体験の活用の有効性を検証する。
論文 参考訳(メタデータ) (2024-10-22T03:59:53Z) - Dynamic Demand Management for Parcel Lockers [0.0]
本研究では,逐次決定分析と強化学習に根ざしたアルゴリズム手法を編成するソリューションフレームワークを開発する。
これらのテクニックを組み合わせるための革新的なアプローチは、この2つの意思決定タイプ間の強い相互関係に対処する上で有効です。
本手法は筋電図のベンチマークを13.7%上回り、業界に触発された政策を12.6%上回る結果となった。
論文 参考訳(メタデータ) (2024-09-08T11:38:48Z) - The Restaurant Meal Delivery Problem with Ghost Kitchens [0.0]
「ゴーストキッチン」では、中央コンプレックスに数軒のレストランを同調した料理が提案されている。
ゴーストキッチンを効果的に運用するための運用戦略を提案する。
本研究は,料理スケジューリングと派遣車両の統合最適化と,今後の需要と意思決定の予測の両方が,事業の成功に不可欠であることを示す。
論文 参考訳(メタデータ) (2024-08-14T09:54:03Z) - Towards Fairness in Online Service with k Servers and its Application on
Fair Food Delivery [6.729646573556134]
我々は k-FOOD 問題という仮定を使わずに k- の現実的な一般化を導入する。
k-FOOD問題は、フードデリバリー、ライドシェアリング、クイックコマースなど、さまざまな現実世界のユースケースをモデル化する汎用性を提供する。
オンラインプラットフォームにおける公平性の必要性に感銘を受けて、最大値の目的を持つFAIR k-FOOD問題を導入する。
論文 参考訳(メタデータ) (2023-12-18T15:22:03Z) - Algorithmic Persuasion Through Simulation [51.23082754429737]
本研究では,受取人に製品購入などの二元的行動を取るよう説得するベイズ説得ゲームについて検討する。
送信者は、製品の品質が高いか低いかなどの世界の(バイナリ)状態について通知されるが、受信者の信念やユーティリティに関する情報は限られている。
顧客の調査やユーザスタディ、最近のAIの進歩によって動機づけられた私たちは、受信者の振る舞いをシミュレートする託宣をクエリすることで、送信側が受信者についてより深く学ぶことを可能にする。
論文 参考訳(メタデータ) (2023-11-29T23:01:33Z) - Beyond Greedy Search: Tracking by Multi-Agent Reinforcement
Learning-based Beam Search [103.53249725360286]
既存のトラッカーは通常、フレーム毎のトラッキング結果として最大スコアの場所または提案を選択する。
本稿では,この問題に対処するために,新しいマルチエージェント強化学習に基づくビームサーチ戦略(BeamTracking と呼ばれる)を提案する。
論文 参考訳(メタデータ) (2022-05-19T16:35:36Z) - Approaching sales forecasting using recurrent neural networks and
transformers [57.43518732385863]
深層学習技術を用いて,日・店・店レベルでの顧客販売予測問題に対処する3つの方法を開発した。
実験結果から,データ前処理を最小限に抑えた単純なシーケンスアーキテクチャを用いて,優れた性能を実現することができることを示す。
提案した解は約0.54の RMSLE を達成し、Kaggle コンペティションで提案された問題に対する他のより具体的な解と競合する。
論文 参考訳(メタデータ) (2022-04-16T12:03:52Z) - Delivery Issues Identification from Customer Feedback Data [0.0]
本稿では、テキストコメントやアップロードされた画像から顧客からのフィードバックを用いて、これらの問題を見つける方法を示す。
テキストモデルとイメージモデルの両方でトランスファーラーニングを使用して、数千のラベル付きサンプルの需要を最小限にしました。
論文 参考訳(メタデータ) (2021-12-26T12:41:10Z) - Information Directed Reward Learning for Reinforcement Learning [64.33774245655401]
我々は、標準rlアルゴリズムが可能な限り少数の専門家クエリで高い期待値を達成することができる報酬関数のモデルを学ぶ。
特定のタイプのクエリ用に設計された以前のアクティブな報酬学習方法とは対照的に、IDRLは自然に異なるクエリタイプに対応します。
我々は,複数の環境における広範囲な評価と,異なるタイプのクエリでこの結果を支持する。
論文 参考訳(メタデータ) (2021-02-24T18:46:42Z) - Fully-Automated Packaging Structure Recognition in Logistics
Environments [60.56493342808093]
包装構造認識の完全自動化手法を提案する。
我々のアルゴリズムは深層学習モデルに基づいており、より正確に畳み込みニューラルネットワークを用いて画像のセグメント化を行う。
テストケースの約85%でパッケージ構造を正しく認識することができ、さらに一般的なパッケージタイプに注目する場合(91%)にさらに多くのパッケージ構造を認識できることを示す。
論文 参考訳(メタデータ) (2020-08-11T10:57:23Z) - Same-Day Delivery with Fairness [5.904739807133708]
2016年、一部のマイノリティ地区はアマゾンの同日配達(SDD)サービスを受け取れなかった。
本稿では,顧客に対して公正なSDDサービスを提供することの問題点について考察する。
我々は、レートから実際のサービスへの学習の新たな変換を導入し、安定的で効率的な学習プロセスを創出する。
論文 参考訳(メタデータ) (2020-07-19T00:25:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。