Fugu-MT 論文翻訳(概要): A Deep Reinforcement Learning Approach for the Meal Delivery Problem

論文の概要: A Deep Reinforcement Learning Approach for the Meal Delivery Problem

arxiv url: http://arxiv.org/abs/2104.12000v1
Date: Sat, 24 Apr 2021 19:01:59 GMT
ステータス: 翻訳完了
システム内更新日: 2021-04-27 14:53:05.560823
Title: A Deep Reinforcement Learning Approach for the Meal Delivery Problem
Title（参考訳）: 食事配送問題に対する深層強化学習アプローチ
Authors: Hadi Jahanshahi, Aysun Bozanta, Mucahit Cevik, Eray Mert Kavuk, Ay\c{s}e Tosun, Sibel B. Sonuc, Bilgin Kosucu, Ay\c{s}e Ba\c{s}ar
Abstract要約: 一日に一組の宅配業者に与えられた動的顧客要求を満たす食事配達サービスについて検討する。私たちはこのサービスをマルコフ決定プロセスとしてモデル化し、ソリューションアプローチとして深層強化学習を使用します。本研究は,ある日に異なる順序周波数のクーリエの割り当てプロセスと最適なクーリエ数の両方について有意な知見を与える。
参考スコア（独自算出の注目度）: 1.5391321019692434
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We consider a meal delivery service fulfilling dynamic customer requests given a set of couriers over the course of a day. A courier's duty is to pick-up an order from a restaurant and deliver it to a customer. We model this service as a Markov decision process and use deep reinforcement learning as the solution approach. We experiment with the resulting policies on synthetic and real-world datasets and compare those with the baseline policies. We also examine the courier utilization for different numbers of couriers. In our analysis, we specifically focus on the impact of the limited available resources in the meal delivery problem. Furthermore, we investigate the effect of intelligent order rejection and re-positioning of the couriers. Our numerical experiments show that, by incorporating the geographical locations of the restaurants, customers, and the depot, our model significantly improves the overall service quality as characterized by the expected total reward and the delivery times. Our results present valuable insights on both the courier assignment process and the optimal number of couriers for different order frequencies on a given day. The proposed model also shows a robust performance under a variety of scenarios for real-world implementation.
Abstract（参考訳）: 一日に一組の宅配業者に与えられた動的顧客要求を満たす食事配達サービスについて検討する。宅配業者の義務は、レストランから注文を受け取り、顧客に届けることである。私たちはこのサービスをマルコフ決定プロセスとしてモデル化し、ソリューションアプローチとして深層強化学習を使用します。合成および実世界のデータセットに対する結果のポリシーを実験し、ベースラインポリシーと比較する。また,異なる数のクーリエの利用状況についても検討した。本分析では,食事提供問題における限られた資源の影響に着目した。さらに,インテリジェントな注文拒否と配送業者の再配置の効果について検討した。数値実験により,飲食店,顧客,デポの地理的位置を組み込むことにより,期待される総報酬と配送時間によって特徴付けられる総合的なサービス品質が大幅に向上することを示した。本研究は,ある日に異なる順序周波数のクーリエの割り当てプロセスと最適なクーリエ数の両方について有意な知見を与える。提案モデルはまた,実世界の実装における様々なシナリオ下での堅牢な性能を示す。

関連論文リスト

How to Peel with a Knife: Aligning Fine-Grained Manipulation with Human Preference [73.16380468921543]
ナイフを用いた剥離を例として,本質的な操作作業のための学習フレームワークを提案する。本システムは,キュウリ,リンゴ,ジャガイモなどの難産品の平均成功率を90%以上達成する。注目すべきは、単一の生産カテゴリで訓練されたポリシーは、カテゴリー内のインスタンスが見えないように、強いゼロショットの一般化を示すことである。
論文参考訳（メタデータ） (2026-03-03T18:59:32Z)
Stochastic Encodings for Active Feature Acquisition [100.47043816019888]
Active Feature Acquisitionは、インスタンスワイドでシーケンシャルな意思決定問題である。目的は、テストインスタンスごとに独立して、現在の観測に基づいて計測する機能を動的に選択することである。一般的なアプローチは強化学習(Reinforcement Learning)であり、トレーニングの困難を経験する。我々は、教師付きで訓練された潜在変数モデルを導入し、潜在空間における観測不能な実現の可能性の多くにまたがる特徴を推論することで獲得する。
論文参考訳（メタデータ） (2025-08-03T23:48:46Z)
MRGRP: Empowering Courier Route Prediction in Food Delivery Service with Multi-Relational Graph [13.815669295898136]
インスタントフードデリバリーは、日常生活の利便性から、世界で最も人気のあるウェブサービスの一つとなっている。基本的な課題は、タスクディスパッチを最適化し、デリバリ効率を向上させるために、courierルートを正確に予測することである。本稿では, 高精度な予測のためのコーリエ決定に影響を及ぼすタスク間の微粒な相関関係をモデル化する, マルチリレーショナルグラフベース経路予測法を提案する。
論文参考訳（メタデータ） (2025-05-17T13:19:34Z)
Learning to Estimate Package Delivery Time in Mixed Imbalanced Delivery and Pickup Logistics Services [12.270567592483888]
トランスフォーマーベースのマルチタスクパッケージ配信時間予測モデルであるTransPDTを提案する。 TransPDTをベースとしたシステムはJD Logisticsの内部に展開され、北京で毎日数十万のパッケージを扱う2000以上の宅配業者を追跡している。
論文参考訳（メタデータ） (2025-05-01T08:00:22Z)
Real-Time Integrated Dispatching and Idle Fleet Steering with Deep Reinforcement Learning for A Meal Delivery Platform [0.0]
本研究は,食事提供プラットフォームにおけるリアルタイム注文派遣とアイドルクーリエステアリングの問題を解決することを目的としている。強化学習(RL)に基づく戦略的二重制御フレームワークを提案する。宅配業者間での配送効率と作業負荷分布の公平性が改善されている。
論文参考訳（メタデータ） (2025-01-10T09:15:40Z)
CoPS: Empowering LLM Agents with Provable Cross-Task Experience Sharing [70.25689961697523]
クロスタスク体験の共有と選択によるシーケンシャル推論を強化する一般化可能なアルゴリズムを提案する。我々の研究は、既存のシーケンシャルな推論パラダイムのギャップを埋め、タスク間体験の活用の有効性を検証する。
論文参考訳（メタデータ） (2024-10-22T03:59:53Z)
Dynamic Demand Management for Parcel Lockers [0.0]
本研究では,逐次決定分析と強化学習に根ざしたアルゴリズム手法を編成するソリューションフレームワークを開発する。これらのテクニックを組み合わせるための革新的なアプローチは、この2つの意思決定タイプ間の強い相互関係に対処する上で有効です。本手法は筋電図のベンチマークを13.7%上回り、業界に触発された政策を12.6%上回る結果となった。
論文参考訳（メタデータ） (2024-09-08T11:38:48Z)
The Restaurant Meal Delivery Problem with Ghost Kitchens [0.0]
「ゴーストキッチン」では、中央コンプレックスに数軒のレストランを同調した料理が提案されている。ゴーストキッチンを効果的に運用するための運用戦略を提案する。本研究は,料理スケジューリングと派遣車両の統合最適化と,今後の需要と意思決定の予測の両方が,事業の成功に不可欠であることを示す。
論文参考訳（メタデータ） (2024-08-14T09:54:03Z)
Towards Fairness in Online Service with k Servers and its Application on Fair Food Delivery [6.729646573556134]
我々は k-FOOD 問題という仮定を使わずに k- の現実的な一般化を導入する。 k-FOOD問題は、フードデリバリー、ライドシェアリング、クイックコマースなど、さまざまな現実世界のユースケースをモデル化する汎用性を提供する。オンラインプラットフォームにおける公平性の必要性に感銘を受けて、最大値の目的を持つFAIR k-FOOD問題を導入する。
論文参考訳（メタデータ） (2023-12-18T15:22:03Z)
Algorithmic Persuasion Through Simulation [51.23082754429737]
本研究では,受取人に製品購入などの二元的行動を取るよう説得するベイズ説得ゲームについて検討する。送信者は、製品の品質が高いか低いかなどの世界の(バイナリ)状態について通知されるが、受信者の信念やユーティリティに関する情報は限られている。顧客の調査やユーザスタディ、最近のAIの進歩によって動機づけられた私たちは、受信者の振る舞いをシミュレートする託宣をクエリすることで、送信側が受信者についてより深く学ぶことを可能にする。
論文参考訳（メタデータ） (2023-11-29T23:01:33Z)
Beyond Greedy Search: Tracking by Multi-Agent Reinforcement Learning-based Beam Search [103.53249725360286]
既存のトラッカーは通常、フレーム毎のトラッキング結果として最大スコアの場所または提案を選択する。本稿では,この問題に対処するために,新しいマルチエージェント強化学習に基づくビームサーチ戦略(BeamTracking と呼ばれる)を提案する。
論文参考訳（メタデータ） (2022-05-19T16:35:36Z)
Approaching sales forecasting using recurrent neural networks and transformers [57.43518732385863]
深層学習技術を用いて,日・店・店レベルでの顧客販売予測問題に対処する3つの方法を開発した。実験結果から,データ前処理を最小限に抑えた単純なシーケンスアーキテクチャを用いて,優れた性能を実現することができることを示す。提案した解は約0.54の RMSLE を達成し、Kaggle コンペティションで提案された問題に対する他のより具体的な解と競合する。
論文参考訳（メタデータ） (2022-04-16T12:03:52Z)
Delivery Issues Identification from Customer Feedback Data [0.0]
本稿では、テキストコメントやアップロードされた画像から顧客からのフィードバックを用いて、これらの問題を見つける方法を示す。テキストモデルとイメージモデルの両方でトランスファーラーニングを使用して、数千のラベル付きサンプルの需要を最小限にしました。
論文参考訳（メタデータ） (2021-12-26T12:41:10Z)
Information Directed Reward Learning for Reinforcement Learning [64.33774245655401]
我々は、標準rlアルゴリズムが可能な限り少数の専門家クエリで高い期待値を達成することができる報酬関数のモデルを学ぶ。特定のタイプのクエリ用に設計された以前のアクティブな報酬学習方法とは対照的に、IDRLは自然に異なるクエリタイプに対応します。我々は,複数の環境における広範囲な評価と,異なるタイプのクエリでこの結果を支持する。
論文参考訳（メタデータ） (2021-02-24T18:46:42Z)
Fully-Automated Packaging Structure Recognition in Logistics Environments [60.56493342808093]
包装構造認識の完全自動化手法を提案する。我々のアルゴリズムは深層学習モデルに基づいており、より正確に畳み込みニューラルネットワークを用いて画像のセグメント化を行う。テストケースの約85%でパッケージ構造を正しく認識することができ、さらに一般的なパッケージタイプに注目する場合(91%)にさらに多くのパッケージ構造を認識できることを示す。
論文参考訳（メタデータ） (2020-08-11T10:57:23Z)
Same-Day Delivery with Fairness [5.904739807133708]
2016年、一部のマイノリティ地区はアマゾンの同日配達(SDD)サービスを受け取れなかった。本稿では,顧客に対して公正なSDDサービスを提供することの問題点について考察する。我々は、レートから実際のサービスへの学習の新たな変換を導入し、安定的で効率的な学習プロセスを創出する。
論文参考訳（メタデータ） (2020-07-19T00:25:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。