論文の概要: Learning to Minimize Cost-to-Serve for Multi-Node Multi-Product Order
Fulfilment in Electronic Commerce
- arxiv url: http://arxiv.org/abs/2112.08736v1
- Date: Thu, 16 Dec 2021 09:42:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-17 14:20:29.080416
- Title: Learning to Minimize Cost-to-Serve for Multi-Node Multi-Product Order
Fulfilment in Electronic Commerce
- Title(参考訳): 電子商取引における多ノード多製品注文受注の費用対効果最小化のための学習
- Authors: Pranavi Pathakota, Kunwar Zaid, Anulekha Dhara, Hardik Meisheri, Shaun
D Souza, Dheeraj Shah, Harshad Khadilkar
- Abstract要約: サプライチェーンの最も多くのノードから製品を提供するコストが重要な課題であることに気付きました。
大規模で高確率で地理的に広がるeコマースサプライチェーンは、慎重に設計されたデータ駆動意思決定アルゴリズムに理想的だ。
強化学習に基づくアルゴリズムは,これらのポリシーと競合し,実世界における効率的なスケールアップの可能性を示す。
- 参考スコア(独自算出の注目度): 3.3865605512957457
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We describe a novel decision-making problem developed in response to the
demands of retail electronic commerce (e-commerce). While working with
logistics and retail industry business collaborators, we found that the cost of
delivery of products from the most opportune node in the supply chain (a
quantity called the cost-to-serve or CTS) is a key challenge. The large scale,
high stochasticity, and large geographical spread of e-commerce supply chains
make this setting ideal for a carefully designed data-driven decision-making
algorithm. In this preliminary work, we focus on the specific subproblem of
delivering multiple products in arbitrary quantities from any warehouse to
multiple customers in each time period. We compare the relative performance and
computational efficiency of several baselines, including heuristics and
mixed-integer linear programming. We show that a reinforcement learning based
algorithm is competitive with these policies, with the potential of efficient
scale-up in the real world.
- Abstract(参考訳): 本稿では,小売電子商取引(eコマース)の需要に対応する新たな意思決定問題について述べる。
物流や小売業の協力者たちと協働しながら、サプライチェーンの最も急激なノード(コスト・トゥ・サーブ(CTS)と呼ばれる量)から製品を届けることのコストが重要な課題であることに気づきました。
eコマースサプライチェーンの大規模で、高い確率性、そして大きな地理的普及は、注意深く設計されたデータ駆動意思決定アルゴリズムにこの設定を理想化する。
この予備的な作業では、各期間に倉庫から複数の顧客へ任意の量で複数の製品を届ける、特定のサブプロブレムに焦点を当てる。
ヒューリスティックスや混合整数線形計画など,複数のベースラインの相対性能と計算効率を比較した。
強化学習に基づくアルゴリズムは,これらのポリシーと競合し,実世界の効率的なスケールアップの可能性を示す。
関連論文リスト
- A Primal-Dual Online Learning Approach for Dynamic Pricing of Sequentially Displayed Complementary Items under Sale Constraints [54.46126953873298]
顧客に対して順次表示される補完アイテムの動的価格設定の問題に対処する。
各項目の価格を個別に最適化するのは効果がないため、補完項目のコヒーレントな価格ポリシーが不可欠である。
実世界のデータからランダムに生成した合成設定を用いて,我々のアプローチを実証的に評価し,制約違反や後悔の観点からその性能を比較した。
論文 参考訳(メタデータ) (2024-07-08T09:55:31Z) - Deep Reinforcement Learning for Traveling Purchaser Problems [63.37136587778153]
旅行購入問題(TPP)は幅広いアプリケーションにおいて重要な最適化問題である。
本稿では,ルート構築と購入計画を個別に扱う,深層強化学習(DRL)に基づく新しいアプローチを提案する。
メタラーニング戦略を導入することで、大規模なTPPインスタンス上で安定してポリシーネットワークをトレーニングすることができる。
論文 参考訳(メタデータ) (2024-04-03T05:32:10Z) - Multi-Agent Learning of Efficient Fulfilment and Routing Strategies in
E-Commerce [11.421159751635667]
電子商取引における製品配送コストを最小化するための統合的アルゴリズムフレームワークを提案する。
電子商取引における大きな課題の1つは、複数の顧客からの時間的に多様な注文が大量にあることだ。
本稿では,グラフニューラルネットワークと強化学習を組み合わせたノード選択と車両エージェントの学習手法を提案する。
論文 参考訳(メタデータ) (2023-11-20T10:32:28Z) - Learning Multi-Agent Intention-Aware Communication for Optimal
Multi-Order Execution in Finance [96.73189436721465]
まず,現実的な制約を考慮したマルチオーダー実行のためのマルチエージェントRL(MARL)手法を提案する。
本稿では,学習可能なマルチラウンド通信プロトコルを提案する。
2つの実世界の市場のデータに関する実験では、優れたパフォーマンスを示し、コラボレーションの有効性が著しく向上した。
論文 参考訳(メタデータ) (2023-07-06T16:45:40Z) - No-Regret Learning in Two-Echelon Supply Chain with Unknown Demand
Distribution [48.27759561064771]
我々は[Cachon and Zipkin, 1999]で導入された2つのエケロンサプライチェーンモデルについて, 2つの異なる設定で検討する。
両設定の最適在庫決定に対する後悔と収束の両面において良好な保証を達成するアルゴリズムを設計する。
私たちのアルゴリズムは、オンライングラディエントDescentとOnline Newton Stepをベースとしています。
論文 参考訳(メタデータ) (2022-10-23T08:45:39Z) - ItemSage: Learning Product Embeddings for Shopping Recommendations at
Pinterest [60.841761065439414]
Pinterestでは、ItemSageと呼ばれるプロダクトの埋め込みセットを構築して、すべてのショッピングユースケースに適切なレコメンデーションを提供しています。
このアプローチによって、エンゲージメントとコンバージョンメトリクスが大幅に改善され、インフラストラクチャとメンテナンスコストの両方が削減された。
論文 参考訳(メタデータ) (2022-05-24T02:28:58Z) - Concepts and Algorithms for Agent-based Decentralized and Integrated
Scheduling of Production and Auxiliary Processes [78.120734120667]
本稿ではエージェントベースの分散型統合スケジューリング手法について述べる。
要求の一部は、線形にスケールする通信アーキテクチャを開発することである。
このアプローチは、工業的要件に基づいた例を使って説明されます。
論文 参考訳(メタデータ) (2022-05-06T18:44:29Z) - Comparing Deep Reinforcement Learning Algorithms in Two-Echelon Supply
Chains [1.4685355149711299]
我々は、サプライチェーン在庫管理問題を解決するための最先端の深層強化学習アルゴリズムの性能を分析し、比較する。
本研究では,サプライチェーンの在庫管理問題を解決するためのカスタマイズ可能な環境を提供するオープンソースソフトウェアライブラリの設計と開発について,詳細な知見を提供する。
論文 参考訳(メタデータ) (2022-04-20T16:33:01Z) - A Deep Reinforcement Learning Approach for Constrained Online Logistics
Route Assignment [4.367543599338385]
物流業界にとって、各出荷区画に適切な物流ルートを割り当てる方法が不可欠である。
このオンライン経路割り当て問題は、制約付きオンライン意思決定問題とみなすことができる。
我々はPPO-RAと呼ばれるモデルフリーDRLアプローチを開発し、経路割当(RA)の課題に対処する専用の技術を用いてPPO(Pximal Policy Optimization)を改善した。
論文 参考訳(メタデータ) (2021-09-08T07:27:39Z) - Mathematical simulation of package delivery optimization using a
combination of carriers [0.0]
著者らは、世界中のサプライヤーやローカルキャリアが配送する経路を組み合わせて、長距離配送のためのパッケージ配送のコスト最適化の問題を分析して提案した。
実験は、幅広いキャリアをデリバリーサービスに使用している米国企業のデータソースに基づいている。
論文 参考訳(メタデータ) (2020-11-02T18:44:04Z) - Reinforcement Learning for Multi-Product Multi-Node Inventory Management
in Supply Chains [17.260459603456745]
本稿では,サプライチェーンにおける多製品在庫管理への強化学習(RL)の適用について述べる。
実験の結果,提案手法は製品販売の最大化と商品の無駄を最小化する多目的報酬を処理可能であることが示された。
論文 参考訳(メタデータ) (2020-06-07T04:02:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。