論文の概要: Can Machine Learning Help in Solving Cargo Capacity Management Booking
Control Problems?
- arxiv url: http://arxiv.org/abs/2102.00092v1
- Date: Fri, 29 Jan 2021 22:11:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-05 00:24:51.113599
- Title: Can Machine Learning Help in Solving Cargo Capacity Management Booking
Control Problems?
- Title(参考訳): カーゴ容量管理予約制御問題の解決に機械学習は役立つか?
- Authors: Justin Dumouchelle, Emma Frejinger, Andrea Lodi
- Abstract要約: 我々は,旅客機よりも文学にはあまり注目されていない貨物の容量管理に重点を置いている。
この問題を有限水平動的プログラムとして定式化する。
我々は,教師付き学習を用いて,車両経路問題に対する解コストの予測者を訓練する。
そこで我々は,この予測を近似動的プログラミングと強化学習アルゴリズムでオンラインに利用し,予約制御問題を解く。
- 参考スコア(独自算出の注目度): 3.3946853660795884
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Revenue management is important for carriers (e.g., airlines and railroads).
In this paper, we focus on cargo capacity management which has received less
attention in the literature than its passenger counterpart. More precisely, we
focus on the problem of controlling booking accept/reject decisions: Given a
limited capacity, accept a booking request or reject it to reserve capacity for
future bookings with potentially higher revenue. We formulate the problem as a
finite-horizon stochastic dynamic program. The cost of fulfilling the accepted
bookings, incurred at the end of the horizon, depends on the packing and
routing of the cargo. This is a computationally challenging aspect as the
latter are solutions to an operational decision-making problem, in our
application a vehicle routing problem (VRP). Seeking a balance between online
and offline computation, we propose to train a predictor of the solution costs
to the VRPs using supervised learning. In turn, we use the predictions online
in approximate dynamic programming and reinforcement learning algorithms to
solve the booking control problem. We compare the results to an existing
approach in the literature and show that we are able to obtain control policies
that provide increased profit at a reduced evaluation time. This is achieved
thanks to accurate approximation of the operational costs and negligible
computing time in comparison to solving the VRPs.
- Abstract(参考訳): 収益管理は航空会社(航空会社や鉄道など)にとって重要である。
本稿では,本論文で注目されていない貨物容量管理に焦点をあてる。
より正確には、予約受理/拒否決定の制御の問題に焦点をあてる: 限られた能力の付与、予約要求の受け入れ、あるいは、潜在的に高い収益で将来の予約の予備能力への拒否。
この問題を有限水平確率動的プログラムとして定式化する。
受理された予約の費用は、地平線の終わりに発生し、貨物の荷造りと経路に依存する。
これは計算的に難しい側面であり、後者は運用上の意思決定問題に対する解決策であり、我々のアプリケーションでは車両ルーティング問題(VRP)である。
オンライン計算とオフライン計算のバランスを求めるため,教師付き学習を用いてvrpに対するソリューションコストの予測者を訓練する。
そこで我々は,この予測を近似動的プログラミングと強化学習アルゴリズムでオンラインに利用し,予約制御問題を解く。
その結果を文献の既存手法と比較し,評価時間を短縮して利益を増大させる制御方針を得ることができることを示した。
これは、運用コストの正確な近似と、VRPの解決と比較して無視可能な計算時間によって達成される。
関連論文リスト
- Zero-shot Generalization in Inventory Management: Train, then Estimate and Decide [0.0]
現実世界の在庫管理における深層強化学習(DRL)の展開が課題となっている。
これらの課題は研究のギャップを浮き彫りにして、パラメータの不確実性の下でのシーケンシャルな意思決定をモデル化し解決するための統一フレームワークの必要性を示唆している。
我々は、在庫管理のためのDRLの未探索領域を探索し、ゼロショット一般化(ZSG)の下での一般有能エージェント(GCAs)の訓練に対処する。
論文 参考訳(メタデータ) (2024-11-01T11:20:05Z) - Contractual Reinforcement Learning: Pulling Arms with Invisible Hands [68.77645200579181]
本稿では,契約設計によるオンライン学習問題において,利害関係者の経済的利益を整合させる理論的枠組みを提案する。
計画問題に対して、遠目エージェントに対する最適契約を決定するための効率的な動的プログラミングアルゴリズムを設計する。
学習問題に対して,契約の堅牢な設計から探索と搾取のバランスに至るまでの課題を解き放つために,非回帰学習アルゴリズムの汎用設計を導入する。
論文 参考訳(メタデータ) (2024-07-01T16:53:00Z) - Predicting Probabilities of Error to Combine Quantization and Early Exiting: QuEE [68.6018458996143]
本稿では,量子化と早期出口動的ネットワークを組み合わせたより一般的な動的ネットワークQuEEを提案する。
我々のアルゴリズムは、ソフトアーリーエグジットや入力依存圧縮の一形態と見なすことができる。
提案手法の重要な要素は、さらなる計算によって実現可能な潜在的な精度向上の正確な予測である。
論文 参考訳(メタデータ) (2024-06-20T15:25:13Z) - Learning with Posterior Sampling for Revenue Management under Time-varying Demand [36.22276574805786]
価格設定項目やサービスによる収益を最大化するための収益管理問題について議論する。
この問題の1つの課題は、需要分布が未知であり、航空会社や小売業のような実際の応用において時間とともに変化することである。
論文 参考訳(メタデータ) (2024-05-08T09:28:26Z) - Model-Based Reinforcement Learning Control of Reaction-Diffusion
Problems [0.0]
強化学習はいくつかのアプリケーション、特にゲームにおいて意思決定に応用されている。
輸送されたフィールドの流れを駆動する2つの新しい報酬関数を導入する。
その結果、これらのアプリケーションで特定の制御をうまく実装できることが判明した。
論文 参考訳(メタデータ) (2024-02-22T11:06:07Z) - Successive Refinement in Large-Scale Computation: Advancing Model
Inference Applications [67.76749044675721]
階層化分解能計算の解を導入する。
これらの解により、最終結果よりも早い段階でより解像度の低い結果が得られる。
論文 参考訳(メタデータ) (2024-02-11T15:36:33Z) - Attention-based Reinforcement Learning for Combinatorial Optimization: Application to Job Shop Scheduling Problem [2.024210754085351]
本研究では,ジョブショップスケジューリング問題に特化して設計された,革新的な注意力に基づく強化学習手法を提案する。
この研究の鍵となる発見は、提案手法で訓練を受けた学習者が、初期訓練セットに含まれない大規模問題に再利用できることである。
論文 参考訳(メタデータ) (2024-01-29T21:31:54Z) - An End-to-End Reinforcement Learning Approach for Job-Shop Scheduling
Problems Based on Constraint Programming [5.070542698701157]
本稿では,CPと強化学習(Reinforcement Learning, RL)を用いてスケジューリング問題を解決する新しいエンドツーエンドアプローチを提案する。
当社のアプローチでは,既存のCPソルバを活用して,プライオリティ・ディスパッチ・ルール(PDR)を学ぶエージェントをトレーニングする。
論文 参考訳(メタデータ) (2023-06-09T08:24:56Z) - A Universal Error Measure for Input Predictions Applied to Online Graph
Problems [57.58926849872494]
本稿では,入力予測における誤差の定量化のための新しい尺度を提案する。
この尺度は、予測されていない要求と予測されていない実際の要求によるエラーをキャプチャする。
論文 参考訳(メタデータ) (2022-05-25T15:24:03Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z) - Probably Approximately Correct Constrained Learning [135.48447120228658]
我々は、ほぼ正しい学習フレームワーク(PAC)に基づく一般化理論を開発する。
PAC学習可能なクラスも制約のある学習者であるという意味では,学習者の導入は学習問題を難しくするものではないことを示す。
このソリューションの特性を分析し,制約付き学習が公平でロバストな分類における問題にどのように対処できるかを説明する。
論文 参考訳(メタデータ) (2020-06-09T19:59:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。