論文の概要: Can Machine Learning Help in Solving Cargo Capacity Management Booking
Control Problems?
- arxiv url: http://arxiv.org/abs/2102.00092v1
- Date: Fri, 29 Jan 2021 22:11:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-05 00:24:51.113599
- Title: Can Machine Learning Help in Solving Cargo Capacity Management Booking
Control Problems?
- Title(参考訳): カーゴ容量管理予約制御問題の解決に機械学習は役立つか?
- Authors: Justin Dumouchelle, Emma Frejinger, Andrea Lodi
- Abstract要約: 我々は,旅客機よりも文学にはあまり注目されていない貨物の容量管理に重点を置いている。
この問題を有限水平動的プログラムとして定式化する。
我々は,教師付き学習を用いて,車両経路問題に対する解コストの予測者を訓練する。
そこで我々は,この予測を近似動的プログラミングと強化学習アルゴリズムでオンラインに利用し,予約制御問題を解く。
- 参考スコア(独自算出の注目度): 3.3946853660795884
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Revenue management is important for carriers (e.g., airlines and railroads).
In this paper, we focus on cargo capacity management which has received less
attention in the literature than its passenger counterpart. More precisely, we
focus on the problem of controlling booking accept/reject decisions: Given a
limited capacity, accept a booking request or reject it to reserve capacity for
future bookings with potentially higher revenue. We formulate the problem as a
finite-horizon stochastic dynamic program. The cost of fulfilling the accepted
bookings, incurred at the end of the horizon, depends on the packing and
routing of the cargo. This is a computationally challenging aspect as the
latter are solutions to an operational decision-making problem, in our
application a vehicle routing problem (VRP). Seeking a balance between online
and offline computation, we propose to train a predictor of the solution costs
to the VRPs using supervised learning. In turn, we use the predictions online
in approximate dynamic programming and reinforcement learning algorithms to
solve the booking control problem. We compare the results to an existing
approach in the literature and show that we are able to obtain control policies
that provide increased profit at a reduced evaluation time. This is achieved
thanks to accurate approximation of the operational costs and negligible
computing time in comparison to solving the VRPs.
- Abstract(参考訳): 収益管理は航空会社(航空会社や鉄道など)にとって重要である。
本稿では,本論文で注目されていない貨物容量管理に焦点をあてる。
より正確には、予約受理/拒否決定の制御の問題に焦点をあてる: 限られた能力の付与、予約要求の受け入れ、あるいは、潜在的に高い収益で将来の予約の予備能力への拒否。
この問題を有限水平確率動的プログラムとして定式化する。
受理された予約の費用は、地平線の終わりに発生し、貨物の荷造りと経路に依存する。
これは計算的に難しい側面であり、後者は運用上の意思決定問題に対する解決策であり、我々のアプリケーションでは車両ルーティング問題(VRP)である。
オンライン計算とオフライン計算のバランスを求めるため,教師付き学習を用いてvrpに対するソリューションコストの予測者を訓練する。
そこで我々は,この予測を近似動的プログラミングと強化学習アルゴリズムでオンラインに利用し,予約制御問題を解く。
その結果を文献の既存手法と比較し,評価時間を短縮して利益を増大させる制御方針を得ることができることを示した。
これは、運用コストの正確な近似と、VRPの解決と比較して無視可能な計算時間によって達成される。
関連論文リスト
- Model-Based Reinforcement Learning Control of Reaction-Diffusion
Problems [0.0]
強化学習はいくつかのアプリケーション、特にゲームにおいて意思決定に応用されている。
輸送されたフィールドの流れを駆動する2つの新しい報酬関数を導入する。
その結果、これらのアプリケーションで特定の制御をうまく実装できることが判明した。
論文 参考訳(メタデータ) (2024-02-22T11:06:07Z) - Successive Refinement in Large-Scale Computation: Advancing Model
Inference Applications [67.76749044675721]
階層化分解能計算の解を導入する。
これらの解により、最終結果よりも早い段階でより解像度の低い結果が得られる。
論文 参考訳(メタデータ) (2024-02-11T15:36:33Z) - Attention-based Reinforcement Learning for Combinatorial Optimization:
Application to Job Shop Scheduling Problem [2.2113048305291683]
そこで本研究では,求人スケジューリング問題に対する注意に基づく強化学習手法を提案する。
重要な結果として,提案手法の学習者は,学習に使われない大規模問題を解くために再利用できる。
論文 参考訳(メタデータ) (2024-01-29T21:31:54Z) - An End-to-End Reinforcement Learning Approach for Job-Shop Scheduling
Problems Based on Constraint Programming [5.070542698701157]
本稿では,CPと強化学習(Reinforcement Learning, RL)を用いてスケジューリング問題を解決する新しいエンドツーエンドアプローチを提案する。
当社のアプローチでは,既存のCPソルバを活用して,プライオリティ・ディスパッチ・ルール(PDR)を学ぶエージェントをトレーニングする。
論文 参考訳(メタデータ) (2023-06-09T08:24:56Z) - A Universal Error Measure for Input Predictions Applied to Online Graph
Problems [57.58926849872494]
本稿では,入力予測における誤差の定量化のための新しい尺度を提案する。
この尺度は、予測されていない要求と予測されていない実際の要求によるエラーをキャプチャする。
論文 参考訳(メタデータ) (2022-05-25T15:24:03Z) - MURAL: Meta-Learning Uncertainty-Aware Rewards for Outcome-Driven
Reinforcement Learning [65.52675802289775]
本研究では,不確かさを意識した分類器が,強化学習の難しさを解消できることを示す。
正規化最大度(NML)分布の計算法を提案する。
得られたアルゴリズムは、カウントベースの探索法と、報酬関数を学習するための先行アルゴリズムの両方に多くの興味深い関係を持つことを示す。
論文 参考訳(メタデータ) (2021-07-15T08:19:57Z) - Learning Algorithms for Regenerative Stopping Problems with Applications
to Shipping Consolidation in Logistics [8.111251824291244]
制御器が停止し、長期平均コストを最小限に抑えると、システムが再起動する再生停止問題について検討する。
従来のモデルベースのソリューションは、推定モデルのためのデータとコンピューティング戦略から基礎となるプロセスを推定する。
シミュレーションからニューラルネットワークのポリシーを学習する深層強化学習と模擬学習とを比較します。
論文 参考訳(メタデータ) (2021-05-05T20:45:46Z) - Computation Resource Allocation Solution in Recommender Systems [19.456109814747048]
限られた計算資源と応答時間でビジネス目標を最大化する計算資源割当ソリューション(CRAS)を提案します。
本手法の有効性はtaobao.comの実データに基づく広範囲な実験により検証された。
論文 参考訳(メタデータ) (2021-03-03T08:41:43Z) - Stein Variational Model Predictive Control [130.60527864489168]
不確実性の下での意思決定は、現実の自律システムにとって極めて重要である。
モデル予測制御 (MPC) 法は, 複雑な分布を扱う場合, 適用範囲が限られている。
この枠組みが、挑戦的で非最適な制御問題における計画の成功に繋がることを示す。
論文 参考訳(メタデータ) (2020-11-15T22:36:59Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z) - Probably Approximately Correct Constrained Learning [135.48447120228658]
我々は、ほぼ正しい学習フレームワーク(PAC)に基づく一般化理論を開発する。
PAC学習可能なクラスも制約のある学習者であるという意味では,学習者の導入は学習問題を難しくするものではないことを示す。
このソリューションの特性を分析し,制約付き学習が公平でロバストな分類における問題にどのように対処できるかを説明する。
論文 参考訳(メタデータ) (2020-06-09T19:59:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。