Fugu-MT 論文翻訳(概要): Can Machine Learning Help in Solving Cargo Capacity Management Booking Control Problems?

論文の概要: Can Machine Learning Help in Solving Cargo Capacity Management Booking Control Problems?

arxiv url: http://arxiv.org/abs/2102.00092v1
Date: Fri, 29 Jan 2021 22:11:59 GMT
ステータス: 翻訳完了
システム内更新日: 2021-04-05 00:24:51.113599
Title: Can Machine Learning Help in Solving Cargo Capacity Management Booking Control Problems?
Title（参考訳）: カーゴ容量管理予約制御問題の解決に機械学習は役立つか?
Authors: Justin Dumouchelle, Emma Frejinger, Andrea Lodi
Abstract要約: 我々は,旅客機よりも文学にはあまり注目されていない貨物の容量管理に重点を置いている。この問題を有限水平動的プログラムとして定式化する。我々は,教師付き学習を用いて,車両経路問題に対する解コストの予測者を訓練する。そこで我々は,この予測を近似動的プログラミングと強化学習アルゴリズムでオンラインに利用し,予約制御問題を解く。
参考スコア（独自算出の注目度）: 3.3946853660795884
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Revenue management is important for carriers (e.g., airlines and railroads). In this paper, we focus on cargo capacity management which has received less attention in the literature than its passenger counterpart. More precisely, we focus on the problem of controlling booking accept/reject decisions: Given a limited capacity, accept a booking request or reject it to reserve capacity for future bookings with potentially higher revenue. We formulate the problem as a finite-horizon stochastic dynamic program. The cost of fulfilling the accepted bookings, incurred at the end of the horizon, depends on the packing and routing of the cargo. This is a computationally challenging aspect as the latter are solutions to an operational decision-making problem, in our application a vehicle routing problem (VRP). Seeking a balance between online and offline computation, we propose to train a predictor of the solution costs to the VRPs using supervised learning. In turn, we use the predictions online in approximate dynamic programming and reinforcement learning algorithms to solve the booking control problem. We compare the results to an existing approach in the literature and show that we are able to obtain control policies that provide increased profit at a reduced evaluation time. This is achieved thanks to accurate approximation of the operational costs and negligible computing time in comparison to solving the VRPs.
Abstract（参考訳）: 収益管理は航空会社(航空会社や鉄道など)にとって重要である。本稿では,本論文で注目されていない貨物容量管理に焦点をあてる。より正確には、予約受理/拒否決定の制御の問題に焦点をあてる: 限られた能力の付与、予約要求の受け入れ、あるいは、潜在的に高い収益で将来の予約の予備能力への拒否。この問題を有限水平確率動的プログラムとして定式化する。受理された予約の費用は、地平線の終わりに発生し、貨物の荷造りと経路に依存する。これは計算的に難しい側面であり、後者は運用上の意思決定問題に対する解決策であり、我々のアプリケーションでは車両ルーティング問題(VRP)である。オンライン計算とオフライン計算のバランスを求めるため,教師付き学習を用いてvrpに対するソリューションコストの予測者を訓練する。そこで我々は,この予測を近似動的プログラミングと強化学習アルゴリズムでオンラインに利用し,予約制御問題を解く。その結果を文献の既存手法と比較し,評価時間を短縮して利益を増大させる制御方針を得ることができることを示した。これは、運用コストの正確な近似と、VRPの解決と比較して無視可能な計算時間によって達成される。

関連論文リスト

Optimized Agent Shift Scheduling Using Multi-Phase Allocation Approach [0.0]
そこで本研究では,その問題をより小さなサブプロブレムとシフトアロケーションに分割することで,スケーラビリティと精度に対処する多相アロケーション手法を提案する。そこで,本提案手法を多目的フレームワークを用いて,ホリデーラッシュなどのピーク需要シナリオがもたらす課題に対処する。
論文参考訳（メタデータ） (2025-11-27T17:10:59Z)
Capacity-Constrained Continual Learning [64.70016365121081]
本稿では,限られた能力を持つエージェントが資源を最適な性能に割り当てる方法について検討する。容量制約付き線形四元数-ガウス列予測問題に対する解法を導出する。サブプロブレムの集合に分解できる問題に対しては、定常状態においてこれらのサブプロブレム全体にわたってキャパシティを最適に割り当てる方法についても示す。
論文参考訳（メタデータ） (2025-07-29T03:47:22Z)
No-Regret Learning Under Adversarial Resource Constraints: A Spending Plan Is All You Need! [56.80767500991973]
アクション選択の前に報酬とコストが観測される$(i)$オンラインリソース割当と、アクション選択後、完全なフィードバックや盗賊フィードバックの下で、リソース制限付きオンライン学習である$(ii)$オンラインリソース割当に焦点を当てた。報酬とコスト分布が時間とともに任意に変化する場合、これらの設定でサブ線形後悔を達成することは不可能であることが知られている。我々は、支出計画に従う基準線に対する半線形後悔を実現する一般的な(基本的)二重的手法を設計し、また、支出計画が予算のバランスの取れた配分を保証すると、アルゴリズムの性能が向上する。
論文参考訳（メタデータ） (2025-06-16T08:42:31Z)
Towards Principled Unsupervised Multi-Agent Reinforcement Learning [49.533774397707056]
実践的な設定でこの問題に対処するために,スケーラブルで分散化された信頼領域ポリシー探索アルゴリズムを提案する。本研究では,特定の目的,すなわち混合エントロピーの最適化が,トラクタビリティと性能のトレードオフに優れたものであることを示す。
論文参考訳（メタデータ） (2025-02-12T12:51:36Z)
Zero-shot Generalization in Inventory Management: Train, then Estimate and Decide [0.0]
現実世界の在庫管理における深層強化学習(DRL)の展開が課題となっている。これらの課題は研究のギャップを浮き彫りにして、パラメータの不確実性の下でのシーケンシャルな意思決定をモデル化し解決するための統一フレームワークの必要性を示唆している。我々は、在庫管理のためのDRLの未探索領域を探索し、ゼロショット一般化(ZSG)の下での一般有能エージェント(GCAs)の訓練に対処する。
論文参考訳（メタデータ） (2024-11-01T11:20:05Z)
Contractual Reinforcement Learning: Pulling Arms with Invisible Hands [68.77645200579181]
本稿では,契約設計によるオンライン学習問題において,利害関係者の経済的利益を整合させる理論的枠組みを提案する。計画問題に対して、遠目エージェントに対する最適契約を決定するための効率的な動的プログラミングアルゴリズムを設計する。学習問題に対して,契約の堅牢な設計から探索と搾取のバランスに至るまでの課題を解き放つために,非回帰学習アルゴリズムの汎用設計を導入する。
論文参考訳（メタデータ） (2024-07-01T16:53:00Z)
Predicting Probabilities of Error to Combine Quantization and Early Exiting: QuEE [68.6018458996143]
本稿では,量子化と早期出口動的ネットワークを組み合わせたより一般的な動的ネットワークQuEEを提案する。我々のアルゴリズムは、ソフトアーリーエグジットや入力依存圧縮の一形態と見なすことができる。提案手法の重要な要素は、さらなる計算によって実現可能な潜在的な精度向上の正確な予測である。
論文参考訳（メタデータ） (2024-06-20T15:25:13Z)
Learning with Posterior Sampling for Revenue Management under Time-varying Demand [36.22276574805786]
価格設定項目やサービスによる収益を最大化するための収益管理問題について議論する。この問題の1つの課題は、需要分布が未知であり、航空会社や小売業のような実際の応用において時間とともに変化することである。
論文参考訳（メタデータ） (2024-05-08T09:28:26Z)
Model-Based Reinforcement Learning Control of Reaction-Diffusion Problems [0.0]
強化学習はいくつかのアプリケーション、特にゲームにおいて意思決定に応用されている。輸送されたフィールドの流れを駆動する2つの新しい報酬関数を導入する。その結果、これらのアプリケーションで特定の制御をうまく実装できることが判明した。
論文参考訳（メタデータ） (2024-02-22T11:06:07Z)
Successive Refinement in Large-Scale Computation: Advancing Model Inference Applications [67.76749044675721]
階層化分解能計算の解を導入する。これらの解により、最終結果よりも早い段階でより解像度の低い結果が得られる。
論文参考訳（メタデータ） (2024-02-11T15:36:33Z)
Attention-based Reinforcement Learning for Combinatorial Optimization: Application to Job Shop Scheduling Problem [2.024210754085351]
本研究では,ジョブショップスケジューリング問題に特化して設計された,革新的な注意力に基づく強化学習手法を提案する。この研究の鍵となる発見は、提案手法で訓練を受けた学習者が、初期訓練セットに含まれない大規模問題に再利用できることである。
論文参考訳（メタデータ） (2024-01-29T21:31:54Z)
An End-to-End Reinforcement Learning Approach for Job-Shop Scheduling Problems Based on Constraint Programming [5.070542698701157]
本稿では,CPと強化学習(Reinforcement Learning, RL)を用いてスケジューリング問題を解決する新しいエンドツーエンドアプローチを提案する。当社のアプローチでは,既存のCPソルバを活用して,プライオリティ・ディスパッチ・ルール(PDR)を学ぶエージェントをトレーニングする。
論文参考訳（メタデータ） (2023-06-09T08:24:56Z)
A Universal Error Measure for Input Predictions Applied to Online Graph Problems [57.58926849872494]
本稿では,入力予測における誤差の定量化のための新しい尺度を提案する。この尺度は、予測されていない要求と予測されていない実際の要求によるエラーをキャプチャする。
論文参考訳（メタデータ） (2022-05-25T15:24:03Z)
Combining Deep Learning and Optimization for Security-Constrained Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。 SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文参考訳（メタデータ） (2020-07-14T12:38:21Z)
Probably Approximately Correct Constrained Learning [135.48447120228658]
我々は、ほぼ正しい学習フレームワーク(PAC)に基づく一般化理論を開発する。 PAC学習可能なクラスも制約のある学習者であるという意味では,学習者の導入は学習問題を難しくするものではないことを示す。このソリューションの特性を分析し,制約付き学習が公平でロバストな分類における問題にどのように対処できるかを説明する。
論文参考訳（メタデータ） (2020-06-09T19:59:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。