論文の概要: PROPEL: Supervised and Reinforcement Learning for Large-Scale Supply Chain Planning
- arxiv url: http://arxiv.org/abs/2504.07383v1
- Date: Thu, 10 Apr 2025 02:04:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-11 12:22:43.015816
- Title: PROPEL: Supervised and Reinforcement Learning for Large-Scale Supply Chain Planning
- Title(参考訳): PROPEL:大規模サプライチェーン計画のための監督と強化学習
- Authors: Vahid Eghbal Akhlaghi, Reza Zandehshahvar, Pascal Van Hentenryck,
- Abstract要約: 本稿では,教師付き学習と深層強化学習(DRL)を併用して,探索空間の規模を大幅に削減する新しいフレームワークであるPROELを提案する。
PROPELは、数百万の変数を持つ産業サプライチェーン計画最適化に適用されている。
その結果, 解の時間と品質が劇的に向上し, 原始積分の60%が減少し, 原始ギャップの88%が減少することがわかった。
- 参考スコア(独自算出の注目度): 14.076978703913605
- License:
- Abstract: This paper considers how to fuse Machine Learning (ML) and optimization to solve large-scale Supply Chain Planning (SCP) optimization problems. These problems can be formulated as MIP models which feature both integer (non-binary) and continuous variables, as well as flow balance and capacity constraints. This raises fundamental challenges for existing integrations of ML and optimization that have focused on binary MIPs and graph problems. To address these, the paper proposes PROPEL, a new framework that combines optimization with both supervised and Deep Reinforcement Learning (DRL) to reduce the size of search space significantly. PROPEL uses supervised learning, not to predict the values of all integer variables, but to identify the variables that are fixed to zero in the optimal solution, leveraging the structure of SCP applications. PROPEL includes a DRL component that selects which fixed-at-zero variables must be relaxed to improve solution quality when the supervised learning step does not produce a solution with the desired optimality tolerance. PROPEL has been applied to industrial supply chain planning optimizations with millions of variables. The computational results show dramatic improvements in solution times and quality, including a 60% reduction in primal integral and an 88% primal gap reduction, and improvement factors of up to 13.57 and 15.92, respectively.
- Abstract(参考訳): 本稿では、機械学習(ML)と最適化を融合して、大規模サプライチェーン計画(SCP)最適化問題を解決する方法について考察する。
これらの問題は、整数(非バイナリ)と連続変数、フローバランスとキャパシティ制約の両方を特徴とするMIPモデルとして定式化することができる。
これにより、MLの既存の統合と、バイナリMIPとグラフの問題に焦点を当てた最適化に対する根本的な課題が提起される。
そこで本研究では, 教師付き学習と深層強化学習(DRL)を併用して, 探索空間の規模を大幅に削減する新しいフレームワーク PROPEL を提案する。
PROPELは教師付き学習を用いて、全ての整数変数の値を予測するだけでなく、最適解においてゼロに固定された変数を識別し、SCPアプリケーションの構造を利用する。
PROPELにはDRLコンポーネントが含まれており、教師付き学習ステップが所望の最適性トレランスを備えたソリューションを生成しない場合、どの固定型変数を緩和してソリューション品質を改善する必要があるかを選択できる。
PROPELは、数百万の変数を持つ産業サプライチェーン計画最適化に適用されている。
計算結果から, 原点積分の60%の削減, 原点ギャップの88%の削減, 最大13.57および15.92の改善因子など, 解時間と品質の劇的な改善が見られた。
関連論文リスト
- Revisiting Zeroth-Order Optimization for Memory-Efficient LLM Fine-Tuning: A Benchmark [166.40879020706151]
本稿では、微調整時のメモリコスト低減のためのソリューションとして、BPフリーゼロオーダー最適化(ZO)への移行を提案する。
従来のZO-SGD法とは異なり、我々の研究はより広い範囲のZO最適化手法に探索を広げる。
本研究は,タスクアライメントの重要性,前方勾配法の役割,アルゴリズムの複雑さと微調整性能のバランスについて,これまで見過ごされてきた最適化原理を明らかにした。
論文 参考訳(メタデータ) (2024-02-18T14:08:48Z) - Self-Supervised Learning for Large-Scale Preventive Security Constrained DC Optimal Power Flow [20.078717680640214]
SCOPF(Security-Constrained Optimal Power Flow)は、電力グリッドの安定性において重要な役割を果たすが、システムが成長するにつれてますます複雑になる。
本稿では,大規模SCOPF問題に対する準最適解を生成するための,自己教師付きエンドツーエンドのPDL-SCOPFについて紹介する。
論文 参考訳(メタデータ) (2023-11-29T20:36:35Z) - Zero-Shot Sharpness-Aware Quantization for Pre-trained Language Models [88.80146574509195]
量子化は、メモリオーバーヘッドを減らし、推論を加速するための有望なアプローチである。
種々のPLMのゼロショット量子化のための新しい量子化(ZSAQ)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-20T07:09:56Z) - Sample-Efficient Multi-Agent RL: An Optimization Perspective [103.35353196535544]
一般関数近似に基づく汎用マルコフゲーム(MG)のためのマルチエージェント強化学習(MARL)について検討した。
汎用MGに対するマルチエージェントデカップリング係数(MADC)と呼ばれる新しい複雑性尺度を導入する。
我々のアルゴリズムは既存の研究に匹敵するサブリニアな後悔を与えることを示す。
論文 参考訳(メタデータ) (2023-10-10T01:39:04Z) - Evolutionary Solution Adaption for Multi-Objective Metal Cutting Process
Optimization [59.45414406974091]
我々は,従来の最適化タスクから解を転送するアルゴリズムの能力を研究することのできる,システムの柔軟性のためのフレームワークを提案する。
NSGA-IIの柔軟性を2つの変種で検討し,1)2つのタスクの解を同時に最適化し,より適応性が高いと期待されるソース間の解を得る,2)活性化あるいは非活性化の異なる可能性に対応する能動的非アクティブなジェノタイプについて検討した。
その結果,標準NSGA-IIによる適応は目標目標への最適化に必要な評価回数を大幅に削減し,提案した変種は適応コストをさらに向上することがわかった。
論文 参考訳(メタデータ) (2023-05-31T12:07:50Z) - Assessment of Reinforcement Learning Algorithms for Nuclear Power Plant
Fuel Optimization [0.0]
この研究は、深いRLを用いてロードパターンの問題を解決するための第一種アプローチを示し、任意のエンジニアリング設計最適化に利用することができる。
論文 参考訳(メタデータ) (2023-05-09T23:51:24Z) - Learning Optimal Solutions via an LSTM-Optimization Framework [0.0]
動的混合整数プログラムに取り組むためのディープラーニング最適化フレームワークを提案する。
我々は,情報を前後に処理できる双方向長短期記憶(LSTM)フレームワークを開発した。
本研究は, 単体容量化ロットサイズ問題に対する最適決定の予測におけるアプローチを実証する。
論文 参考訳(メタデータ) (2022-07-06T19:38:01Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z) - Automatically Learning Compact Quality-aware Surrogates for Optimization
Problems [55.94450542785096]
未知パラメータで最適化問題を解くには、未知パラメータの値を予測し、これらの値を用いて問題を解くための予測モデルを学ぶ必要がある。
最近の研究によると、複雑なトレーニングモデルパイプラインのレイヤーとして最適化の問題を含めると、観測されていない意思決定の繰り返しを予測することになる。
我々は,大規模最適化問題の低次元サロゲートモデルを学習することにより,解の質を向上させることができることを示す。
論文 参考訳(メタデータ) (2020-06-18T19:11:54Z) - Simplified Swarm Optimization for Bi-Objection Active Reliability
Redundancy Allocation Problems [1.5990720051907859]
信頼性冗長性割り当て問題(RRAP)は、システム設計、開発、管理においてよく知られた問題である。
本研究では, コスト制約を新たな目標として変更することにより, 両対象RRAPを定式化する。
提案課題を解決するために,ペナルティ関数を備えた新しい簡易スワム最適化 (SSO) ,実効1型ソリューション構造,数値ベースの自己適応型新しい更新機構,制約付き非支配型ソリューション選択,および新しいpBest代替ポリシーを開発した。
論文 参考訳(メタデータ) (2020-06-17T13:15:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。