論文の概要: An Expandable Machine Learning-Optimization Framework to Sequential
Decision-Making
- arxiv url: http://arxiv.org/abs/2311.06972v1
- Date: Sun, 12 Nov 2023 21:54:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-14 16:04:00.956090
- Title: An Expandable Machine Learning-Optimization Framework to Sequential
Decision-Making
- Title(参考訳): 逐次意思決定のための拡張可能な機械学習最適化フレームワーク
- Authors: Dogacan Yilmaz and \.I. Esra B\"uy\"uktahtak{\i}n
- Abstract要約: 逐次的意思決定問題を効率的に解決する統合予測最適化(PredOpt)フレームワークを提案する。
本稿では,機械学習(ML)における逐次依存,実現可能性,一般化といった課題に対処し,インスタンス問題に対する最適解の予測を行う。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present an integrated prediction-optimization (PredOpt) framework to
efficiently solve sequential decision-making problems by predicting the values
of binary decision variables in an optimal solution. We address the key issues
of sequential dependence, infeasibility, and generalization in machine learning
(ML) to make predictions for optimal solutions to combinatorial problems. The
sequential nature of the combinatorial optimization problems considered is
captured with recurrent neural networks and a sliding-attention window. We
integrate an attention-based encoder-decoder neural network architecture with
an infeasibility-elimination and generalization framework to learn high-quality
feasible solutions to time-dependent optimization problems. In this framework,
the required level of predictions is optimized to eliminate the infeasibility
of the ML predictions. These predictions are then fixed in mixed-integer
programming (MIP) problems to solve them quickly with the aid of a commercial
solver. We demonstrate our approach to tackling the two well-known dynamic
NP-Hard optimization problems: multi-item capacitated lot-sizing (MCLSP) and
multi-dimensional knapsack (MSMK). Our results show that models trained on
shorter and smaller-dimensional instances can be successfully used to predict
longer and larger-dimensional problems. The solution time can be reduced by
three orders of magnitude with an average optimality gap below 0.1%. We compare
PredOpt with various specially designed heuristics and show that our framework
outperforms them. PredOpt can be advantageous for solving dynamic MIP problems
that need to be solved instantly and repetitively.
- Abstract(参考訳): 最適解における二項決定変数の値を予測することにより、逐次決定問題を効率的に解決する統合予測最適化(PredOpt)フレームワークを提案する。
本稿では,機械学習(ML)における逐次依存,実現可能性,一般化といった課題に対処し,組合せ問題に対する最適解の予測を行う。
組合せ最適化問題の逐次的性質は、繰り返しニューラルネットワークとスライディングアテンションウインドウで把握される。
我々は,注意に基づくエンコーダ・デコーダニューラルネットワークアーキテクチャと,実現可能性排除・一般化フレームワークを統合し,時間依存最適化問題に対する高品質な実現可能な解法を学習する。
このフレームワークでは、ML予測の可能性を排除するために、必要なレベルの予測が最適化される。
これらの予測は、MIP(Mixed-Integer Programming)問題で修正され、商用の問題解決者によって迅速に解決される。
MCLSP(Multi-item capacitated lot-size)とMSMK(Multi-dimensional knapsack)という2つのよく知られた動的NP-Hard最適化問題に対処するアプローチを実証する。
その結果,より短小のインスタンスで学習したモデルを用いて,より長大な問題を予測することができた。
解の時間は、平均最適性ギャップが0.1%未満の3桁に縮めることができる。
PredOptと様々な設計のヒューリスティックスを比較し、我々のフレームワークがそれらより優れていることを示す。
PredOptは、即座に反復的に解決する必要がある動的なMIP問題を解決するのに有利である。
関連論文リスト
- Reducing the Need for Backpropagation and Discovering Better Optima With
Explicit Optimizations of Neural Networks [4.807347156077897]
本稿では,ニューラルネットワークの最適化のための計算効率のよい代替案を提案する。
我々は、単純なフィードフォワード言語モデルに対する明確な解決策を導出する。
実験では,明示的な解がほぼ最適であることを示す。
論文 参考訳(メタデータ) (2023-11-13T17:38:07Z) - Optimization and Optimizers for Adversarial Robustness [10.279287131070157]
本稿では,汎用的制約最適化解法と制約Foldingを融合した新しいフレームワークを提案する。
信頼性に関して、PWCFは、ソリューションの品質を評価するための定常度測定と実現可能性テストのソリューションを提供する。
さらに、損失、摂動モデル、最適化アルゴリズムの様々な組み合わせを用いて、これらの問題を解決するための解の異なるパターンについて検討する。
論文 参考訳(メタデータ) (2023-03-23T16:22:59Z) - Backpropagation of Unrolled Solvers with Folded Optimization [55.04219793298687]
ディープネットワークにおけるコンポーネントとしての制約付き最適化モデルの統合は、多くの専門的な学習タスクに有望な進歩をもたらした。
1つの典型的な戦略はアルゴリズムのアンローリングであり、これは反復解法の操作による自動微分に依存している。
本稿では,非ロール最適化の後方通過に関する理論的知見を提供し,効率よく解けるバックプロパゲーション解析モデルを生成するシステムに繋がる。
論文 参考訳(メタデータ) (2023-01-28T01:50:42Z) - MIP-GNN: A Data-Driven Framework for Guiding Combinatorial Solvers [13.790116387956703]
混合整数プログラミング(MIP)技術は最適化問題の定式化と解法を提供する。
MIP-GNNは、データ駆動の洞察でそのような問題を解決するための一般的なフレームワークである。
MIP-GNNを最先端のMIP解決器に統合し,ノード選択やウォームスタートといったタスクに適用する。
論文 参考訳(メタデータ) (2022-05-27T19:34:14Z) - Predict and Optimize: Through the Lens of Learning to Rank [9.434400627011108]
ノイズコントラスト推定は、ソリューションキャッシュのランク付けを学習する場合とみなすことができる。
また、最適化問題を解くことなく、閉じた形で区別できるペアワイズとリストワイズランキングの損失関数も開発する。
論文 参考訳(メタデータ) (2021-12-07T10:11:44Z) - An Online Prediction Approach Based on Incremental Support Vector
Machine for Dynamic Multiobjective Optimization [19.336520152294213]
インクリメンタルサポートベクトルマシン(ISVM)に基づく新しい予測アルゴリズムを提案する。
動的多目的最適化問題(DMOP)の解決をオンライン学習プロセスとして扱う。
提案アルゴリズムは動的多目的最適化問題に効果的に取り組むことができる。
論文 参考訳(メタデータ) (2021-02-24T08:51:23Z) - Offline Model-Based Optimization via Normalized Maximum Likelihood
Estimation [101.22379613810881]
データ駆動最適化の問題を検討し、一定の点セットでクエリのみを与えられた関数を最大化する必要がある。
この問題は、関数評価が複雑で高価なプロセスである多くの領域に現れる。
我々は,提案手法を高容量ニューラルネットワークモデルに拡張可能なトラクタブル近似を提案する。
論文 参考訳(メタデータ) (2021-02-16T06:04:27Z) - Divide and Learn: A Divide and Conquer Approach for Predict+Optimize [50.03608569227359]
予測+最適化問題は、予測係数を使用する最適化プロブレムと、確率係数の機械学習を組み合わせる。
本稿では, 予測係数を1次線形関数として, 最適化問題の損失を直接表現する方法を示す。
本稿では,この制約を伴わずに最適化問題に対処し,最適化損失を用いてその係数を予測する新しい分割アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-12-04T00:26:56Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z) - Automatically Learning Compact Quality-aware Surrogates for Optimization
Problems [55.94450542785096]
未知パラメータで最適化問題を解くには、未知パラメータの値を予測し、これらの値を用いて問題を解くための予測モデルを学ぶ必要がある。
最近の研究によると、複雑なトレーニングモデルパイプラインのレイヤーとして最適化の問題を含めると、観測されていない意思決定の繰り返しを予測することになる。
我々は,大規模最適化問題の低次元サロゲートモデルを学習することにより,解の質を向上させることができることを示す。
論文 参考訳(メタデータ) (2020-06-18T19:11:54Z) - Self-Directed Online Machine Learning for Topology Optimization [58.920693413667216]
自己指向型オンライン学習最適化は、ディープニューラルネットワーク(DNN)と有限要素法(FEM)計算を統合している。
本アルゴリズムは, コンプライアンスの最小化, 流体構造最適化, 伝熱促進, トラス最適化の4種類の問題によって検証された。
その結果, 直接使用法と比較して計算時間を2~5桁削減し, 実験で検証した全ての最先端アルゴリズムより優れていた。
論文 参考訳(メタデータ) (2020-02-04T20:00:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。