論文の概要: Feasibility-Aware Decision-Focused Learning for Predicting Parameters in the Constraints
- arxiv url: http://arxiv.org/abs/2510.04951v1
- Date: Mon, 06 Oct 2025 15:52:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-07 16:52:59.962456
- Title: Feasibility-Aware Decision-Focused Learning for Predicting Parameters in the Constraints
- Title(参考訳): 制約パラメータ予測のための可能性を考慮した決定型学習
- Authors: Jayanta Mandi, Marianne Defresne, Senne Berden, Tias Guns,
- Abstract要約: 一般化最適化問題における制約パラメータの予測のためのDFLフレームワークを開発した。
最大推定値に基づいて2つの新しい損失関数を導出する。
我々は,このパラメータを調整することで,両者のトレードオフの制御が可能になることを実験的に実証した。
- 参考スコア(独自算出の注目度): 8.380358508407637
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: When some parameters of a constrained optimization problem (COP) are uncertain, this gives rise to a predict-then-optimize (PtO) problem, comprising two stages -- the prediction of the unknown parameters from contextual information and the subsequent optimization using those predicted parameters. Decision-focused learning (DFL) implements the first stage by training a machine learning (ML) model to optimize the quality of the decisions made using the predicted parameters. When parameters in the constraints of a COP are predicted, the predicted parameters can lead to infeasible solutions. Therefore, it is important to simultaneously manage both feasibility and decision quality. We develop a DFL framework for predicting constraint parameters in a generic COP. While prior works typically assume that the underlying optimization problem is a linear program (LP) or integer linear program (ILP), our approach makes no such assumption. We derive two novel loss functions based on maximum likelihood estimation (MLE): the first one penalizes infeasibility (by penalizing when the predicted parameters lead to infeasible solutions), and the second one penalizes suboptimal decisions (by penalizing when the true optimal solution is infeasible under the predicted parameters). We introduce a single tunable parameter to form a weighted average of the two losses, allowing decision-makers to balance suboptimality and feasibility. We experimentally demonstrate that adjusting this parameter provides a decision-maker the control over the trade-off between the two. Moreover, across several COP instances, we find that for a single value of the tunable parameter, our method matches the performance of the existing baselines on suboptimality and feasibility.
- Abstract(参考訳): 制約付き最適化問題(COP)のいくつかのパラメータが不確かである場合、これは予測テーマ最適化(PtO)問題を引き起こす。
決定中心学習(DFL)は、予測パラメータを使用した決定の質を最適化するために機械学習(ML)モデルをトレーニングすることで、第1段階を実装する。
COPの制約のパラメータが予測されると、予測されたパラメータは実現不可能な解につながる。
したがって、実現可能性と意思決定品質の両方を同時に管理することが重要である。
我々は,制約パラメータをジェネリックCOPで予測するためのDFLフレームワークを開発した。
従来の研究では、根底にある最適化問題は線形プログラム(LP)あるいは整数線形プログラム(ILP)であると仮定していたが、我々の手法はそのような仮定をしない。
最大極大推定(MLE)に基づく2つの新しい損失関数を導出する。第1は不実現性(予測されたパラメータが不実現性解に導いた場合のペナルティ化)、第2は最適解が予測されたパラメータの下で不有効である場合のペナルティ化)である。
2つの損失の重み付け平均を形成するために、調整可能なパラメータを1つ導入し、意思決定者が最適化と実現可能性のバランスをとることを可能にする。
我々は,このパラメータを調整することで,両者のトレードオフの制御が可能になることを実験的に実証した。
さらに、複数のCOPインスタンスにおいて、調整可能なパラメータの1つの値に対して、既存のベースラインの性能が最適化と実現可能性に合致していることが判明した。
関連論文リスト
- Scaling Exponents Across Parameterizations and Optimizers [94.54718325264218]
本稿では,先行研究における重要な仮定を考察し,パラメータ化の新たな視点を提案する。
私たちの経験的調査には、3つの組み合わせでトレーニングされた数万のモデルが含まれています。
最高の学習率のスケーリング基準は、以前の作業の仮定から除外されることがよくあります。
論文 参考訳(メタデータ) (2024-07-08T12:32:51Z) - Double Duality: Variational Primal-Dual Policy Optimization for
Constrained Reinforcement Learning [132.7040981721302]
本研究では,訪問尺度の凸関数を最小化することを目的として,制約付き凸決定プロセス(MDP)について検討する。
制約付き凸MDPの設計アルゴリズムは、大きな状態空間を扱うなど、いくつかの課題に直面している。
論文 参考訳(メタデータ) (2024-02-16T16:35:18Z) - End-to-End Learning for Fair Multiobjective Optimization Under
Uncertainty [55.04219793298687]
機械学習における予測-Then-Forecast(PtO)パラダイムは、下流の意思決定品質を最大化することを目的としている。
本稿では,PtO法を拡張して,OWA(Nondifferentiable Ordered Weighted Averaging)の目的を最適化する。
この結果から,不確実性の下でのOWA関数の最適化とパラメトリック予測を効果的に統合できることが示唆された。
論文 参考訳(メタデータ) (2024-02-12T16:33:35Z) - Decision-focused predictions via pessimistic bilevel optimization: complexity and algorithms [0.7499722271664147]
我々は最近の意思決定中心の予測、すなわち予測モデルの構築への取り組みに貢献する。
NP のメンバシップを含む問題の計算結果を示す。
次に,経験的トラクタビリティを実現するために,様々な計算手法を定式化する。
論文 参考訳(メタデータ) (2023-12-29T15:05:00Z) - Predict-Then-Optimize by Proxy: Learning Joint Models of Prediction and
Optimization [59.386153202037086]
Predict-Then-フレームワークは、機械学習モデルを使用して、最適化問題の未知のパラメータを、解決前の機能から予測する。
このアプローチは非効率であり、最適化ステップを通じてバックプロパゲーションのための手作りの、問題固有のルールを必要とする。
本稿では,予測モデルを用いて観測可能な特徴から最適解を直接学習する手法を提案する。
論文 参考訳(メタデータ) (2023-11-22T01:32:06Z) - Score Function Gradient Estimation to Widen the Applicability of Decision-Focused Learning [17.962860438133312]
決定中心学習(DFL)パラダイムは、例えば後悔など、タスク損失を直接最小化するためのトレーニングによって制限を克服する。
そこで我々は,このような仮定をせずに,任意のタスク損失に作用するスコア関数推定とスムースに組み合わせた代替手法を提案する。
実験の結果、一般的に多くのエポックを必要とするが、専門的な手法と同等であり、特にソリューションの品質、スケーラビリティ、あるいはその両方の観点から、制約の不確実性に悩む問題に対して、特にうまく機能していることが示されている。
論文 参考訳(メタデータ) (2023-07-11T12:32:13Z) - Predict+Optimize for Packing and Covering LPs with Unknown Parameters in
Constraints [5.762370982168012]
本稿では,予測+設定のための新規かつ実用的な枠組みを提案するが,目的と制約の両方に未知のパラメータを持つ。
本稿では, 補正関数の概念と, 損失関数に付加的なペナルティ項を導入し, 真のパラメータが明らかにされた後, 推定された最適解を実現可能な解に変換する現実的なシナリオをモデル化する。
私たちのアプローチは、マンディとガンズの以前の研究にインスピレーションを受けています。
論文 参考訳(メタデータ) (2022-09-08T09:28:24Z) - Learning MDPs from Features: Predict-Then-Optimize for Sequential
Decision Problems by Reinforcement Learning [52.74071439183113]
我々は、強化学習を通して解決された逐次決定問題(MDP)の文脈における予測列最適化フレームワークについて検討した。
2つの重要な計算課題は、意思決定中心の学習をMDPに適用することである。
論文 参考訳(メタデータ) (2021-06-06T23:53:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。