論文の概要: Robust Losses for Decision-Focused Learning
- arxiv url: http://arxiv.org/abs/2310.04328v2
- Date: Sat, 27 Jul 2024 13:40:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-31 00:36:23.582517
- Title: Robust Losses for Decision-Focused Learning
- Title(参考訳): 意思決定型学習におけるロバストな損失
- Authors: Noah Schutte, Krzysztof Postek, Neil Yorke-Smith,
- Abstract要約: 決定にフォーカスした学習は、最適下決定を行うことで後悔を最小限に抑えるために予測モデルを訓練することを目的としている。
経験的最適決定は期待された最適決定と大きく異なるため、経験的後悔は非効果的な代理となり得る。
より強固に予測された後悔を近似する3つの新しい損失関数を提案する。
- 参考スコア(独自算出の注目度): 2.9652474178611405
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Optimization models used to make discrete decisions often contain uncertain parameters that are context-dependent and estimated through prediction. To account for the quality of the decision made based on the prediction, decision-focused learning (end-to-end predict-then-optimize) aims at training the predictive model to minimize regret, i.e., the loss incurred by making a suboptimal decision. Despite the challenge of the gradient of this loss w.r.t. the predictive model parameters being zero almost everywhere for optimization problems with a linear objective, effective gradient-based learning approaches have been proposed to minimize the expected loss, using the empirical loss as a surrogate. However, empirical regret can be an ineffective surrogate because empirical optimal decisions can vary substantially from expected optimal decisions. To understand the impact of this deficiency, we evaluate the effect of aleatoric and epistemic uncertainty on the accuracy of empirical regret as a surrogate. Next, we propose three novel loss functions that approximate expected regret more robustly. Experimental results show that training two state-of-the-art decision-focused learning approaches using robust regret losses improves test-sample empirical regret in general while keeping computational time equivalent relative to the number of training epochs.
- Abstract(参考訳): 離散決定に使用される最適化モデルは、しばしば文脈に依存し、予測によって推定される不確実なパラメータを含む。
予測に基づく意思決定の質を考慮し、意思決定中心の学習(エンドツーエンドの予測テーマ最適化)は、後悔を最小限に抑えるために予測モデルを訓練することを目的とした。
この損失の勾配W.r.t.の問題は、線形目的を持つ最適化問題に対して、ほぼ至るところで予測モデルパラメータがゼロであるにもかかわらず、効果的な勾配に基づく学習アプローチは、実証的損失を代理として、期待される損失を最小限に抑えるために提案されている。
しかし、経験的最適決定は期待される最適決定と大きく異なるため、経験的後悔は非効果的な代理となる。
この欠損症の影響を明らかにするため, 動脈硬化およびてんかんの不確かさが, 経験的後悔の精度に及ぼす影響をサロゲートとして評価した。
次に、より堅牢に予測された後悔を近似する3つの新しい損失関数を提案する。
実験結果から,頑健な後悔の損失を用いた2つの最先端意思決定型学習アプローチの訓練は,訓練エポック数に匹敵する計算時間を保ちながら,一般にテストサンプル的後悔を改善することが示された。
関連論文リスト
- Smart Predict-then-Optimize Method with Dependent Data: Risk Bounds and Calibration of Autoregression [7.369846475695131]
本稿では,決定段階における最適化問題を直接対象とする自己回帰型SPO手法を提案する。
我々は, 絶対損失と最小二乗損失と比較して, SPO+サロゲートの有効性を示す実験を行った。
論文 参考訳(メタデータ) (2024-11-19T17:02:04Z) - Uncertainty-Penalized Direct Preference Optimization [52.387088396044206]
我々は、優先不確実性ペナル化スキームを導入し、DPOの悲観的な枠組みを開発する。
ペナル化は、不確実なサンプルの損失勾配を減衰させる損失の補正として機能する。
我々は,バニラDPOと比較して全体的な性能が向上し,高い不確実性選択/拒絶反応によるプロンプトの完成度も向上した。
論文 参考訳(メタデータ) (2024-10-26T14:24:37Z) - Asymptotically Optimal Regret for Black-Box Predict-then-Optimize [7.412445894287709]
我々は,特別な構造を欠いた新たなブラックボックス予測最適化問題と,その行動から得られる報酬のみを観察する方法について検討した。
本稿では,経験的ソフトレグレット(ESR, Empirical Soft Regret)と呼ばれる新しい損失関数を提案する。
また、私たちのアプローチは、ニュースレコメンデーションやパーソナライズされた医療における現実の意思決定問題において、最先端のアルゴリズムよりも大幅に優れています。
論文 参考訳(メタデータ) (2024-06-12T04:46:23Z) - Optimistic Regret Bounds for Online Learning in Adversarial Markov Decision Processes [5.116582735311639]
コスト予測器のセットを活用して後悔を最小限に抑えることを目的とした,新たなAMDPの導入と研究を行う。
提案手法は,コスト予測器の推算力で優雅に劣化する残差である,確率の高いサブリニアな懐疑的後悔を実現するための新しいポリシー探索手法を開発する。
論文 参考訳(メタデータ) (2024-05-03T15:44:31Z) - Decision-focused predictions via pessimistic bilevel optimization: a computational study [0.7499722271664147]
最適化パラメータの不確かさは、重要かつ長年にわたる課題である。
予測モデルを構築して,それを用いた意思決定の文言的指標を測定します。
トラクタビリティを実現するために,様々な計算手法を示す。
論文 参考訳(メタデータ) (2023-12-29T15:05:00Z) - Leaving the Nest: Going Beyond Local Loss Functions for
Predict-Then-Optimize [57.22851616806617]
本手法は,文献から得られた4つの領域において,最先端の成果が得られることを示す。
提案手法は, 局所性仮定が破られた場合, 既存手法よりも200%近く性能が向上する。
論文 参考訳(メタデータ) (2023-05-26T11:17:45Z) - Post-hoc loss-calibration for Bayesian neural networks [25.05373000435213]
本研究では, 近似的後続予測分布の補正手法を開発し, 高ユーティリティな意思決定を推奨する。
従来の研究とは対照的に、我々のアプローチは近似推論アルゴリズムの選択に非依存である。
論文 参考訳(メタデータ) (2021-06-13T13:53:27Z) - Learning MDPs from Features: Predict-Then-Optimize for Sequential
Decision Problems by Reinforcement Learning [52.74071439183113]
我々は、強化学習を通して解決された逐次決定問題(MDP)の文脈における予測列最適化フレームワークについて検討した。
2つの重要な計算課題は、意思決定中心の学習をMDPに適用することである。
論文 参考訳(メタデータ) (2021-06-06T23:53:31Z) - A Regret Minimization Approach to Iterative Learning Control [61.37088759497583]
我々は、標準的な不確実性の仮定を最悪の場合の後悔に置き換える新しいパフォーマンスメトリック、計画後悔を提案します。
提案アルゴリズムがいくつかのベンチマークで既存の手法よりも優れているという理論的および実証的な証拠を提供します。
論文 参考訳(メタデータ) (2021-02-26T13:48:49Z) - On the Loss Landscape of Adversarial Training: Identifying Challenges
and How to Overcome Them [57.957466608543676]
機械学習モデルの損失景観に及ぼす対人訓練の影響を解析する。
曲率の増加と散乱勾配の増大により, 対向損失景観は最適化にはあまり好ましくないことを示す。
論文 参考訳(メタデータ) (2020-06-15T13:50:23Z) - Learning to Predict Error for MRI Reconstruction [67.76632988696943]
提案手法による予測の不確実性は予測誤差と強く相関しないことを示す。
本稿では,2段階の予測誤差の目標ラベルと大小を推定する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-02-13T15:55:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。