論文の概要: End-to-end Conditional Robust Optimization
- arxiv url: http://arxiv.org/abs/2403.04670v1
- Date: Thu, 7 Mar 2024 17:16:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-08 13:12:39.838275
- Title: End-to-end Conditional Robust Optimization
- Title(参考訳): 終端条件付きロバスト最適化
- Authors: Abhilash Chenreddy and Erick Delage
- Abstract要約: 条件付きロバスト最適化(CRO)は、不確実な定量化と堅牢な最適化を組み合わせることで、高利得アプリケーションの安全性と信頼性を促進する。
本稿では,CROモデルの学習方法として,所定の決定の実証的リスクと,それをサポートする文脈不確実性セットの条件付きカバレッジの質の両方を考慮に入れた,新しいエンドツーエンドアプローチを提案する。
提案したトレーニングアルゴリズムは,従来の推定値を上回って,アプローチを最適化する決定を生成する。
- 参考スコア(独自算出の注目度): 6.363653898208231
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The field of Contextual Optimization (CO) integrates machine learning and
optimization to solve decision making problems under uncertainty. Recently, a
risk sensitive variant of CO, known as Conditional Robust Optimization (CRO),
combines uncertainty quantification with robust optimization in order to
promote safety and reliability in high stake applications. Exploiting modern
differentiable optimization methods, we propose a novel end-to-end approach to
train a CRO model in a way that accounts for both the empirical risk of the
prescribed decisions and the quality of conditional coverage of the contextual
uncertainty set that supports them. While guarantees of success for the latter
objective are impossible to obtain from the point of view of conformal
prediction theory, high quality conditional coverage is achieved empirically by
ingeniously employing a logistic regression differentiable layer within the
calculation of coverage quality in our training loss. We show that the proposed
training algorithms produce decisions that outperform the traditional estimate
then optimize approaches.
- Abstract(参考訳): コンテキスト最適化(CO)の分野は、不確実性の下で意思決定問題を解決する機械学習と最適化を統合している。
近年, 条件付きロバスト最適化 (CRO) と呼ばれるCOのリスク敏感な変種が, 不確実な定量化とロバストな最適化を組み合わせることで, 高利得アプリケーションの安全性と信頼性を向上している。
現代の微分可能最適化手法を考案し、所定の決定の実証リスクとそれをサポートする文脈不確実性セットの条件付きカバレッジの質の両方を考慮し、CROモデルを訓練するための新しいエンドツーエンドアプローチを提案する。
適合予測理論の観点からは,後者の目的に対する成功の保証は得られないが,訓練損失のカバレッジ品質の計算において,ロジスティック回帰微分可能な層を巧みに利用することにより,高品質な条件付きカバレッジを経験的に達成することができる。
提案する学習アルゴリズムは,従来の推定手法に勝る判断を導き,最適化する。
関連論文リスト
- Robust portfolio optimization for recommender systems considering uncertainty of estimated statistics [2.928964540437144]
本稿では,基数に基づく不確実性集合に基づく推定統計の不確実性に対応する,ロバストなポートフォリオ最適化モデルを提案する。
提案手法は,様々なレーティング予測アルゴリズムの推薦品質を向上させる可能性がある。
論文 参考訳(メタデータ) (2024-06-09T15:42:54Z) - Spectral-Risk Safe Reinforcement Learning with Convergence Guarantees [13.470544618339506]
本稿では、スペクトルリスク尺度制約付きRLアルゴリズム、スペクトルリスク制約付きポリシー最適化(SRCPO)を提案する。
双レベル最適化構造では、外部問題はリスク測度から導出される双対変数を最適化することであり、内部問題は最適ポリシーを見つけることである。
提案手法は連続制御タスク上で評価され,制約を満たす他のRCRLアルゴリズムの中で最高の性能を示した。
論文 参考訳(メタデータ) (2024-05-29T02:17:25Z) - End-to-End Learning for Fair Multiobjective Optimization Under
Uncertainty [55.04219793298687]
機械学習における予測-Then-Forecast(PtO)パラダイムは、下流の意思決定品質を最大化することを目的としている。
本稿では,PtO法を拡張して,OWA(Nondifferentiable Ordered Weighted Averaging)の目的を最適化する。
この結果から,不確実性の下でのOWA関数の最適化とパラメトリック予測を効果的に統合できることが示唆された。
論文 参考訳(メタデータ) (2024-02-12T16:33:35Z) - Model-Based Epistemic Variance of Values for Risk-Aware Policy
Optimization [63.32053223422317]
モデルベース強化学習における累積報酬に対する不確実性を定量化する問題を考察する。
特に、MDP上の分布によって誘導される値の分散を特徴付けることに焦点をあてる。
我々は、解が値の真後分散に収束する新しい不確実性ベルマン方程式(UBE)を提案する。
論文 参考訳(メタデータ) (2023-12-07T15:55:58Z) - Rethinking and Benchmarking Predict-then-Optimize Paradigm for
Combinatorial Optimization Problems [62.25108152764568]
多くのWebアプリケーションは、エネルギーコストを考慮したスケジューリング、Web広告の予算配分、ソーシャルネットワークでのグラフマッチングなど、最適化問題の解決に頼っている。
統一システムにおける予測と意思決定の性能について考察する。
我々は、現在のアプローチを包括的に分類し、既存の実験シナリオを統合する。
論文 参考訳(メタデータ) (2023-11-13T13:19:34Z) - Likelihood Ratio Confidence Sets for Sequential Decision Making [51.66638486226482]
確率に基づく推論の原理を再検討し、確率比を用いて妥当な信頼シーケンスを構築することを提案する。
本手法は, 精度の高い問題に特に適している。
提案手法は,オンライン凸最適化への接続に光を当てることにより,推定器の最適シーケンスを確実に選択する方法を示す。
論文 参考訳(メタデータ) (2023-11-08T00:10:21Z) - Conformal Contextual Robust Optimization [21.2737854880866]
データ駆動による確率論的意思決定問題を予測するアプローチは、安全クリティカルな設定における不確実な領域の不確実性のリスクを軽減することを目指している。
本稿では,CPO(Conformal-Then-Predict)フレームワークを提案する。
確率列最適化による意思決定問題。
論文 参考訳(メタデータ) (2023-10-16T01:58:27Z) - Stochastic Methods for AUC Optimization subject to AUC-based Fairness
Constraints [51.12047280149546]
公正な予測モデルを得るための直接的なアプローチは、公正な制約の下で予測性能を最適化することでモデルを訓練することである。
フェアネスを考慮した機械学習モデルのトレーニング問題を,AUCに基づくフェアネス制約のクラスを対象とする最適化問題として定式化する。
フェアネス測定値の異なる実世界のデータに対するアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2022-12-23T22:29:08Z) - Integrated Conditional Estimation-Optimization [6.037383467521294]
確率のある不確実なパラメータを文脈的特徴情報を用いて推定できる実世界の多くの最適化問題である。
不確実なパラメータの分布を推定する標準的な手法とは対照的に,統合された条件推定手法を提案する。
当社のI CEOアプローチは、穏健な条件下で理論的に一貫性があることを示します。
論文 参考訳(メタデータ) (2021-10-24T04:49:35Z) - Policy Gradient Bayesian Robust Optimization for Imitation Learning [49.881386773269746]
我々は、期待される性能とリスクのバランスをとるために、新しいポリシー勾配スタイルのロバスト最適化手法PG-BROILを導出する。
その結果,PG-BROILはリスクニュートラルからリスク・アバースまでの行動のファミリを創出できる可能性が示唆された。
論文 参考訳(メタデータ) (2021-06-11T16:49:15Z) - Chance Constrained Policy Optimization for Process Control and
Optimization [1.4908563154226955]
1) プラントモデルミスマッチ, 2) プロセス障害, 3) 安全な運転の制約が, 化学プロセスの最適化と制御に影響を及ぼす。
本研究では,確率の高い連立確率制約の満足度を保証できる確率制約付きポリシ最適化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-30T14:20:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。