論文の概要: Regret Bounds and Experimental Design for Estimate-then-Optimize
- arxiv url: http://arxiv.org/abs/2210.15576v1
- Date: Thu, 27 Oct 2022 16:13:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-28 15:15:56.192311
- Title: Regret Bounds and Experimental Design for Estimate-then-Optimize
- Title(参考訳): 最適推定のためのレグレト境界と実験設計
- Authors: Samuel Tan, Peter I. Frazier
- Abstract要約: 実用的なアプリケーションでは、データは見積もりと最適化の2つのステップで決定される。
見積もりステップのエラーは、見積もりを最適化して、サブ最適決定に導くことができる。
我々は、滑らかで制約のない最適化問題に対するこの後悔に縛られた小説を提供する。
- 参考スコア(独自算出の注目度): 9.340611077939828
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In practical applications, data is used to make decisions in two steps:
estimation and optimization. First, a machine learning model estimates
parameters for a structural model relating decisions to outcomes. Second, a
decision is chosen to optimize the structural model's predicted outcome as if
its parameters were correctly estimated. Due to its flexibility and simple
implementation, this ``estimate-then-optimize'' approach is often used for
data-driven decision-making. Errors in the estimation step can lead
estimate-then-optimize to sub-optimal decisions that result in regret, i.e., a
difference in value between the decision made and the best decision available
with knowledge of the structural model's parameters. We provide a novel bound
on this regret for smooth and unconstrained optimization problems. Using this
bound, in settings where estimated parameters are linear transformations of
sub-Gaussian random vectors, we provide a general procedure for experimental
design to minimize the regret resulting from estimate-then-optimize. We
demonstrate our approach on simple examples and a pandemic control application.
- Abstract(参考訳): 実用的なアプリケーションでは、データは見積もりと最適化の2つのステップで決定される。
まず、機械学習モデルは、決定と結果に関する構造モデルのパラメータを推定する。
第二に、パラメータが正しく推定されたかのように、構造モデルの予測結果の最適化が決定される。
柔軟性とシンプルな実装のため、この ``estimate-then-optimize''' アプローチはデータ駆動の意思決定によく使われる。
推定ステップの誤差は、見積もりを最適化して、後悔をもたらす準最適決定、すなわち、決定と構造モデルのパラメータの知識で得られる最良の決定の値の差に導くことができる。
滑らかで制約のない最適化問題に対するこの後悔に縛られた小説を提供する。
この境界を用いて、推定パラメータがガウス以下のランダムベクトルの線形変換であるような場合、推定列最適化による後悔を最小限に抑えるための実験設計のための一般的な手順を提供する。
簡単な例とパンデミックコントロールアプリケーションについて,我々のアプローチを実証する。
関連論文リスト
- Scaling Exponents Across Parameterizations and Optimizers [94.54718325264218]
本稿では,先行研究における重要な仮定を考察し,パラメータ化の新たな視点を提案する。
私たちの経験的調査には、3つの組み合わせでトレーニングされた数万のモデルが含まれています。
最高の学習率のスケーリング基準は、以前の作業の仮定から除外されることがよくあります。
論文 参考訳(メタデータ) (2024-07-08T12:32:51Z) - Adaptive Preference Scaling for Reinforcement Learning with Human Feedback [103.36048042664768]
人間からのフィードバックからの強化学習(RLHF)は、AIシステムと人間の価値を合わせるための一般的なアプローチである。
本稿では,分散ロバスト最適化(DRO)に基づく適応的優先損失を提案する。
提案手法は多用途であり,様々な選好最適化フレームワークに容易に適用可能である。
論文 参考訳(メタデータ) (2024-06-04T20:33:22Z) - End-to-End Learning for Fair Multiobjective Optimization Under
Uncertainty [55.04219793298687]
機械学習における予測-Then-Forecast(PtO)パラダイムは、下流の意思決定品質を最大化することを目的としている。
本稿では,PtO法を拡張して,OWA(Nondifferentiable Ordered Weighted Averaging)の目的を最適化する。
この結果から,不確実性の下でのOWA関数の最適化とパラメトリック予測を効果的に統合できることが示唆された。
論文 参考訳(メタデータ) (2024-02-12T16:33:35Z) - Decision-focused predictions via pessimistic bilevel optimization: a computational study [0.7499722271664147]
最適化パラメータの不確かさは、重要かつ長年にわたる課題である。
予測モデルを構築して,それを用いた意思決定の文言的指標を測定します。
トラクタビリティを実現するために,様々な計算手法を示す。
論文 参考訳(メタデータ) (2023-12-29T15:05:00Z) - Predict-Then-Optimize by Proxy: Learning Joint Models of Prediction and
Optimization [59.386153202037086]
Predict-Then-フレームワークは、機械学習モデルを使用して、最適化問題の未知のパラメータを、解決前の機能から予測する。
このアプローチは非効率であり、最適化ステップを通じてバックプロパゲーションのための手作りの、問題固有のルールを必要とする。
本稿では,予測モデルを用いて観測可能な特徴から最適解を直接学習する手法を提案する。
論文 参考訳(メタデータ) (2023-11-22T01:32:06Z) - DADO -- Low-Cost Query Strategies for Deep Active Design Optimization [1.6298921134113031]
我々は,多目的設計最適化問題における計算コストを削減するために,自己最適化のための2つの選択戦略を提案する。
我々は流体力学の領域から大規模データセットの戦略を評価し、モデルの性能を決定するために2つの新しい評価指標を導入する。
論文 参考訳(メタデータ) (2023-07-10T13:01:27Z) - A Note on Task-Aware Loss via Reweighing Prediction Loss by
Decision-Regret [11.57423546614283]
我々は予測最適化の意思決定対応版を提案する。
コストの(非重みのない)パイロット推定器が犯した決定の後悔による予測誤差を再検討する。
このアプローチは"予測を最適化する"フレームワークよりも改善する可能性があることを示す。
論文 参考訳(メタデータ) (2022-11-09T18:59:35Z) - Efficient Learning of Decision-Making Models: A Penalty Block Coordinate
Descent Algorithm for Data-Driven Inverse Optimization [12.610576072466895]
我々は、意思決定プロセスを明らかにするために、事前の意思決定データを使用する逆問題を考える。
この統計的学習問題は、データ駆動逆最適化と呼ばれる。
そこで本稿では,大規模問題を解くために,効率的なブロック座標降下に基づくアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-10-27T12:52:56Z) - SimPO: Simultaneous Prediction and Optimization [3.181417685380586]
本稿では,同時予測最適化(SimPO)フレームワークの定式化を提案する。
このフレームワークでは,決定駆動型予測MLモデルと最適化対象関数の重み付き損失を併用する。
論文 参考訳(メタデータ) (2022-03-31T20:01:36Z) - Learning MDPs from Features: Predict-Then-Optimize for Sequential
Decision Problems by Reinforcement Learning [52.74071439183113]
我々は、強化学習を通して解決された逐次決定問題(MDP)の文脈における予測列最適化フレームワークについて検討した。
2つの重要な計算課題は、意思決定中心の学習をMDPに適用することである。
論文 参考訳(メタデータ) (2021-06-06T23:53:31Z) - Fast Rates for Contextual Linear Optimization [52.39202699484225]
提案手法は, 下流決定性能を直接最適化する手法よりもはるかに高速な, 後悔の収束率を実現する。
予測モデルは、既存のツールを使ったトレーニングが簡単かつ高速で、解釈が簡単で、私たちが示しているように、非常にうまく機能する決定につながる。
論文 参考訳(メタデータ) (2020-11-05T18:43:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。