論文の概要: The Parametric Cost Function Approximation: A new approach for
multistage stochastic programming
- arxiv url: http://arxiv.org/abs/2201.00258v1
- Date: Sat, 1 Jan 2022 23:25:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-04 15:26:42.401125
- Title: The Parametric Cost Function Approximation: A new approach for
multistage stochastic programming
- Title(参考訳): パラメトリックコスト関数近似:多段階確率プログラミングの新しいアプローチ
- Authors: Warren B Powell, Saeed Ghadimi
- Abstract要約: 決定論的最適化モデルのパラメータ化バージョンは、プログラミングや動的プログラミングの複雑さを伴わずに不確実性を扱う効果的な方法であることを示す。
このアプローチは複雑な高次元状態変数を処理でき、シナリオツリーや値関数近似に関連する通常の近似を避けることができる。
- 参考スコア(独自算出の注目度): 4.847980206213335
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The most common approaches for solving multistage stochastic programming
problems in the research literature have been to either use value functions
("dynamic programming") or scenario trees ("stochastic programming") to
approximate the impact of a decision now on the future. By contrast, common
industry practice is to use a deterministic approximation of the future which
is easier to understand and solve, but which is criticized for ignoring
uncertainty. We show that a parameterized version of a deterministic
optimization model can be an effective way of handling uncertainty without the
complexity of either stochastic programming or dynamic programming. We present
the idea of a parameterized deterministic optimization model, and in particular
a deterministic lookahead model, as a powerful strategy for many complex
stochastic decision problems. This approach can handle complex,
high-dimensional state variables, and avoids the usual approximations
associated with scenario trees or value function approximations. Instead, it
introduces the offline challenge of designing and tuning the parameterization.
We illustrate the idea by using a series of application settings, and
demonstrate its use in a nonstationary energy storage problem with rolling
forecasts.
- Abstract(参考訳): 研究文献における多段階確率的プログラミング問題を解決する最も一般的なアプローチは、現在決定が未来に与える影響を近似するためにバリュー関数(動的プログラミング)またはシナリオツリー(確率的プログラミング)を使用することである。
対照的に、一般的な業界の実践は、理解し解くのが容易であるが不確実性を無視していると批判される未来の決定論的近似を使用することである。
決定論的最適化モデルのパラメータ化バージョンは、確率的プログラミングや動的プログラミングの複雑さなしに不確実性を扱う効果的な方法であることを示す。
本稿では,多くの複雑な確率的決定問題に対する強力な戦略として,パラメータ化決定論的最適化モデル,特に決定論的ルックアヘッドモデルを提案する。
このアプローチは複雑な高次元状態変数を処理でき、シナリオツリーや値関数近似に関連する通常の近似を避けることができる。
代わりに、パラメータ化を設計し、チューニングするというオフラインの課題を導入する。
一連のアプリケーション設定を用いてそのアイデアを説明し、ローリング予測を伴う非定常エネルギー貯蔵問題におけるその使用例を示す。
関連論文リスト
- Learning Joint Models of Prediction and Optimization [56.04498536842065]
Predict-Then-Thenフレームワークは、機械学習モデルを使用して、最適化問題の未知のパラメータを、解決前の機能から予測する。
本稿では,共同予測モデルを用いて観測可能特徴から最適解を直接学習する手法を提案する。
論文 参考訳(メタデータ) (2024-09-07T19:52:14Z) - End-to-End Learning for Fair Multiobjective Optimization Under
Uncertainty [55.04219793298687]
機械学習における予測-Then-Forecast(PtO)パラダイムは、下流の意思決定品質を最大化することを目的としている。
本稿では,PtO法を拡張して,OWA(Nondifferentiable Ordered Weighted Averaging)の目的を最適化する。
この結果から,不確実性の下でのOWA関数の最適化とパラメトリック予測を効果的に統合できることが示唆された。
論文 参考訳(メタデータ) (2024-02-12T16:33:35Z) - Predict-Then-Optimize by Proxy: Learning Joint Models of Prediction and
Optimization [59.386153202037086]
Predict-Then-フレームワークは、機械学習モデルを使用して、最適化問題の未知のパラメータを、解決前の機能から予測する。
このアプローチは非効率であり、最適化ステップを通じてバックプロパゲーションのための手作りの、問題固有のルールを必要とする。
本稿では,予測モデルを用いて観測可能な特徴から最適解を直接学習する手法を提案する。
論文 参考訳(メタデータ) (2023-11-22T01:32:06Z) - A Data-Driven State Aggregation Approach for Dynamic Discrete Choice
Models [7.7347261505610865]
本稿では,状態の選択と集約のためのデータ駆動型手法を提案する。
提案した2段階のアプローチは,問題次元を減らして次元の呪いを緩和する。
2つの古典的動的離散的選択推定法におけるアルゴリズムの実証的性能を実証する。
論文 参考訳(メタデータ) (2023-04-11T01:07:24Z) - Numerical Methods for Convex Multistage Stochastic Optimization [86.45244607927732]
最適化プログラミング(SP)、最適制御(SOC)、決定プロセス(MDP)に焦点を当てる。
凸多段マルコフ問題の解決の最近の進歩は、動的プログラミング方程式のコスト対ゴー関数の切断面近似に基づいている。
切削平面型法は多段階問題を多段階的に扱えるが、状態(決定)変数は比較的少ない。
論文 参考訳(メタデータ) (2023-03-28T01:30:40Z) - Sample Complexity of Robust Reinforcement Learning with a Generative
Model [0.0]
本稿では,モデルに基づく強化学習(RL)アルゴリズムを提案する。
我々は,全変動距離,カイ二乗発散,KL発散の3種類の不確実性集合を考察した。
この結果に加えて,ロバストポリシの利点に関する公式な分析的議論も提示する。
論文 参考訳(メタデータ) (2021-12-02T18:55:51Z) - Learning MDPs from Features: Predict-Then-Optimize for Sequential
Decision Problems by Reinforcement Learning [52.74071439183113]
我々は、強化学習を通して解決された逐次決定問題(MDP)の文脈における予測列最適化フレームワークについて検討した。
2つの重要な計算課題は、意思決定中心の学習をMDPに適用することである。
論文 参考訳(メタデータ) (2021-06-06T23:53:31Z) - Modeling the Second Player in Distributionally Robust Optimization [90.25995710696425]
我々は、最悪のケース分布を特徴付けるために神経生成モデルを使うことを議論する。
このアプローチは多くの実装と最適化の課題をもたらします。
提案されたアプローチは、同等のベースラインよりも堅牢なモデルを生み出す。
論文 参考訳(メタデータ) (2021-03-18T14:26:26Z) - Variational Nonlinear System Identification [0.8793721044482611]
本稿では,非線形状態空間モデルに対するパラメータ推定について検討する。
我々は,最大確率推定に深いつながりを持つ原理的手法である変分推論(vi)アプローチを採用する。
このviアプローチは最終的に、決定論的で扱いやすく、標準最適化ツールを使って解決できる最適化問題の解としてモデルの推定を提供する。
論文 参考訳(メタデータ) (2020-12-08T05:43:50Z) - Variable selection for Gaussian process regression through a sparse
projection [0.802904964931021]
本稿では,ガウス過程(GP)レグレッションと統合された新しい変数選択手法を提案する。
パラメータの調整と推定の精度を,選択したベンチマーク手法を用いて評価した。
論文 参考訳(メタデータ) (2020-08-25T01:06:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。