論文の概要: A Survey of Contextual Optimization Methods for Decision Making under
Uncertainty
- arxiv url: http://arxiv.org/abs/2306.10374v2
- Date: Fri, 2 Feb 2024 22:54:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-07 06:04:45.643986
- Title: A Survey of Contextual Optimization Methods for Decision Making under
Uncertainty
- Title(参考訳): 不確実性を考慮した意思決定における文脈最適化手法の検討
- Authors: Utsav Sadana, Abhilash Chenreddy, Erick Delage, Alexandre Forel, Emma
Frejinger, Thibaut Vidal
- Abstract要約: この記事では、データからポリシーを学ぶための3つの主要なフレームワークを特定し、その強みと限界について論じる。
統一的な表記と用語の下で既存のモデルとメソッドを示し、これらを3つの主要なフレームワークに従って分類する。
- 参考スコア(独自算出の注目度): 47.73071218563257
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently there has been a surge of interest in operations research (OR) and
the machine learning (ML) community in combining prediction algorithms and
optimization techniques to solve decision-making problems in the face of
uncertainty. This gave rise to the field of contextual optimization, under
which data-driven procedures are developed to prescribe actions to the
decision-maker that make the best use of the most recently updated information.
A large variety of models and methods have been presented in both OR and ML
literature under a variety of names, including data-driven optimization,
prescriptive optimization, predictive stochastic programming, policy
optimization, (smart) predict/estimate-then-optimize, decision-focused
learning, (task-based) end-to-end learning/forecasting/optimization, etc.
Focusing on single and two-stage stochastic programming problems, this review
article identifies three main frameworks for learning policies from data and
discusses their strengths and limitations. We present the existing models and
methods under a uniform notation and terminology and classify them according to
the three main frameworks identified. Our objective with this survey is to both
strengthen the general understanding of this active field of research and
stimulate further theoretical and algorithmic advancements in integrating ML
and stochastic programming.
- Abstract(参考訳): 近年,不確実性に直面した意思決定問題を解決するために,予測アルゴリズムと最適化手法を組み合わせた操作研究(OR)と機械学習(ML)コミュニティへの関心が高まっている。
これによりコンテキスト最適化の分野が生まれ、データ駆動の手順が開発され、最も最近更新された情報を最大限に活用する意思決定者にアクションを処方する。
データ駆動型最適化、規範的最適化、予測確率プログラミング、ポリシー最適化、(スマート)予測/見積-最適化、決定中心学習、(タスクベース)エンドツーエンドの学習/予測/最適化など、さまざまな名前でORとMLの文献にさまざまなモデルとメソッドが提示されている。
本稿では,1段階と2段階の確率的プログラミング問題に着目し,データから方針を学ぶための3つの主要なフレームワークを特定し,その強みと限界について論じる。
既存のモデルと手法を統一的な記法と用語で提示し,識別された3つのフレームワークに従って分類する。
この調査の目的は、この活発な研究分野の一般的な理解を強化し、mlと確率的プログラミングの統合におけるさらなる理論とアルゴリズムの進歩を刺激することである。
関連論文リスト
- Autoformulation of Mathematical Optimization Models Using LLMs [50.030647274271516]
商用問題解決者のための自然言語記述から最適化モデルを作成するための自動アプローチを開発する。
本稿では,(1)問題依存仮説空間の定義,(2)不確実性の下でこの空間を効率的に探索すること,(3)定式化の正しさを評価すること,の3つの課題を同定する。
論文 参考訳(メタデータ) (2024-11-03T20:41:38Z) - Learning Joint Models of Prediction and Optimization [56.04498536842065]
Predict-Then-Thenフレームワークは、機械学習モデルを使用して、最適化問題の未知のパラメータを、解決前の機能から予測する。
本稿では,共同予測モデルを用いて観測可能特徴から最適解を直接学習する手法を提案する。
論文 参考訳(メタデータ) (2024-09-07T19:52:14Z) - Unraveling the Versatility and Impact of Multi-Objective Optimization: Algorithms, Applications, and Trends for Solving Complex Real-World Problems [4.023511716339818]
マルチオブジェクト最適化(MOO)技術は近年ますます人気が高まっている。
本稿では,最近開発されたMOOアルゴリズムについて検討する。
実世界のケーススタディでは、MOOアルゴリズムは複雑な意思決定課題に対処する。
論文 参考訳(メタデータ) (2024-06-29T15:19:46Z) - Constrained Reinforcement Learning with Average Reward Objective: Model-Based and Model-Free Algorithms [34.593772931446125]
モノグラフは、平均報酬決定過程(MDPs)の文脈内で制約された様々なモデルベースおよびモデルフリーアプローチの探索に焦点を当てている
このアルゴリズムは制約付きMDPの解法として検討されている。
論文 参考訳(メタデータ) (2024-06-17T12:46:02Z) - End-to-End Learning for Fair Multiobjective Optimization Under
Uncertainty [55.04219793298687]
機械学習における予測-Then-Forecast(PtO)パラダイムは、下流の意思決定品質を最大化することを目的としている。
本稿では,PtO法を拡張して,OWA(Nondifferentiable Ordered Weighted Averaging)の目的を最適化する。
この結果から,不確実性の下でのOWA関数の最適化とパラメトリック予測を効果的に統合できることが示唆された。
論文 参考訳(メタデータ) (2024-02-12T16:33:35Z) - Learning MDPs from Features: Predict-Then-Optimize for Sequential
Decision Problems by Reinforcement Learning [52.74071439183113]
我々は、強化学習を通して解決された逐次決定問題(MDP)の文脈における予測列最適化フレームワークについて検討した。
2つの重要な計算課題は、意思決定中心の学習をMDPに適用することである。
論文 参考訳(メタデータ) (2021-06-06T23:53:31Z) - Integrated Optimization of Predictive and Prescriptive Tasks [0.0]
予測タスクを記述タスクとして直接統合する新しいフレームワークを提案する。
予測アルゴリズムのパラメータを2レベル最適化技術により、処方問題内でトレーニングします。
論文 参考訳(メタデータ) (2021-01-02T02:43:10Z) - A Survey on Large-scale Machine Learning [67.6997613600942]
機械学習はデータに対する深い洞察を与え、マシンが高品質な予測を行うことを可能にする。
ほとんどの高度な機械学習アプローチは、大規模なデータを扱う場合の膨大な時間コストに悩まされる。
大規模機械学習は、ビッグデータからパターンを、同等のパフォーマンスで効率的に学習することを目的としている。
論文 参考訳(メタデータ) (2020-08-10T06:07:52Z) - A Unifying Framework for Reinforcement Learning and Planning [2.564530030795554]
本稿では、強化学習計画(FRAP)のための統一的アルゴリズムフレームワークを提案する。
論文の最後には、これらの次元に沿って、よく知られたプランニング、モデルフリー、モデルベースRLアルゴリズムを比較した。
論文 参考訳(メタデータ) (2020-06-26T14:30:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。