論文の概要: Markov Decision Processes under Model Uncertainty
- arxiv url: http://arxiv.org/abs/2206.06109v1
- Date: Mon, 13 Jun 2022 12:51:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-14 18:21:47.891142
- Title: Markov Decision Processes under Model Uncertainty
- Title(参考訳): モデル不確かさ下におけるマルコフ決定過程
- Authors: Ariel Neufeld, Julian Sester, Mario \v{S}iki\'c
- Abstract要約: モデル不確実性の下でマルコフ決定問題に対する一般的な枠組みを導入する。
このフレームワークをS&P 500のデータを含むポートフォリオ最適化に適用する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce a general framework for Markov decision problems under model
uncertainty in a discrete-time infinite horizon setting. By providing a dynamic
programming principle we obtain a local-to-global paradigm, namely solving a
local, i.e., a one time-step robust optimization problem leads to an optimizer
of the global (i.e. infinite time-steps) robust stochastic optimal control
problem, as well as to a corresponding worst-case measure. Moreover, we apply
this framework to portfolio optimization involving data of the S&P 500. We
present two different types of ambiguity sets; one is fully data-driven given
by a Wasserstein-ball around the empirical measure, the second one is described
by a parametric set of multivariate normal distributions, where the
corresponding uncertainty sets of the parameters are estimated from the data.
It turns out that in scenarios where the market is volatile or bearish, the
optimal portfolio strategies from the corresponding robust optimization problem
outperforms the ones without model uncertainty, showcasing the importance of
taking model uncertainty into account.
- Abstract(参考訳): 離散時間無限地平線設定におけるモデル不確実性の下でのマルコフ決定問題の一般的な枠組みを紹介する。
動的プログラミングの原理を提供することにより、局所的-グローバルなパラダイム、すなわち、一段階の堅牢な最適化問題を解くことで、大域的(無限の時間ステップ)頑健な確率的最適制御問題の最適化と、それに対応する最悪の尺度が得られる。
さらに、このフレームワークをS&P500のデータを含むポートフォリオ最適化に適用する。
2つの異なる曖昧性集合を提示する。1つは経験的測度の周りのwasserstein-ballによって与えられたデータ駆動であり、もう1つはパラメータの不確かさ集合がデータから推定される多変量正規分布のパラメトリック集合によって記述される。
市場が変動的あるいは不安定なシナリオでは、対応する堅牢な最適化問題からの最適ポートフォリオ戦略がモデル不確実性のないポートフォリオよりも優れており、モデル不確実性を考慮することの重要性が示される。
関連論文リスト
- End-to-End Learning for Fair Multiobjective Optimization Under
Uncertainty [55.04219793298687]
機械学習における予測-Then-Forecast(PtO)パラダイムは、下流の意思決定品質を最大化することを目的としている。
本稿では,PtO法を拡張して,OWA(Nondifferentiable Ordered Weighted Averaging)の目的を最適化する。
この結果から,不確実性の下でのOWA関数の最適化とパラメトリック予測を効果的に統合できることが示唆された。
論文 参考訳(メタデータ) (2024-02-12T16:33:35Z) - Model-Free Robust Average-Reward Reinforcement Learning [25.125481838479256]
我々は,モデルフリーの反復設定の下で,ロバストな平均回帰MDPに着目した。
我々は2つのモデルフリーアルゴリズム、ロバスト相対値(RVI)TDとロバスト相対値(RVI)Q-ラーニングを設計し、理論的に最適解への収束性を証明した。
論文 参考訳(メタデータ) (2023-05-17T18:19:23Z) - Improving Generalization via Uncertainty Driven Perturbations [107.45752065285821]
トレーニングデータポイントの不確実性による摂動について考察する。
損失駆動摂動とは異なり、不確実性誘導摂動は決定境界を越えてはならない。
線形モデルにおいて,UDPがロバスト性マージン決定を達成することが保証されていることを示す。
論文 参考訳(メタデータ) (2022-02-11T16:22:08Z) - Sample Complexity of Robust Reinforcement Learning with a Generative
Model [0.0]
本稿では,モデルに基づく強化学習(RL)アルゴリズムを提案する。
我々は,全変動距離,カイ二乗発散,KL発散の3種類の不確実性集合を考察した。
この結果に加えて,ロバストポリシの利点に関する公式な分析的議論も提示する。
論文 参考訳(メタデータ) (2021-12-02T18:55:51Z) - Integrated Conditional Estimation-Optimization [6.037383467521294]
確率のある不確実なパラメータを文脈的特徴情報を用いて推定できる実世界の多くの最適化問題である。
不確実なパラメータの分布を推定する標準的な手法とは対照的に,統合された条件推定手法を提案する。
当社のI CEOアプローチは、穏健な条件下で理論的に一貫性があることを示します。
論文 参考訳(メタデータ) (2021-10-24T04:49:35Z) - Robustifying Conditional Portfolio Decisions via Optimal Transport [19.30689697702845]
副次情報,条件推定,ロバスト性を統合したデータ駆動型ポートフォリオ選択モデルを提案する。
側情報問題による分散ロバストなポートフォリオ割り当ては,有限次元最適化問題として再構成可能であることを示す。
論文 参考訳(メタデータ) (2021-03-30T15:56:03Z) - Modeling the Second Player in Distributionally Robust Optimization [90.25995710696425]
我々は、最悪のケース分布を特徴付けるために神経生成モデルを使うことを議論する。
このアプローチは多くの実装と最適化の課題をもたらします。
提案されたアプローチは、同等のベースラインよりも堅牢なモデルを生み出す。
論文 参考訳(メタデータ) (2021-03-18T14:26:26Z) - Stein Variational Model Predictive Control [130.60527864489168]
不確実性の下での意思決定は、現実の自律システムにとって極めて重要である。
モデル予測制御 (MPC) 法は, 複雑な分布を扱う場合, 適用範囲が限られている。
この枠組みが、挑戦的で非最適な制御問題における計画の成功に繋がることを示す。
論文 参考訳(メタデータ) (2020-11-15T22:36:59Z) - Robust, Accurate Stochastic Optimization for Variational Inference [68.83746081733464]
また, 共通最適化手法は, 問題が適度に大きい場合, 変分近似の精度が低下することを示した。
これらの結果から,基礎となるアルゴリズムをマルコフ連鎖の生成とみなして,より堅牢で正確な最適化フレームワークを開発する。
論文 参考訳(メタデータ) (2020-09-01T19:12:11Z) - Accounting for Unobserved Confounding in Domain Generalization [107.0464488046289]
本稿では,データセットの組み合わせから頑健で一般化可能な予測モデルを学習する際の問題点について検討する。
堅牢なモデルを学ぶことの課題の一部は、保存されていない共同設立者の影響にある。
異なるモダリティの医療データに対するアプローチの実証的性能を実証する。
論文 参考訳(メタデータ) (2020-07-21T08:18:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。