論文の概要: Wasserstein Distributionally Robust Inverse Multiobjective Optimization
- arxiv url: http://arxiv.org/abs/2009.14552v1
- Date: Wed, 30 Sep 2020 10:44:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-12 23:10:13.066956
- Title: Wasserstein Distributionally Robust Inverse Multiobjective Optimization
- Title(参考訳): ワッサーシュタイン分布ロバスト逆多目的最適化
- Authors: Chaosheng Dong, Bo Zeng
- Abstract要約: 分散ロバストな逆多目的最適化問題(WRO-IMOP)を開発する。
We show that the excess risk of the WRO-IMOP estimator has a sub-linear convergence rate。
合成多目的二次プログラムと実世界のポートフォリオ最適化問題において,本手法の有効性を実証する。
- 参考スコア(独自算出の注目度): 14.366265951396587
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Inverse multiobjective optimization provides a general framework for the
unsupervised learning task of inferring parameters of a multiobjective decision
making problem (DMP), based on a set of observed decisions from the human
expert. However, the performance of this framework relies critically on the
availability of an accurate DMP, sufficient decisions of high quality, and a
parameter space that contains enough information about the DMP. To hedge
against the uncertainties in the hypothetical DMP, the data, and the parameter
space, we investigate in this paper the distributionally robust approach for
inverse multiobjective optimization. Specifically, we leverage the Wasserstein
metric to construct a ball centered at the empirical distribution of these
decisions. We then formulate a Wasserstein distributionally robust inverse
multiobjective optimization problem (WRO-IMOP) that minimizes a worst-case
expected loss function, where the worst case is taken over all distributions in
the Wasserstein ball. We show that the excess risk of the WRO-IMOP estimator
has a sub-linear convergence rate. Furthermore, we propose the semi-infinite
reformulations of the WRO-IMOP and develop a cutting-plane algorithm that
converges to an approximate solution in finite iterations. Finally, we
demonstrate the effectiveness of our method on both a synthetic multiobjective
quadratic program and a real world portfolio optimization problem.
- Abstract(参考訳): 逆多目的最適化は、人間の専門家による一連の決定に基づいて、多目的意思決定問題(DMP)のパラメータを推論する教師なし学習タスクのための一般的なフレームワークを提供する。
しかし、このフレームワークの性能は、正確なDMPの可用性、高品質の十分な決定、DMPに関する十分な情報を含むパラメータ空間に依存している。
仮説的DMP, データ, パラメータ空間の不確かさに対処するため, 本論文では, 逆多目的最適化に対する分布的ロバストなアプローチについて検討する。
具体的には、wassersteinメトリックを利用して、これらの決定の実証的な分布を中心とするボールを構築します。
次に,WRO-IMOP (Warerstein distributionally robust inverse multijective optimization problem) を定式化し,Warerstein 球のすべての分布に対して最悪のケースが取られる最悪のケース予測損失関数を最小化する。
wro-imop推定器の過剰なリスクは、サブリニア収束率を持つことを示す。
さらに、WRO-IMOPの半無限再構成を提案し、有限反復で近似解に収束する切断平面アルゴリズムを開発した。
最後に,合成多目的二次プログラムと実世界のポートフォリオ最適化問題において,本手法の有効性を示す。
関連論文リスト
- Total Uncertainty Quantification in Inverse PDE Solutions Obtained with Reduced-Order Deep Learning Surrogate Models [50.90868087591973]
機械学習サロゲートモデルを用いて得られた逆PDE解の総不確かさを近似したベイズ近似法を提案する。
非線型拡散方程式に対する反復的アンサンブルスムーズおよび深層アンサンブル法との比較により,提案手法を検証した。
論文 参考訳(メタデータ) (2024-08-20T19:06:02Z) - End-to-End Learning for Fair Multiobjective Optimization Under
Uncertainty [55.04219793298687]
機械学習における予測-Then-Forecast(PtO)パラダイムは、下流の意思決定品質を最大化することを目的としている。
本稿では,PtO法を拡張して,OWA(Nondifferentiable Ordered Weighted Averaging)の目的を最適化する。
この結果から,不確実性の下でのOWA関数の最適化とパラメトリック予測を効果的に統合できることが示唆された。
論文 参考訳(メタデータ) (2024-02-12T16:33:35Z) - Model-Free Robust Average-Reward Reinforcement Learning [25.125481838479256]
我々は,モデルフリーの反復設定の下で,ロバストな平均回帰MDPに着目した。
我々は2つのモデルフリーアルゴリズム、ロバスト相対値(RVI)TDとロバスト相対値(RVI)Q-ラーニングを設計し、理論的に最適解への収束性を証明した。
論文 参考訳(メタデータ) (2023-05-17T18:19:23Z) - Multistage Stochastic Optimization via Kernels [3.7565501074323224]
我々は,多段階最適化問題に対する非パラメトリック,データ駆動,トラクタブルアプローチを開発した。
本稿では,提案手法が最適に近い平均性能で決定ルールを生成することを示す。
論文 参考訳(メタデータ) (2023-03-11T23:19:32Z) - Hedging Complexity in Generalization via a Parametric Distributionally
Robust Optimization Framework [18.6306170209029]
経験的リスク最小化(ERM)と分散ロバスト最適化(DRO)は最適化問題の解法として一般的な手法である。
本稿では,パラメトリックな分布系列を用いて乱摂動分布を近似する簡単な手法を提案する。
この新たな誤差源は適切なDRO定式化によって制御可能であることを示す。
論文 参考訳(メタデータ) (2022-12-03T03:26:34Z) - Wasserstein Distributionally Robust Estimation in High Dimensions:
Performance Analysis and Optimal Hyperparameter Tuning [0.0]
雑音線形測定から未知パラメータを推定するための分布的ロバストな推定フレームワークを提案する。
このような推定器の2乗誤差性能を解析する作業に着目する。
凸凹最適化問題の解法として2乗誤差を復元できることを示す。
論文 参考訳(メタデータ) (2022-06-27T13:02:59Z) - Complexity-Free Generalization via Distributionally Robust Optimization [4.313143197674466]
分散ロバスト最適化(DRO)から解の一般化境界を得るための代替経路を提案する。
我々の DRO 境界は、あいまいな集合の幾何と真の損失関数との整合性に依存する。
特に、DRO距離計量として最大平均誤差を用いる場合、我々の分析は、我々の知識の最も良いところは、真の損失関数にのみ依存する文献における第一の一般化であることを示している。
論文 参考訳(メタデータ) (2021-06-21T15:19:52Z) - Learning MDPs from Features: Predict-Then-Optimize for Sequential
Decision Problems by Reinforcement Learning [52.74071439183113]
我々は、強化学習を通して解決された逐次決定問題(MDP)の文脈における予測列最適化フレームワークについて検討した。
2つの重要な計算課題は、意思決定中心の学習をMDPに適用することである。
論文 参考訳(メタデータ) (2021-06-06T23:53:31Z) - Permutation Invariant Policy Optimization for Mean-Field Multi-Agent
Reinforcement Learning: A Principled Approach [128.62787284435007]
本稿では,平均場近似ポリシ最適化(MF-PPO)アルゴリズムを提案する。
我々は,MF-PPOが収束のサブ線形速度で世界的最適政策を達成することを証明した。
特に、置換不変ニューラルアーキテクチャによって引き起こされる誘導バイアスは、MF-PPOが既存の競合より優れていることを示す。
論文 参考訳(メタデータ) (2021-05-18T04:35:41Z) - Modeling the Second Player in Distributionally Robust Optimization [90.25995710696425]
我々は、最悪のケース分布を特徴付けるために神経生成モデルを使うことを議論する。
このアプローチは多くの実装と最適化の課題をもたらします。
提案されたアプローチは、同等のベースラインよりも堅牢なモデルを生み出す。
論文 参考訳(メタデータ) (2021-03-18T14:26:26Z) - Stein Variational Model Predictive Control [130.60527864489168]
不確実性の下での意思決定は、現実の自律システムにとって極めて重要である。
モデル予測制御 (MPC) 法は, 複雑な分布を扱う場合, 適用範囲が限られている。
この枠組みが、挑戦的で非最適な制御問題における計画の成功に繋がることを示す。
論文 参考訳(メタデータ) (2020-11-15T22:36:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。