Fugu-MT 論文翻訳(概要): Data-driven Multistage Distributionally Robust Linear Optimization with Nested Distance

論文の概要: Data-driven Multistage Distributionally Robust Linear Optimization with Nested Distance

arxiv url: http://arxiv.org/abs/2407.16346v1
Date: Tue, 23 Jul 2024 09:49:22 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-24 17:45:51.880301
Title: Data-driven Multistage Distributionally Robust Linear Optimization with Nested Distance
Title（参考訳）: ネスト距離を用いたデータ駆動多段分布ロバスト線形最適化
Authors: Rui Gao, Rohit Arora, Yizhe Huang,
Abstract要約: サンプルパスに時間一貫性があり,適切に定義された,最適なロバストポリシを見出す。凸最適化手法を用いて,値関数を効率的に計算できる場合の抽出可能なケースを同定する。
参考スコア（独自算出の注目度）: 11.651972987789655
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We study multistage distributionally robust linear optimization, where the uncertainty set is defined as a ball of distribution centered at a scenario tree using the nested distance. The resulting minimax problem is notoriously difficult to solve due to its inherent non-convexity. In this paper, we demonstrate that, under mild conditions, the robust risk evaluation of a given policy can be expressed in an equivalent recursive form. Furthermore, assuming stagewise independence, we derive equivalent dynamic programming reformulations to find an optimal robust policy that is time-consistent and well-defined on unseen sample paths. Our reformulations reconcile two modeling frameworks: the multistage-static formulation (with nested distance) and the multistage-dynamic formulation (with one-period Wasserstein distance). Moreover, we identify tractable cases when the value functions can be computed efficiently using convex optimization techniques.
Abstract（参考訳）: 本研究では,複数段階の分布性のある線形最適化について検討し,不確実性集合をネスト距離を用いてシナリオツリーを中心とする分布の球として定義する。結果として生じるミニマックス問題は、その固有の非凸性のために解決が難しいことで知られている。本稿では、軽度条件下では、与えられたポリシーの頑健なリスク評価を等価な再帰形式で表現できることを実証する。さらに、段階的に独立を仮定すると、等価な動的プログラミング改革を導出し、未確認のサンプルパスに時間一貫性があり、適切に定義された最適なロバストなポリシーを見出す。我々は,多段階静電定式化 (入れ子距離) と多段階動的定式化 (一周期ワッサーシュタイン距離) の2つのモデリング枠組みを整理する。さらに、凸最適化手法を用いて、値関数を効率的に計算できる場合の抽出可能なケースを同定する。

関連論文リスト

Parallel Diffusion Solver via Residual Dirichlet Policy Optimization [88.7827307535107]
拡散モデル(DM)は、最先端の生成性能を達成したが、シーケンシャルなデノナイジング特性のため、高いサンプリング遅延に悩まされている。既存のソルバベースの加速度法では、低次元の予算で画像品質が著しく低下することが多い。本研究では,各ステップに複数の勾配並列評価を組み込んだ新しいODE解法であるEnsemble Parallel Directionsolvr(EPD-EPr)を提案する。
論文参考訳（メタデータ） (2025-12-28T05:48:55Z)
Uniform-in-time convergence bounds for Persistent Contrastive Divergence Algorithms [0.29494468099506904]
非正規化密度の最大最大値推定(MLE)のための持続的コントラスト分散(PCD)の連続時間定式化を提案する。我々は,PCDとモデルパラメータのMLE解との誤差に対して,明示的な境界を導出することができる。
論文参考訳（メタデータ） (2025-10-02T12:12:33Z)
Stochastic Optimization with Optimal Importance Sampling [49.484190237840714]
本稿では,両者の時間的分離を必要とせずに,意思決定とIS分布を共同で更新する反復型アルゴリズムを提案する。本手法は,IS分布系に対する目的的,軽度な仮定の凸性の下で,最小の変数分散を達成し,大域収束を保証する。
論文参考訳（メタデータ） (2025-04-04T16:10:18Z)
Nested Stochastic Algorithm for Generalized Sinkhorn distance-Regularized Distributionally Robust Optimization [4.989068568135242]
分散ロバストシフト最適化(DRO)は、データ分散に対するロバストモデルのための強力な手法である。本稿では、一般化近似関数によって不確実性をモデル化した正規化非DRO問題の解決を目的とする。
論文参考訳（メタデータ） (2025-03-29T01:01:02Z)
Wasserstein Distributionally Robust Bayesian Optimization with Continuous Context [5.4147994801415145]
我々は,文脈分布の不確実性の下での逐次的データ駆動意思決定の課題に対処する。 We propose a novel algorithm for Wasserstein Distributionally Robust Bayesian Optimization。我々の理論解析はヒルベルト空間における自己正規化濃度と分布的ロバストな最適化のための有限サンプル境界の最近の結果を組み合わせたものである。
論文参考訳（メタデータ） (2025-03-26T09:11:17Z)
Generalization Bounds of Surrogate Policies for Combinatorial Optimization Problems [53.03951222945921]
我々はスムーズな(摂動された)ポリシーを解析し、線形オラクルが使用する方向に対して制御されたランダムな摂動を付加する。我々の主な貢献は、過剰リスクを摂動バイアス、統計的推定誤差、最適化誤差に分解する一般化境界である。車両のスケジューリングやスムーズ化がトラクタブルトレーニングと制御された一般化の両方を可能にしていることを示す。
論文参考訳（メタデータ） (2024-07-24T12:00:30Z)
Improved High-Probability Bounds for the Temporal Difference Learning Algorithm via Exponential Stability [17.771354881467435]
一般化された, インスタンスに依存しないステップサイズを持つ単純なアルゴリズムは, ほぼ最適分散とバイアス項を得るのに十分であることを示す。本手法は, 線形近似のための洗練された誤差境界と, ランダム行列の積に対する新しい安定性結果に基づく。
論文参考訳（メタデータ） (2023-10-22T12:37:25Z)
Multistage Stochastic Optimization via Kernels [3.7565501074323224]
我々は,多段階最適化問題に対する非パラメトリック,データ駆動,トラクタブルアプローチを開発した。本稿では,提案手法が最適に近い平均性能で決定ルールを生成することを示す。
論文参考訳（メタデータ） (2023-03-11T23:19:32Z)
Inference on Optimal Dynamic Policies via Softmax Approximation [27.396891119011215]
最適な治療体制に対するソフトマックスの簡単な近似は、真に最適な治療体制に対する妥当な推測を達成できることを示す。我々の研究は、半パラメトリック推論と$g$-estimationの技法と適切な配列中央極限定理を組み合わせたものである。
論文参考訳（メタデータ） (2023-03-08T07:42:47Z)
Fully Stochastic Trust-Region Sequential Quadratic Programming for Equality-Constrained Optimization Problems [62.83783246648714]
目的と決定論的等式制約による非線形最適化問題を解くために,逐次2次プログラミングアルゴリズム(TR-StoSQP)を提案する。アルゴリズムは信頼領域半径を適応的に選択し、既存の直線探索StoSQP方式と比較して不確定なヘッセン行列を利用することができる。
論文参考訳（メタデータ） (2022-11-29T05:52:17Z)
Distributionally robust risk evaluation with a causality constraint and structural information [0.0]
ニューラルネットワークによるテスト関数を近似し、Rademacherの複雑さによるサンプルの複雑さを証明する。我々のフレームワークは、分散的にロバストなポートフォリオ選択問題において、従来のものよりも優れています。
論文参考訳（メタデータ） (2022-03-20T14:48:37Z)
Optimal Rates for Random Order Online Optimization [60.011653053877126]
敵が損失関数を選択できるカテットガルバー2020onlineについて検討するが、一様にランダムな順序で提示される。 2020onlineアルゴリズムが最適境界を達成し,安定性を著しく向上することを示す。
論文参考訳（メタデータ） (2021-06-29T09:48:46Z)
Optimal oracle inequalities for solving projected fixed-point equations [53.31620399640334]
ヒルベルト空間の既知の低次元部分空間を探索することにより、確率観測の集合を用いて近似解を計算する手法を検討する。本稿では,線形関数近似を用いた政策評価問題に対する時間差分学習手法の誤差を正確に評価する方法について述べる。
論文参考訳（メタデータ） (2020-12-09T20:19:32Z)
Adaptive Sequential SAA for Solving Two-stage Stochastic Linear Programs [1.6181085766811525]
大規模2段階線形プログラムを解くための適応的逐次SAA(sample average approximation)アルゴリズムを提案する。提案アルゴリズムは,品質の確率論的保証が与えられた解を返すために,有限時間で停止することができる。
論文参考訳（メタデータ） (2020-12-07T14:58:16Z)
Efficient semidefinite-programming-based inference for binary and multi-class MRFs [83.09715052229782]
分割関数やMAP推定をペアワイズMRFで効率的に計算する手法を提案する。一般のバイナリMRFから完全多クラス設定への半定緩和を拡張し、解法を用いて再び効率的に解けるようなコンパクトな半定緩和を開発する。
論文参考訳（メタデータ） (2020-12-04T15:36:29Z)
High-Dimensional Robust Mean Estimation via Gradient Descent [73.61354272612752]
一定対向分数の存在下でのロバスト平均推定の問題は勾配降下によって解けることを示す。我々の研究は、近辺の非補題推定とロバスト統計の間の興味深い関係を確立する。
論文参考訳（メタデータ） (2020-05-04T10:48:04Z)
Is Temporal Difference Learning Optimal? An Instance-Dependent Analysis [102.29671176698373]
我々は、割引決定過程における政策評価の問題に対処し、生成モデルの下で、ll_infty$errorに対するマルコフに依存した保証を提供する。我々は、ポリシー評価のために、局所ミニマックス下限の両漸近バージョンと非漸近バージョンを確立し、アルゴリズムを比較するためのインスタンス依存ベースラインを提供する。
論文参考訳（メタデータ） (2020-03-16T17:15:28Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。