論文の概要: Multistage Conditional Compositional Optimization
- arxiv url: http://arxiv.org/abs/2604.14075v1
- Date: Wed, 15 Apr 2026 16:45:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.649007
- Title: Multistage Conditional Compositional Optimization
- Title(参考訳): 多段階条件構成最適化
- Authors: Buse Şen, Yifan Hu, Daniel Kuhn,
- Abstract要約: 我々は,不確実性を考慮した意思決定のための新しいパラダイムとして,多段階条件構成最適化(MCCO)を導入する。
MCCOは条件付き期待と非線形コスト関数のネストを最小限にする。
最適停止、線形二乗規制問題、分布的に頑健な文脈的帯域幅、および動的リスク対策に関わる問題に多くの応用がある。
- 参考スコア(独自算出の注目度): 10.639780409712808
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce Multistage Conditional Compositional Optimization (MCCO) as a new paradigm for decision-making under uncertainty that combines aspects of multistage stochastic programming and conditional stochastic optimization. MCCO minimizes a nest of conditional expectations and nonlinear cost functions. It has numerous applications and arises, for example, in optimal stopping, linear-quadratic regulator problems, distributionally robust contextual bandits, as well as in problems involving dynamic risk measures. The naïve nested sampling approach for MCCO suffers from the curse of dimensionality familiar from scenario tree-based multistage stochastic programming, that is, its scenario complexity grows exponentially with the number of nests. We develop new multilevel Monte Carlo techniques for MCCO whose scenario complexity grows only polynomially with the desired accuracy.
- Abstract(参考訳): 我々は,多段階確率プログラミングと条件確率最適化の側面を組み合わせた不確実性の下での意思決定のための新しいパラダイムとして,多段階条件合成最適化(MCCO)を紹介した。
MCCOは条件付き期待と非線形コスト関数のネストを最小限にする。
様々な応用があり、例えば、最適停止、線形四重項規制問題、分布的に堅牢な文脈的帯域幅、および動的リスク対策を含む問題などにおいて発生する。
MCCOのネストサンプリングアプローチは、シナリオツリーベースの多段階確率プログラミングに慣れ親しんだ次元性の呪い、すなわち、そのシナリオの複雑さは、ネストの数とともに指数関数的に増加する。
我々はMCCOのための新しいマルチレベルモンテカルロ手法を開発し、シナリオの複雑さは所望の精度で多項式的にしか成長しない。
関連論文リスト
- Stochastic interior-point methods for smooth conic optimization with applications [0.8519339317685906]
一般円錐最適化のためのインテリアポイント法を4つの新しいSIPM変種とともに導入する。
提案したSIPMの複雑性は,多対数係数まで,制約のないデータストリームにおいて最もよく知られた結果と一致する。
頑健な線形回帰、マルチタスク関係学習、クラスタリングデータストリームの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2024-12-17T15:06:44Z) - Context-aware Diversity Enhancement for Neural Multi-Objective Combinatorial Optimization [19.631213689157995]
マルチオブジェクト最適化(MOCO)問題は、様々な現実世界のアプリケーションで広く用いられている。
我々はCDEというコンテキスト対応の多様性向上アルゴリズムを提案する。
提案したCDEは,文脈情報を効果的かつ効率的に把握し,多様性の向上をもたらす。
論文 参考訳(メタデータ) (2024-05-14T13:42:19Z) - Sample-Efficient Multi-Agent RL: An Optimization Perspective [103.35353196535544]
一般関数近似に基づく汎用マルコフゲーム(MG)のためのマルチエージェント強化学習(MARL)について検討した。
汎用MGに対するマルチエージェントデカップリング係数(MADC)と呼ばれる新しい複雑性尺度を導入する。
我々のアルゴリズムは既存の研究に匹敵するサブリニアな後悔を与えることを示す。
論文 参考訳(メタデータ) (2023-10-10T01:39:04Z) - Federated Conditional Stochastic Optimization [110.513884892319]
条件付き最適化は、不変学習タスク、AUPRC、AMLなど、幅広い機械学習タスクで見られる。
本稿では,分散フェデレーション学習のためのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-10-04T01:47:37Z) - Monte Carlo Policy Gradient Method for Binary Optimization [3.742634130733923]
パラメータ化されたポリシー分布に従って二項解をサンプリングする新しい確率モデルを開発する。
離散空間におけるコヒーレント探索には、並列マルコフ・チェイン・モンテカルロ法(MCMC)を用いる。
政策勾配法を期待する定常点への収束性を確立する。
論文 参考訳(メタデータ) (2023-07-03T07:01:42Z) - Numerical Methods for Convex Multistage Stochastic Optimization [86.45244607927732]
最適化プログラミング(SP)、最適制御(SOC)、決定プロセス(MDP)に焦点を当てる。
凸多段マルコフ問題の解決の最近の進歩は、動的プログラミング方程式のコスト対ゴー関数の切断面近似に基づいている。
切削平面型法は多段階問題を多段階的に扱えるが、状態(決定)変数は比較的少ない。
論文 参考訳(メタデータ) (2023-03-28T01:30:40Z) - On the Global Solution of Soft k-Means [159.23423824953412]
本稿では,ソフトk-平均問題の解法を全世界で提案する。
ミニマルボリュームソフトkMeans (MVSkM) と呼ばれる新しいモデルを提案する。
論文 参考訳(メタデータ) (2022-12-07T12:06:55Z) - Faster One-Sample Stochastic Conditional Gradient Method for Composite
Convex Minimization [61.26619639722804]
滑らかで非滑らかな項の和として形成される凸有限サム目標を最小化するための条件勾配法(CGM)を提案する。
提案手法は, 平均勾配 (SAG) 推定器を備え, 1回に1回のサンプルしか必要としないが, より高度な分散低減技術と同等の高速収束速度を保証できる。
論文 参考訳(メタデータ) (2022-02-26T19:10:48Z) - Handling Hard Affine SDP Shape Constraints in RKHSs [3.8073142980733]
関数誘導体上でハードアフィンSDP制約を符号化するための統一化されたモジュール型凸最適化フレームワークを提案する。
vRKHSの幾何学的性質を利用して、提案されたスキームとその適応変種の一貫性を証明します。
論文 参考訳(メタデータ) (2021-01-05T14:08:58Z) - Planning in Markov Decision Processes with Gap-Dependent Sample
Complexity [48.98199700043158]
マルコフ決定過程における計画のための新しいトラジェクトリに基づくモンテカルロ木探索アルゴリズム MDP-GapE を提案する。
我々は, MDP-GapE に要求される生成モデルに対する呼び出し回数の上限を証明し, 確率の高い準最適動作を同定する。
論文 参考訳(メタデータ) (2020-06-10T15:05:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。