論文の概要: Stochastic Compositional Optimization with Compositional Constraints
- arxiv url: http://arxiv.org/abs/2209.04086v1
- Date: Fri, 9 Sep 2022 02:06:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-12 13:10:23.990673
- Title: Stochastic Compositional Optimization with Compositional Constraints
- Title(参考訳): 構成制約付き確率的構成最適化
- Authors: Shuoguang Yang, Zhe Zhang, Ethan X. Fang
- Abstract要約: 単一レベルの期待値と2レベルの構成制約を現在のSCOフレームワークに組み込んだ新しいモデルについて検討する。
我々のモデルは、リスク-逆最適化やハイモーメントポートフォリオの選択など、データ駆動最適化やリスク管理に広く適用することができる。
本稿では, 最適解に収束するシーケンスを, 単レベル期待値と2レベル構成制約の両方で$cO(frac1sqrtN)$underで生成するアルゴリズムのクラスを提案する。
- 参考スコア(独自算出の注目度): 8.535822787583486
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Stochastic compositional optimization (SCO) has attracted considerable
attention because of its broad applicability to important real-world problems.
However, existing works on SCO assume that the projection within a solution
update is simple, which fails to hold for problem instances where the
constraints are in the form of expectations, such as empirical conditional
value-at-risk constraints. We study a novel model that incorporates
single-level expected value and two-level compositional constraints into the
current SCO framework. Our model can be applied widely to data-driven
optimization and risk management, including risk-averse optimization and
high-moment portfolio selection, and can handle multiple constraints. We
further propose a class of primal-dual algorithms that generates sequences
converging to the optimal solution at the rate of
$\cO(\frac{1}{\sqrt{N}})$under both single-level expected value and two-level
compositional constraints, where $N$ is the iteration counter, establishing the
benchmarks in expected value constrained SCO.
- Abstract(参考訳): 確率的合成最適化(SCO)は、重要な実世界の問題に広く適用できるため、注目されている。
しかし、SCO上の既存の研究は、ソリューション更新におけるプロジェクションは単純であり、経験的条件付き値-リスク制約のような期待の形で制約が設定されている問題インスタンスでは保持できないと仮定している。
単一レベルの期待値と2レベルの構成制約を現在のSCOフレームワークに組み込んだ新しいモデルについて検討する。
我々のモデルは、リスク-逆最適化やハイモーメントポートフォリオ選択など、データ駆動最適化やリスク管理に広く適用でき、複数の制約を処理できる。
さらに, 1 レベル期待値と 2 レベル構成制約の両方で$\cO(\frac{1}{\sqrt{N}})$under$\cO(\frac{1}{\sqrt{N}})の速度で最適解に収束する列を生成する原始双対アルゴリズムのクラスを提案する。
関連論文リスト
- Double Duality: Variational Primal-Dual Policy Optimization for
Constrained Reinforcement Learning [132.7040981721302]
本研究では,訪問尺度の凸関数を最小化することを目的として,制約付き凸決定プロセス(MDP)について検討する。
制約付き凸MDPの設計アルゴリズムは、大きな状態空間を扱うなど、いくつかの課題に直面している。
論文 参考訳(メタデータ) (2024-02-16T16:35:18Z) - Algorithm for Constrained Markov Decision Process with Linear
Convergence [55.41644538483948]
エージェントは、そのコストに対する複数の制約により、期待される累積割引報酬を最大化することを目的としている。
エントロピー正規化ポリシーとベイダの二重化という2つの要素を統合した新しい双対アプローチが提案されている。
提案手法は(線形速度で)大域的最適値に収束することが示されている。
論文 参考訳(メタデータ) (2022-06-03T16:26:38Z) - Comparing Classical-Quantum Portfolio Optimization with Enhanced
Constraints [0.0]
ポートフォリオ最適化問題に基本的な分析を加え、選択したバランスシートのメトリクスに基づいて資産固有の制約とグローバルな制約を追加する方法について述べる。
我々は、D-Waveの量子プロセッサを用いて、そのような問題を解決するための最先端のアルゴリズムを解析し、商用で利用可能な最適化ソフトウェアで得られるソリューションの品質を比較した。
論文 参考訳(メタデータ) (2022-03-09T17:46:32Z) - Online Learning with Knapsacks: the Best of Both Worlds [54.28273783164608]
オンライン学習の課題として,意思決定者が,リソース制約の有限セットに違反することなく,期待する報酬を最大化したい,という課題を提起する。
当社のフレームワークは,意思決定者がそのエビデンスを柔軟かつコスト論的に扱えるようにします。
論文 参考訳(メタデータ) (2022-02-28T12:10:48Z) - A Globally Convergent Evolutionary Strategy for Stochastic Constrained
Optimization with Applications to Reinforcement Learning [0.6445605125467573]
進化的戦略は、強化学習における複雑な最適化問題に対して、競合する性能のレベルを達成することが示されている。
しかし、制約された問題を最適化する進化戦略の収束保証は文献に欠けている。
論文 参考訳(メタデータ) (2022-02-21T17:04:51Z) - Faster Algorithm and Sharper Analysis for Constrained Markov Decision
Process [56.55075925645864]
制約付き意思決定プロセス (CMDP) の問題点について検討し, エージェントは, 複数の制約を条件として, 期待される累積割引報酬を最大化することを目的とする。
新しいユーティリティ・デュアル凸法は、正規化ポリシー、双対正則化、ネステロフの勾配降下双対という3つの要素の新たな統合によって提案される。
これは、凸制約を受ける全ての複雑性最適化に対して、非凸CMDP問題が$mathcal O (1/epsilon)$の低い境界に達する最初の実演である。
論文 参考訳(メタデータ) (2021-10-20T02:57:21Z) - Momentum Accelerates the Convergence of Stochastic AUPRC Maximization [80.8226518642952]
高精度リコール曲線(AUPRC)に基づく領域の最適化について検討し,不均衡なタスクに広く利用されている。
我々は、$O (1/epsilon4)$のより優れた反復による、$epsilon$定常解を見つけるための新しい運動量法を開発する。
また,O(1/epsilon4)$と同じ複雑さを持つ適応手法の新たなファミリを設計し,実際により高速な収束を享受する。
論文 参考訳(メタデータ) (2021-07-02T16:21:52Z) - A Lyapunov-Based Methodology for Constrained Optimization with Bandit
Feedback [22.17503016665027]
各アクションが未知の関節分布からランダムな報酬、コスト、ペナルティを返す問題を考える。
我々は、$tt LyOn$という新しい低複雑さアルゴリズムを提案し、$O(sqrtBlog B)$ regretと$O(log B/B)$ constraint-violationを達成することを証明した。
計算コストの低い$tt LyOn$は、Lyapunovをベースとしたアルゴリズム設計手法が制約付き帯域最適化問題の解決に有効であることを示唆している。
論文 参考訳(メタデータ) (2021-06-09T16:12:07Z) - Modeling the Second Player in Distributionally Robust Optimization [90.25995710696425]
我々は、最悪のケース分布を特徴付けるために神経生成モデルを使うことを議論する。
このアプローチは多くの実装と最適化の課題をもたらします。
提案されたアプローチは、同等のベースラインよりも堅牢なモデルを生み出す。
論文 参考訳(メタデータ) (2021-03-18T14:26:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。