論文の概要: Online Long-run Constrained Optimization
- arxiv url: http://arxiv.org/abs/2311.02426v1
- Date: Sat, 4 Nov 2023 15:08:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-07 17:45:02.069875
- Title: Online Long-run Constrained Optimization
- Title(参考訳): オンライン長期制約最適化
- Authors: Shijie Pan and Wenjie Huang
- Abstract要約: 各周期において、ランダムな線形摂動と強い凹凸摂動は、それぞれ主方向と双対方向に、オフラインのオラクルに組み込まれている。
提案アルゴリズムは,長期(リスク)制約のある河川汚染源同定問題に対処するために適用された。
- 参考スコア(独自算出の注目度): 2.4022340214033915
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, a novel Follow-the-Perturbed-Leader type algorithm is proposed
and analyzed for solving general long-term constrained optimization problems in
online manner, where the objective and constraints are not necessarily convex.
In each period, random linear perturbation and strongly concave perturbation
are incorporated in primal and dual directions, respectively, to the offline
oracle, and a global minimax point is searched as solution. Based on two
particular definitions of expected static cumulative regret, we derive the
first sublinear $O(T^{8/9})$ regret complexity for this class of problems. The
proposed algorithm is applied to tackle a long-term (risk) constrained river
pollutant source identification problem, demonstrating the validity of the
theoretical results and exhibiting superior performance compared to existing
method.
- Abstract(参考訳): 本稿では,目的と制約が必ずしも凸であるとは限らないオンライン方式の長期的制約付き最適化問題を解くために,新しい追従型アルゴリズムを提案し,解析する。
各期間において、ランダムな線形摂動と強い凹凸摂動をそれぞれ、オフラインのオラクルにプリマル方向とデュアル方向に組み入れ、グローバルミニマックス点を解として探索する。
期待される2つの静的累積後悔の定義に基づいて、この問題のクラスに対する最初のサブ線形$O(T^{8/9})$後悔の複雑さを導き出す。
提案アルゴリズムは,長期(リスク)制約のある河川汚染源同定問題に対処し,理論結果の有効性を実証し,既存手法と比較して優れた性能を示す。
関連論文リスト
- Self-supervised Equality Embedded Deep Lagrange Dual for Approximate Constrained Optimization [5.412875005737914]
ニューラルネットワーク(NN)を用いた高速最適近似器としてDeepLDEを提案する。
不等式制約を課すために,DeepLDEと初等・非双対学習法の収束を証明した。
提案したDeepLDEソリューションは,最小のNNベースアプローチ間の最適ラグギャップを実現する。
論文 参考訳(メタデータ) (2023-06-11T13:19:37Z) - Primal-Dual Contextual Bayesian Optimization for Control System Online
Optimization with Time-Average Constraints [21.38692458445459]
本稿では,制約付き閉ループ制御システムのオンライン性能最適化問題について検討する。
動的最適解に対する線形累積後悔を克服する主元-双対文脈ベイズ最適化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-12T18:37:52Z) - A Sequential Quadratic Programming Method with High Probability Complexity Bounds for Nonlinear Equality Constrained Stochastic Optimization [2.3814052021083354]
制約関数値と導関数は利用可能であると仮定されるが、対象関数とその関連する導関数のプログラミング近似のみを計算することができる。
1次定常性を近似するためにアルゴリズムの反復複雑性に縛られる高い確率が導出される。
論文 参考訳(メタデータ) (2023-01-01T21:46:50Z) - Algorithm for Constrained Markov Decision Process with Linear
Convergence [55.41644538483948]
エージェントは、そのコストに対する複数の制約により、期待される累積割引報酬を最大化することを目的としている。
エントロピー正規化ポリシーとベイダの二重化という2つの要素を統合した新しい双対アプローチが提案されている。
提案手法は(線形速度で)大域的最適値に収束することが示されている。
論文 参考訳(メタデータ) (2022-06-03T16:26:38Z) - Simultaneously Achieving Sublinear Regret and Constraint Violations for
Online Convex Optimization with Time-varying Constraints [26.473560927031176]
我々は,オンライン凸最適化(OCO)問題に対して,長期的制約と時間的制約を伴う新しい仮想キューベースのオンラインアルゴリズムを開発した。
本アルゴリズムは,サブ線形動的後悔と制約違反を同時に実現した最初のパラメータフリーアルゴリズムである。
論文 参考訳(メタデータ) (2021-11-15T12:23:31Z) - Faster Algorithm and Sharper Analysis for Constrained Markov Decision
Process [56.55075925645864]
制約付き意思決定プロセス (CMDP) の問題点について検討し, エージェントは, 複数の制約を条件として, 期待される累積割引報酬を最大化することを目的とする。
新しいユーティリティ・デュアル凸法は、正規化ポリシー、双対正則化、ネステロフの勾配降下双対という3つの要素の新たな統合によって提案される。
これは、凸制約を受ける全ての複雑性最適化に対して、非凸CMDP問題が$mathcal O (1/epsilon)$の低い境界に達する最初の実演である。
論文 参考訳(メタデータ) (2021-10-20T02:57:21Z) - Two-Stage Stochastic Optimization via Primal-Dual Decomposition and Deep
Unrolling [86.85697555068168]
2段階のアルゴリズム最適化は、様々な工学や科学的応用において重要な役割を果たす。
特に長期変数と短期変数が制約の中で結合されている場合、アルゴリズムは効率的ではない。
PDD-SSCAが既存のソリューションよりも優れたパフォーマンスを達成できることを示します。
論文 参考訳(メタデータ) (2021-05-05T03:36:00Z) - Recent Theoretical Advances in Non-Convex Optimization [56.88981258425256]
近年、深層ネットワークにおける非最適化アルゴリズムの解析やデータ問題への関心が高まっており、非最適化のための理論的最適化アルゴリズムの最近の結果の概要を概説する。
論文 参考訳(メタデータ) (2020-12-11T08:28:51Z) - Efficient Methods for Structured Nonconvex-Nonconcave Min-Max
Optimization [98.0595480384208]
定常点に収束する一般化外空間を提案する。
このアルゴリズムは一般の$p$ノルド空間だけでなく、一般の$p$次元ベクトル空間にも適用される。
論文 参考訳(メタデータ) (2020-10-31T21:35:42Z) - An Asymptotically Optimal Primal-Dual Incremental Algorithm for
Contextual Linear Bandits [129.1029690825929]
複数の次元に沿った最先端技術を改善する新しいアルゴリズムを提案する。
非文脈線形帯域の特別な場合において、学習地平線に対して最小限の最適性を確立する。
論文 参考訳(メタデータ) (2020-10-23T09:12:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。