論文の概要: Online Non-convex Optimization with Long-term Non-convex Constraints
- arxiv url: http://arxiv.org/abs/2311.02426v4
- Date: Wed, 01 Oct 2025 06:17:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-02 14:33:21.387333
- Title: Online Non-convex Optimization with Long-term Non-convex Constraints
- Title(参考訳): 長期非凸制約を用いたオンライン非凸最適化
- Authors: Shijie Pan, Jianyu Xu, Wenjie Huang,
- Abstract要約: 一般の長期制約最適化問題をオンライン手法で解くために,新しいFollow-the-Perturbed-Leader型アルゴリズムを提案し,解析した。
提案手法は,長期制約のある情報源同定問題に対処し,理論結果の検証を行い,既存手法と比較して優れた性能を示す。
- 参考スコア(独自算出の注目度): 7.68925638410622
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A novel Follow-the-Perturbed-Leader type algorithm is proposed and analyzed for solving general long-term constrained optimization problems in an online manner, where the target and constraint functions are oblivious adversarially generated and not necessarily convex. The algorithm is based on Lagrangian reformulation and innovatively integrates random perturbations and regularizations in primal and dual directions: 1). exponentially distributed random perturbations in the primal direction to handle non-convexity, and 2). strongly concave logarithmic regularizations in the dual space to handle constraint violations. Based on a proposed expected static cumulative regret, and under mild Lipschitz continuity assumption, the algorithm demonstrates the online learnability, achieving the first sublinear cumulative regret complexity for this class of problems. The proposed algorithm is applied to tackle a long-term (extreme value) constrained river pollutant source identification problem, validate the theoretical results and exhibit superior performance compared to existing methods.
- Abstract(参考訳): 対象関数と制約関数が不可逆的に生成され、必ずしも凸ではないオンライン方法で、一般的な長期制約付き最適化問題を解くために、新しいFollow-the-Perturbed-Leader型アルゴリズムを提案し、解析した。
このアルゴリズムはラグランジュの再構成に基づいており、ランダムな摂動と原始方向と双対方向の正規化を革新的に統合する。
非凸性を扱うために一次方向の指数関数的に分布するランダム摂動、2
厳密な対数正規化 二重空間で 制約違反に対処する
提案された静的累積的後悔と、軽度リプシッツ連続性仮定に基づいて、このアルゴリズムはオンライン学習可能性を示し、この種の問題に対して最初のサブ線形累積的後悔複雑性を達成する。
提案アルゴリズムは,河川汚染源の長期的(極端値)の特定問題に対処し,理論的結果の検証を行い,既存手法と比較して優れた性能を示す。
関連論文リスト
- Stable Nonconvex-Nonconcave Training via Linear Interpolation [51.668052890249726]
本稿では,ニューラルネットワークトレーニングを安定化(大規模)するための原理的手法として,線形アヘッドの理論解析を提案する。
最適化過程の不安定性は、しばしば損失ランドスケープの非単調性によって引き起こされるものであり、非拡張作用素の理論を活用することによって線型性がいかに役立つかを示す。
論文 参考訳(メタデータ) (2023-10-20T12:45:12Z) - Self-supervised Equality Embedded Deep Lagrange Dual for Approximate Constrained Optimization [5.412875005737914]
ニューラルネットワーク(NN)を用いた高速最適近似器としてDeepLDEを提案する。
不等式制約を課すために,DeepLDEと初等・非双対学習法の収束を証明した。
提案したDeepLDEソリューションは,最小のNNベースアプローチ間の最適ラグギャップを実現する。
論文 参考訳(メタデータ) (2023-06-11T13:19:37Z) - Primal-Dual Contextual Bayesian Optimization for Control System Online
Optimization with Time-Average Constraints [21.38692458445459]
本稿では,制約付き閉ループ制御システムのオンライン性能最適化問題について検討する。
動的最適解に対する線形累積後悔を克服する主元-双対文脈ベイズ最適化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-12T18:37:52Z) - A Sequential Quadratic Programming Method with High Probability Complexity Bounds for Nonlinear Equality Constrained Stochastic Optimization [2.3814052021083354]
制約関数値と導関数は利用可能であると仮定されるが、対象関数とその関連する導関数のプログラミング近似のみを計算することができる。
1次定常性を近似するためにアルゴリズムの反復複雑性に縛られる高い確率が導出される。
論文 参考訳(メタデータ) (2023-01-01T21:46:50Z) - Algorithm for Constrained Markov Decision Process with Linear
Convergence [55.41644538483948]
エージェントは、そのコストに対する複数の制約により、期待される累積割引報酬を最大化することを目的としている。
エントロピー正規化ポリシーとベイダの二重化という2つの要素を統合した新しい双対アプローチが提案されている。
提案手法は(線形速度で)大域的最適値に収束することが示されている。
論文 参考訳(メタデータ) (2022-06-03T16:26:38Z) - Simultaneously Achieving Sublinear Regret and Constraint Violations for
Online Convex Optimization with Time-varying Constraints [26.473560927031176]
我々は,オンライン凸最適化(OCO)問題に対して,長期的制約と時間的制約を伴う新しい仮想キューベースのオンラインアルゴリズムを開発した。
本アルゴリズムは,サブ線形動的後悔と制約違反を同時に実現した最初のパラメータフリーアルゴリズムである。
論文 参考訳(メタデータ) (2021-11-15T12:23:31Z) - Faster Algorithm and Sharper Analysis for Constrained Markov Decision
Process [56.55075925645864]
制約付き意思決定プロセス (CMDP) の問題点について検討し, エージェントは, 複数の制約を条件として, 期待される累積割引報酬を最大化することを目的とする。
新しいユーティリティ・デュアル凸法は、正規化ポリシー、双対正則化、ネステロフの勾配降下双対という3つの要素の新たな統合によって提案される。
これは、凸制約を受ける全ての複雑性最適化に対して、非凸CMDP問題が$mathcal O (1/epsilon)$の低い境界に達する最初の実演である。
論文 参考訳(メタデータ) (2021-10-20T02:57:21Z) - Two-Stage Stochastic Optimization via Primal-Dual Decomposition and Deep
Unrolling [86.85697555068168]
2段階のアルゴリズム最適化は、様々な工学や科学的応用において重要な役割を果たす。
特に長期変数と短期変数が制約の中で結合されている場合、アルゴリズムは効率的ではない。
PDD-SSCAが既存のソリューションよりも優れたパフォーマンスを達成できることを示します。
論文 参考訳(メタデータ) (2021-05-05T03:36:00Z) - Recent Theoretical Advances in Non-Convex Optimization [56.88981258425256]
近年、深層ネットワークにおける非最適化アルゴリズムの解析やデータ問題への関心が高まっており、非最適化のための理論的最適化アルゴリズムの最近の結果の概要を概説する。
論文 参考訳(メタデータ) (2020-12-11T08:28:51Z) - Efficient Methods for Structured Nonconvex-Nonconcave Min-Max
Optimization [98.0595480384208]
定常点に収束する一般化外空間を提案する。
このアルゴリズムは一般の$p$ノルド空間だけでなく、一般の$p$次元ベクトル空間にも適用される。
論文 参考訳(メタデータ) (2020-10-31T21:35:42Z) - An Asymptotically Optimal Primal-Dual Incremental Algorithm for
Contextual Linear Bandits [129.1029690825929]
複数の次元に沿った最先端技術を改善する新しいアルゴリズムを提案する。
非文脈線形帯域の特別な場合において、学習地平線に対して最小限の最適性を確立する。
論文 参考訳(メタデータ) (2020-10-23T09:12:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。