論文の概要: COCO Denoiser: Using Co-Coercivity for Variance Reduction in Stochastic
Convex Optimization
- arxiv url: http://arxiv.org/abs/2109.03207v1
- Date: Tue, 7 Sep 2021 17:21:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-08 14:26:05.761475
- Title: COCO Denoiser: Using Co-Coercivity for Variance Reduction in Stochastic
Convex Optimization
- Title(参考訳): COCOデノイザ:確率凸最適化における共係数を用いた可変化
- Authors: Manuel Madeira, Renato Negrinho, Jo\~ao Xavier and Pedro M. Q. Aguiar
- Abstract要約: 我々は,勾配オラクルによって出力される雑音の推定値を改善するために,凸性およびL平滑性を利用する。
問合せ点の数と近さの増加は、より良い勾配推定に繋がることを示す。
また、SGD、Adam、STRSAGAといった既存のアルゴリズムにCOCOをプラグインすることで、バニラ設定にもCOCOを適用します。
- 参考スコア(独自算出の注目度): 4.970364068620608
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: First-order methods for stochastic optimization have undeniable relevance, in
part due to their pivotal role in machine learning. Variance reduction for
these algorithms has become an important research topic. In contrast to common
approaches, which rarely leverage global models of the objective function, we
exploit convexity and L-smoothness to improve the noisy estimates outputted by
the stochastic gradient oracle. Our method, named COCO denoiser, is the joint
maximum likelihood estimator of multiple function gradients from their noisy
observations, subject to co-coercivity constraints between them. The resulting
estimate is the solution of a convex Quadratically Constrained Quadratic
Problem. Although this problem is expensive to solve by interior point methods,
we exploit its structure to apply an accelerated first-order algorithm, the
Fast Dual Proximal Gradient method. Besides analytically characterizing the
proposed estimator, we show empirically that increasing the number and
proximity of the queried points leads to better gradient estimates. We also
apply COCO in stochastic settings by plugging it in existing algorithms, such
as SGD, Adam or STRSAGA, outperforming their vanilla versions, even in
scenarios where our modelling assumptions are mismatched.
- Abstract(参考訳): 確率的最適化のための一階法には、機械学習において重要な役割があるため、否定できない関連性がある。
これらのアルゴリズムのばらつき低減は重要な研究トピックとなっている。
目的関数の大域的モデルを利用する一般的なアプローチとは対照的に、凸性やL-滑らかさを利用して確率勾配オラクルによって出力される雑音の推定を改善する。
ココ・デノイザー (coco denoiser) という手法は, 共保磁力制約を受けることにより, 騒音観測による関数勾配の最大値推定法である。
結果の見積もりは、凸二次制約付き二次問題の解である。
この問題はインテリアポイント法で解くには高価であるが、高速化された1次アルゴリズムであるFast Dual Proximal Gradient法を適用するためにその構造を利用する。
提案する推定値の解析的特徴付けに加えて,クエリ点の数と近接度の増加が勾配推定精度の向上に寄与することを示す。
SGDやAdam,STRSAGAといった既存のアルゴリズムにCOCOをプラグインすることで,モデリングの前提が一致していない場合においても,そのバニラバージョンよりも優れています。
関連論文リスト
- Trust-Region Sequential Quadratic Programming for Stochastic Optimization with Random Models [57.52124921268249]
本稿では,1次と2次の両方の定常点を見つけるための信頼逐次準計画法を提案する。
本手法は, 1次定常点に収束するため, 対象対象の近似を最小化して定義された各イテレーションの勾配ステップを計算する。
2階定常点に収束するため,本手法は負曲率を減少するヘッセン行列を探索する固有ステップも計算する。
論文 参考訳(メタデータ) (2024-09-24T04:39:47Z) - Stochastic Zeroth-Order Optimization under Strongly Convexity and Lipschitz Hessian: Minimax Sample Complexity [59.75300530380427]
本稿では,アルゴリズムが検索対象関数の雑音評価にのみアクセス可能な2次スムーズかつ強い凸関数を最適化する問題を考察する。
本研究は, ミニマックス単純後悔率について, 一致した上界と下界を発達させることにより, 初めて厳密な評価を行ったものである。
論文 参考訳(メタデータ) (2024-06-28T02:56:22Z) - Robust Stochastic Optimization via Gradient Quantile Clipping [6.2844649973308835]
グラディエントDescent(SGD)のための量子クリッピング戦略を導入する。
通常のクリッピングチェーンとして、グラデーション・ニュー・アウトリージを使用します。
本稿では,Huberiles を用いたアルゴリズムの実装を提案する。
論文 参考訳(メタデータ) (2023-09-29T15:24:48Z) - Accelerated stochastic approximation with state-dependent noise [7.4648480208501455]
勾配観測における2次雑音に対する一般仮定の下での滑らかな凸最適化問題を考察する。
このような問題は、統計学におけるよく知られた一般化された線形回帰問題において、様々な応用において自然に発生する。
SAGDとSGEは、適切な条件下で、最適収束率を達成することを示す。
論文 参考訳(メタデータ) (2023-07-04T06:06:10Z) - Differentiable Annealed Importance Sampling and the Perils of Gradient
Noise [68.44523807580438]
Annealed importance sample (AIS) と関連するアルゴリズムは、限界推定のための非常に効果的なツールである。
差別性は、目的として限界確率を最適化する可能性を認めるため、望ましい性質である。
我々はメトロポリス・ハスティングスのステップを放棄して微分可能アルゴリズムを提案し、ミニバッチ計算をさらに解き放つ。
論文 参考訳(メタデータ) (2021-07-21T17:10:14Z) - Zeroth-Order Hybrid Gradient Descent: Towards A Principled Black-Box
Optimization Framework [100.36569795440889]
この作業は、一階情報を必要としない零次最適化(ZO)の反復である。
座標重要度サンプリングにおける優雅な設計により,ZO最適化法は複雑度と関数クエリコストの両面において効率的であることを示す。
論文 参考訳(メタデータ) (2020-12-21T17:29:58Z) - Stochastic Compositional Gradient Descent under Compositional
constraints [13.170519806372075]
目的関数と制約関数が凸であり,関数の合成として表される制約最適化問題について検討する。
この問題は、公平な分類/回帰とキューシステムの設計に生じる。
提案手法は最適かつ実現可能な解をほぼ確実に見つけることが保証されている。
論文 参考訳(メタデータ) (2020-12-17T05:38:37Z) - Cogradient Descent for Bilinear Optimization [124.45816011848096]
双線形問題に対処するために、CoGDアルゴリズム(Cogradient Descent Algorithm)を導入する。
一方の変数は、他方の変数との結合関係を考慮し、同期勾配降下をもたらす。
本アルゴリズムは,空間的制約下での1変数の問題を解くために応用される。
論文 参考訳(メタデータ) (2020-06-16T13:41:54Z) - Non-asymptotic bounds for stochastic optimization with biased noisy
gradient oracles [8.655294504286635]
関数の測定値が推定誤差を持つ設定を捉えるために,バイアス付き勾配オラクルを導入する。
提案するオラクルは,例えば,独立分散シミュレーションと同一分散シミュレーションのバッチによるリスク計測推定の実践的な状況にある。
論文 参考訳(メタデータ) (2020-02-26T12:53:04Z) - Towards Better Understanding of Adaptive Gradient Algorithms in
Generative Adversarial Nets [71.05306664267832]
適応アルゴリズムは勾配の歴史を用いて勾配を更新し、深層ニューラルネットワークのトレーニングにおいてユビキタスである。
本稿では,非コンケーブ最小値問題に対するOptimisticOAアルゴリズムの変種を解析する。
実験の結果,適応型GAN非適応勾配アルゴリズムは経験的に観測可能であることがわかった。
論文 参考訳(メタデータ) (2019-12-26T22:10:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。