論文の概要: SC-Reg: Training Overparameterized Neural Networks under Self-Concordant
Regularization
- arxiv url: http://arxiv.org/abs/2112.07344v1
- Date: Tue, 14 Dec 2021 13:03:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-15 16:52:29.643034
- Title: SC-Reg: Training Overparameterized Neural Networks under Self-Concordant
Regularization
- Title(参考訳): SC-Reg: 自己一致正則化による過パラメータニューラルネットワークのトレーニング
- Authors: Adeyemi D. Adeoye, Alberto Bemporad
- Abstract要約: 本稿では,凸問題に対するEmphNewtonデクリメントフレームワークに2次情報を組み込むことで,フィードフォワードニューラルネットワークを学習するためのフレームワークを提案する。
提案アルゴリズムは,Hessian行列の2次情報を利用して,トレーニング計算のオーバーヘッドを低減する。
- 参考スコア(独自算出の注目度): 0.20305676256390928
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper we propose the SC-Reg (self-concordant regularization)
framework for learning overparameterized feedforward neural networks by
incorporating second-order information in the \emph{Newton decrement} framework
for convex problems. We propose the generalized Gauss-Newton with
Self-Concordant Regularization (SCoRe-GGN) algorithm that updates the network
parameters each time it receives a new input batch. The proposed algorithm
exploits the structure of the second-order information in the Hessian matrix,
thereby reducing the training computational overhead. Although our current
analysis considers only the convex case, numerical experiments show the
efficiency of our method and its fast convergence under both convex and
non-convex settings, which compare favorably against baseline first-order
methods and a quasi-Newton method.
- Abstract(参考訳): 本稿では,畳み込み問題に対する 'emph{Newton decrement} フレームワークに2次情報を組み込むことで,過パラメータ化フィードフォワードニューラルネットワークを学習するための SC-Reg (self-concordant regularization) フレームワークを提案する。
本稿では,新たな入力バッチを受信するたびにネットワークパラメータを更新する自己一致正規化(SCoRe-GGN)アルゴリズムを提案する。
提案アルゴリズムは,ヘッセン行列の2次情報構造を利用して,トレーニング計算のオーバーヘッドを低減する。
現在の解析では凸の場合のみを考慮しているが、数値実験により凸法と非凸法の両方の条件下での手法の効率と高速収束が示されている。
関連論文リスト
- Reduced-Space Iteratively Reweighted Second-Order Methods for Nonconvex Sparse Regularization [11.56128809794923]
本稿では,局所的なプロパティ収束の反復を$ell_p-$で行うような非スパース性プロモート正規化問題について検討する。
論文 参考訳(メタデータ) (2024-07-24T12:15:59Z) - Efficient Low-rank Identification via Accelerated Iteratively Reweighted Nuclear Norm Minimization [8.879403568685499]
パラメータの平滑化に適応的な更新戦略を導入する。
この振る舞いは、アルゴリズムを数回繰り返した後に、効果的に問題を解決するものに変えます。
すべてのイテレーションが重要なものであることを保証し、グローバルに提案された実験を証明します。
論文 参考訳(メタデータ) (2024-06-22T02:37:13Z) - Faster Riemannian Newton-type Optimization by Subsampling and Cubic
Regularization [3.867143522757309]
この研究は、制約集合が多様体構造を意味するような制約付き大規模非制約最適化に関するものである。
本稿では,収束性の向上と計算コストの削減を目的とした2階サドル最適化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-22T00:37:44Z) - Accelerated First-Order Optimization under Nonlinear Constraints [73.2273449996098]
我々は、制約付き最適化のための一階アルゴリズムと非滑らかなシステムの間で、新しい一階アルゴリズムのクラスを設計する。
これらのアルゴリズムの重要な性質は、制約がスパース変数の代わりに速度で表されることである。
論文 参考訳(メタデータ) (2023-02-01T08:50:48Z) - Faster Algorithm and Sharper Analysis for Constrained Markov Decision
Process [56.55075925645864]
制約付き意思決定プロセス (CMDP) の問題点について検討し, エージェントは, 複数の制約を条件として, 期待される累積割引報酬を最大化することを目的とする。
新しいユーティリティ・デュアル凸法は、正規化ポリシー、双対正則化、ネステロフの勾配降下双対という3つの要素の新たな統合によって提案される。
これは、凸制約を受ける全ての複雑性最適化に対して、非凸CMDP問題が$mathcal O (1/epsilon)$の低い境界に達する最初の実演である。
論文 参考訳(メタデータ) (2021-10-20T02:57:21Z) - Zeroth and First Order Stochastic Frank-Wolfe Algorithms for Constrained
Optimization [13.170519806372075]
2組の制約を持つ凸最適化の問題は、半定値プログラミングの文脈で頻繁に発生する。
最初の制約セットへのプロジェクションは困難であるため、プロジェクションフリーなアルゴリズムを探索する必要がある。
提案アルゴリズムの有効性は, スパース行列推定, 半定緩和によるクラスタリング, および一様スペースカット問題の適用性について検証した。
論文 参考訳(メタデータ) (2021-07-14T08:01:30Z) - Recent Theoretical Advances in Non-Convex Optimization [56.88981258425256]
近年、深層ネットワークにおける非最適化アルゴリズムの解析やデータ問題への関心が高まっており、非最適化のための理論的最適化アルゴリズムの最近の結果の概要を概説する。
論文 参考訳(メタデータ) (2020-12-11T08:28:51Z) - Efficient Methods for Structured Nonconvex-Nonconcave Min-Max
Optimization [98.0595480384208]
定常点に収束する一般化外空間を提案する。
このアルゴリズムは一般の$p$ノルド空間だけでなく、一般の$p$次元ベクトル空間にも適用される。
論文 参考訳(メタデータ) (2020-10-31T21:35:42Z) - Convergence of adaptive algorithms for weakly convex constrained
optimization [59.36386973876765]
モローエンベロープの勾配のノルムに対して$mathcaltilde O(t-1/4)$収束率を証明する。
我々の分析では、最小バッチサイズが1ドル、定数が1位と2位のモーメントパラメータが1ドル、そしておそらくスムーズな最適化ドメインで機能する。
論文 参考訳(メタデータ) (2020-06-11T17:43:19Z) - Effective Dimension Adaptive Sketching Methods for Faster Regularized
Least-Squares Optimization [56.05635751529922]
スケッチに基づくL2正規化最小二乗問題の解法を提案する。
我々は、最も人気のあるランダム埋め込みの2つ、すなわちガウス埋め込みとサブサンプリングランダム化アダマール変換(SRHT)を考える。
論文 参考訳(メタデータ) (2020-06-10T15:00:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。