Fugu-MT 論文翻訳(概要): Hybrid Coordinate Descent for Efficient Neural Network Learning Using Line Search and Gradient Descent

論文の概要: Hybrid Coordinate Descent for Efficient Neural Network Learning Using Line Search and Gradient Descent

arxiv url: http://arxiv.org/abs/2408.01374v1
Date: Fri, 2 Aug 2024 16:29:54 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-05 12:48:28.944253
Title: Hybrid Coordinate Descent for Efficient Neural Network Learning Using Line Search and Gradient Descent
Title（参考訳）: ラインサーチとグラディエントディフレッシュを用いた高能率ニューラルネットワーク学習のためのハイブリッドコーディネートディフレッシュ
Authors: Yen-Che Hsiao, Abhishek Dutta,
Abstract要約: 本稿では,2乗誤差損失関数に対する新しい座標降下アルゴリズムを提案する。各パラメータは、線探索法または勾配法によって決定された更新を行う。その並列化性は計算時間の短縮を促進する。
参考スコア（独自算出の注目度）: 3.8936716676293917
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This paper presents a novel coordinate descent algorithm leveraging a combination of one-directional line search and gradient information for parameter updates for a squared error loss function. Each parameter undergoes updates determined by either the line search or gradient method, contingent upon whether the modulus of the gradient of the loss with respect to that parameter surpasses a predefined threshold. Notably, a larger threshold value enhances algorithmic efficiency. Despite the potentially slower nature of the line search method relative to gradient descent, its parallelizability facilitates computational time reduction. Experimental validation conducted on a 2-layer Rectified Linear Unit network with synthetic data elucidates the impact of hyperparameters on convergence rates and computational efficiency.
Abstract（参考訳）: 本稿では,一方向線探索と勾配情報を組み合わせた2乗誤差損失関数のパラメータ更新手法を提案する。各パラメータは、線探索法または勾配法のいずれかで決定された更新を行い、そのパラメータに対する損失の勾配のモジュラリティが予め定義された閾値を超えるか否かを判断する。特に、より大きなしきい値によってアルゴリズムの効率が向上する。勾配降下に対する線探索法の潜在的に遅い性質にもかかわらず、その並列化性は計算時間の短縮を促進する。合成データを用いた2層整流線形ユニットネットワーク上での実験検証により,ハイパーパラメータが収束率と計算効率に与える影響が明らかになった。

関連論文リスト

Correlations Are Ruining Your Gradient Descent [1.2432046687586285]
自然勾配降下は、最も急勾配の方向を示す勾配ベクトルが、損失景観の局所曲率を考慮することにより、どのように改善されるかを照らしている。ニューラルネットワークの各層におけるノード応答を含む,任意の線形変換におけるデータの相関が,モデルパラメータ間の非正規的関係を生じさせることを示す。本稿では,ノード出力のデコレーションと白化のために提案された手法について述べるとともに,これを拡張し,分散コンピューティングや計算神経科学に特に有用な新しい手法を提案する。
論文参考訳（メタデータ） (2024-07-15T14:59:43Z)
Adaptive Federated Learning Over the Air [108.62635460744109]
オーバー・ザ・エア・モデル・トレーニングの枠組みの中で,適応勾配法,特にAdaGradとAdamの連合バージョンを提案する。解析の結果,AdaGrad に基づくトレーニングアルゴリズムは $mathcalO(ln(T) / T 1 - frac1alpha の速度で定常点に収束することがわかった。
論文参考訳（メタデータ） (2024-03-11T09:10:37Z)
On Learning Gaussian Multi-index Models with Gradient Flow [57.170617397894404]
高次元ガウスデータに対する多次元回帰問題の勾配流について検討する。低階射影をパラメトリする部分空間よりも、非パラメトリックモデルで低次元リンク関数を無限に高速に学習する2時間スケールのアルゴリズムを考える。
論文参考訳（メタデータ） (2023-10-30T17:55:28Z)
Stochastic Marginal Likelihood Gradients using Neural Tangent Kernels [78.6096486885658]
線形化されたラプラス近似に下界を導入する。これらの境界は漸進的な最適化が可能であり、推定精度と計算複雑性とのトレードオフを可能にする。
論文参考訳（メタデータ） (2023-06-06T19:02:57Z)
An Accelerated Doubly Stochastic Gradient Method with Faster Explicit Model Identification [97.28167655721766]
本稿では、分散正規化損失最小化問題に対する2倍加速勾配降下法(ADSGD)を提案する。まず、ADSGDが線形収束率を達成でき、全体的な計算複雑性を低減できることを示す。
論文参考訳（メタデータ） (2022-08-11T22:27:22Z)
AdaLoss: A computationally-efficient and provably convergent adaptive gradient method [7.856998585396422]
本稿では,損失関数の情報を用いて数値的な調整を行う,計算に親しみやすい学習スケジュール"AnomidaLoss"を提案する。テキストおよび制御問題に対するLSTMモデルの適用による数値実験の範囲の検証を行う。
論文参考訳（メタデータ） (2021-09-17T01:45:25Z)
Solving Sparse Linear Inverse Problems in Communication Systems: A Deep Learning Approach With Adaptive Depth [51.40441097625201]
疎信号回復問題に対するエンドツーエンドの訓練可能なディープラーニングアーキテクチャを提案する。提案手法は,出力するレイヤ数を学習し,各タスクのネットワーク深さを推論フェーズで動的に調整する。
論文参考訳（メタデータ） (2020-10-29T06:32:53Z)
GTAdam: Gradient Tracking with Adaptive Momentum for Distributed Online Optimization [4.103281325880475]
本稿では、中央コーディネータを使わずに、局所的な計算と通信によって、オンライン最適化問題を分散的に解決することを目的とした、計算機エージェントのネットワークを扱う。本稿では,適応運動量推定法(GTAdam)を用いた勾配追従法と,勾配の1次および2次運動量推定法を組み合わせた勾配追従法を提案する。マルチエージェント学習によるこれらの数値実験では、GTAdamは最先端の分散最適化手法よりも優れている。
論文参考訳（メタデータ） (2020-09-03T15:20:21Z)
Cogradient Descent for Bilinear Optimization [124.45816011848096]
双線形問題に対処するために、CoGDアルゴリズム(Cogradient Descent Algorithm)を導入する。一方の変数は、他方の変数との結合関係を考慮し、同期勾配降下をもたらす。本アルゴリズムは,空間的制約下での1変数の問題を解くために応用される。
論文参考訳（メタデータ） (2020-06-16T13:41:54Z)
Online Hyperparameter Search Interleaved with Proximal Parameter Updates [9.543667840503739]
本研究では,近似勾配法の構造に依存する手法を開発し,スムーズなコスト関数を必要としない。そのような方法は、Leave-one-out (LOO)-validated LassoおよびGroup Lassoに適用される。数値実験により,提案手法の収束度をLOO検証誤差曲線の局所最適値に相関させる。
論文参考訳（メタデータ） (2020-04-06T15:54:03Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。