Fugu-MT 論文翻訳(概要): MARINA-P: Superior Performance in Non-smooth Federated Optimization with Adaptive Stepsizes

論文の概要: MARINA-P: Superior Performance in Non-smooth Federated Optimization with Adaptive Stepsizes

arxiv url: http://arxiv.org/abs/2412.17082v1
Date: Sun, 22 Dec 2024 16:18:34 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-24 19:42:48.249149
Title: MARINA-P: Superior Performance in Non-smooth Federated Optimization with Adaptive Stepsizes
Title（参考訳）: MARINA-P:適応ステップサイズをもつ非滑らかなフェデレーション最適化における上位性能
Authors: Igor Sokolov, Peter Richtárik,
Abstract要約: EF21-P (匿名2024) と MARINA-P (arXiv:2402.06412) の非滑らか凸理論を非サイズ凸設定で拡張する。我々は、定数、減少、適応(aktype)ステップの理論的保証を提供する。
参考スコア（独自算出の注目度）: 57.24311218570012
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Non-smooth communication-efficient federated optimization is crucial for many machine learning applications, yet remains largely unexplored theoretically. Recent advancements have primarily focused on smooth convex and non-convex regimes, leaving a significant gap in understanding the non-smooth convex setting. Additionally, existing literature often overlooks efficient server-to-worker communication (downlink), focusing primarily on worker-to-server communication (uplink). We consider a setup where uplink costs are negligible and focus on optimizing downlink communication by improving state-of-the-art schemes like EF21-P (arXiv:2209.15218) and MARINA-P (arXiv:2402.06412) in the non-smooth convex setting. We extend the non-smooth convex theory of EF21-P [Anonymous, 2024], originally developed for single-node scenarios, to the distributed setting, and extend MARINA-P to the non-smooth convex setting. For both algorithms, we prove an optimal $O(1/\sqrt{T})$ convergence rate and establish communication complexity bounds matching classical subgradient methods. We provide theoretical guarantees under constant, decreasing, and adaptive (Polyak-type) stepsizes. Our experiments demonstrate that MARINA-P with correlated compressors outperforms other methods in both smooth non-convex and non-smooth convex settings. This work presents the first theoretical results for distributed non-smooth optimization with server-to-worker compression, along with comprehensive analysis for various stepsize schemes.
Abstract（参考訳）: 非滑らかな通信効率のフェデレーション最適化は、多くの機械学習アプリケーションにとって重要であるが、理論上はほとんど解明されていない。最近の進歩は主に滑らかな凸系と非凸系に焦点を当てており、非滑らかな凸系を理解する上で大きなギャップを残している。さらに、既存の文献は、労働者間通信(アップリンク)を中心に、効率的なサーバ間通信(ダウンリンク)を見落としていることが多い。我々は、アップリンクコストが無視可能であり、非平滑な凸におけるEF21-P(arXiv:2209.15218)やMARINA-P(arXiv:2402.06412)のような最先端のスキームを改善して、ダウンリンク通信の最適化に重点を置いている。 EF21-P[Anonymous, 2024]の非平滑凸理論は、もともと単一ノードシナリオ用に開発されたもので、分散設定に拡張し、MARINA-Pを非平滑凸設定に拡張する。両方のアルゴリズムに対して、最適な$O(1/\sqrt{T})$収束率を証明し、古典的な下位段階法と一致する通信複雑性境界を確立する。我々は、定数、減少、適応性(ポリアク型)のステップサイズの下で理論的な保証を提供する。実験により, 相関圧縮機を用いたMARINA-Pは, 平滑な非凸および非平滑な凸設定において, 他の手法よりも優れることを示した。本研究では、サーバ間圧縮による分散非滑らかな最適化のための最初の理論的結果と、各種ステップサイズスキームの包括的解析について述べる。

関連論文リスト

Stochastic Momentum Methods for Non-smooth Non-Convex Finite-Sum Coupled Compositional Optimization [64.99236464953032]
我々は、(ほぼ)$レベルのKKTソリューションを見つけるために、$O(/epsilon)$の最先端の複雑さを新たに提案する。 O(/epsilon)$ の(ほぼ) $ レベルの KKT ソリューションを見つけるための技術的複雑さを適用することで、(ほぼ) $ レベルの KKT ソリューションを見つけるための $O(/epsilon)$ の最先端の複雑さを新たに達成する。
論文参考訳（メタデータ） (2025-06-03T06:31:59Z)
Scalable Min-Max Optimization via Primal-Dual Exact Pareto Optimization [66.51747366239299]
拡張ラグランジアンに基づくmin-max問題のスムーズな変種を提案する。提案アルゴリズムは, 段階的戦略よりも目的数で拡張性が高い。
論文参考訳（メタデータ） (2025-03-16T11:05:51Z)
Smoothed Normalization for Efficient Distributed Private Optimization [54.197255548244705]
フェデレートされた学習は、参加者のプライバシを備えた機械学習モデルを可能にする。トレーニングやフィードバックのない問題に対して、差分にプライベートな分散手法は存在しない。証明可能な収束保証付き分散アルゴリズム$alpha$-$sf NormEC$を導入する。
論文参考訳（メタデータ） (2025-02-19T07:10:32Z)
Double Momentum and Error Feedback for Clipping with Fast Rates and Differential Privacy [11.356444450240799]
既存のアルゴリズムは、強い微分プライバシー(DP)と最適化の保証を一度に達成しない。クリッピング,重球運動量,誤差フィードバックを組み合わせたClip21-SGD2Mを提案する。
論文参考訳（メタデータ） (2025-02-17T11:16:21Z)
Decentralized Projection-free Online Upper-Linearizable Optimization with Applications to DR-Submodular Optimization [29.705337940879705]
分散プロジェクションフリー最適化のための新しいフレームワークを提案する。我々は、高次線形化可能な関数フレームワークの柔軟性で分散最適化手法を活用する。
論文参考訳（メタデータ） (2025-01-30T07:28:34Z)
Improved Communication-Privacy Trade-offs in $L_2$ Mean Estimation under Streaming Differential Privacy [47.997934291881414]
既存の平均推定スキームは、通常、$L_infty$幾何に最適化され、ランダムな回転や、$L$幾何に適応するカシンの表現に依存する。本稿では,スパシフィケーションに固有のランダム性をDPに組み込んだ,スパシフィケーションガウシアン機構の新たなプライバシ会計手法を提案する。従来の手法とは異なり、我々の会計アルゴリズムは直接$L$幾何で動作し、ガウスの機構に迅速に収束するMSEが得られる。
論文参考訳（メタデータ） (2024-05-02T03:48:47Z)
ALEXR: An Optimal Single-Loop Algorithm for Convex Finite-Sum Coupled Compositional Stochastic Optimization [53.14532968909759]
ALEXRと呼ばれる,効率的な単ループプリマルデュアルブロックコーディネートアルゴリズムを提案する。本研究では, ALEXR の凸面および強凸面の収束速度を滑らか性および非滑らか性条件下で確立する。本稿では,ALEXRの収束速度が,検討されたcFCCO問題に対する1次ブロック座標アルゴリズムの中で最適であることを示すために,より低い複雑性境界を示す。
論文参考訳（メタデータ） (2023-12-04T19:00:07Z)
Asymmetrically Decentralized Federated Learning [22.21977974314497]
分散フェデレーションラーニング(DFL)が出現し、ピアツーピア(P2P)通信フレームワークでサーバを破棄する。本稿では,非対称トポロジに基づくPush-Awareプロトコルを用いたDFedSGPSMアルゴリズムを提案する。
論文参考訳（メタデータ） (2023-10-08T09:46:26Z)
Preconditioned Federated Learning [7.7269332266153326]
Federated Learning(FL)は、コミュニケーションの効率的かつプライバシ保護の方法でモデルトレーニングを可能にする分散機械学習アプローチである。 FedAvgは、現代の一階適応最適化と比較してアルゴリズム適応性を欠いていると考えられている。局所適応性(PreFed)とサーバ側適応性(PreFedOp)の2つのフレームワークに基づく通信効率の高い新しいFLアルゴリズムを提案する。
論文参考訳（メタデータ） (2023-09-20T14:58:47Z)
Locally Adaptive Federated Learning [30.19411641685853]
フェデレートラーニング(Federated Learning)とは、複数のクライアントが中央サーバと協調してモデルを学習する分散機械学習のパラダイムである。 Federated Averaging (FedAvg)のような標準的なフェデレーション最適化手法は、クライアント間の一般化を保証する。本稿では,各クライアント関数の局所的幾何情報を利用する局所的フェデレーション学習アルゴリズムを提案する。
論文参考訳（メタデータ） (2023-07-12T17:02:32Z)
Rich Feature Construction for the Optimization-Generalization Dilemma [18.721567020497968]
我々は、モデルで使用できる潜在的に有用な機能のパレットを含むリッチな表現(RFC)を構築する。 RFCは、6つのOoDメソッドが挑戦的な不変トレーニングベンチマークで最高のパフォーマンスを達成するのを一貫して支援します。現実的な Camelyon17 タスクでは,OoD と OoD の両手法が,従来の計算可能な結果に対して少なくとも 5% 以上の性能を発揮する。
論文参考訳（メタデータ） (2022-03-24T20:39:33Z)
Faster Algorithm and Sharper Analysis for Constrained Markov Decision Process [56.55075925645864]
制約付き意思決定プロセス (CMDP) の問題点について検討し, エージェントは, 複数の制約を条件として, 期待される累積割引報酬を最大化することを目的とする。新しいユーティリティ・デュアル凸法は、正規化ポリシー、双対正則化、ネステロフの勾配降下双対という3つの要素の新たな統合によって提案される。これは、凸制約を受ける全ての複雑性最適化に対して、非凸CMDP問題が$mathcal O (1/epsilon)$の低い境界に達する最初の実演である。
論文参考訳（メタデータ） (2021-10-20T02:57:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。