Fugu-MT 論文翻訳(概要): Distributed Pruning Towards Tiny Neural Networks in Federated Learning

論文の概要: Distributed Pruning Towards Tiny Neural Networks in Federated Learning

arxiv url: http://arxiv.org/abs/2212.01977v2
Date: Tue, 11 Jul 2023 13:09:37 GMT
ステータス: 翻訳完了
システム内更新日: 2023-07-12 19:07:12.911384
Title: Distributed Pruning Towards Tiny Neural Networks in Federated Learning
Title（参考訳）: フェデレーション学習における小さなニューラルネットワークへの分散pruning
Authors: Hong Huang, Lan Zhang, Chaoyue Sun, Ruogu Fang, Xiaoyong Yuan, Dapeng Wu
Abstract要約: FedTinyは、フェデレートラーニングのための分散プルーニングフレームワークである。メモリとコンピューティングに制約のあるデバイスのための、特殊な小さなモデルを生成する。 2.61%の精度向上を実現し、計算コストを95.91%削減した。
参考スコア（独自算出の注目度）: 12.63559789381064
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Neural network pruning is an essential technique for reducing the size and complexity of deep neural networks, enabling large-scale models on devices with limited resources. However, existing pruning approaches heavily rely on training data for guiding the pruning strategies, making them ineffective for federated learning over distributed and confidential datasets. Additionally, the memory- and computation-intensive pruning process becomes infeasible for recourse-constrained devices in federated learning. To address these challenges, we propose FedTiny, a distributed pruning framework for federated learning that generates specialized tiny models for memory- and computing-constrained devices. We introduce two key modules in FedTiny to adaptively search coarse- and finer-pruned specialized models to fit deployment scenarios with sparse and cheap local computation. First, an adaptive batch normalization selection module is designed to mitigate biases in pruning caused by the heterogeneity of local data. Second, a lightweight progressive pruning module aims to finer prune the models under strict memory and computational budgets, allowing the pruning policy for each layer to be gradually determined rather than evaluating the overall model structure. The experimental results demonstrate the effectiveness of FedTiny, which outperforms state-of-the-art approaches, particularly when compressing deep models to extremely sparse tiny models. FedTiny achieves an accuracy improvement of 2.61% while significantly reducing the computational cost by 95.91% and the memory footprint by 94.01% compared to state-of-the-art methods.
Abstract（参考訳）: ニューラルネットワークのプルーニングは、ディープニューラルネットワークのサイズと複雑さを低減し、リソースの少ないデバイス上での大規模モデルを可能にするために必要な技術である。しかしながら、既存のpruningアプローチは、pruning戦略を導くためのトレーニングデータに大きく依存しており、分散および機密データセットよりもフェデレーション学習に有効ではない。さらに、メモリおよび計算集約的なプルーニングプロセスは、フェデレート学習において、リコース制約されたデバイスに対して実現不可能となる。これらの課題に対処するために,我々は,メモリおよびコンピューティングに制約のあるデバイスのための専用小モデルを生成するフェデレーション学習のための分散プルーニングフレームワークであるfeedtinyを提案する。 fedtinyに2つの重要なモジュールを導入して,粗粒および細粒度の特殊モデルを適応的に検索し,分散および安価に局所計算可能なデプロイメントシナリオに適合させる。まず、適応バッチ正規化選択モジュールは、局所データの不均一性に起因するプルーニングのバイアスを軽減するように設計されている。第二に、軽量なプログレッシブプルーニングモジュールは、厳密なメモリと計算予算の下でモデルを微調整することを目的としており、全体的なモデル構造を評価するのではなく、各層に対するプルーニングポリシーを徐々に決定することができる。実験の結果,特に深層モデルを極小モデルに圧縮する場合において,最先端のアプローチに勝るfeedtinyの有効性が示された。 FedTinyは2.61%の精度向上を実現し、計算コストを95.91%、メモリフットプリントを94.01%削減した。

関連論文リスト

An Efficient Sparse Fine-Tuning with Low Quantization Error via Neural Network Pruning [9.208007322096535]
ニューラルネットワークプルーニングのアイデアに基づく新しいSpFTフレームワークを開発した。提案手法は,LoRAの変種のような最先端手法の精度に適合しながら,SpFTのメモリ効率を20～50%向上することを示す。
論文参考訳（メタデータ） (2025-02-17T04:54:42Z)
Just How Flexible are Neural Networks in Practice? [89.80474583606242]
ニューラルネットワークは、パラメータを持つ少なくとも多くのサンプルを含むトレーニングセットに適合できると広く信じられている。しかし実際には、勾配や正規化子など、柔軟性を制限したトレーニング手順によるソリューションしか見つからない。
論文参考訳（メタデータ） (2024-06-17T12:24:45Z)
Explicit Foundation Model Optimization with Self-Attentive Feed-Forward Neural Units [4.807347156077897]
バックプロパゲーションを用いた反復近似法はニューラルネットワークの最適化を可能にするが、大規模に使用すると計算コストがかかる。本稿では、ニューラルネットワークのスケーリングコストを削減し、低リソースアプリケーションに高効率な最適化を提供する、ニューラルネットワークの最適化のための効率的な代替手段を提案する。
論文参考訳（メタデータ） (2023-11-13T17:55:07Z)
Soft Merging: A Flexible and Robust Soft Model Merging Approach for Enhanced Neural Network Performance [6.599368083393398]
グラディエント(SGD)はしばしばモデル性能を改善するために局所最適化を収束させることに制限される。エム・ソフト・マージング法は、望ましくない結果で得られた局所最適モデルを最小化する。実験は、統合されたネットワークの有効性を裏付けるものである。
論文参考訳（メタデータ） (2023-09-21T17:07:31Z)
Adaptive Model Pruning and Personalization for Federated Learning over Wireless Networks [72.59891661768177]
フェデレーション学習(FL)は、データプライバシを保護しながら、エッジデバイス間での分散学習を可能にする。これらの課題を克服するために、部分的なモデルプルーニングとパーソナライズを備えたFLフレームワークを検討する。このフレームワークは、学習モデルを、データ表現を学ぶためにすべてのデバイスと共有されるモデルプルーニングと、特定のデバイスのために微調整されるパーソナライズされた部分とで、グローバルな部分に分割する。
論文参考訳（メタデータ） (2023-09-04T21:10:45Z)
Iterative Soft Shrinkage Learning for Efficient Image Super-Resolution [91.3781512926942]
画像超解像(SR)は、CNNからトランスフォーマーアーキテクチャへの広範なニューラルネットワーク設計を目撃している。本研究は,市販のネットワーク設計を生かし,基礎となる計算オーバーヘッドを低減するため,超高解像度イテレーションにおけるネットワークプルーニングの可能性について検討する。本研究では, ランダムネットワークのスパース構造を最適化し, 重要でない重みを小さめに微調整することにより, 反復型軟収縮率(ISS-P)法を提案する。
論文参考訳（メタデータ） (2023-03-16T21:06:13Z)
Paoding: Supervised Robustness-preserving Data-free Neural Network Pruning [3.6953655494795776]
エンフェータフリーコンテキストにおけるニューラルネットワークのプルーニングについて検討する。従来の攻撃的なワンショット戦略を、プルーニングを進歩的なプロセスとして扱う保守的な戦略に置き換えます。提案手法は,TextscPaodingというPythonパッケージとして実装され,多様なニューラルネットワークモデルに関する一連の実験により評価された。
論文参考訳（メタデータ） (2022-04-02T07:09:17Z)
LCS: Learning Compressible Subspaces for Adaptive Network Compression at Inference Time [57.52251547365967]
本稿では,ニューラルネットワークの「圧縮可能な部分空間」を訓練する手法を提案する。構造的・非構造的空間に対する推定時間における微粒な精度・効率のトレードオフを任意に達成するための結果を示す。我々のアルゴリズムは、可変ビット幅での量子化にまで拡張し、個別に訓練されたネットワークと同等の精度を実現する。
論文参考訳（メタデータ） (2021-10-08T17:03:34Z)
Investigating the Relationship Between Dropout Regularization and Model Complexity in Neural Networks [0.0]
ドロップアウト規則化は、ディープラーニングモデルのばらつきを低減するのに役立つ。 2,000のニューラルネットワークをトレーニングすることにより,ドロップアウト率とモデル複雑性の関係について検討する。各密層に隠されたユニットの数から、最適なドロップアウト率を予測するニューラルネットワークを構築します。
論文参考訳（メタデータ） (2021-08-14T23:49:33Z)
Probabilistic partition of unity networks: clustering based deep approximation [0.0]
ユニタリネットワーク(POU-Nets)の分割は、回帰とPDEの解に対する代数収束率を実現することができる。ガウス雑音モデルを用いてPOU-Netを拡張し、最大可算損失の勾配に基づく一般化を導出できる確率的一般化を得る。本研究では,高次元・低次元での性能を定量化するためのベンチマークを行い,高次元空間内のデータの潜在次元にのみ依存することを示す。
論文参考訳（メタデータ） (2021-07-07T08:02:00Z)
Efficient Micro-Structured Weight Unification and Pruning for Neural Network Compression [56.83861738731913]
ディープニューラルネットワーク(DNN)モデルは、特にリソース制限されたデバイスにおいて、実用的なアプリケーションに不可欠である。既往の非構造的あるいは構造化された重量刈り法は、推論を真に加速することはほとんど不可能である。ハードウェア互換のマイクロ構造レベルでの一般化された重み統一フレームワークを提案し,高い圧縮と加速度を実現する。
論文参考訳（メタデータ） (2021-06-15T17:22:59Z)
Belief Propagation Reloaded: Learning BP-Layers for Labeling Problems [83.98774574197613]
最も単純な推論手法の1つとして、切り詰められた最大積のBelief伝播を取り上げ、それをディープラーニングモデルの適切なコンポーネントにするために必要となるものを加えます。このBP-Layerは畳み込みニューラルネットワーク(CNN)の最終ブロックまたは中間ブロックとして使用できるこのモデルは様々な密集予測問題に適用可能であり、パラメータ効率が高く、ステレオ、光フロー、セマンティックセグメンテーションにおける堅牢な解を提供する。
論文参考訳（メタデータ） (2020-03-13T13:11:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。