論文の概要: Impact of ML Optimization Tactics on Greener Pre-Trained ML Models
- arxiv url: http://arxiv.org/abs/2409.12878v1
- Date: Thu, 19 Sep 2024 16:23:03 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-07 13:10:09.660431
- Title: Impact of ML Optimization Tactics on Greener Pre-Trained ML Models
- Title(参考訳): ML最適化戦術がよりグリーンな事前学習MLモデルに及ぼす影響
- Authors: Alexandra González Álvarez, Joel Castaño, Xavier Franch, Silverio Martínez-Fernández,
- Abstract要約: 本研究の目的は,画像分類データセットと事前学習モデルの解析,最適化モデルと非最適化モデルを比較して推論効率を向上させること,最適化の経済的影響を評価することである。
画像分類におけるPyTorch最適化手法(動的量子化、トーチ・コンパイル、局所プルーニング、グローバルプルーニング)と42のHugging Faceモデルの影響を評価するための制御実験を行った。
動的量子化は推論時間とエネルギー消費の大幅な削減を示し、大規模システムに非常に適している。
- 参考スコア(独自算出の注目度): 46.78148962732881
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Background: Given the fast-paced nature of today's technology, which has surpassed human performance in tasks like image classification, visual reasoning, and English understanding, assessing the impact of Machine Learning (ML) on energy consumption is crucial. Traditionally, ML projects have prioritized accuracy over energy, creating a gap in energy consumption during model inference. Aims: This study aims to (i) analyze image classification datasets and pre-trained models, (ii) improve inference efficiency by comparing optimized and non-optimized models, and (iii) assess the economic impact of the optimizations. Method: We conduct a controlled experiment to evaluate the impact of various PyTorch optimization techniques (dynamic quantization, torch.compile, local pruning, and global pruning) to 42 Hugging Face models for image classification. The metrics examined include GPU utilization, power and energy consumption, accuracy, time, computational complexity, and economic costs. The models are repeatedly evaluated to quantify the effects of these software engineering tactics. Results: Dynamic quantization demonstrates significant reductions in inference time and energy consumption, making it highly suitable for large-scale systems. Additionally, torch.compile balances accuracy and energy. In contrast, local pruning shows no positive impact on performance, and global pruning's longer optimization times significantly impact costs. Conclusions: This study highlights the role of software engineering tactics in achieving greener ML models, offering guidelines for practitioners to make informed decisions on optimization methods that align with sustainability goals.
- Abstract(参考訳): 背景: 画像分類、視覚的推論、英語理解といったタスクにおいて人間のパフォーマンスを上回った今日の技術の急速な影響を考えると、機械学習(ML)がエネルギー消費に与える影響を評価することが重要である。
伝統的に、MLプロジェクトはエネルギーよりも精度を優先し、モデル推論中にエネルギー消費のギャップを生じさせる。
Aims: この研究の目的は
一 画像分類データセット及び事前学習モデルの分析。
2最適化モデルと非最適化モデルを比較して推論効率を向上させること。
三 最適化の経済的影響を評価すること。
方法: 画像分類におけるPyTorch最適化手法(動的量子化, torch.compile, 局所プルーニング, グローバルプルーニング)と42Hugging Faceモデルの影響を評価するための制御実験を行った。
調査対象のメトリクスは、GPU利用率、電力とエネルギー消費、正確性、時間、計算複雑性、経済コストである。
これらのモデルは、これらのソフトウェアエンジニアリング戦術の効果を定量化するために繰り返し評価される。
結果: 動的量子化は推論時間とエネルギー消費の大幅な削減を示し, 大規模システムに非常に適している。
さらに torch.compile は精度とエネルギーのバランスをとる。
対照的に、局所的なプルーニングは性能に肯定的な影響を与えず、グローバルプルーニングの長い最適化時間はコストに大きな影響を及ぼす。
結論: この研究は、グリーンなMLモデルの達成において、ソフトウェアエンジニアリングの戦術が果たす役割を強調し、持続可能性の目標と整合する最適化手法について、実践者が決定を下すためのガイドラインを提供します。
関連論文リスト
- Investigating Energy Efficiency and Performance Trade-offs in LLM Inference Across Tasks and DVFS Settings [1.5749416770494706]
大規模言語モデル(LLM)は多くの自然言語処理(NLP)タスクにおいて大幅に改善されている。
LLMはリソース集約型であり、トレーニングと推論の両方に広範な計算資源を必要とする。
導入が加速するにつれて、LLMの持続性は重要な問題となっている。
論文 参考訳(メタデータ) (2025-01-14T16:02:33Z) - A Survey on Inference Optimization Techniques for Mixture of Experts Models [50.40325411764262]
大規模Mixture of Experts(MoE)モデルは、条件計算によるモデル容量と計算効率の向上を提供する。
これらのモデル上で推論をデプロイし実行することは、計算資源、レイテンシ、エネルギー効率において大きな課題を示す。
本調査では,システムスタック全体にわたるMoEモデルの最適化手法について分析する。
論文 参考訳(メタデータ) (2024-12-18T14:11:15Z) - Numerical Pruning for Efficient Autoregressive Models [87.56342118369123]
本稿では,デコーダのみを用いた変圧器を用いた自己回帰モデルの圧縮に着目する。
具体的には,ニュートン法とモジュールの数値スコアをそれぞれ計算する学習自由プルーニング法を提案する。
提案手法の有効性を検証するため,理論的支援と広範囲な実験を行った。
論文 参考訳(メタデータ) (2024-12-17T01:09:23Z) - Automated Computational Energy Minimization of ML Algorithms using Constrained Bayesian Optimization [1.2891210250935148]
我々は,エネルギー消費を最小化する目的で,制約付きベイズ最適化(CBO)を評価した。
我々は,MLモデルの予測性能を損なうことなく,CBOによる省エネ効果を実証した。
論文 参考訳(メタデータ) (2024-07-08T09:49:38Z) - Efficiency optimization of large-scale language models based on deep learning in natural language processing tasks [6.596361762662328]
大規模言語モデルの内部構造と操作機構を理論的に解析する。
我々は、適応最適化アルゴリズム(AdamWなど)、大規模並列計算技術、混合精度訓練戦略の寄与を評価した。
論文 参考訳(メタデータ) (2024-05-20T00:10:00Z) - A Comparative Study of Machine Learning Algorithms for Anomaly Detection
in Industrial Environments: Performance and Environmental Impact [62.997667081978825]
本研究は,環境の持続可能性を考慮した高性能機械学習モデルの要求に応えることを目的としている。
Decision TreesやRandom Forestsといった従来の機械学習アルゴリズムは、堅牢な効率性とパフォーマンスを示している。
しかし, 資源消費の累積増加にもかかわらず, 最適化された構成で優れた結果が得られた。
論文 参考訳(メタデータ) (2023-07-01T15:18:00Z) - Design Amortization for Bayesian Optimal Experimental Design [70.13948372218849]
予測情報ゲイン(EIG)のバウンダリに関してパラメータ化された変分モデルを最適化する。
実験者が1つの変分モデルを最適化し、潜在的に無限に多くの設計に対してEIGを推定できる新しいニューラルアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-10-07T02:12:34Z) - Deep Learning-based Prediction of Key Performance Indicators for
Electrical Machine [0.0]
データ支援,深層学習に基づくメタモデルを用いて,電気機械の設計を迅速かつ高精度に予測する。
その結果、高い予測精度を示し、最適化時間を最小化するためのディープラーニングに基づくメタモデルの妥当性を示す。
論文 参考訳(メタデータ) (2020-12-16T18:03:58Z) - Models, Pixels, and Rewards: Evaluating Design Trade-offs in Visual
Model-Based Reinforcement Learning [109.74041512359476]
視覚的MBRLアルゴリズムにおける予測モデルの設計決定について検討する。
潜在空間の使用など、しばしば重要と見なされる設計上の決定は、タスクのパフォーマンスにはほとんど影響しないことが分かりました。
我々は,この現象が探索とどのように関係しているか,および標準ベンチマークにおける下位スコーリングモデルのいくつかが,同じトレーニングデータでトレーニングされた場合のベストパフォーマンスモデルと同等の性能を発揮するかを示す。
論文 参考訳(メタデータ) (2020-12-08T18:03:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。