論文の概要: Machine Learning Systems are Bloated and Vulnerable
- arxiv url: http://arxiv.org/abs/2212.09437v2
- Date: Mon, 8 May 2023 11:04:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-09 23:39:17.428168
- Title: Machine Learning Systems are Bloated and Vulnerable
- Title(参考訳): 機械学習システムは肥大化し、脆弱です
- Authors: Huaifeng Zhang, Fahmi Abdulqadir Ahmed, Dyako Fatih, Akayou Kitessa,
Mohannad Alhanahnah, Philipp Leitner, Ahmed Ali-Eldin
- Abstract要約: 機械学習コンテナの肥大を解析するフレームワークであるMMLBを開発した。
我々のツールは肥大の原因を定量化し、分析ツールと統合して、肥大化がコンテナの脆弱性に与える影響を評価する。
- 参考スコア(独自算出の注目度): 3.9119172498051964
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Today's software is bloated with both code and features that are not used by
most users. This bloat is prevalent across the entire software stack, from the
operating system, all the way to software backends, frontends, and web-pages.
In this paper, we focus on analyzing and quantifying bloat in machine learning
containers. We develop MMLB, a framework to analyze bloat in machine learning
containers, measuring the amount of bloat that exists on the container and
package levels. Our tool quantifies the sources of bloat and integrates with
vulnerability analysis tools to evaluate the impact of bloat on container
vulnerabilities. Through experimentation with 15 machine learning containers
from Tensorflow, Pytorch, and NVIDIA, we show that bloat is a significant
issue, accounting for up to 80% of the container size in some cases. Our
results demonstrate that bloat significantly increases the container
provisioning time by up to 370% and exacerbates vulnerabilities by up to 99%.
- Abstract(参考訳): 今日のソフトウェアは、ほとんどのユーザが使用していないコードと機能の両方で肥大化している。
この肥大化は、オペレーティングシステムからソフトウェアバックエンド、フロントエンド、Webページに至るまで、ソフトウェアスタック全体に広まっています。
本稿では,機械学習コンテナの肥大の分析と定量化に注目する。
我々は機械学習コンテナの肥大化を分析するフレームワークであるMMLBを開発し、コンテナとパッケージレベルに存在する肥大化の量を測定する。
当社のツールはbloatのソースを定量化し,コンテナ脆弱性に対するbloatの影響を評価する脆弱性解析ツールと統合する。
tensorflow、pytorch、nvidiaの15の機械学習コンテナの実験を通じて、肥大化が重要な問題であることを示し、場合によってはコンテナサイズの最大80%を占めている。
その結果,bloatはコンテナのプロビジョニング時間を最大370%増加させ,脆弱性を最大99%悪化させることがわかった。
関連論文リスト
- Green AI: A Preliminary Empirical Study on Energy Consumption in DL
Models Across Different Runtime Infrastructures [56.200335252600354]
トレーニング済みのモデルを、ネイティブな開発環境とは異なる環境にデプロイするのは、一般的なプラクティスです。
これにより、インフラを含むONNXや標準フォーマットとして機能するONNXなどの交換フォーマットが導入された。
論文 参考訳(メタデータ) (2024-02-21T09:18:44Z) - Jup2Kub: algorithms and a system to translate a Jupyter Notebook
pipeline to a fault tolerant distributed Kubernetes deployment [0.9790236766474201]
科学は計算、データ操作、時には科学的データ分析のための可視化ステップを促進する。
Jupyterノートブックは、より大きなデータセットでスケールするのに苦労し、耐障害性がなく、基盤となるツールやパッケージの安定性に大きく依存している。
Jup2KupはJupyterノートブックから分散された高性能環境に変換し、フォールトトレランスを向上させる。
論文 参考訳(メタデータ) (2023-11-21T02:54:06Z) - FusionAI: Decentralized Training and Deploying LLMs with Massive
Consumer-Level GPUs [57.12856172329322]
我々は、巨大な未使用のコンシューマレベルのGPUをアンロックする分散システムを構想する。
このシステムは、CPUとGPUメモリの制限、ネットワーク帯域幅の低さ、ピアとデバイスの多様性など、重要な課題に直面している。
論文 参考訳(メタデータ) (2023-09-03T13:27:56Z) - In Situ Framework for Coupling Simulation and Machine Learning with
Application to CFD [51.04126395480625]
近年、流体力学計算を容易にする機械学習(ML)の多くの成功例が報告されている。
シミュレーションが大きくなるにつれて、従来のオフライン学習のための新しいトレーニングデータセットの生成は、I/Oとストレージのボトルネックを生み出します。
この作業は、この結合を単純化し、異種クラスタでのその場トレーニングと推論を可能にするソリューションを提供する。
論文 参考訳(メタデータ) (2023-06-22T14:07:54Z) - BLAFS: A Bloat Aware File System [2.3476033905954687]
コンテナ用のBLoat-Aware-fileシステムであるBLAFSを紹介する。
BLAFSは、クラウドおよびエッジシステムのデブロ安全性を保証する。
論文 参考訳(メタデータ) (2023-05-08T11:41:30Z) - A Simulation Platform for Multi-tenant Machine Learning Services on
Thousands of GPUs [38.92672037891692]
AnalySIMは、マルチテナント機械学習サービスの効率的な設計探索を可能にするクラスタシミュレータである。
GPUリソースの利用など、さまざまなパフォーマンスメトリクスで、さまざまなスケジューリングポリシをテストし、分析することが可能になる。
プリエンプションとマイグレーションによって、平均的な仕事の完了時間が大幅に短縮できることがわかった。
論文 参考訳(メタデータ) (2022-01-10T06:00:11Z) - Opacus: User-Friendly Differential Privacy Library in PyTorch [54.8720687562153]
私たちは、差分プライバシーでディープラーニングモデルをトレーニングするための、オープンソースのPyTorchライブラリであるOpacusを紹介します。
シンプルでユーザフレンドリなAPIを提供しており、コードに最大2行を追加することで、マシンラーニングの実践者がトレーニングパイプラインをプライベートにすることができる。
論文 参考訳(メタデータ) (2021-09-25T07:10:54Z) - Automated Machine Learning Techniques for Data Streams [91.3755431537592]
本稿では、最先端のオープンソースAutoMLツールを調査し、ストリームから収集したデータに適用し、時間とともにパフォーマンスがどのように変化するかを測定する。
この結果から,既製のAutoMLツールで十分な結果が得られることが示されたが,概念ドリフトや検出,適応といった手法が適用されれば,予測精度を時間とともに維持することが可能になる。
論文 参考訳(メタデータ) (2021-06-14T11:42:46Z) - Progressive Network Grafting for Few-Shot Knowledge Distillation [60.38608462158474]
本稿では, 数ショットデータに適した二段蒸留方式を提案する。
最初のステップでは、生徒のブロックを1つずつ教師に移植し、移植されたブロックのパラメータと他の教師ブロックのパラメータを学習します。
CIFAR10, CIFAR100, ILSVRC-2012で, わずか数サンプルで, 満足のいく結果が得られることを実証した。
論文 参考訳(メタデータ) (2020-12-09T08:34:36Z) - TensorFlow Lite Micro: Embedded Machine Learning on TinyML Systems [5.188829601887422]
組み込みデバイス上でのディープラーニング推論は、小さな組み込みデバイスが一様であることから、無数のアプリケーションで溢れている分野である。
組み込みデバイス上でのディープラーニング推論は、小さな組み込みデバイスが一様であることから、無数のアプリケーションで溢れている分野である。
組み込みシステム上でディープラーニングモデルを実行するための,オープンソースのML推論フレームワークであるLite Microを紹介した。
論文 参考訳(メタデータ) (2020-10-17T00:44:30Z) - TensorFI: A Flexible Fault Injection Framework for TensorFlow
Applications [2.204335500292961]
複製に基づくアプリケーションのための高レベルフォールトインジェクション(FI)フレームワークを提案する。
FIFIは一般的なプログラムにハードウェアとソフトウェアの両方の欠点を注入することができる。
既存のプログラムに統合して,さまざまな障害タイプに対するレジリエンスを評価することも可能だ。
論文 参考訳(メタデータ) (2020-04-03T19:26:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。