論文の概要: Large-Scale Application of Fault Injection into PyTorch Models -- an
Extension to PyTorchFI for Validation Efficiency
- arxiv url: http://arxiv.org/abs/2310.19449v1
- Date: Mon, 30 Oct 2023 11:18:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-01 20:32:52.138215
- Title: Large-Scale Application of Fault Injection into PyTorch Models -- an
Extension to PyTorchFI for Validation Efficiency
- Title(参考訳): PyTorchモデルへの大規模フォールトインジェクションの適用 - 検証効率向上のためのPyTorchFIの拡張-
- Authors: Ralf Graafe, Qutub Syed Sha, Florian Geissler, Michael Paulitsch
- Abstract要約: PyTorchALFI (Application Level Fault Injection for PyTorch) という,PyTorchFIに基づく新しいフォールトインジェクションフレームワークを導入する。
PyTorchALFIは、ランダムに生成された再利用可能な障害セットを定義して、PyTorchモデルに注入する効率的な方法を提供する。
- 参考スコア(独自算出の注目度): 1.7205106391379026
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Transient or permanent faults in hardware can render the output of Neural
Networks (NN) incorrect without user-specific traces of the error, i.e. silent
data errors (SDE). On the other hand, modern NNs also possess an inherent
redundancy that can tolerate specific faults. To establish a safety case, it is
necessary to distinguish and quantify both types of corruptions. To study the
effects of hardware (HW) faults on software (SW) in general and NN models in
particular, several fault injection (FI) methods have been established in
recent years. Current FI methods focus on the methodology of injecting faults
but often fall short of accounting for large-scale FI tests, where many fault
locations based on a particular fault model need to be analyzed in a short
time. Results need to be concise, repeatable, and comparable. To address these
requirements and enable fault injection as the default component in a machine
learning development cycle, we introduce a novel fault injection framework
called PyTorchALFI (Application Level Fault Injection for PyTorch) based on
PyTorchFI. PyTorchALFI provides an efficient way to define randomly generated
and reusable sets of faults to inject into PyTorch models, defines complex test
scenarios, enhances data sets, and generates test KPIs while tightly coupling
fault-free, faulty, and modified NN. In this paper, we provide details about
the definition of test scenarios, software architecture, and several examples
of how to use the new framework to apply iterative changes in fault location
and number, compare different model modifications, and analyze test results.
- Abstract(参考訳): ハードウェアにおける過渡的あるいは恒久的な障害は、ユーザー固有のエラー、すなわちサイレントデータエラー(SDE)の痕跡なしで、ニューラルネットワーク(NN)の出力を誤ったものにすることができる。
一方、現代のNNは特定の障害を許容できる固有の冗長性を持っている。
安全ケースを確立するには,両タイプの腐敗を識別し,定量化する必要がある。
近年,ハードウェア(HW)故障がソフトウェア(SW),特にNNモデルに与える影響を調べるために,いくつかの欠陥注入法が確立されている。
現在の FI 法は, 断層を注入する手法に重点を置いているが, 大規模な FI 試験に欠かせない場合が多く, 特定の断層モデルに基づく多くの故障箇所を短時間で解析する必要がある。
結果は簡潔で、繰り返し可能で、同等である必要があります。
これらの要件に対処し、機械学習開発サイクルのデフォルトコンポーネントとしてフォールトインジェクションを有効にするため、PyTorchALFI(Application Level Fault Injection for PyTorch)と呼ばれる新しいフォールトインジェクションフレームワークを導入する。
PyTorchALFIは、ランダムに生成された再利用可能なフォールトセットを定義し、PyTorchモデルに注入し、複雑なテストシナリオを定義し、データセットを拡張し、テストKPIを生成する。
本稿では, テストシナリオの定義, ソフトウェアアーキテクチャ, および新しいフレームワークを用いて, 故障位置と数値の反復的変化を適用し, 異なるモデル修正を比較し, テスト結果を解析するいくつかの例について述べる。
関連論文リスト
- Global Context Aggregation Network for Lightweight Saliency Detection of
Surface Defects [70.48554424894728]
我々は,エンコーダ・デコーダ構造上の表面欠陥を簡易に検出するためのGCANet(Global Context Aggregation Network)を開発した。
まず、軽量バックボーンの上部層に新しいトランスフォーマーエンコーダを導入し、DSA(Depth-wise Self-Attention)モジュールを通じてグローバルなコンテキスト情報をキャプチャする。
3つの公開欠陥データセットの実験結果から,提案したネットワークは,他の17の最先端手法と比較して,精度と実行効率のトレードオフを良好に達成できることが示された。
論文 参考訳(メタデータ) (2023-09-22T06:19:11Z) - MRFI: An Open Source Multi-Resolution Fault Injection Framework for
Neural Network Processing [8.871260896931211]
MRFIはディープニューラルネットワークのための高解像度フォールトインジェクションツールである。
異なる視点から広範な障害解析機能を統合する。
PyTorchの主要なニューラルネットワークコンピューティングフレームワークを変更していない。
論文 参考訳(メタデータ) (2023-06-20T06:46:54Z) - Bridging Precision and Confidence: A Train-Time Loss for Calibrating
Object Detection [58.789823426981044]
本稿では,境界ボックスのクラス信頼度を予測精度に合わせることを目的とした,新たな補助損失定式化を提案する。
その結果,列車の走行時間損失はキャリブレーション基準を超過し,キャリブレーション誤差を低減させることがわかった。
論文 参考訳(メタデータ) (2023-03-25T08:56:21Z) - ISimDL: Importance Sampling-Driven Acceleration of Fault Injection
Simulations for Evaluating the Robustness of Deep Learning [10.757663798809144]
我々は,重要なサンプリングに基づく障害シナリオを生成するために,ニューロンの感度を利用する新しい手法であるISimDLを提案する。
実験の結果, ランダムな一様サンプリングよりも臨界断層を選択する場合, 重要サンプリングは最大15倍の精度で, 100個未満の故障でその精度に達することがわかった。
論文 参考訳(メタデータ) (2023-03-14T16:15:28Z) - enpheeph: A Fault Injection Framework for Spiking and Compressed Deep
Neural Networks [10.757663798809144]
スパイク・圧縮型ディープニューラルネットワーク(DNN)の故障注入フレームワークであるenpheephについて述べる。
ランダムかつ増加する故障数を注入することにより,DNNはパラメータあたり7 x 10 (-7) の故障率で精度を低下させることができ,精度は40%以上低下することを示した。
論文 参考訳(メタデータ) (2022-07-31T00:30:59Z) - Fast and Accurate Error Simulation for CNNs against Soft Errors [64.54260986994163]
本稿では,誤りシミュレーションエンジンを用いて,コナールニューラルネットワーク(CNN)の信頼性解析のためのフレームワークを提案する。
これらの誤差モデルは、故障によって誘導されるCNN演算子の出力の破損パターンに基づいて定義される。
提案手法は,SASSIFIの欠陥効果の約99%の精度と,限定的なエラーモデルのみを実装した44倍から63倍までのスピードアップを実現する。
論文 参考訳(メタデータ) (2022-06-04T19:45:02Z) - Training on Test Data with Bayesian Adaptation for Covariate Shift [96.3250517412545]
ディープニューラルネットワークは、信頼できない不確実性推定で不正確な予測を行うことが多い。
分布シフトの下でのラベルなし入力とモデルパラメータとの明確に定義された関係を提供するベイズモデルを導出する。
本手法は精度と不確実性の両方を向上することを示す。
論文 参考訳(メタデータ) (2021-09-27T01:09:08Z) - Adaptive Anomaly Detection for Internet of Things in Hierarchical Edge
Computing: A Contextual-Bandit Approach [81.5261621619557]
階層エッジコンピューティング(HEC)を用いた適応型異常検出手法を提案する。
まず,複雑性を増した複数のDNNモデルを構築し,それぞれを対応するHEC層に関連付ける。
そこで我々は、文脈帯域問題として定式化され、強化学習ポリシーネットワークを用いて解決される適応モデル選択スキームを設計する。
論文 参考訳(メタデータ) (2021-08-09T08:45:47Z) - Fault Injectors for TensorFlow: Evaluation of the Impact of Random
Hardware Faults on Deep CNNs [4.854070123523902]
我々は,ランダムな障害の存在下での深層学習(dl)コンポーネントの動作を評価するための2つの新しいフォールトインジェクション(fi)フレームワークを提案する。
本稿では,2つの画像セットを用いた4つのvgg畳み込みnnを用いたfi実験の結果について述べる。
結果は、最も重要な操作とレイヤーを特定し、機能的に類似したNNの信頼性特性を比較し、選択的なフォールトトレランスメカニズムを導入するのに役立ちます。
論文 参考訳(メタデータ) (2020-12-13T11:16:25Z) - NADS: Neural Architecture Distribution Search for Uncertainty Awareness [79.18710225716791]
機械学習(ML)システムは、トレーニングデータとは異なるディストリビューションから来るテストデータを扱う場合、しばしばOoD(Out-of-Distribution)エラーに遭遇する。
既存のOoD検出アプローチはエラーを起こしやすく、時にはOoDサンプルに高い確率を割り当てることもある。
本稿では,すべての不確実性を考慮したアーキテクチャの共通構築ブロックを特定するために,ニューラルアーキテクチャ分布探索(NADS)を提案する。
論文 参考訳(メタデータ) (2020-06-11T17:39:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。