論文の概要: DeepFT: Fault-Tolerant Edge Computing using a Self-Supervised Deep
Surrogate Model
- arxiv url: http://arxiv.org/abs/2212.01302v1
- Date: Fri, 2 Dec 2022 16:51:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 17:35:33.043035
- Title: DeepFT: Fault-Tolerant Edge Computing using a Self-Supervised Deep
Surrogate Model
- Title(参考訳): DeepFT:自己監督型ディープサロゲートモデルを用いたフォールトトレラントエッジコンピューティング
- Authors: Shreshth Tuli and Giuliano Casale and Ludmila Cherkasova and Nicholas
R. Jennings
- Abstract要約: 本稿では,システム過負荷とその悪影響を積極的に回避するためにDeepFTを提案する。
DeepFTは、システム内の障害を正確に予測し、診断するために、ディープサロゲートモデルを使用している。
モデルのサイズが1ユニットあたりわずか3~1%のスケールで、アクティブなタスクやホストの数が増えるため、非常にスケーラブルなソリューションを提供する。
- 参考スコア(独自算出の注目度): 12.335763358698564
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The emergence of latency-critical AI applications has been supported by the
evolution of the edge computing paradigm. However, edge solutions are typically
resource-constrained, posing reliability challenges due to heightened
contention for compute and communication capacities and faulty application
behavior in the presence of overload conditions. Although a large amount of
generated log data can be mined for fault prediction, labeling this data for
training is a manual process and thus a limiting factor for automation. Due to
this, many companies resort to unsupervised fault-tolerance models. Yet,
failure models of this kind can incur a loss of accuracy when they need to
adapt to non-stationary workloads and diverse host characteristics. To cope
with this, we propose a novel modeling approach, called DeepFT, to proactively
avoid system overloads and their adverse effects by optimizing the task
scheduling and migration decisions. DeepFT uses a deep surrogate model to
accurately predict and diagnose faults in the system and co-simulation based
self-supervised learning to dynamically adapt the model in volatile settings.
It offers a highly scalable solution as the model size scales by only 3 and 1
percent per unit increase in the number of active tasks and hosts. Extensive
experimentation on a Raspberry-Pi based edge cluster with DeFog benchmarks
shows that DeepFT can outperform state-of-the-art baseline methods in
fault-detection and QoS metrics. Specifically, DeepFT gives the highest F1
scores for fault-detection, reducing service deadline violations by up to 37\%
while also improving response time by up to 9%.
- Abstract(参考訳): レイテンシクリティカルなAIアプリケーションの出現は、エッジコンピューティングパラダイムの進化に支えられている。
しかし、エッジソリューションは通常リソース制約があり、オーバーロード条件が存在する場合の計算能力と通信能力の増大とアプリケーション動作の不良により信頼性が低下する。
障害予測のために大量のログデータをマイニングすることは可能だが、トレーニングのためにこのデータをラベル付けすることは手動のプロセスであり、自動化の限界要因である。
このため、多くの企業は教師なしフォールトトレランスモデルに頼っている。
しかし、この種の障害モデルは、非定常ワークロードや多様なホスト特性に適応する必要がある場合、精度を失う可能性がある。
これに対応するために,DeepFTと呼ばれる新しいモデリング手法を提案し,タスクスケジューリングとマイグレーション決定を最適化することにより,システム過負荷とその悪影響を積極的に回避する。
DeepFTはディープサロゲートモデルを使用してシステム内の障害を正確に予測し、診断し、コシミュレートベースの自己教師付き学習により、不安定な環境でモデルを動的に適応する。
モデルサイズがアクティブなタスクやホスト数の増加に対して,ユニットあたりわずか3~1%のスケールアップに留まり,高度にスケーラブルなソリューションを提供する。
defogベンチマークによるraspberry-piベースのエッジクラスタでの広範な実験は、deepftがフォールト検出とqosメトリクスにおいて最先端のベースラインメソッドを上回ることができることを示している。
具体的には、DeepFTは障害検出の最高スコアを与え、サービス期限違反を最大37\%削減し、レスポンスタイムを最大9%改善する。
関連論文リスト
- Towards Resource-Efficient Federated Learning in Industrial IoT for Multivariate Time Series Analysis [50.18156030818883]
異常と欠落したデータは、産業応用における厄介な問題を構成する。
ディープラーニングによる異常検出が重要な方向として現れている。
エッジデバイスで収集されたデータは、ユーザのプライバシを含む。
論文 参考訳(メタデータ) (2024-11-06T15:38:31Z) - Three-Stage Adjusted Regression Forecasting (TSARF) for Software Defect
Prediction [5.826476252191368]
非均一ポアソン過程 (NHPP) SRGM が最も一般的に用いられるモデルである。
モデル複雑性の増大は、堅牢で計算効率のよいアルゴリズムを識別する上での課題である。
論文 参考訳(メタデータ) (2024-01-31T02:19:35Z) - EdgeFD: An Edge-Friendly Drift-Aware Fault Diagnosis System for
Industrial IoT [0.0]
我々は,産業用モノのインターネット(IIoT)における頻繁なデータドリフトによる課題を軽減するため,DAWC(Drift-Aware Weight Consolidation)を提案する。
DAWCは複数のデータドリフトシナリオを効率的に管理し、エッジデバイス上での一定のモデル微調整の必要性を最小限にする。
包括的診断・可視化プラットフォームも開発しました。
論文 参考訳(メタデータ) (2023-10-07T06:48:07Z) - Learning Sample Difficulty from Pre-trained Models for Reliable
Prediction [55.77136037458667]
本稿では,大規模事前学習モデルを用いて,サンプル難易度を考慮したエントロピー正規化による下流モデルトレーニングを指導する。
我々は、挑戦的なベンチマークで精度と不確実性の校正を同時に改善する。
論文 参考訳(メタデータ) (2023-04-20T07:29:23Z) - Deep Convolutional Architectures for Extrapolative Forecast in
Time-dependent Flow Problems [0.0]
深層学習技術は、対流に支配された問題に対するシステムの力学をモデル化するために用いられる。
これらのモデルは、PDEから得られた連続した時間ステップに対する高忠実度ベクトル解のシーケンスとして入力される。
ディープオートエンコーダネットワークのような非侵襲的な低次モデリング技術を用いて高忠実度スナップショットを圧縮する。
論文 参考訳(メタデータ) (2022-09-18T03:45:56Z) - Fast and Accurate Error Simulation for CNNs against Soft Errors [64.54260986994163]
本稿では,誤りシミュレーションエンジンを用いて,コナールニューラルネットワーク(CNN)の信頼性解析のためのフレームワークを提案する。
これらの誤差モデルは、故障によって誘導されるCNN演算子の出力の破損パターンに基づいて定義される。
提案手法は,SASSIFIの欠陥効果の約99%の精度と,限定的なエラーモデルのみを実装した44倍から63倍までのスピードアップを実現する。
論文 参考訳(メタデータ) (2022-06-04T19:45:02Z) - On Efficient Uncertainty Estimation for Resource-Constrained Mobile
Applications [0.0]
予測の不確実性は、モデル予測を補完し、下流タスクの機能を改善します。
Axolotlフレームワークを用いてモンテカルロ・ドロップアウト(MCDO)モデルを構築することでこの問題に対処する。
我々は,(1)CIFAR10データセットを用いた多クラス分類タスク,(2)より複雑な人体セグメンテーションタスクについて実験を行った。
論文 参考訳(メタデータ) (2021-11-11T22:24:15Z) - Adaptive Anomaly Detection for Internet of Things in Hierarchical Edge
Computing: A Contextual-Bandit Approach [81.5261621619557]
階層エッジコンピューティング(HEC)を用いた適応型異常検出手法を提案する。
まず,複雑性を増した複数のDNNモデルを構築し,それぞれを対応するHEC層に関連付ける。
そこで我々は、文脈帯域問題として定式化され、強化学習ポリシーネットワークを用いて解決される適応モデル選択スキームを設計する。
論文 参考訳(メタデータ) (2021-08-09T08:45:47Z) - Adaptive Subcarrier, Parameter, and Power Allocation for Partitioned
Edge Learning Over Broadband Channels [69.18343801164741]
パーティショニングエッジ学習(PARTEL)は、無線ネットワークにおいてよく知られた分散学習手法であるパラメータサーバトレーニングを実装している。
本稿では、いくつかの補助変数を導入してParticleELを用いてトレーニングできるディープニューラルネットワーク(DNN)モデルについて考察する。
論文 参考訳(メタデータ) (2020-10-08T15:27:50Z) - Uncertainty Estimation Using a Single Deep Deterministic Neural Network [66.26231423824089]
本稿では,1回のフォワードパスで,テスト時に分布データポイントの発見と拒否が可能な決定論的ディープモデルを訓練する手法を提案する。
我々は,新しい損失関数とセントロイド更新方式を用いて,これらをスケールトレーニングし,ソフトマックスモデルの精度に適合させる。
論文 参考訳(メタデータ) (2020-03-04T12:27:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。