論文の概要: Exploring Error Bits for Memory Failure Prediction: An In-Depth
Correlative Study
- arxiv url: http://arxiv.org/abs/2312.02855v2
- Date: Mon, 18 Dec 2023 15:30:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-20 22:03:51.978018
- Title: Exploring Error Bits for Memory Failure Prediction: An In-Depth
Correlative Study
- Title(参考訳): メモリ障害予測のための誤りビットの探索--深部相関研究
- Authors: Qiao Yu, Wengui Zhang, Jorge Cardoso and Odej Kao
- Abstract要約: 本研究はCEとUEの相関に関する総合的研究である。
解析の結果,大時間誤りビットとUEの発生との間には強い相関関係が認められた。
提案手法は,UEによる仮想マシンの中断回数を約59%削減する。
- 参考スコア(独自算出の注目度): 5.292618442300404
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In large-scale datacenters, memory failure is a common cause of server
crashes, with Uncorrectable Errors (UEs) being a major indicator of Dual Inline
Memory Module (DIMM) defects. Existing approaches primarily focus on predicting
UEs using Correctable Errors (CEs), without fully considering the information
provided by error bits. However, error bit patterns have a strong correlation
with the occurrence of UEs. In this paper, we present a comprehensive study on
the correlation between CEs and UEs, specifically emphasizing the importance of
spatio-temporal error bit information. Our analysis reveals a strong
correlation between spatio-temporal error bits and UE occurrence. Through
evaluations using real-world datasets, we demonstrate that our approach
significantly improves prediction performance by 15% in F1-score compared to
the state-of-the-art algorithms. Overall, our approach effectively reduces the
number of virtual machine interruptions caused by UEs by approximately 59%.
- Abstract(参考訳): 大規模なデータセンタでは、メモリ障害はサーバクラッシュの一般的な原因であり、修正不能エラー(ues)はデュアルインラインメモリモジュール(dimm)障害の主要な指標である。
既存のアプローチは主に、エラービットによって提供される情報を十分に考慮せずに、修正可能なエラー(CE)を使用してUEを予測することに焦点を当てている。
しかし、誤りビットパターンはUEの発生と強い相関関係を持つ。
本稿では,CEとUEの相関関係に関する総合的研究を行い,特に時空間誤りビット情報の重要性を強調した。
解析の結果,時空間誤差ビットとue発生との間に強い相関が認められた。
実世界のデータセットを用いた評価により,本手法は最先端のアルゴリズムと比較してF1スコアの予測性能を15%向上することを示した。
提案手法は,UEによる仮想マシンの中断回数を約59%削減する。
関連論文リスト
- Detrimental non-Markovian errors for surface code memory [0.5490714603843316]
非マルコフ相関誤差の構造とそれらの表面コードメモリ性能への影響について検討する。
解析の結果、時間的相関構造はすべて有害な構造ではないが、特定の構造、特にマルチタイムの「不安定な」相関は、論理的誤り率のスケーリングを著しく低下させることが示唆された。
論文 参考訳(メタデータ) (2024-10-31T09:52:21Z) - Is Difficulty Calibration All We Need? Towards More Practical Membership Inference Attacks [16.064233621959538]
我々は,textbfRe-levertextbfA を直接 textbfRe-levertextbfA を用いて mtextbfItigate the error in textbfDifficulty calibration を提案する。
論文 参考訳(メタデータ) (2024-08-31T11:59:42Z) - Regularized Contrastive Partial Multi-view Outlier Detection [76.77036536484114]
RCPMOD(Regularized Contrastive partial Multi-view Outlier Detection)と呼ばれる新しい手法を提案する。
このフレームワークでは、コントラスト学習を利用して、ビュー一貫性のある情報を学び、一貫性の度合いでアウトレイラを識別する。
4つのベンチマークデータセットによる実験結果から,提案手法が最先端の競合より優れていることが示された。
論文 参考訳(メタデータ) (2024-08-02T14:34:27Z) - Investigating Memory Failure Prediction Across CPU Architectures [8.477622236186695]
本稿では,CPUアーキテクチャ間での補正エラー (CE) と修正不可能エラー (UE) の相関について検討する。
本分析では,各プロセッサプラットフォームに関連するメモリ障害のユニークなパターンを同定する。
異なるプロセッサのプラットフォームでメモリ障害予測を行い、既存のアルゴリズムと比較して最大15%F1スコアの改善を実現した。
論文 参考訳(メタデータ) (2024-06-08T05:10:23Z) - D-BIAS: A Causality-Based Human-in-the-Loop System for Tackling
Algorithmic Bias [57.87117733071416]
D-BIASは、人間のループ内AIアプローチを具現化し、社会的バイアスを監査し軽減する視覚対話型ツールである。
ユーザは、因果ネットワークにおける不公平な因果関係を識別することにより、グループに対する偏見の存在を検出することができる。
それぞれのインタラクション、例えばバイアスのある因果縁の弱体化/削除は、新しい(偏りのある)データセットをシミュレートするために、新しい方法を用いている。
論文 参考訳(メタデータ) (2022-08-10T03:41:48Z) - Local Learning Matters: Rethinking Data Heterogeneity in Federated
Learning [61.488646649045215]
フェデレートラーニング(FL)は、クライアントのネットワーク(エッジデバイス)でプライバシ保護、分散ラーニングを行うための有望な戦略である。
論文 参考訳(メタデータ) (2021-11-28T19:03:39Z) - Tightening the Approximation Error of Adversarial Risk with Auto Loss
Function Search [12.263913626161155]
一般的な評価手法は、モデルの逆方向リスクをロバスト性指標として近似することである。
本稿では,エラーを厳格化するための損失関数を探索する最初の手法であるAutoLoss-ARを提案する。
その結果,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2021-11-09T11:47:43Z) - Discriminative-Generative Dual Memory Video Anomaly Detection [81.09977516403411]
近年,ビデオ異常検出(VAD)には,トレーニングプロセス中に通常のデータに代えて,いくつかの異常を使おうと試みている。
本稿では,いくつかの異常を生かしてデータの不均衡を解決するために,識別生成型デュアルメモリ(dream)異常検出モデルを提案する。
論文 参考訳(メタデータ) (2021-04-29T15:49:01Z) - Collaborative Boundary-aware Context Encoding Networks for Error Map
Prediction [65.44752447868626]
本稿では,AEP-Net と呼ばれる協調的コンテキスト符号化ネットワークを提案する。
具体的には、画像とマスクのより優れた特徴融合のための協調的な特徴変換分岐と、エラー領域の正確な局所化を提案する。
AEP-Netはエラー予測タスクの平均DSCが0.8358,0.8164であり、ピアソン相関係数が0.9873である。
論文 参考訳(メタデータ) (2020-06-25T12:42:01Z) - An Investigation of Why Overparameterization Exacerbates Spurious
Correlations [98.3066727301239]
この動作を駆動するトレーニングデータの2つの重要な特性を特定します。
モデルの"記憶"に対する帰納的バイアスが,パラメータ化の超過を損なう可能性を示す。
論文 参考訳(メタデータ) (2020-05-09T01:59:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。