論文の概要: McUDI: Model-Centric Unsupervised Degradation Indicator for Failure
Prediction AIOps Solutions
- arxiv url: http://arxiv.org/abs/2401.14093v1
- Date: Thu, 25 Jan 2024 11:15:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-26 15:11:30.855166
- Title: McUDI: Model-Centric Unsupervised Degradation Indicator for Failure
Prediction AIOps Solutions
- Title(参考訳): McUDI: 失敗予測AIOpsソリューションのためのモデル中心の教師なし劣化指標
- Authors: Lorena Poenaru-Olaru, Luis Cruz, Jan Rellermeyer, Arie van Deursen
- Abstract要約: 我々は、AIOpsモデルが再トレーニングを必要とする正確なタイミングを検出することができるモデル中心の教師なし劣化指標であるMcUDIを提案する。
AIOpsソリューションのメンテナンスパイプラインにMcUDIを用いることで、ジョブ障害予測に30k、ディスク障害予測に260kのアノテーションを必要とするサンプルの数を減らすことができることを示す。
- 参考スコア(独自算出の注目度): 17.738978371826562
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Due to the continuous change in operational data, AIOps solutions suffer from
performance degradation over time. Although periodic retraining is the
state-of-the-art technique to preserve the failure prediction AIOps models'
performance over time, this technique requires a considerable amount of labeled
data to retrain. In AIOps obtaining label data is expensive since it requires
the availability of domain experts to intensively annotate it. In this paper,
we present McUDI, a model-centric unsupervised degradation indicator that is
capable of detecting the exact moment the AIOps model requires retraining as a
result of changes in data. We further show how employing McUDI in the
maintenance pipeline of AIOps solutions can reduce the number of samples that
require annotations with 30k for job failure prediction and 260k for disk
failure prediction while achieving similar performance with periodic
retraining.
- Abstract(参考訳): 運用データの継続的な変化のため、aiopsソリューションは時間とともにパフォーマンスが低下する。
周期的リトレーニングは、失敗予測AIOpsモデルのパフォーマンスを経時的に保持する最先端技術であるが、このテクニックは、リトレーニングに大量のラベル付きデータを必要とする。
AIOpsでは、ラベルデータを取得するには、ドメインの専門家が集中的にアノテートする必要があるため、コストがかかる。
本稿では,aiopsモデルの正確なモーメントを検出するためのモデル中心の非教師なし分解指標であるmcudiを提案する。
さらに,aiopsソリューションのメンテナンスパイプラインでmcudiを使用することで,ジョブ障害予測に30k,ディスク障害予測に260kのアノテーションを必要とするサンプル数を削減できると同時に,周期的なリトレーニングで同様のパフォーマンスを達成できることを示す。
関連論文リスト
- Improved Long Short-Term Memory-based Wastewater Treatment Simulators for Deep Reinforcement Learning [0.0]
排水処理データのトレーニングモデルを改善するための2つの手法を実装した。
実験結果から, これらの手法を用いることで, シミュレーションの動作を1年を通して動的時間ワープで改善できることがわかった。
論文 参考訳(メタデータ) (2024-03-22T10:20:09Z) - Is Your Anomaly Detector Ready for Change? Adapting AIOps Solutions to the Real World [15.1355549683548]
モデル更新頻度から2種類の異常検出モデル保守手法を解析した。
我々は、データ変更監視ツールが、再トレーニングによって異常検出モデルを更新する必要があるかどうかを判断できるかどうかを検討する。
論文 参考訳(メタデータ) (2023-11-17T09:54:35Z) - PULL: Reactive Log Anomaly Detection Based On Iterative PU Learning [58.85063149619348]
本稿では,推定故障時間ウィンドウに基づくリアクティブ異常検出のための反復ログ解析手法PULLを提案する。
我々の評価では、PULLは3つの異なるデータセットで10のベンチマークベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2023-01-25T16:34:43Z) - Temporal Output Discrepancy for Loss Estimation-based Active Learning [65.93767110342502]
ラベルのないサンプルが高損失を伴っていると信じられている場合に,データアノテーションのオラクルに問い合わせる,新しいディープラーニングアプローチを提案する。
本手法は,画像分類やセマンティックセグメンテーションタスクにおける最先端の能動学習手法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2022-12-20T19:29:37Z) - Improving self-supervised pretraining models for epileptic seizure
detection from EEG data [0.23624125155742057]
本稿では、時系列に基づく拡散畳み込みニューラルネットワーク(DCRNN)モデルの性能を高めるための様々な自己超越戦略を提案する。
自己超越事前訓練フェーズの学習重量は、モデルの予測能力を高めるために教師付きトレーニングフェーズに移行することができる。
論文 参考訳(メタデータ) (2022-06-28T17:15:49Z) - Monte Carlo EM for Deep Time Series Anomaly Detection [6.312089019297173]
時系列データは、しばしば外れ値や他の種類の異常によって破壊される。
異常検出と予測への最近のアプローチは、トレーニングデータの異常の割合が無視できるほど小さいと仮定している。
本稿では,既存の時系列モデルを拡張して,トレーニングデータの異常を明示的に考慮する手法を提案する。
論文 参考訳(メタデータ) (2021-12-29T07:52:36Z) - Cloud Failure Prediction with Hierarchical Temporary Memory: An
Empirical Assessment [64.73243241568555]
Hierarchical Temporary Memory (HTM) は、新皮質の特徴にインスパイアされた教師なし学習アルゴリズムである。
本稿では,障害予測の文脈でHTMを評価する最初の体系的研究について述べる。
論文 参考訳(メタデータ) (2021-10-06T07:09:45Z) - Imputation-Free Learning from Incomplete Observations [73.15386629370111]
本稿では,不備な値を含む入力からの推論をインプットなしでトレーニングするIGSGD法の重要性について紹介する。
バックプロパゲーションによるモデルのトレーニングに使用する勾配の調整には強化学習(RL)を用いる。
我々の計算自由予測は、最先端の計算手法を用いて従来の2段階の計算自由予測よりも優れている。
論文 参考訳(メタデータ) (2021-07-05T12:44:39Z) - TELESTO: A Graph Neural Network Model for Anomaly Classification in
Cloud Services [77.454688257702]
機械学習(ML)と人工知能(AI)はITシステムの運用とメンテナンスに適用される。
1つの方向は、修復自動化を可能にするために、繰り返し発生する異常タイプを認識することである。
与えられたデータの次元変化に不変な手法を提案する。
論文 参考訳(メタデータ) (2021-02-25T14:24:49Z) - Detection of Anomalies in a Time Series Data using InfluxDB and Python [0.0]
本論文では,時系列データに対するデータクリーニングと準備について述べる。
さらに,時系列データに異常なデータ点を検出するソリューションとして,コストに敏感な機械学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-12-15T17:27:39Z) - SUOD: Accelerating Large-Scale Unsupervised Heterogeneous Outlier
Detection [63.253850875265115]
外乱検出(OD)は、一般的なサンプルから異常物体を識別するための機械学習(ML)タスクである。
そこで我々は,SUODと呼ばれるモジュール型加速度システムを提案する。
論文 参考訳(メタデータ) (2020-03-11T00:22:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。