論文の概要: Anomaly Detection in Large-Scale Cloud Systems: An Industry Case and Dataset
- arxiv url: http://arxiv.org/abs/2411.09047v1
- Date: Wed, 13 Nov 2024 22:04:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-15 15:25:26.191191
- Title: Anomaly Detection in Large-Scale Cloud Systems: An Industry Case and Dataset
- Title(参考訳): 大規模クラウドシステムにおける異常検出:産業事例とデータセット
- Authors: Mohammad Saiful Islam, Mohamed Sami Rakha, William Pourmajidi, Janakan Sivaloganathan, John Steinbacher, Andriy Miranskyy,
- Abstract要約: 我々は、IBM Cloud Consoleから4.5ヶ月以上にわたって収集された、IBM Cloudからの新しい高次元データセットを紹介します。
このデータセットは39,365行と117,448列のテレメトリデータからなる。
本稿では、異常検出のための機械学習モデルの応用を実演し、このプロセスで直面する重要な課題について論じる。
- 参考スコア(独自算出の注目度): 1.293050392312921
- License:
- Abstract: As Large-Scale Cloud Systems (LCS) become increasingly complex, effective anomaly detection is critical for ensuring system reliability and performance. However, there is a shortage of large-scale, real-world datasets available for benchmarking anomaly detection methods. To address this gap, we introduce a new high-dimensional dataset from IBM Cloud, collected over 4.5 months from the IBM Cloud Console. This dataset comprises 39,365 rows and 117,448 columns of telemetry data. Additionally, we demonstrate the application of machine learning models for anomaly detection and discuss the key challenges faced in this process. This study and the accompanying dataset provide a resource for researchers and practitioners in cloud system monitoring. It facilitates more efficient testing of anomaly detection methods in real-world data, helping to advance the development of robust solutions to maintain the health and performance of large-scale cloud infrastructures.
- Abstract(参考訳): 大規模クラウドシステム(LCS)が複雑化するにつれて、システムの信頼性と性能を確保するために効果的な異常検出が重要である。
しかし、異常検出方法のベンチマークには大規模な実世界のデータセットが不足している。
このギャップに対処するために、IBM Cloud Consoleから4.5ヶ月以上収集された、IBM Cloudからの新しい高次元データセットを紹介します。
このデータセットは39,365行と117,448列のテレメトリデータからなる。
さらに、異常検出のための機械学習モデルの応用を実証し、このプロセスで直面する重要な課題について議論する。
この研究と付随するデータセットは、クラウドコンピューティングモニタリングの研究者や実践者のためのリソースを提供する。
これは、現実世界のデータにおける異常検出方法のより効率的なテストを可能にし、大規模クラウドインフラストラクチャの健全性とパフォーマンスを維持するための堅牢なソリューションの開発を促進するのに役立つ。
関連論文リスト
- Cloud Atlas: Efficient Fault Localization for Cloud Systems using Language Models and Causal Insight [12.272468397322738]
我々は、クラウドシステムのための因果グラフを自動的に合成する新しいアプローチであるAtlasを提示する。
我々はAtlasをさまざまな障害局所化シナリオで評価し、Atlasがスケーラブルで一般化可能な方法で因果グラフを生成することができることを示す。
論文 参考訳(メタデータ) (2024-07-11T17:31:12Z) - ModelNet-O: A Large-Scale Synthetic Dataset for Occlusion-Aware Point
Cloud Classification [28.05358017259757]
本論文では,123,041サンプルの大規模合成データセットであるModelNet-Oを提案する。
ModelNet-Oは、モノクロカメラからのスキャンによる自己閉塞で現実世界の点雲をエミュレートする。
本稿では,PointMLSと呼ばれるロバストポイントクラウド処理手法を提案する。
論文 参考訳(メタデータ) (2024-01-16T08:54:21Z) - A Survey of Label-Efficient Deep Learning for 3D Point Clouds [109.07889215814589]
本稿では,点雲のラベル効率学習に関する包括的調査を行う。
本稿では,ラベルの種類によって提供されるデータ前提条件に基づいて,ラベル効率のよい学習手法を整理する分類法を提案する。
それぞれのアプローチについて、問題設定の概要と、関連する進展と課題を示す広範な文献レビューを提供する。
論文 参考訳(メタデータ) (2023-05-31T12:54:51Z) - An Outlier Exposure Approach to Improve Visual Anomaly Detection
Performance for Mobile Robots [76.36017224414523]
移動ロボットの視覚異常検出システム構築の問題点を考察する。
標準異常検出モデルは、非異常データのみからなる大規模なデータセットを用いて訓練される。
本研究では,これらのデータを利用してリアルNVP異常検出モデルの性能向上を図る。
論文 参考訳(メタデータ) (2022-09-20T15:18:13Z) - Exploring Scalable, Distributed Real-Time Anomaly Detection for Bridge
Health Monitoring [15.920402427606959]
現代のリアルタイム構造健康モニタリングシステムは、かなりの量の情報を生成することができる。
現在のクラウドベースのソリューションは、数千の建物から生データを収集する必要がある場合、スケールできない。
本稿では、SHMシステムのための効率よくスケーラブルな異常検出パイプラインのフルスタック展開について述べる。
論文 参考訳(メタデータ) (2022-03-04T15:37:20Z) - Online Self-Evolving Anomaly Detection in Cloud Computing Environments [6.480575492140354]
本稿では,クラウド信頼性保証のための自己進化型異常検出(SEAD)フレームワークを提案する。
我々のフレームワークは、新たに検証された異常記録を探索し、オンラインの異常検出を継続的に更新することによって、自己進化する。
我々の検出器は感度88.94%、平均94.60%を達成でき、実際の展開に適している。
論文 参考訳(メタデータ) (2021-11-16T05:13:38Z) - Robust and Transferable Anomaly Detection in Log Data using Pre-Trained
Language Models [59.04636530383049]
クラウドのような大規模コンピュータシステムにおける異常や障害は、多くのユーザに影響を与える。
システム情報の主要なトラブルシューティングソースとして,ログデータの異常検出のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-23T09:17:05Z) - Data Mining with Big Data in Intrusion Detection Systems: A Systematic
Literature Review [68.15472610671748]
クラウドコンピューティングは、複雑で高性能でスケーラブルな計算のために、強力で必要不可欠な技術になっている。
データ生成の迅速化とボリュームは、データ管理とセキュリティに重大な課題をもたらし始めている。
ビッグデータ設定における侵入検知システム(IDS)の設計と展開が重要視されている。
論文 参考訳(メタデータ) (2020-05-23T20:57:12Z) - Contextual-Bandit Anomaly Detection for IoT Data in Distributed
Hierarchical Edge Computing [65.78881372074983]
IoTデバイスは複雑なディープニューラルネットワーク(DNN)モデルにはほとんど余裕がなく、異常検出タスクをクラウドにオフロードすることは長い遅延を引き起こす。
本稿では,分散階層エッジコンピューティング(HEC)システムを対象とした適応型異常検出手法のデモと構築を行う。
提案手法は,検出タスクをクラウドにオフロードした場合と比較して,精度を犠牲にすることなく検出遅延を著しく低減することを示す。
論文 参考訳(メタデータ) (2020-04-15T06:13:33Z) - Adaptive Anomaly Detection for IoT Data in Hierarchical Edge Computing [71.86955275376604]
本稿では,階層型エッジコンピューティング(HEC)システムに対する適応型異常検出手法を提案する。
本研究では,入力データから抽出した文脈情報に基づいてモデルを選択する適応的手法を設計し,異常検出を行う。
提案手法を実際のIoTデータセットを用いて評価し,検出タスクをクラウドにオフロードするのとほぼ同じ精度を維持しながら,検出遅延を84%削減できることを実証した。
論文 参考訳(メタデータ) (2020-01-10T05:29:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。