論文の概要: Can Tree Based Approaches Surpass Deep Learning in Anomaly Detection? A
Benchmarking Study
- arxiv url: http://arxiv.org/abs/2402.07281v2
- Date: Mon, 26 Feb 2024 04:56:07 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-28 00:01:26.719417
- Title: Can Tree Based Approaches Surpass Deep Learning in Anomaly Detection? A
Benchmarking Study
- Title(参考訳): 木に基づくアプローチは異常検出におけるディープラーニングを克服できるか?
ベンチマーク研究
- Authors: Santonu Sarkar, Shanay Mehta, Nicole Fernandes, Jyotirmoy Sarkar and
Snehanshu Saha
- Abstract要約: 本稿では,機械学習に基づく異常検出アルゴリズムの多種多様さを評価する。
本論文は, 種々の異常検出アルゴリズムの非バイアス比較を行うことにより, 顕著に寄与する。
- 参考スコア(独自算出の注目度): 0.6291443816903801
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Detection of anomalous situations for complex mission-critical systems holds
paramount importance when their service continuity needs to be ensured. A major
challenge in detecting anomalies from the operational data arises due to the
imbalanced class distribution problem since the anomalies are supposed to be
rare events. This paper evaluates a diverse array of machine learning-based
anomaly detection algorithms through a comprehensive benchmark study. The paper
contributes significantly by conducting an unbiased comparison of various
anomaly detection algorithms, spanning classical machine learning including
various tree-based approaches to deep learning and outlier detection methods.
The inclusion of 104 publicly available and a few proprietary industrial
systems datasets enhances the diversity of the study, allowing for a more
realistic evaluation of algorithm performance and emphasizing the importance of
adaptability to real-world scenarios. The paper dispels the deep learning myth,
demonstrating that though powerful, deep learning is not a universal solution
in this case. We observed that recently proposed tree-based evolutionary
algorithms outperform in many scenarios. We noticed that tree-based approaches
catch a singleton anomaly in a dataset where deep learning methods fail. On the
other hand, classical SVM performs the best on datasets with more than 10%
anomalies, implying that such scenarios can be best modeled as a classification
problem rather than anomaly detection. To our knowledge, such a study on a
large number of state-of-the-art algorithms using diverse data sets, with the
objective of guiding researchers and practitioners in making informed
algorithmic choices, has not been attempted earlier.
- Abstract(参考訳): 複雑なミッションクリティカルシステムに対する異常な状況の検出は、サービス継続性を確保する必要がある場合に最重要となる。
運用データから異常を検出する大きな課題は、異常が稀なイベントであると考えられるため、不均衡なクラス分散の問題によって発生する。
本稿では,機械学習に基づく異常検出アルゴリズムを総合的なベンチマークにより評価する。
本論文は,様々な異常検出アルゴリズムの偏りのない比較を行い,ディープラーニングおよび異常検出手法に対する木ベースアプローチを含む古典的機械学習にまたがる。
104のパブリックデータセットといくつかのプロプライエタリな産業システムデータセットは研究の多様性を高め、アルゴリズムのパフォーマンスをより現実的に評価し、現実のシナリオへの適応性の重要性を強調する。
この論文はディープラーニングの神話を解き放ち、強力ではあるが、このケースではディープラーニングは普遍的な解決策ではないことを証明している。
最近提案された木に基づく進化的アルゴリズムは,多くのシナリオにおいて優れていた。
私たちは、ディープラーニングメソッドが失敗するデータセットで、ツリーベースのアプローチがシングルトン異常をキャッチしていることに気付きました。
一方、古典的なSVMは10%以上の異常を持つデータセット上で最善を尽くしており、このようなシナリオは異常検出よりも分類問題としてモデル化できることを示している。
我々の知る限りでは、研究者や実践者が情報的アルゴリズムの選択を指導する目的で、多様なデータセットを用いた多数の最先端アルゴリズムの研究は、これまで試みられていない。
関連論文リスト
- A Comprehensive Library for Benchmarking Multi-class Visual Anomaly Detection [52.228708947607636]
本稿では,新しい手法のモジュラーフレームワークであるADerを包括的視覚異常検出ベンチマークとして紹介する。
このベンチマークには、産業ドメインと医療ドメインからの複数のデータセットが含まれており、15の最先端メソッドと9つの包括的なメトリクスを実装している。
我々は,異なる手法の長所と短所を客観的に明らかにし,多クラス視覚異常検出の課題と今後の方向性について考察する。
論文 参考訳(メタデータ) (2024-06-05T13:40:07Z) - Unraveling the "Anomaly" in Time Series Anomaly Detection: A
Self-supervised Tri-domain Solution [89.16750999704969]
異常ラベルは時系列異常検出において従来の教師付きモデルを妨げる。
自己教師型学習のような様々なSOTA深層学習技術がこの問題に対処するために導入されている。
自己教師型3領域異常検出器(TriAD)を提案する。
論文 参考訳(メタデータ) (2023-11-19T05:37:18Z) - Active anomaly detection based on deep one-class classification [9.904380236739398]
我々は,Deep SVDDにおけるアクティブラーニングの2つの重要な課題,すなわちクエリ戦略と半教師付きラーニング手法に対処する。
まず、単に異常を識別するのではなく、適応境界に従って不確実なサンプルを選択する。
第2に、ラベル付き正規データと異常データの両方を効果的に組み込むために、一級分類モデルの訓練にノイズコントラスト推定を適用した。
論文 参考訳(メタデータ) (2023-09-18T03:56:45Z) - Deep Learning for Time Series Anomaly Detection: A Survey [53.83593870825628]
時系列異常検出は、製造業や医療を含む幅広い研究分野や応用に応用されている。
時系列の大規模かつ複雑なパターンにより、研究者は異常パターンを検出するための特別な深層学習モデルを開発するようになった。
本調査は,ディープラーニングを用いた構造化および総合的時系列異常検出モデルの提供に焦点を当てる。
論文 参考訳(メタデータ) (2022-11-09T22:40:22Z) - Deep Learning for Anomaly Detection in Log Data: A Survey [3.508620069426877]
自己学習異常検出技術は、ログデータのパターンをキャプチャし、予期しないログイベントを報告する。
この目的のためのディープラーニングニューラルネットワークが紹介されている。
ディープラーニングにはさまざまなアーキテクチャがあり、生と非構造化のログデータをエンコードするのは簡単ではない。
論文 参考訳(メタデータ) (2022-07-08T10:58:28Z) - Meta-learning One-class Classifiers with Eigenvalue Solvers for
Supervised Anomaly Detection [55.888835686183995]
教師付き異常検出のためのニューラルネットワークに基づくメタラーニング手法を提案する。
提案手法は,既存の異常検出法や少数ショット学習法よりも優れた性能を実現することを実験的に実証した。
論文 参考訳(メタデータ) (2021-03-01T01:43:04Z) - Theoretical Insights Into Multiclass Classification: A High-dimensional
Asymptotic View [82.80085730891126]
線形多クラス分類の最初の現代的精度解析を行う。
分析の結果,分類精度は分布に依存していることがわかった。
得られた洞察は、他の分類アルゴリズムの正確な理解の道を開くかもしれない。
論文 参考訳(メタデータ) (2020-11-16T05:17:29Z) - Algorithmic Frameworks for the Detection of High Density Anomalies [0.0]
高密度異常(英: high-density anomalies)は、データ空間の最も正常な領域に位置する不確定なケースである。
本研究では、教師なし検出のための非パラメトリックアルゴリズムフレームワークをいくつか導入する。
論文 参考訳(メタデータ) (2020-10-09T17:48:02Z) - TadGAN: Time Series Anomaly Detection Using Generative Adversarial
Networks [73.01104041298031]
TadGANは、GAN(Generative Adversarial Networks)上に構築された教師なしの異常検出手法である。
時系列の時間相関を捉えるために,ジェネレータと批評家のベースモデルとしてLSTMリカレントニューラルネットワークを用いる。
提案手法の性能と一般化性を示すため,いくつかの異常スコアリング手法を検証し,最も適した手法を報告する。
論文 参考訳(メタデータ) (2020-09-16T15:52:04Z) - Anomaly Detection in Univariate Time-series: A Survey on the
State-of-the-Art [0.0]
時系列データの異常検出は、長い間重要な研究分野であった。
近年,時系列の異常を検出する機械学習アルゴリズムが増えている。
研究者たちは、(ディープ)ニューラルネットワークを使ってこれらの技術を改善しようとした。
論文 参考訳(メタデータ) (2020-04-01T13:22:34Z) - Effectiveness of Tree-based Ensembles for Anomaly Discovery: Insights, Batch and Streaming Active Learning [18.49217234413188]
本論文は,木に基づくアンサンブルを用いた異常発見の最先端化に大きく貢献する。
我々は,発見された異常の多様性を改善するために,新しいバッチ能動的学習アルゴリズムを開発した。
本稿では, ドリフトを頑健に検出するだけでなく, 異常検出を原理的に適応するための補正行動を行えるデータドリフト検出アルゴリズムを提案する。
論文 参考訳(メタデータ) (2019-01-23T23:41:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。