論文の概要: Clustered Hierarchical Anomaly and Outlier Detection Algorithms
- arxiv url: http://arxiv.org/abs/2103.11774v1
- Date: Tue, 9 Feb 2021 15:27:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-05 00:34:59.744157
- Title: Clustered Hierarchical Anomaly and Outlier Detection Algorithms
- Title(参考訳): クラスタ型階層的異常検出アルゴリズム
- Authors: Najib Ishaq, Thomas J. Howard III, Noah M. Daniels
- Abstract要約: 距離計量によって定義されるバナッハ空間の多様体を学習する高速階層的クラスタリング手法であるCLAMを提案する。
24の公開データセットで、CHAODAのパフォーマンスを最先端の監視されていない異常検出アルゴリズムと比較します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Anomaly and outlier detection in datasets is a long-standing problem in
machine learning. In some cases, anomaly detection is easy, such as when data
are drawn from well-characterized distributions such as the Gaussian. However,
when data occupy high-dimensional spaces, anomaly detection becomes more
difficult. We present CLAM (Clustered Learning of Approximate Manifolds), a
fast hierarchical clustering technique that learns a manifold in a Banach space
defined by a distance metric. CLAM induces a graph from the cluster tree, based
on overlapping clusters determined by several geometric and topological
features. On these graphs, we implement CHAODA (Clustered Hierarchical Anomaly
and Outlier Detection Algorithms), exploring various properties of the graphs
and their constituent clusters to compute scores of anomalousness. On 24
publicly available datasets, we compare the performance of CHAODA (by measure
of ROC AUC) to a variety of state-of-the-art unsupervised anomaly-detection
algorithms. Six of the datasets are used for training. CHAODA outperforms other
approaches on 14 of the remaining 18 datasets.
- Abstract(参考訳): データセットの異常と異常検出は、機械学習の長年の問題である。
ガウス分布のような良好な分布からデータが引き出される場合など、異常検出は容易である場合もある。
しかし、データが高次元空間を占めると、異常検出がより困難になる。
距離計量によって定義されるバナッハ空間の多様体を学習する高速階層的クラスタリング手法であるCLAM(Clustered Learning of Approximate Manifolds)を提案する。
CLAMは、幾何的および位相的特徴によって決定される重なり合うクラスタに基づいて、クラスタツリーからグラフを誘導する。
これらのグラフでは, CHAODA (Clustered Hierarchical Anomaly and Outlier Detection Algorithms) を実装し, グラフとその構成クラスタの様々な特性を探索し, 異常点の計算を行う。
公開されている24のデータセットでは、CHAODA(ROC AUCによる)と最先端の非教師付き異常検出アルゴリズムを比較した。
トレーニングには6つのデータセットが使用される。
CHAODAは、残りの18のデータセットのうち14のアプローチよりも優れている。
関連論文リスト
- UMGAD: Unsupervised Multiplex Graph Anomaly Detection [40.17829938834783]
UMGADと呼ばれる新しい教師なし多重グラフ異常検出法を提案する。
我々はまず、多重異種グラフにおけるノード間の多重相関関係を学習する。
そして、ノイズや冗長な情報が異常情報抽出に与える影響を弱めるために、属性レベルおよびサブグラフレベルの拡張ビューグラフを生成する。
論文 参考訳(メタデータ) (2024-11-19T15:15:45Z) - ARC: A Generalist Graph Anomaly Detector with In-Context Learning [62.202323209244]
ARCは汎用的なGADアプローチであり、一対一のGADモデルで様々なグラフデータセットの異常を検出することができる。
ARCはコンテキスト内学習を備えており、ターゲットデータセットからデータセット固有のパターンを直接抽出することができる。
各種領域からの複数のベンチマークデータセットに対する大規模な実験は、ARCの優れた異常検出性能、効率、一般化性を示す。
論文 参考訳(メタデータ) (2024-05-27T02:42:33Z) - Multi-Class Deep SVDD: Anomaly Detection Approach in Astronomy with
Distinct Inlier Categories [46.34797489552547]
我々は,異なるデータ分布を持つ複数の不整合カテゴリを扱うために,MCDSVDD(Multi-class Deep Support Vector Data Description)を提案する。
MCDSVDDはニューラルネットワークを使用してデータをハイパースフィアにマッピングする。
以上の結果から, 異常源の検出にMDCSVDDが有効であることが示唆された。
論文 参考訳(メタデータ) (2023-08-09T15:10:53Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - Unsupervised anomaly detection algorithms on real-world data: how many
do we need? [1.4610038284393165]
この研究は、これまでで最大の教師なし異常検出アルゴリズムの比較である。
ローカルデータセットでは、$k$NN ($k$-nearest neighbor)アルゴリズムがトップに表示される。
グローバルデータセットでは、EDF(extended isolation forest)アルゴリズムが最善を尽くしている。
論文 参考訳(メタデータ) (2023-05-01T09:27:42Z) - ARISE: Graph Anomaly Detection on Attributed Networks via Substructure
Awareness [70.60721571429784]
サブ構造認識(ARISE)による属性付きネットワーク上の新しいグラフ異常検出フレームワークを提案する。
ARISEは、異常を識別するグラフのサブ構造に焦点を当てている。
実験により、ARISEは最先端の属性付きネットワーク異常検出(ANAD)アルゴリズムと比較して、検出性能が大幅に向上することが示された。
論文 参考訳(メタデータ) (2022-11-28T12:17:40Z) - Semi-Supervised Domain Adaptation for Cross-Survey Galaxy Morphology
Classification and Anomaly Detection [57.85347204640585]
We developed a Universal Domain Adaptation method DeepAstroUDA。
異なるタイプのクラスオーバーラップしたデータセットに適用することができる。
初めて、我々は2つの非常に異なる観測データセットに対するドメイン適応の有効利用を実演した。
論文 参考訳(メタデータ) (2022-11-01T18:07:21Z) - TadGAN: Time Series Anomaly Detection Using Generative Adversarial
Networks [73.01104041298031]
TadGANは、GAN(Generative Adversarial Networks)上に構築された教師なしの異常検出手法である。
時系列の時間相関を捉えるために,ジェネレータと批評家のベースモデルとしてLSTMリカレントニューラルネットワークを用いる。
提案手法の性能と一般化性を示すため,いくつかの異常スコアリング手法を検証し,最も適した手法を報告する。
論文 参考訳(メタデータ) (2020-09-16T15:52:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。