論文の概要: Deep Isolation Forest for Anomaly Detection
- arxiv url: http://arxiv.org/abs/2206.06602v1
- Date: Tue, 14 Jun 2022 05:47:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-16 04:36:35.440677
- Title: Deep Isolation Forest for Anomaly Detection
- Title(参考訳): 異常検出のための深い孤立林
- Authors: Hongzuo Xu and Guansong Pang and Yijie Wang and Yongjun Wang
- Abstract要約: 孤立林(iForest)は近年、おそらく最も人気のある異常検知器として出現している。
本稿では,iForest, deep isolation forestの新たな拡張について紹介する。
- 参考スコア(独自算出の注目度): 16.581154394513025
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Isolation forest (iForest) has been emerging as arguably the most popular
anomaly detector in recent years. It iteratively performs axis-parallel data
space partition in a tree structure to isolate deviated data objects from the
other data, with the isolation difficulty of the objects defined as anomaly
scores. iForest shows effective performance across popular dataset benchmarks,
but its axis-parallel-based linear data partition is ineffective in handling
hard anomalies in high-dimensional/non-linear-separable data space, and even
worse, it leads to a notorious algorithmic bias that assigns unexpectedly large
anomaly scores to artefact regions. There have been several extensions of
iForest, but they still focus on linear data partition, failing to effectively
isolate those hard anomalies. This paper introduces a novel extension of
iForest, deep isolation forest. Our method offers a comprehensive isolation
method that can arbitrarily partition the data at any random direction and
angle on subspaces of any size, effectively avoiding the algorithmic bias in
the linear partition. Further, it requires only randomly initialised neural
networks (i.e., no optimisation is required in our method) to ensure the
freedom of the partition. In doing so, desired randomness and diversity in both
random network-based representations and random partition-based isolation can
be fully leveraged to significantly enhance the isolation ensemble-based
anomaly detection. Also, our approach offers a data-type-agnostic anomaly
detection solution. It is versatile to detect anomalies in different types of
data by simply plugging in corresponding randomly initialised neural networks
in the feature mapping. Extensive empirical results on a large collection of
real-world datasets show that our model achieves substantial improvement over
state-of-the-art isolation-based and non-isolation-based anomaly detection
models.
- Abstract(参考訳): 孤立林(iforest)は近年、最も一般的な異常検知器として出現している。
木構造において軸並列データ空間分割を反復的に行い、乱雑なデータオブジェクトを他のデータから分離し、異常スコアとして定義されたオブジェクトの分離困難を解消する。
iForestは一般的なデータセットベンチマークで効果的なパフォーマンスを示しているが、その軸パラレルベースの線形データ分割は、高次元/非線形分離可能なデータ空間におけるハード異常を扱うのに効果がなく、さらに悪いことに、予期しないほど大きな異常スコアをアーティファクト領域に割り当てるアルゴリズムバイアスにつながる。
iForestにはいくつかの拡張があるが、依然として線形データパーティションにフォーカスしており、これらのハードな異常を効果的に分離することができない。
本稿では,iForest, deep isolation forestの新たな拡張について紹介する。
本手法は任意のランダムな方向と角度のデータを任意のサイズの部分空間に任意に分割し,線形分割のアルゴリズムバイアスを効果的に回避する包括的分離手法を提供する。
さらに、分割の自由を確保するためにランダムに初期化されたニューラルネットワーク(すなわち、我々の方法では最適化は必要ない)のみを必要とする。
これにより、ランダムなネットワークベース表現とランダムなパーティションベースの分離の両方において、望ましいランダム性と多様性をフル活用して、分離アンサンブルベースの異常検出を大幅に強化することができる。
また,本手法はデータ型非依存異常検出ソリューションを提供する。
特徴マッピングにおいて、対応するランダムに初期化されたニューラルネットワークをプラグインするだけで、異なるタイプのデータの異常を検出することができる。
実世界のデータセットの膨大なコレクションに関する広範な実験結果から,本モデルが最先端のアイソレーションベースおよび非イゾレーションベースの異常検出モデルよりも大幅に改善できることが分かる。
関連論文リスト
- GLAD: Towards Better Reconstruction with Global and Local Adaptive Diffusion Models for Unsupervised Anomaly Detection [60.78684630040313]
拡散モデルは、特定のノイズを付加したテスト画像の通常の画像を再構成する傾向がある。
世界的視点から見ると、異なる異常による画像再構成の難しさは不均一である。
本稿では,非教師付き異常検出のためのグローバルかつ局所的な適応拡散モデル(GLADと略す)を提案する。
論文 参考訳(メタデータ) (2024-06-11T17:27:23Z) - Anomaly Detection Based on Isolation Mechanisms: A Survey [13.449446806837422]
分離に基づく教師なし異常検出は、データの異常を識別するための新しく効果的なアプローチである。
本稿では,データ分割戦略,異常スコア関数,アルゴリズムの詳細など,最先端の分離に基づく異常検出手法について概説する。
論文 参考訳(メタデータ) (2024-03-16T04:29:21Z) - MLAD: A Unified Model for Multi-system Log Anomaly Detection [35.68387377240593]
複数のシステムにまたがる意味的関係推論を組み込んだ新しい異常検出モデルMLADを提案する。
具体的には、Sentence-bertを用いてログシーケンス間の類似性を捉え、それらを高次元の学習可能な意味ベクトルに変換する。
我々は,各キーワードのシーケンスにおける意義を識別し,マルチシステムデータセットの全体分布をモデル化するために,アテンション層の公式を改訂する。
論文 参考訳(メタデータ) (2024-01-15T12:51:13Z) - Subspace-Guided Feature Reconstruction for Unsupervised Anomaly
Localization [5.085309164633571]
監督されていない異常なローカライゼーションは工業生産において重要な役割を担っている。
最近の手法では、事前訓練されたディープニューラルネットワークを用いて、ターゲットサンプルの特徴マッチングや再構成を行う。
本稿では,アノマライゼーションのための適応的特徴近似を追求する,新しいサブスペース誘導型特徴再構成フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-25T06:58:57Z) - ManiFlow: Implicitly Representing Manifolds with Normalizing Flows [145.9820993054072]
正規化フロー(NF)は、複雑な実世界のデータ分布を正確にモデル化することが示されているフレキシブルな明示的な生成モデルである。
摂動分布から標本を与えられた多様体上の最も可能性の高い点を復元する最適化目的を提案する。
最後に、NFsの明示的な性質、すなわち、ログのような勾配とログのような勾配から抽出された表面正規化を利用する3次元点雲に焦点を当てる。
論文 参考訳(メタデータ) (2022-08-18T16:07:59Z) - Intrinsic dimension estimation for discrete metrics [65.5438227932088]
本稿では,離散空間に埋め込まれたデータセットの内在次元(ID)を推定するアルゴリズムを提案する。
我々は,その精度をベンチマークデータセットで示すとともに,種鑑定のためのメダゲノミクスデータセットの分析に応用する。
このことは、列の空間の高次元性にもかかわらず、蒸発圧が低次元多様体に作用することを示唆している。
論文 参考訳(メタデータ) (2022-07-20T06:38:36Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Distributed Dynamic Safe Screening Algorithms for Sparse Regularization [73.85961005970222]
本稿では,分散動的安全スクリーニング(DDSS)手法を提案し,共有メモリアーキテクチャと分散メモリアーキテクチャにそれぞれ適用する。
提案手法は, 線形収束率を低次複雑度で達成し, 有限個の繰り返しにおいてほとんどすべての不活性な特徴をほぼ確実に除去できることを示す。
論文 参考訳(メタデータ) (2022-04-23T02:45:55Z) - TiWS-iForest: Isolation Forest in Weakly Supervised and Tiny ML
scenarios [2.7285752469525315]
アイソレーション・フォレスト(Isolation Forest)は、アイソレーション・ツリーと呼ばれる木々のアンサンブルを用いて、異常スコアを定義できる一般的なアルゴリズムである。
メモリ要件,レイテンシ,パフォーマンスの観点から,標準アルゴリズムが改良される可能性がある。
弱い監視を生かしたTiWS-iForestを提案することにより,森林分離の複雑さを低減し,検出性能を向上させることができる。
論文 参考訳(メタデータ) (2021-11-30T14:24:27Z) - Discriminative-Generative Dual Memory Video Anomaly Detection [81.09977516403411]
近年,ビデオ異常検出(VAD)には,トレーニングプロセス中に通常のデータに代えて,いくつかの異常を使おうと試みている。
本稿では,いくつかの異常を生かしてデータの不均衡を解決するために,識別生成型デュアルメモリ(dream)異常検出モデルを提案する。
論文 参考訳(メタデータ) (2021-04-29T15:49:01Z) - Online stochastic gradient descent on non-convex losses from
high-dimensional inference [2.2344764434954256]
勾配降下(SGD)は高次元タスクにおける最適化問題に対する一般的なアルゴリズムである。
本稿では,データから非自明な相関関係を推定する。
本稿では、位相探索や一般化モデルの推定といった一連のタスクに適用することで、我々のアプローチを説明する。
論文 参考訳(メタデータ) (2020-03-23T17:34:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。