論文の概要: Deep Isolation Forest for Anomaly Detection
- arxiv url: http://arxiv.org/abs/2206.06602v4
- Date: Fri, 9 Jun 2023 01:19:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-12 18:36:15.457802
- Title: Deep Isolation Forest for Anomaly Detection
- Title(参考訳): 異常検出のための深い孤立林
- Authors: Hongzuo Xu and Guansong Pang and Yijie Wang and Yongjun Wang
- Abstract要約: 孤立林(iForest)は近年、おそらく最も人気のある異常検知器として出現している。
我々のモデルでは,データセット上での最先端の分離手法や深層検出器よりも大幅に改善されている。
- 参考スコア(独自算出の注目度): 16.581154394513025
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Isolation forest (iForest) has been emerging as arguably the most popular
anomaly detector in recent years due to its general effectiveness across
different benchmarks and strong scalability. Nevertheless, its linear
axis-parallel isolation method often leads to (i) failure in detecting hard
anomalies that are difficult to isolate in
high-dimensional/non-linear-separable data space, and (ii) notorious
algorithmic bias that assigns unexpectedly lower anomaly scores to artefact
regions. These issues contribute to high false negative errors. Several iForest
extensions are introduced, but they essentially still employ shallow, linear
data partition, restricting their power in isolating true anomalies. Therefore,
this paper proposes deep isolation forest. We introduce a new representation
scheme that utilises casually initialised neural networks to map original data
into random representation ensembles, where random axis-parallel cuts are
subsequently applied to perform the data partition. This representation scheme
facilitates high freedom of the partition in the original data space
(equivalent to non-linear partition on subspaces of varying sizes), encouraging
a unique synergy between random representations and random partition-based
isolation. Extensive experiments show that our model achieves significant
improvement over state-of-the-art isolation-based methods and deep detectors on
tabular, graph and time series datasets; our model also inherits desired
scalability from iForest.
- Abstract(参考訳): アイソレーションフォレスト(iforest)は、さまざまなベンチマークと強力なスケーラビリティにより、近年最も人気のある異常検知器として登場している。
それでも、その線形軸並列分離法は、しばしば、
一)高次元・非線形分離データ空間において孤立し難いハード異常の検出の失敗、及び
(ii)不意に低い異常スコアをアーティファクト領域に割り当てる悪名高いアルゴリズムバイアス。
これらの問題は偽陰性な誤りに寄与する。
いくつかのiforest拡張が導入されているが、本質的には浅い線形データ分割を採用しており、真の異常を分離する能力を制限する。
そこで本論文では,深い孤立林を提案する。
そこで我々は,カジュアルに初期化されたニューラルネットワークを用いて,元のデータをランダムな表現アンサンブルにマッピングする新しい表現手法を提案する。
この表現スキームは、元のデータ空間におけるパーティションの高自由化(様々なサイズのサブ空間上の非線形パーティションと等価)を促進し、ランダム表現とランダムなパーティションベース分離のユニークな相乗性を促進する。
広範な実験により,我々のモデルは,最先端のアイソレーションベース手法や,表型,グラフ型,時系列のデータセット上でのディープディテクターよりも大きな改善を達成していることが示された。
関連論文リスト
- GLAD: Towards Better Reconstruction with Global and Local Adaptive Diffusion Models for Unsupervised Anomaly Detection [60.78684630040313]
拡散モデルは、特定のノイズを付加したテスト画像の通常の画像を再構成する傾向がある。
世界的視点から見ると、異なる異常による画像再構成の難しさは不均一である。
本稿では,非教師付き異常検出のためのグローバルかつ局所的な適応拡散モデル(GLADと略す)を提案する。
論文 参考訳(メタデータ) (2024-06-11T17:27:23Z) - Anomaly Detection Based on Isolation Mechanisms: A Survey [13.449446806837422]
分離に基づく教師なし異常検出は、データの異常を識別するための新しく効果的なアプローチである。
本稿では,データ分割戦略,異常スコア関数,アルゴリズムの詳細など,最先端の分離に基づく異常検出手法について概説する。
論文 参考訳(メタデータ) (2024-03-16T04:29:21Z) - MLAD: A Unified Model for Multi-system Log Anomaly Detection [35.68387377240593]
複数のシステムにまたがる意味的関係推論を組み込んだ新しい異常検出モデルMLADを提案する。
具体的には、Sentence-bertを用いてログシーケンス間の類似性を捉え、それらを高次元の学習可能な意味ベクトルに変換する。
我々は,各キーワードのシーケンスにおける意義を識別し,マルチシステムデータセットの全体分布をモデル化するために,アテンション層の公式を改訂する。
論文 参考訳(メタデータ) (2024-01-15T12:51:13Z) - Subspace-Guided Feature Reconstruction for Unsupervised Anomaly
Localization [5.085309164633571]
監督されていない異常なローカライゼーションは工業生産において重要な役割を担っている。
最近の手法では、事前訓練されたディープニューラルネットワークを用いて、ターゲットサンプルの特徴マッチングや再構成を行う。
本稿では,アノマライゼーションのための適応的特徴近似を追求する,新しいサブスペース誘導型特徴再構成フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-25T06:58:57Z) - ManiFlow: Implicitly Representing Manifolds with Normalizing Flows [145.9820993054072]
正規化フロー(NF)は、複雑な実世界のデータ分布を正確にモデル化することが示されているフレキシブルな明示的な生成モデルである。
摂動分布から標本を与えられた多様体上の最も可能性の高い点を復元する最適化目的を提案する。
最後に、NFsの明示的な性質、すなわち、ログのような勾配とログのような勾配から抽出された表面正規化を利用する3次元点雲に焦点を当てる。
論文 参考訳(メタデータ) (2022-08-18T16:07:59Z) - Intrinsic dimension estimation for discrete metrics [65.5438227932088]
本稿では,離散空間に埋め込まれたデータセットの内在次元(ID)を推定するアルゴリズムを提案する。
我々は,その精度をベンチマークデータセットで示すとともに,種鑑定のためのメダゲノミクスデータセットの分析に応用する。
このことは、列の空間の高次元性にもかかわらず、蒸発圧が低次元多様体に作用することを示唆している。
論文 参考訳(メタデータ) (2022-07-20T06:38:36Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Distributed Dynamic Safe Screening Algorithms for Sparse Regularization [73.85961005970222]
本稿では,分散動的安全スクリーニング(DDSS)手法を提案し,共有メモリアーキテクチャと分散メモリアーキテクチャにそれぞれ適用する。
提案手法は, 線形収束率を低次複雑度で達成し, 有限個の繰り返しにおいてほとんどすべての不活性な特徴をほぼ確実に除去できることを示す。
論文 参考訳(メタデータ) (2022-04-23T02:45:55Z) - TiWS-iForest: Isolation Forest in Weakly Supervised and Tiny ML
scenarios [2.7285752469525315]
アイソレーション・フォレスト(Isolation Forest)は、アイソレーション・ツリーと呼ばれる木々のアンサンブルを用いて、異常スコアを定義できる一般的なアルゴリズムである。
メモリ要件,レイテンシ,パフォーマンスの観点から,標準アルゴリズムが改良される可能性がある。
弱い監視を生かしたTiWS-iForestを提案することにより,森林分離の複雑さを低減し,検出性能を向上させることができる。
論文 参考訳(メタデータ) (2021-11-30T14:24:27Z) - Discriminative-Generative Dual Memory Video Anomaly Detection [81.09977516403411]
近年,ビデオ異常検出(VAD)には,トレーニングプロセス中に通常のデータに代えて,いくつかの異常を使おうと試みている。
本稿では,いくつかの異常を生かしてデータの不均衡を解決するために,識別生成型デュアルメモリ(dream)異常検出モデルを提案する。
論文 参考訳(メタデータ) (2021-04-29T15:49:01Z) - Online stochastic gradient descent on non-convex losses from
high-dimensional inference [2.2344764434954256]
勾配降下(SGD)は高次元タスクにおける最適化問題に対する一般的なアルゴリズムである。
本稿では,データから非自明な相関関係を推定する。
本稿では、位相探索や一般化モデルの推定といった一連のタスクに適用することで、我々のアプローチを説明する。
論文 参考訳(メタデータ) (2020-03-23T17:34:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。