論文の概要: Detecting Anomalies Using Rotated Isolation Forest
- arxiv url: http://arxiv.org/abs/2501.17787v1
- Date: Wed, 29 Jan 2025 17:26:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-30 15:53:34.603200
- Title: Detecting Anomalies Using Rotated Isolation Forest
- Title(参考訳): 回転した孤立林を用いた異常検出
- Authors: Vahideh Monemizadeh, Kourosh Kiani,
- Abstract要約: 我々は,iForestで観測された軸方向のゴーストクラスタと,EIFで観測されたゴーストクラスタの両方を効果的に処理する,回転孤立林 (RIF) アルゴリズムを導入する。
我々の実験は、RIFアルゴリズムがiForestとEIFより優れており、人工データセットと実世界のデータセットの両方から得られた結果から証明されている。
- 参考スコア(独自算出の注目度): 10.850101961203748
- License:
- Abstract: The Isolation Forest (iForest), proposed by Liu, Ting, and Zhou at TKDE 2012, has become a prominent tool for unsupervised anomaly detection. However, recent research by Hariri, Kind, and Brunner, published in TKDE 2021, has revealed issues with iForest. They identified the presence of axis-aligned ghost clusters that can be misidentified as normal clusters, leading to biased anomaly scores and inaccurate predictions. In response, they developed the Extended Isolation Forest (EIF), which effectively solves these issues by eliminating the ghost clusters introduced by iForest. This enhancement results in improved consistency of anomaly scores and superior performance. We reveal a previously overlooked problem in the Extended Isolation Forest (EIF), showing that it is vulnerable to ghost inter-clusters between normal clusters of data points. In this paper, we introduce the Rotated Isolation Forest (RIF) algorithm which effectively addresses both the axis-aligned ghost clusters observed in iForest and the ghost inter-clusters seen in EIF. RIF accomplishes this by randomly rotating the dataset (using random rotation matrices and QR decomposition) before feeding it into the iForest construction, thereby increasing dataset variation and eliminating ghost clusters. Our experiments conclusively demonstrate that the RIF algorithm outperforms iForest and EIF, as evidenced by the results obtained from both synthetic datasets and real-world datasets.
- Abstract(参考訳): TKDE 2012でLiu, Ting, Zhouによって提案されたアイフォレスト(iForest)は、教師なしの異常検出のための重要なツールとなっている。
しかし、TKDE 2021で発表されたHariri、Kid、Brunnerによる最近の研究は、iForestの問題を明らかにしている。
彼らは、通常のクラスタと誤識別できる軸方向のゴーストクラスタの存在を特定し、バイアスのある異常スコアと不正確な予測につながった。
これに応えて、iForestが導入したゴーストクラスタを排除し、これらの問題を効果的に解決する拡張隔離林(EIF)を開発した。
この強化により、異常スコアの整合性が向上し、性能が向上する。
拡張隔離林 (EIF) でこれまで見過ごされていた問題を明らかにし, 通常のデータポイントのクラスタ間におけるゴースト・クラスタ間の脆弱性を明らかにした。
本稿では,iForest で観測された軸方向のゴーストクラスタと EIF で観測されたゴーストクラスタの両方を効果的に処理する回転孤立林 (RIF) アルゴリズムを提案する。
RIFは、データセットをランダムに回転させ(ランダムな回転行列とQR分解を使って)、iForest構造に供給することで、データセットの変動を増大させ、ゴーストクラスタを除去する。
我々の実験は、RIFアルゴリズムがiForestとEIFより優れており、人工データセットと実世界のデータセットの両方から得られた結果から証明されている。
関連論文リスト
- Deep evolving semi-supervised anomaly detection [14.027613461156864]
本研究の目的は,連続的半教師付き異常検出(CSAD)のタスクを形式化することである。
本稿では,半教師付きデータを扱うための変分オートエンコーダ(VAE)のベースラインモデルを提案する。
論文 参考訳(メタデータ) (2024-12-01T15:48:37Z) - ARC: A Generalist Graph Anomaly Detector with In-Context Learning [62.202323209244]
ARCは汎用的なGADアプローチであり、一対一のGADモデルで様々なグラフデータセットの異常を検出することができる。
ARCはコンテキスト内学習を備えており、ターゲットデータセットからデータセット固有のパターンを直接抽出することができる。
各種領域からの複数のベンチマークデータセットに対する大規模な実験は、ARCの優れた異常検出性能、効率、一般化性を示す。
論文 参考訳(メタデータ) (2024-05-27T02:42:33Z) - SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised
Learning for Robust Infrared Small Target Detection [53.19618419772467]
単一フレーム赤外線小ターゲット検出(SIRST)は、乱雑な背景から小さなターゲットを認識することを目的としている。
Transformerの開発に伴い、SIRSTモデルのスケールは常に増大している。
赤外線小ターゲットデータの多彩な多様性により,本アルゴリズムはモデル性能と収束速度を大幅に改善する。
論文 参考訳(メタデータ) (2024-03-08T16:14:54Z) - Enhancing Interpretability and Generalizability in Extended Isolation Forests [5.139809663513828]
ExIFFI (Extended isolated Forest Feature Importance) は、EIF(Extended isolated Forest)モデルによる予測を説明する手法である。
EIF+は、修正された分割戦略により、見えない異常を検出するモデルの能力を高めるように設計されている。
ExIFFIは、11の現実世界のデータセットのうち8つで、他の教師なしの解釈可能性メソッドよりも優れています。
論文 参考訳(メタデータ) (2023-10-09T07:24:04Z) - Imbalanced Aircraft Data Anomaly Detection [103.01418862972564]
航空シナリオ下でのセンサーからの時間データの異常検出は実用的だが難しい課題である。
本稿では,グラフィカル・テンポラル・データ分析フレームワークを提案する。
シリーズ・トゥ・イメージ (S2I) と呼ばれる3つのモジュール、ユークリッド距離 (CRD) を用いたクラスタ・ベース・リサンプリング・アプローチ、変数・ベース・ロス (VBL) から構成される。
論文 参考訳(メタデータ) (2023-05-17T09:37:07Z) - Are we certain it's anomalous? [57.729669157989235]
時系列における異常検出は、高度に非線形な時間的相関のため、異常は稀であるため、複雑なタスクである。
本稿では,異常検出(HypAD)におけるハイパボリック不確実性の新しい利用法を提案する。
HypADは自己指導で入力信号を再構築する。
論文 参考訳(メタデータ) (2022-11-16T21:31:39Z) - Anomaly Rule Detection in Sequence Data [2.3757190901941736]
本稿では,一組のシーケンスからユーティリティを意識した外部規則の発見を可能にする,DUOSと呼ばれる新しい異常検出フレームワークを提案する。
本研究では,集団の異常性と実用性を両立させ,ユーティリティ・アウェア・アウトリー・ルール(UOSR)の概念を導入する。
論文 参考訳(メタデータ) (2021-11-29T23:52:31Z) - New Methods and Datasets for Group Anomaly Detection From Fundamental
Physics [0.4297070083645048]
教師なしのグループ異常検出は、基礎物理学の新たなフロンティアとなっている。
グループ異常検出アルゴリズムの開発のために,現実的な合成ベンチマークデータセット(LHCO 2020)を提案する。
論文 参考訳(メタデータ) (2021-07-06T18:00:57Z) - Real-Time Anomaly Detection in Edge Streams [49.26098240310257]
マイクロクラスタ異常の検出に焦点を当てたMIDASを提案する。
さらに、アルゴリズムの内部状態に異常が組み込まれている問題を解くために、MIDAS-Fを提案する。
実験の結果,MIDAS-Fの精度はMIDASよりも有意に高かった。
論文 参考訳(メタデータ) (2020-09-17T17:59:27Z) - TadGAN: Time Series Anomaly Detection Using Generative Adversarial
Networks [73.01104041298031]
TadGANは、GAN(Generative Adversarial Networks)上に構築された教師なしの異常検出手法である。
時系列の時間相関を捉えるために,ジェネレータと批評家のベースモデルとしてLSTMリカレントニューラルネットワークを用いる。
提案手法の性能と一般化性を示すため,いくつかの異常スコアリング手法を検証し,最も適した手法を報告する。
論文 参考訳(メタデータ) (2020-09-16T15:52:04Z) - Random Partitioning Forest for Point-Wise and Collective Anomaly
Detection -- Application to Intrusion Detection [9.74672460306765]
DiFF-RFはランダムな分割二分木で構成されるアンサンブルアプローチであり、異常を検出する。
実験の結果,DiFF-RFはアイソレーション・フォレスト(IF)アルゴリズムをほぼ体系的に上回っていることがわかった。
我々の経験から,DiFF-RFは小規模な学習データの存在下では有効であることがわかった。
論文 参考訳(メタデータ) (2020-06-29T10:44:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。