論文の概要: Isolation Forest in Novelty Detection Scenario
- arxiv url: http://arxiv.org/abs/2505.08489v1
- Date: Tue, 13 May 2025 12:21:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-14 20:57:54.549142
- Title: Isolation Forest in Novelty Detection Scenario
- Title(参考訳): ノベルティ検出シナリオにおける孤立林
- Authors: Adam Ulrich, Jan Krňávek, Roman Šenkeřík, Zuzana Komínková Oplatková, Radek Vala,
- Abstract要約: ノベルティ検出は、通常のデータのみをトレーニングした後、これまで見えなかったパターンを特定することに焦点を当てる。
本研究では,ストリーミング異常検出のために提案されたハーフスペースツリー(HST)アルゴリズムについて検討する。
本稿では,新規性検出タスクに特化して適応する理論的修正を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Data mining offers a diverse toolbox for extracting meaningful structures from complex datasets, with anomaly detection emerging as a critical subfield particularly in the context of streaming or real-time data. Within anomaly detection, novelty detection focuses on identifying previously unseen patterns after training solely on regular data. While classic algorithms such as One-Class SVM or Local Outlier Factor (LOF) have been widely applied, they often lack interpretability and scalability. In this work, we explore the Half-Space Tree (HST) algorithm, originally proposed for streaming anomaly detection, and propose a novel theoretical modification to adapt it specifically for novelty detection tasks. Our approach is grounded in the idea that anomalies i.e., novelties tend to appear in the higher leaves of the tree, which are less frequently visited by regular instances. We analytically demonstrate the effectiveness of this approach using probabilistic analysis, expected depth (EXD) calculations, and combinatorial reasoning. A comparative analysis of expected depths between our modified HST and the original Isolation Forest highlights that novelty points are significantly more isolated in our approach. This supports the hypothesis that HSTs, with appropriate structural adaptation, can serve as interpretable and efficient novelty detectors. The paper contributes a theoretical foundation and supporting analysis for this adaptation, setting the stage for further application and experimentation.
- Abstract(参考訳): データマイニングは、複雑なデータセットから意味のある構造を抽出するための多様なツールボックスを提供する。
異常検出において、新規性検出は、通常のデータのみをトレーニングした後で、これまで見えなかったパターンを特定することに焦点を当てる。
One-Class SVMやLoF(Local Outlier Factor)のような古典的なアルゴリズムは広く採用されているが、解釈可能性やスケーラビリティに欠けることが多い。
本研究では,ストリーム異常検出のためのHalf-Space Tree (HST) アルゴリズムについて検討し,新規性検出タスクに特化して適応するための理論的修正を提案する。
我々のアプローチは、異常、すなわち新奇性が木の上の葉に現れる傾向にあり、通常の例ではあまり訪れないという考え方に基づいている。
本研究では,確率論的解析,予測深度(EXD)計算,組合せ推論を用いて,本手法の有効性を解析的に検証した。
修正HSTと原生林との予測深度の比較分析により,本研究のアプローチにおいて,新規性が著しく孤立していることが明らかになった。
これは、HSTが適切な構造に適応し、解釈可能で効率的なノベルティ検出器として機能できるという仮説を支持している。
本論文は, この適応の理論的基礎と支援分析に寄与し, さらなる適用と実験の段階を定めている。
関連論文リスト
- Anomaly Prediction: A Novel Approach with Explicit Delay and Horizon [1.8816077341295625]
本稿では,時系列異常予測に時間的情報を直接組み込んだ新しい手法を提案する。
本研究は, 時間的, 正確な異常予測を行う上で, 提案手法の有効性を実証し, 今後の研究のための新しいベンチマークを設定した。
論文 参考訳(メタデータ) (2024-08-08T11:22:52Z) - Rethinking Out-of-Distribution Detection for Reinforcement Learning: Advancing Methods for Evaluation and Detection [3.7384109981836158]
強化学習(RL)におけるアウト・オブ・ディストリビューション(OOD)検出の問題点について検討する。
本稿では、RLにおけるOOD検出の用語の明確化を提案し、他の機械学習分野の文献と整合する。
OOD検出のための新しいベンチマークシナリオを提案し、エージェント環境ループの異なるコンポーネントに時間的自己相関を伴う異常を導入する。
DEXTERはベンチマークシナリオ間の異常を確実に識別でき、統計から得られた最先端のOOD検出器や高次元変化点検出器と比較して優れた性能を示す。
論文 参考訳(メタデータ) (2024-04-10T15:39:49Z) - Don't Miss Out on Novelty: Importance of Novel Features for Deep Anomaly
Detection [64.21963650519312]
異常検出(AD)は、正規性の学習モデルに適合しない観察を識別する重要なタスクである。
本稿では, 入力空間における説明不能な観測として, 説明可能性を用いた新しいAD手法を提案する。
当社のアプローチでは,複数のベンチマークにまたがる新たな最先端性を確立し,さまざまな異常な型を扱う。
論文 参考訳(メタデータ) (2023-10-01T21:24:05Z) - Harnessing Contrastive Learning and Neural Transformation for Time Series Anomaly Detection [0.0]
時系列異常検出(TSAD)は多くの産業応用において重要な役割を担っている。
コントラスト学習は、ラベルのないデータから意味のある表現を抽出する過程において、時系列領域で勢いを増している。
本研究では,学習可能な変換で強化されたウィンドウベースのコントラスト学習戦略を取り入れた新しいアプローチであるCNTを提案する。
論文 参考訳(メタデータ) (2023-04-16T21:36:19Z) - Spatio-temporal predictive tasks for abnormal event detection in videos [60.02503434201552]
オブジェクトレベルの正規化パターンを学習するための制約付きプレテキストタスクを提案する。
我々のアプローチは、ダウンスケールの視覚的クエリとそれに対応する正常な外観と運動特性のマッピングを学習することである。
いくつかのベンチマークデータセットの実験では、異常の局所化と追跡のためのアプローチの有効性が示されている。
論文 参考訳(メタデータ) (2022-10-27T19:45:12Z) - Explanation Method for Anomaly Detection on Mixed Numerical and
Categorical Spaces [0.9543943371833464]
EADMNC (混合数値およびカテゴリー空間における説明可能な異常検出)
これは、元のモデルで得られた予測に説明可能性を追加する。
本稿では,大規模な実世界のデータ,特にネットワーク侵入検出領域における実験結果について報告する。
論文 参考訳(メタデータ) (2022-09-09T08:20:13Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。