論文の概要: Theoretical Investigation on Inductive Bias of Isolation Forest
- arxiv url: http://arxiv.org/abs/2505.12825v1
- Date: Mon, 19 May 2025 08:07:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:11.477484
- Title: Theoretical Investigation on Inductive Bias of Isolation Forest
- Title(参考訳): 孤立林の誘導バイアスに関する理論的研究
- Authors: Qin-Cheng Zheng, Shao-Qun Zhang, Shen-Huan Lyu, Yuan Jiang, Zhi-Hua Zhou,
- Abstract要約: アイフォレスト(iForest)は、大規模タスクにおける例外的な実行効率と性能で評価される、広く使われている教師なしの異常検知器である。
本稿では, 奥行き関数と成長過程の定式化による誘導バイアスの解析により, iForestの有効性の条件と範囲を理論的に検討する。
- 参考スコア(独自算出の注目度): 50.73712396699867
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Isolation Forest (iForest) stands out as a widely-used unsupervised anomaly detector valued for its exceptional runtime efficiency and performance on large-scale tasks. Despite its widespread adoption, a theoretical foundation explaining iForest's success remains unclear. This paper theoretically investigates the conditions and extent of iForest's effectiveness by analyzing its inductive bias through the formulation of depth functions and growth processes. Since directly analyzing the depth function proves intractable due to iForest's random splitting mechanism, we model the growth process of iForest as a random walk, enabling us to derive the expected depth function using transition probabilities. Our case studies reveal key inductive biases: iForest exhibits lower sensitivity to central anomalies while demonstrating greater parameter adaptability compared to $k$-Nearest Neighbor anomaly detectors. Our study provides theoretical understanding of the effectiveness of iForest and establishes a foundation for further theoretical exploration.
- Abstract(参考訳): アイフォレスト(iForest)は、大規模タスクにおける例外的な実行効率と性能で評価される、広く使われている教師なしの異常検知器である。
広く採用されているにもかかわらず、iForestの成功を説明する理論的基盤は未だに不明である。
本稿では,深さ関数と成長過程の定式化による誘導バイアスの解析により,iForestの有効性の条件と範囲を理論的に検討する。
深度関数を直接解析することはiForestのランダム分割機構により難解であるため、iForestの成長過程をランダムウォークとしてモデル化し、遷移確率を用いた予測深度関数の導出を可能にする。
iForestは中央異常に対する感度を低く、パラメータ適応性は$k$-Nearest Nearest Anomaly Detectorと比較して高い。
本研究は,iForestの有効性を理論的に理解し,さらなる理論的探索の基礎を築いた。
関連論文リスト
- Probing Deep into Temporal Profile Makes the Infrared Small Target Detector Much Better [63.567886330598945]
赤外線小目標(IRST)検出は、精度、普遍性、堅牢性、効率的な性能を同時に達成する上で困難である。
現在の学習に基づく手法は、空間的領域と短期的領域の両方から"より多くの情報を活用する。
本稿では、IRST検出のための時間次元でのみ計算を行う効率的な深部プローブネットワーク(DeepPro)を提案する。
論文 参考訳(メタデータ) (2025-06-15T08:19:32Z) - Long-term Causal Inference via Modeling Sequential Latent Confounding [49.64731441006396]
長期因果推論は、様々な科学的領域において重要な問題であるが難しい問題である。
本稿では, 条件付き付加的等価バイアス(CAECB)の仮定に基づくアプローチを提案する。
提案した仮定は、時間的短期的な結果にまたがる逐次的共起バイアス間の機能的関係を述べる。
論文 参考訳(メタデータ) (2025-02-26T09:56:56Z) - Towards Understanding Extrapolation: a Causal Lens [53.15488984371969]
我々は、外挿がいつ可能かを理論的に理解し、それを実現するための原則的な方法を提供する。
この定式化の下では、外挿問題を潜在変数識別問題にキャストする。
この理論は、基礎となる多様体の滑らかさとシフト特性の間の複雑な相互作用を明らかにする。
論文 参考訳(メタデータ) (2025-01-15T21:29:29Z) - A Central Limit Theorem for the permutation importance measure [0.44998333629984877]
U-Statistics理論を用いたRFPIMの中央極限定理の形式的証明を提供する。
本研究の目的は、総合的な仮説テストを行うのではなく、RFPIMの理論的理解を改善することである。
論文 参考訳(メタデータ) (2024-12-17T15:40:21Z) - Bayesian Intervention Optimization for Causal Discovery [23.51328013481865]
因果発見は複雑なシステムを理解し、決定を下すのに不可欠である。
ベイジアンやグラフ理論的なアプローチのような現在の手法は意思決定を優先しない。
ベイズ因子に着想を得た新しいベイズ最適化手法を提案する。
論文 参考訳(メタデータ) (2024-06-16T12:45:44Z) - Ladder-of-Thought: Using Knowledge as Steps to Elevate Stance Detection [73.31406286956535]
姿勢検出タスクにLadder-of-Thought(LoT)を導入する。
LoTは、小さなLMに高品質な外部知識を同化させ、生成した中間的論理を精査するように指示する。
実験では, 姿勢検出タスクにおけるCoTのGPT-3.5よりも16%改善し, 10%向上した。
論文 参考訳(メタデータ) (2023-08-31T14:31:48Z) - OptIForest: Optimal Isolation Forest for Anomaly Detection [19.38817835115542]
孤立林のメカニズムに基づくカテゴリーは、その単純さ、有効性、効率性から際立っている。
本稿では,分離効率の理論を確立し,分離木に対する最適分岐係数を決定する。
理論的基盤に基づいて,クラスタリングに基づく学習をハッシュに組み込んだ,実用的な最適孤立林 OptIForest を設計する。
論文 参考訳(メタデータ) (2023-06-22T07:14:02Z) - Counterfactual Reasoning for Out-of-distribution Multimodal Sentiment
Analysis [56.84237932819403]
本稿では,OODの高次一般化に対するテキストモダリティの悪影響を推定・緩和することを目的とする。
そこで本研究では,マルチモーダル感情分析のためのモデルに依存しない反現実的フレームワークを考案した。
論文 参考訳(メタデータ) (2022-07-24T03:57:40Z) - FACT: High-Dimensional Random Forests Inference [4.941630596191806]
ランダム森林学習における個々の特徴の有用性の定量化は、その解釈可能性を大幅に向上させる。
既存の研究では、ランダム森林の特徴的重要度尺度が偏見の問題に悩まされていることが示されている。
本研究では, 自己正規化特徴-残留相関テスト(FACT)の枠組みを提案する。
論文 参考訳(メタデータ) (2022-07-04T19:05:08Z) - Counterfactual Maximum Likelihood Estimation for Training Deep Networks [83.44219640437657]
深層学習モデルは、予測的手がかりとして学習すべきでない急激な相関を学習する傾向がある。
本研究では,観測可能な共同設立者による相関関係の緩和を目的とした因果関係に基づくトレーニングフレームワークを提案する。
自然言語推論(NLI)と画像キャプションという2つの実世界の課題について実験を行った。
論文 参考訳(メタデータ) (2021-06-07T17:47:16Z) - Interpretable Anomaly Detection with DIFFI: Depth-based Isolation Forest
Feature Importance [4.769747792846005]
異常検出(英: Anomaly Detection)は、歴史的データに対する異常な振る舞いを検出することを目的とした教師なし学習課題である。
孤立林は、異常検出の分野で最も広く採用されているアルゴリズムの1つである。
本稿では,森林のグローバルレベルと地域レベルの両方で特徴重要度を定義する手法を提案する。
論文 参考訳(メタデータ) (2020-07-21T22:19:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。