論文の概要: Theoretical Investigation on Inductive Bias of Isolation Forest
- arxiv url: http://arxiv.org/abs/2505.12825v1
- Date: Mon, 19 May 2025 08:07:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:11.477484
- Title: Theoretical Investigation on Inductive Bias of Isolation Forest
- Title(参考訳): 孤立林の誘導バイアスに関する理論的研究
- Authors: Qin-Cheng Zheng, Shao-Qun Zhang, Shen-Huan Lyu, Yuan Jiang, Zhi-Hua Zhou,
- Abstract要約: アイフォレスト(iForest)は、大規模タスクにおける例外的な実行効率と性能で評価される、広く使われている教師なしの異常検知器である。
本稿では, 奥行き関数と成長過程の定式化による誘導バイアスの解析により, iForestの有効性の条件と範囲を理論的に検討する。
- 参考スコア(独自算出の注目度): 50.73712396699867
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Isolation Forest (iForest) stands out as a widely-used unsupervised anomaly detector valued for its exceptional runtime efficiency and performance on large-scale tasks. Despite its widespread adoption, a theoretical foundation explaining iForest's success remains unclear. This paper theoretically investigates the conditions and extent of iForest's effectiveness by analyzing its inductive bias through the formulation of depth functions and growth processes. Since directly analyzing the depth function proves intractable due to iForest's random splitting mechanism, we model the growth process of iForest as a random walk, enabling us to derive the expected depth function using transition probabilities. Our case studies reveal key inductive biases: iForest exhibits lower sensitivity to central anomalies while demonstrating greater parameter adaptability compared to $k$-Nearest Neighbor anomaly detectors. Our study provides theoretical understanding of the effectiveness of iForest and establishes a foundation for further theoretical exploration.
- Abstract(参考訳): アイフォレスト(iForest)は、大規模タスクにおける例外的な実行効率と性能で評価される、広く使われている教師なしの異常検知器である。
広く採用されているにもかかわらず、iForestの成功を説明する理論的基盤は未だに不明である。
本稿では,深さ関数と成長過程の定式化による誘導バイアスの解析により,iForestの有効性の条件と範囲を理論的に検討する。
深度関数を直接解析することはiForestのランダム分割機構により難解であるため、iForestの成長過程をランダムウォークとしてモデル化し、遷移確率を用いた予測深度関数の導出を可能にする。
iForestは中央異常に対する感度を低く、パラメータ適応性は$k$-Nearest Nearest Anomaly Detectorと比較して高い。
本研究は,iForestの有効性を理論的に理解し,さらなる理論的探索の基礎を築いた。
関連論文リスト
- Observationally Informed Adaptive Causal Experimental Design [55.998153710215654]
本稿では,観測モデルを基礎的先行として活用する新たなパラダイムであるアクティブ残留学習を提案する。
このアプローチは、実験的な焦点を、目標因果量の学習から、観察バイアスの補正に必要な残差を効率的に推定するへとシフトさせる。
合成および半合成ベンチマークの実験は、R-Designがベースラインを大幅に上回ることを示した。
論文 参考訳(メタデータ) (2026-03-04T06:52:37Z) - Boule or Baguette? A Study on Task Topology, Length Generalization, and the Benefit of Reasoning Traces [31.37944377681284]
命題論理における2300万以上の文とそれに対応する証明のデータセットであるPITAを使用します。
RTモデルは広小部分集合と浅小部分集合でよく一般化され、非RTベースラインに対して狭小部分集合と深小部分集合では劣化する。
我々の理論は、RTモデルが深いタスクでどれだけうまく機能するかを制限する基本的なスケーリングを示唆し、幅広いタスクでそれらの一般化の強みを強調している。
論文 参考訳(メタデータ) (2026-02-16T02:20:37Z) - Think Longer to Explore Deeper: Learn to Explore In-Context via Length-Incentivized Reinforcement Learning [53.58654277639939]
文脈内探索(In-context Exploring)は、単一の連続した文脈内で仮説を生成、検証、洗練する本質的な能力である。
本稿では,モデルにさらなる探索を促すLongth-Incentivized Explorationを提案する。
提案手法は、ドメイン内タスクの平均4.4%改善と、ドメイン外ベンチマークの2.7%向上を実現している。
論文 参考訳(メタデータ) (2026-02-12T09:24:32Z) - Diffusion Bridge or Flow Matching? A Unifying Framework and Comparative Analysis [57.614436689939986]
拡散ブリッジとフローマッチングは、任意の分布間の変換において魅力的な経験的性能を示した。
我々は,これらのフレームワークを最適制御のレンズを通して再キャストし,拡散橋のコスト関数が低いことを証明した。
これらの理論的主張を裏付けるために,潜伏変圧器上に構築された拡散橋の新しい強力なアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-09-29T09:45:22Z) - Positional Biases Shift as Inputs Approach Context Window Limits [57.00239097102958]
入力がモデルのコンテキストウィンドウの最大50%を占める場合、LiM効果は最強となる。
関係情報が入力の終端に近づくと,モデルの性能が向上する,距離に基づくバイアスが観測される。
論文 参考訳(メタデータ) (2025-08-10T20:40:24Z) - Open-ended Scientific Discovery via Bayesian Surprise [63.26412847240136]
AutoDSは、ベイジアン・サプライズを用いた科学探査を駆動する、オープンエンドの科学的発見の方法である。
我々はAutoDSを、生物学、経済学、金融学、行動科学といった21の領域にまたがる実世界のデータセットにまたがるデータ駆動ディスカバリの設定で評価する。
論文 参考訳(メタデータ) (2025-06-30T22:53:59Z) - Probing Deep into Temporal Profile Makes the Infrared Small Target Detector Much Better [63.567886330598945]
赤外線小目標(IRST)検出は、精度、普遍性、堅牢性、効率的な性能を同時に達成する上で困難である。
現在の学習に基づく手法は、空間的領域と短期的領域の両方から"より多くの情報を活用する。
本稿では、IRST検出のための時間次元でのみ計算を行う効率的な深部プローブネットワーク(DeepPro)を提案する。
論文 参考訳(メタデータ) (2025-06-15T08:19:32Z) - Long-term Causal Inference via Modeling Sequential Latent Confounding [49.64731441006396]
長期因果推論は、様々な科学的領域において重要な問題であるが難しい問題である。
本稿では, 条件付き付加的等価バイアス(CAECB)の仮定に基づくアプローチを提案する。
提案した仮定は、時間的短期的な結果にまたがる逐次的共起バイアス間の機能的関係を述べる。
論文 参考訳(メタデータ) (2025-02-26T09:56:56Z) - Towards Understanding Extrapolation: a Causal Lens [53.15488984371969]
我々は、外挿がいつ可能かを理論的に理解し、それを実現するための原則的な方法を提供する。
この定式化の下では、外挿問題を潜在変数識別問題にキャストする。
この理論は、基礎となる多様体の滑らかさとシフト特性の間の複雑な相互作用を明らかにする。
論文 参考訳(メタデータ) (2025-01-15T21:29:29Z) - A Central Limit Theorem for the permutation importance measure [0.44998333629984877]
U-Statistics理論を用いたRFPIMの中央極限定理の形式的証明を提供する。
本研究の目的は、総合的な仮説テストを行うのではなく、RFPIMの理論的理解を改善することである。
論文 参考訳(メタデータ) (2024-12-17T15:40:21Z) - Bayesian Intervention Optimization for Causal Discovery [23.51328013481865]
因果発見は複雑なシステムを理解し、決定を下すのに不可欠である。
ベイジアンやグラフ理論的なアプローチのような現在の手法は意思決定を優先しない。
ベイズ因子に着想を得た新しいベイズ最適化手法を提案する。
論文 参考訳(メタデータ) (2024-06-16T12:45:44Z) - Ladder-of-Thought: Using Knowledge as Steps to Elevate Stance Detection [73.31406286956535]
姿勢検出タスクにLadder-of-Thought(LoT)を導入する。
LoTは、小さなLMに高品質な外部知識を同化させ、生成した中間的論理を精査するように指示する。
実験では, 姿勢検出タスクにおけるCoTのGPT-3.5よりも16%改善し, 10%向上した。
論文 参考訳(メタデータ) (2023-08-31T14:31:48Z) - OptIForest: Optimal Isolation Forest for Anomaly Detection [19.38817835115542]
孤立林のメカニズムに基づくカテゴリーは、その単純さ、有効性、効率性から際立っている。
本稿では,分離効率の理論を確立し,分離木に対する最適分岐係数を決定する。
理論的基盤に基づいて,クラスタリングに基づく学習をハッシュに組み込んだ,実用的な最適孤立林 OptIForest を設計する。
論文 参考訳(メタデータ) (2023-06-22T07:14:02Z) - Counterfactual Reasoning for Out-of-distribution Multimodal Sentiment
Analysis [56.84237932819403]
本稿では,OODの高次一般化に対するテキストモダリティの悪影響を推定・緩和することを目的とする。
そこで本研究では,マルチモーダル感情分析のためのモデルに依存しない反現実的フレームワークを考案した。
論文 参考訳(メタデータ) (2022-07-24T03:57:40Z) - FACT: High-Dimensional Random Forests Inference [4.941630596191806]
ランダム森林学習における個々の特徴の有用性の定量化は、その解釈可能性を大幅に向上させる。
既存の研究では、ランダム森林の特徴的重要度尺度が偏見の問題に悩まされていることが示されている。
本研究では, 自己正規化特徴-残留相関テスト(FACT)の枠組みを提案する。
論文 参考訳(メタデータ) (2022-07-04T19:05:08Z) - Beyond Distributional Hypothesis: Let Language Models Learn Meaning-Text
Correspondence [45.9949173746044]
大規模事前学習言語モデル (PLM) が論理否定特性 (LNP) を満たさないことを示す。
そこで本研究では,意味テキスト対応を直接学習するための新しい中間訓練課題である「意味マッチング」を提案する。
このタスクにより、PLMは語彙意味情報を学習することができる。
論文 参考訳(メタデータ) (2022-05-08T08:37:36Z) - Counterfactual Maximum Likelihood Estimation for Training Deep Networks [83.44219640437657]
深層学習モデルは、予測的手がかりとして学習すべきでない急激な相関を学習する傾向がある。
本研究では,観測可能な共同設立者による相関関係の緩和を目的とした因果関係に基づくトレーニングフレームワークを提案する。
自然言語推論(NLI)と画像キャプションという2つの実世界の課題について実験を行った。
論文 参考訳(メタデータ) (2021-06-07T17:47:16Z) - Interpretable Anomaly Detection with DIFFI: Depth-based Isolation Forest
Feature Importance [4.769747792846005]
異常検出(英: Anomaly Detection)は、歴史的データに対する異常な振る舞いを検出することを目的とした教師なし学習課題である。
孤立林は、異常検出の分野で最も広く採用されているアルゴリズムの1つである。
本稿では,森林のグローバルレベルと地域レベルの両方で特徴重要度を定義する手法を提案する。
論文 参考訳(メタデータ) (2020-07-21T22:19:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。