論文の概要: Dimensionality-Aware Outlier Detection: Theoretical and Experimental
Analysis
- arxiv url: http://arxiv.org/abs/2401.05453v1
- Date: Wed, 10 Jan 2024 01:07:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-13 02:33:21.355513
- Title: Dimensionality-Aware Outlier Detection: Theoretical and Experimental
Analysis
- Title(参考訳): 次元認識異常検出:理論的および実験的解析
- Authors: Alastair Anderberg, James Bailey, Ricardo J. G. B. Campello, Michael
E. Houle, Henrique O. Marques, Milo\v{s} Radovanovi\'c, Arthur Zimek
- Abstract要約: 本稿では,データセット内の次元の局所的変動をフルに考慮した非パラメトリックな外乱検出手法を提案する。
提案手法は,3つの重要なベンチマーク・アウトレイラ検出手法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 10.462432732238039
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a nonparametric method for outlier detection that takes full
account of local variations in intrinsic dimensionality within the dataset.
Using the theory of Local Intrinsic Dimensionality (LID), our
'dimensionality-aware' outlier detection method, DAO, is derived as an
estimator of an asymptotic local expected density ratio involving the query
point and a close neighbor drawn at random. The dimensionality-aware behavior
of DAO is due to its use of local estimation of LID values in a
theoretically-justified way. Through comprehensive experimentation on more than
800 synthetic and real datasets, we show that DAO significantly outperforms
three popular and important benchmark outlier detection methods: Local Outlier
Factor (LOF), Simplified LOF, and kNN.
- Abstract(参考訳): 本稿では,データセット内の内在次元の局所的変動をフルに考慮した非パラメトリックな外乱検出手法を提案する。
局所内在次元(lid)の理論を用いて,この「次元認識」異常検出法であるdaoを,クエリ点とランダムに描画された近接近傍との漸近的局所期待密度比の推定値として導出する。
DAOの次元認識挙動は、理論的に正当な方法でLID値の局所推定を利用するためである。
800以上の合成および実データセットに対する総合的な実験により、DAOは、LoF(Local Outlier Factor)、簡易LOF(Simplified LOF)、kNN(kNN)の3つの人気かつ重要なベンチマークアウトリエ検出手法を著しく上回っていることを示す。
関連論文リスト
- Embedding Trajectory for Out-of-Distribution Detection in Mathematical Reasoning [50.84938730450622]
数理推論におけるOOD検出にトラジェクトリボラティリティを用いたトラジェクトリベースのTVスコアを提案する。
本手法は, 数学的推論シナリオ下でのGLM上での従来のアルゴリズムよりも優れる。
提案手法は,複数選択質問などの出力空間における高密度特徴を持つアプリケーションに拡張することができる。
論文 参考訳(メタデータ) (2024-05-22T22:22:25Z) - Collaborative Heterogeneous Causal Inference Beyond Meta-analysis [68.4474531911361]
異種データを用いた因果推論のための協調的逆確率スコア推定器を提案する。
異質性の増加に伴うメタアナリシスに基づく手法に対して,本手法は有意な改善を示した。
論文 参考訳(メタデータ) (2024-04-24T09:04:36Z) - Improving Efficiency of Iso-Surface Extraction on Implicit Neural
Representations Using Uncertainty Propagation [32.329370320329005]
Inlicit Neural representations (INR) は、科学的データ削減と可視化に広く用いられている。
レンジ解析は、3次元測地におけるINR上の幾何的クエリの効率を向上する有望な結果を示している。
本稿では,算術規則を再検討し,空間領域内におけるネットワーク出力の確率分布を解析することにより,範囲解析のための改良手法を提案する。
論文 参考訳(メタデータ) (2024-02-21T15:10:20Z) - Score Approximation, Estimation and Distribution Recovery of Diffusion
Models on Low-Dimensional Data [68.62134204367668]
本稿では,未知の低次元線形部分空間上でデータをサポートする場合の拡散モデルのスコア近似,推定,分布回復について検討する。
適切に選択されたニューラルネットワークアーキテクチャでは、スコア関数を正確に近似し、効率的に推定することができる。
推定スコア関数に基づいて生成された分布は、データ幾何学構造を捕捉し、データ分布の近傍に収束する。
論文 参考訳(メタデータ) (2023-02-14T17:02:35Z) - Preserving local densities in low-dimensional embeddings [37.278617643507815]
tSNEやUMAPのような最先端の手法は、高次元データに隠された局所構造を明らかにするのに優れている。
しかし, これらの手法は, 密度の相対的差など, 局所的な特性の再構築に失敗することを示す。
局所密度をほぼ保存するdtSNEを提案する。
論文 参考訳(メタデータ) (2023-01-31T16:11:54Z) - Intrinsic Dimensionality Estimation within Tight Localities: A
Theoretical and Experimental Analysis [0.0]
そこで本研究では,20個のサンプル点からなるタイトな局所性に対しても安定な局所ID推定手法を提案する。
実験結果から,提案手法の偏差は比較的小さいが, 偏差は比較的小さく, 試料径は最先端の推定値よりもはるかに小さいことがわかった。
論文 参考訳(メタデータ) (2022-09-29T00:00:11Z) - LIDL: Local Intrinsic Dimension Estimation Using Approximate Likelihood [10.35315334180936]
この問題に対する新しいアプローチを提案する: 近似的類似度(LIDL)を用いた局所固有次元推定
本手法は, 任意の密度推定法をサブルーチンとして用い, 次元の挑戦をサイドステップしようと試みる。
LIDLは,この問題の標準ベンチマークで競合する結果を得るとともに,数千次元まで拡張可能であることを示す。
論文 参考訳(メタデータ) (2022-06-29T19:47:46Z) - Meta-Learning for Relative Density-Ratio Estimation [59.75321498170363]
相対密度比推定(DRE)の既存の方法は、両方の密度から多くのインスタンスを必要とする。
本稿では,関係データセットの知識を用いて,相対密度比を数例から推定する,相対DREのメタラーニング手法を提案する。
提案手法の有効性を,相対的DRE,データセット比較,外乱検出の3つの問題を用いて実証的に実証した。
論文 参考訳(メタデータ) (2021-07-02T02:13:45Z) - Distributionally Robust Local Non-parametric Conditional Estimation [22.423052432220235]
非パラメトリックな局所推定を生成する分布安定な新しい推定器を提案する。
一般には難解であるにもかかわらず、局所推定器は凸最適化によって効率的に見つけることができることを示す。
合成およびMNISTデータセットを用いた実験は、この新しいクラスの推定器の競合性能を示している。
論文 参考訳(メタデータ) (2020-10-12T00:11:17Z) - Nonparametric Density Estimation from Markov Chains [68.8204255655161]
我々はマルコフ・チェインにインスパイアされた新しい非パラメトリック密度推定器を導入し、よく知られたケルネル密度推定器を一般化する。
我々の推定器は, 通常のものに対していくつかの利点を示し, 全密度アルゴリズムの基盤として容易に利用できる。
論文 参考訳(メタデータ) (2020-09-08T18:33:42Z) - Distribution Approximation and Statistical Estimation Guarantees of
Generative Adversarial Networks [82.61546580149427]
GAN(Generative Adversarial Networks)は教師なし学習において大きな成功を収めている。
本稿では,H'older空間における密度データ分布推定のためのGANの近似と統計的保証を提供する。
論文 参考訳(メタデータ) (2020-02-10T16:47:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。