論文の概要: Variance Norms for Kernelized Anomaly Detection
- arxiv url: http://arxiv.org/abs/2407.11873v1
- Date: Tue, 16 Jul 2024 15:59:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-07-17 14:03:36.673006
- Title: Variance Norms for Kernelized Anomaly Detection
- Title(参考訳): カーネル化異常検出のための変数ノルム
- Authors: Thomas Cass, Lukas Gonon, Nikita Zozoulenko,
- Abstract要約: バナッハ空間上でのマハラノビス型異常検出の統一理論を提案する。
半教師付き異常検出のためのカーネル化近辺マハラノビス距離の概念を導入する。
12個の実世界のデータセットに関する実証的研究において、核化された最も近いマハラノビス距離が従来の核化されたマハラノビス距離より優れていることを示した。
- 参考スコア(独自算出の注目度): 2.389598109913754
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a unified theory for Mahalanobis-type anomaly detection on Banach spaces, using ideas from Cameron-Martin theory applied to non-Gaussian measures. This approach leads to a basis-free, data-driven notion of anomaly distance through the so-called variance norm of a probability measure, which can be consistently estimated using empirical measures. Our framework generalizes the classical $\mathbb{R}^d$, functional $(L^2[0,1])^d$, and kernelized settings, including the general case of non-injective covariance operator. We prove that the variance norm depends solely on the inner product in a given Hilbert space, and hence that the kernelized Mahalanobis distance can naturally be recovered by working on reproducing kernel Hilbert spaces. Using the variance norm, we introduce the notion of a kernelized nearest-neighbour Mahalanobis distance for semi-supervised anomaly detection. In an empirical study on 12 real-world datasets, we demonstrate that the kernelized nearest-neighbour Mahalanobis distance outperforms the traditional kernelized Mahalanobis distance for multivariate time series anomaly detection, using state-of-the-art time series kernels such as the signature, global alignment, and Volterra reservoir kernels. Moreover, we provide an initial theoretical justification of nearest-neighbour Mahalanobis distances by developing concentration inequalities in the finite-dimensional Gaussian case.
- Abstract(参考訳): 非ガウス測度に適用したキャメロン・マーチン理論のアイデアを用いて、バナッハ空間上でのマハラノビス型異常検出の統一理論を提案する。
このアプローチは、確率測度のいわゆる分散ノルムを通じて、ベースフリーでデータ駆動の異常距離の概念を導いており、これは経験的測度を用いて一貫して推定できる。
我々のフレームワークは、古典的な $\mathbb{R}^d$, functional $(L^2[0,1])^d$, カーネル化された設定を一般化する。
我々は、分散ノルムが与えられたヒルベルト空間の内積のみに依存することを証明し、従って核化されたマハラノビス距離はヒルベルト空間を再現することによって自然に回復できることを示した。
分散ノルムを用いて、半教師付き異常検出のためのカーネル化された最も近いマハラノビス距離の概念を導入する。
実世界の12のデータセットに関する実証的研究において、カーネル化された最も近いマハラノビス距離は、署名、グローバルアライメント、ボルテラ貯水池カーネルといった最先端の時系列カーネルを用いて、多変量時系列異常検出のために従来のカーネル化されたマハラノビス距離よりも優れていることを示した。
さらに、有限次元ガウスの場合の濃度不等式を発達させることにより、近傍のマハラノビス距離の初期理論的正当化を与える。
関連論文リスト
- Sampling and estimation on manifolds using the Langevin diffusion [45.57801520690309]
離散化マルコフ過程に基づく$mu_phi $の線形汎函数の2つの推定器を検討する。
誤差境界は、本質的に定義されたランゲヴィン拡散の離散化を用いてサンプリングと推定のために導出される。
論文 参考訳(メタデータ) (2023-12-22T18:01:11Z) - Intrinsic Bayesian Cramér-Rao Bound with an Application to Covariance Matrix Estimation [49.67011673289242]
本稿では, 推定パラメータが滑らかな多様体内にある推定問題に対して, 新たな性能境界を提案する。
これはパラメータ多様体の幾何学と推定誤差測度の本質的な概念を誘導する。
論文 参考訳(メタデータ) (2023-11-08T15:17:13Z) - Curvature-Independent Last-Iterate Convergence for Games on Riemannian
Manifolds [77.4346324549323]
本研究では, 多様体の曲率に依存しないステップサイズが, 曲率非依存かつ直線的最終点収束率を達成することを示す。
我々の知る限りでは、曲率非依存率や/または最終点収束の可能性はこれまでに検討されていない。
論文 参考訳(メタデータ) (2023-06-29T01:20:44Z) - General Gaussian Noise Mechanisms and Their Optimality for Unbiased Mean
Estimation [58.03500081540042]
プライベート平均推定に対する古典的なアプローチは、真の平均を計算し、バイアスのないがおそらく相関のあるガウスノイズを加えることである。
すべての入力データセットに対して、集中的な差分プライバシーを満たす非バイアス平均推定器が、少なくとも多くのエラーをもたらすことを示す。
論文 参考訳(メタデータ) (2023-01-31T18:47:42Z) - Robust Inference of Manifold Density and Geometry by Doubly Stochastic
Scaling [8.271859911016719]
我々は高次元雑音下で頑健な推論のためのツールを開発する。
提案手法は, セルタイプにまたがる技術的ノイズレベルの変動に頑健であることを示す。
論文 参考訳(メタデータ) (2022-09-16T15:39:11Z) - Robust Estimation for Nonparametric Families via Generative Adversarial
Networks [92.64483100338724]
我々は,高次元ロバストな統計問題を解くためにGAN(Generative Adversarial Networks)を設計するためのフレームワークを提供する。
我々の研究は、これらをロバスト平均推定、第二モーメント推定、ロバスト線形回帰に拡張する。
技術面では、提案したGAN損失は、スムーズで一般化されたコルモゴロフ-スミルノフ距離と見なすことができる。
論文 参考訳(メタデータ) (2022-02-02T20:11:33Z) - Optimal policy evaluation using kernel-based temporal difference methods [78.83926562536791]
カーネルヒルベルト空間を用いて、無限水平割引マルコフ報酬過程の値関数を推定する。
我々は、関連するカーネル演算子の固有値に明示的に依存した誤差の非漸近上界を導出する。
MRP のサブクラスに対する minimax の下位境界を証明する。
論文 参考訳(メタデータ) (2021-09-24T14:48:20Z) - Spectral convergence of diffusion maps: improved error bounds and an
alternative normalisation [0.6091702876917281]
本稿では,分布がハイパートーラス上でサポートされているモデルの場合の誤差境界を改善するために,新しい手法を用いる。
我々は、スペクトルデータと演算子離散化のノルム収束の両方に対して、長年のポイントワイズ誤差境界と一致する。
また、シンクホーン重みに基づく拡散写像の別の正規化も導入する。
論文 参考訳(メタデータ) (2020-06-03T04:23:43Z) - Schoenberg-Rao distances: Entropy-based and geometry-aware statistical
Hilbert distances [12.729120803225065]
我々は、シェーンベルク-ラオ距離(Schoenberg-Rao distances)と呼ばれる統計ヒルベルト距離のクラスを研究する。
ガウス分布の混合物間の新しい閉形式距離を導出する。
提案手法はワッサーシュタイン距離の代替として実用的であり,その効率性は幅広い機械学習タスクで説明できる。
論文 参考訳(メタデータ) (2020-02-19T18:48:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。