論文の概要: Infinite-dimensional Mahalanobis Distance with Applications to Kernelized Novelty Detection
- arxiv url: http://arxiv.org/abs/2407.11873v2
- Date: Wed, 28 May 2025 14:12:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-29 17:35:50.00173
- Title: Infinite-dimensional Mahalanobis Distance with Applications to Kernelized Novelty Detection
- Title(参考訳): 不定次元マハラノビス距離とカーネル化ノベルティ検出への応用
- Authors: Nikita Zozoulenko, Thomas Cass, Lukas Gonon,
- Abstract要約: マハラノビス距離の概念を分離可能なバナッハ空間に拡張し、確率測度に付随するキャメロン・マルティンノルムとして再解釈する。
このアプローチは、いわゆる分散ノルムを通じて、ベースフリーでデータ駆動の異常距離の概念をもたらす。
12の実世界のデータセットに関する実証的研究において、核化された最も近いマハラノビス距離が従来の核化されたマハラノビス距離より優れていることを示した。
- 参考スコア(独自算出の注目度): 2.389598109913754
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Mahalanobis distance is a classical tool used to measure the covariance-adjusted distance between points in $\bbR^d$. In this work, we extend the concept of Mahalanobis distance to separable Banach spaces by reinterpreting it as a Cameron-Martin norm associated with a probability measure. This approach leads to a basis-free, data-driven notion of anomaly distance through the so-called variance norm, which can naturally be estimated using empirical measures of a sample. Our framework generalizes the classical $\bbR^d$, functional $(L^2[0,1])^d$, and kernelized settings; importantly, it incorporates non-injective covariance operators. We prove that the variance norm is invariant under invertible bounded linear transformations of the data, extending previous results which are limited to unitary operators. In the Hilbert space setting, we connect the variance norm to the RKHS of the covariance operator and establish consistency and convergence results for estimation using empirical measures. Using the variance norm, we introduce the notion of a kernelized nearest-neighbour Mahalanobis distance. In an empirical study on 12 real-world data sets, we demonstrate that the kernelized nearest-neighbour Mahalanobis distance outperforms the traditional kernelized Mahalanobis distance for multivariate time series novelty detection, using state-of-the-art time series kernels such as the signature, global alignment, and Volterra reservoir kernels.
- Abstract(参考訳): マハラノビス距離(英: Mahalanobis distance)は、$\bbR^d$の点間の共分散調整距離を測定する古典的なツールである。
本研究では、マハラノビス距離の概念を可分バナッハ空間に拡張し、確率測度に付随するキャメロン・マルティンノルムとして再解釈する。
このアプローチは、サンプルの実証測度を用いて自然に推定できる、いわゆる分散ノルムを通じて、ベースフリーでデータ駆動の異常距離の概念をもたらす。
我々のフレームワークは古典的な$\bbR^d$、関数的な$(L^2[0,1])^d$、カーネル化された設定を一般化する。
分散ノルムは、データの可逆有界線型変換の下で不変であることが証明され、ユニタリ作用素に制限された以前の結果を拡張する。
ヒルベルト空間設定では、分散ノルムを共分散作用素のRKHSに接続し、経験的測度を用いた推定のための一貫性および収束結果を確立する。
分散ノルムを用いることで、核化された最も近いマハラノビス距離の概念を導入する。
12の実世界のデータセットに関する実証的研究において、核化された最も近いマハラノビス距離は、署名、大域的アライメント、ボルテラ貯水池核といった最先端の時系列カーネルを用いて、多変量時系列の新規性検出のために従来のカーネル化されたマハラノビス距離よりも優れていることを示した。
関連論文リスト
- Sampling and estimation on manifolds using the Langevin diffusion [45.57801520690309]
離散化マルコフ過程に基づく$mu_phi $の線形汎函数の2つの推定器を検討する。
誤差境界は、本質的に定義されたランゲヴィン拡散の離散化を用いてサンプリングと推定のために導出される。
論文 参考訳(メタデータ) (2023-12-22T18:01:11Z) - Intrinsic Bayesian Cramér-Rao Bound with an Application to Covariance Matrix Estimation [49.67011673289242]
本稿では, 推定パラメータが滑らかな多様体内にある推定問題に対して, 新たな性能境界を提案する。
これはパラメータ多様体の幾何学と推定誤差測度の本質的な概念を誘導する。
論文 参考訳(メタデータ) (2023-11-08T15:17:13Z) - Curvature-Independent Last-Iterate Convergence for Games on Riemannian
Manifolds [77.4346324549323]
本研究では, 多様体の曲率に依存しないステップサイズが, 曲率非依存かつ直線的最終点収束率を達成することを示す。
我々の知る限りでは、曲率非依存率や/または最終点収束の可能性はこれまでに検討されていない。
論文 参考訳(メタデータ) (2023-06-29T01:20:44Z) - General Gaussian Noise Mechanisms and Their Optimality for Unbiased Mean
Estimation [58.03500081540042]
プライベート平均推定に対する古典的なアプローチは、真の平均を計算し、バイアスのないがおそらく相関のあるガウスノイズを加えることである。
すべての入力データセットに対して、集中的な差分プライバシーを満たす非バイアス平均推定器が、少なくとも多くのエラーをもたらすことを示す。
論文 参考訳(メタデータ) (2023-01-31T18:47:42Z) - Robust Inference of Manifold Density and Geometry by Doubly Stochastic
Scaling [8.271859911016719]
我々は高次元雑音下で頑健な推論のためのツールを開発する。
提案手法は, セルタイプにまたがる技術的ノイズレベルの変動に頑健であることを示す。
論文 参考訳(メタデータ) (2022-09-16T15:39:11Z) - Robust Estimation for Nonparametric Families via Generative Adversarial
Networks [92.64483100338724]
我々は,高次元ロバストな統計問題を解くためにGAN(Generative Adversarial Networks)を設計するためのフレームワークを提供する。
我々の研究は、これらをロバスト平均推定、第二モーメント推定、ロバスト線形回帰に拡張する。
技術面では、提案したGAN損失は、スムーズで一般化されたコルモゴロフ-スミルノフ距離と見なすことができる。
論文 参考訳(メタデータ) (2022-02-02T20:11:33Z) - Optimal policy evaluation using kernel-based temporal difference methods [78.83926562536791]
カーネルヒルベルト空間を用いて、無限水平割引マルコフ報酬過程の値関数を推定する。
我々は、関連するカーネル演算子の固有値に明示的に依存した誤差の非漸近上界を導出する。
MRP のサブクラスに対する minimax の下位境界を証明する。
論文 参考訳(メタデータ) (2021-09-24T14:48:20Z) - Spectral convergence of diffusion maps: improved error bounds and an
alternative normalisation [0.6091702876917281]
本稿では,分布がハイパートーラス上でサポートされているモデルの場合の誤差境界を改善するために,新しい手法を用いる。
我々は、スペクトルデータと演算子離散化のノルム収束の両方に対して、長年のポイントワイズ誤差境界と一致する。
また、シンクホーン重みに基づく拡散写像の別の正規化も導入する。
論文 参考訳(メタデータ) (2020-06-03T04:23:43Z) - Schoenberg-Rao distances: Entropy-based and geometry-aware statistical
Hilbert distances [12.729120803225065]
我々は、シェーンベルク-ラオ距離(Schoenberg-Rao distances)と呼ばれる統計ヒルベルト距離のクラスを研究する。
ガウス分布の混合物間の新しい閉形式距離を導出する。
提案手法はワッサーシュタイン距離の代替として実用的であり,その効率性は幅広い機械学習タスクで説明できる。
論文 参考訳(メタデータ) (2020-02-19T18:48:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。