論文の概要: Outlier detection in non-elliptical data by kernel MRCD
- arxiv url: http://arxiv.org/abs/2008.02046v2
- Date: Mon, 29 Mar 2021 22:23:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 17:56:06.727989
- Title: Outlier detection in non-elliptical data by kernel MRCD
- Title(参考訳): 核MRCDによる非楕円データの外部検出
- Authors: Joachim Schreurs, Iwein Vranckx, Mia Hubert, Johan A.K. Suykens, Peter
J. Rousseeuw
- Abstract要約: Kernel Minimum Regularized Covariance Determinant (KMRCD) 推定器を提案する。
カーネル誘導特徴空間におけるMRCD推定値を暗黙的に計算する。
カーネルベースの初期推定から始まり、カーネルのトリックを利用して、その後の計算を高速化する高速アルゴリズムが構築されている。
- 参考スコア(独自算出の注目度): 10.69910379275607
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The minimum regularized covariance determinant method (MRCD) is a robust
estimator for multivariate location and scatter, which detects outliers by
fitting a robust covariance matrix to the data. Its regularization ensures that
the covariance matrix is well-conditioned in any dimension. The MRCD assumes
that the non-outlying observations are roughly elliptically distributed, but
many datasets are not of that form. Moreover, the computation time of MRCD
increases substantially when the number of variables goes up, and nowadays
datasets with many variables are common. The proposed Kernel Minimum
Regularized Covariance Determinant (KMRCD) estimator addresses both issues. It
is not restricted to elliptical data because it implicitly computes the MRCD
estimates in a kernel induced feature space. A fast algorithm is constructed
that starts from kernel-based initial estimates and exploits the kernel trick
to speed up the subsequent computations. Based on the KMRCD estimates, a rule
is proposed to flag outliers. The KMRCD algorithm performs well in simulations,
and is illustrated on real-life data.
- Abstract(参考訳): 最小正規化共分散行列法 (MRCD) は多変量位置と散乱のロバストな推定器であり、データにロバストな共分散行列を嵌合させて外乱を検出する。
その正則化は共分散行列が任意の次元において良く条件付けされることを保証する。
MRCDは、外部からの観測は概ね楕円的に分散しているが、多くのデータセットはそのような形式ではないと仮定している。
さらに,変数数が増加するとMRCDの計算時間は大幅に増加し,現在では多くの変数を持つデータセットが一般的である。
KMRCD (Kernel Minimum Regularized Covariance Determinant) 推定器は両問題に対処する。
カーネル誘導特徴空間におけるMRCD推定を暗黙的に計算するため、楕円データに限定されない。
カーネルベースの初期推定から始まり、カーネルトリックを利用してその後の計算を高速化する高速アルゴリズムが構築される。
KMRCDの推定に基づいて、外れ値にフラグを付ける規則が提案されている。
KMRCDアルゴリズムはシミュレーションでよく機能し、実生活データで示される。
関連論文リスト
- Universality of kernel random matrices and kernel regression in the quadratic regime [18.51014786894174]
本研究では、カーネルカーネルの回帰の研究を二次構造にまで拡張する。
我々は、元のカーネルランダム行列と二次カーネルランダム行列の差分に限定した作用素ノルム近似を確立する。
我々は、$n/d2$が非ゼロ定数に収束する二次状態におけるKRRの正確なトレーニングと一般化誤差を特徴づける。
論文 参考訳(メタデータ) (2024-08-02T07:29:49Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - Kernel distance measures for time series, random fields and other
structured data [71.61147615789537]
kdiffは、構造化データのインスタンス間の距離を推定するためのカーネルベースの新しい尺度である。
これはインスタンス間の自己類似性と交差類似性の両方を考慮し、距離分布の低い定量値を用いて定義される。
kdiffをクラスタリングと分類問題のための距離尺度として用いた分離性条件について,いくつかの理論的結果が得られた。
論文 参考訳(メタデータ) (2021-09-29T22:54:17Z) - Optimal policy evaluation using kernel-based temporal difference methods [78.83926562536791]
カーネルヒルベルト空間を用いて、無限水平割引マルコフ報酬過程の値関数を推定する。
我々は、関連するカーネル演算子の固有値に明示的に依存した誤差の非漸近上界を導出する。
MRP のサブクラスに対する minimax の下位境界を証明する。
論文 参考訳(メタデータ) (2021-09-24T14:48:20Z) - SreaMRAK a Streaming Multi-Resolution Adaptive Kernel Algorithm [60.61943386819384]
既存のKRRの実装では、すべてのデータがメインメモリに格納される必要がある。
KRRのストリーミング版であるStreaMRAKを提案する。
本稿では,2つの合成問題と2重振り子の軌道予測について紹介する。
論文 参考訳(メタデータ) (2021-08-23T21:03:09Z) - Kernel Mean Estimation by Marginalized Corrupted Distributions [96.9272743070371]
カーネル平均をヒルベルト空間で推定することは、多くのカーネル学習アルゴリズムにおいて重要な要素である。
本稿では,カーネル平均推定器としてカーネル平均推定器を提案する。
論文 参考訳(メタデータ) (2021-07-10T15:11:28Z) - Faster Kernel Interpolation for Gaussian Processes [30.04235162264955]
大規模データセットへのプロセス(GP)回帰のスケーリングにおける重要な課題は、正確な推論がnxnのカーネル行列を必要とすることである。
構造化カーネル(SKI)は最もスケーラブルな方法の一つである。
1つのO(n)時間前計算ステップの後、SKIをO(m log m)に還元できることが示される。
我々は, m と n の広い範囲で実際に高速化を実演し, 1億点を超える3次元気象レーダデータセット上でGP推定に適用した。
論文 参考訳(メタデータ) (2021-01-28T00:09:22Z) - Kernel Alignment Risk Estimator: Risk Prediction from Training Data [10.739602293023058]
我々はKRR(Kernel Ridge Regression)のリスク(すなわち一般化誤差)を、ridge $lambda>0$およびi.i.d.観測値を持つカーネル$K$に対して検討する。
本稿では、SCT(Signal Capture Threshold)とKARE(Kernel Alignment Risk Estimator)の2つのオブジェクトを紹介する。
論文 参考訳(メタデータ) (2020-06-17T12:00:05Z) - Variance reduction for Random Coordinate Descent-Langevin Monte Carlo [7.464874233755718]
高速収束を提供するランゲヴィン・モンテカルロ(LMC)は勾配近似の計算を必要とする。
実際には、有限差分近似を代理として使用し、高次元では高価である。
本稿では,新しい分散低減手法であるCoordinates Averaging Descent (RCAD)を導入し,過度に損傷を受けたLCCと過度に損傷を受けたLCCを併用する。
論文 参考訳(メタデータ) (2020-06-10T21:08:38Z) - Improved guarantees and a multiple-descent curve for Column Subset
Selection and the Nystr\"om method [76.73096213472897]
我々は,データ行列のスペクトル特性を利用して近似保証を改良する手法を開発した。
我々のアプローチは、特異値減衰の既知の速度を持つデータセットのバウンダリが大幅に向上する。
RBFパラメータを変更すれば,改良された境界線と多重発振曲線の両方を実データセット上で観測できることが示される。
論文 参考訳(メタデータ) (2020-02-21T00:43:06Z) - Kernel Selection for Modal Linear Regression: Optimal Kernel and IRLS
Algorithm [8.571896191090744]
MLRパラメータの平均二乗誤差を最小化するという意味では,Biweightカーネルが最適であることを示す。
第2に、アルゴリズムを反復的に再重み付けした最小二乗アルゴリズム(IRLS)が収束することを保証したカーネルクラスを提供する。
論文 参考訳(メタデータ) (2020-01-30T03:57:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。