論文の概要: RECol: Reconstruction Error Columns for Outlier Detection
- arxiv url: http://arxiv.org/abs/2102.02791v1
- Date: Thu, 4 Feb 2021 18:24:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-06 01:40:24.927771
- Title: RECol: Reconstruction Error Columns for Outlier Detection
- Title(参考訳): RECol: 異常検出のための再構築エラー列
- Authors: J\"orn Hees, Dayananda Herurkar, Mario Meier
- Abstract要約: 我々はREColという汎用データ前処理手法を導入し、アウト・アウト・ファッションで追加のカラムを生成する。
各列に対して、他の列に基づいてその値を予測し、再構成エラー列を生成する。
生成した再構成誤り特徴空間は一般に一般的な外れ値検出法をサポートし,ROC-AUC値とPR-AUC値を大幅に改善することを示す。
- 参考スコア(独自算出の注目度): 3.539745817331099
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Detecting outliers or anomalies is a common data analysis task. As a
sub-field of unsupervised machine learning, a large variety of approaches
exist, but the vast majority treats the input features as independent and often
fails to recognize even simple (linear) relationships in the input feature
space. Hence, we introduce RECol, a generic data pre-processing approach to
generate additional columns in a leave-one-out-fashion: For each column, we try
to predict its values based on the other columns, generating reconstruction
error columns. We run experiments across a large variety of common baseline
approaches and benchmark datasets with and without our RECol pre-processing
method and show that the generated reconstruction error feature space generally
seems to support common outlier detection methods and often considerably
improves their ROC-AUC and PR-AUC values.
- Abstract(参考訳): 異常や異常を検出することは、一般的なデータ分析タスクです。
教師なし機械学習のサブフィールドとして、様々なアプローチが存在するが、大多数は入力特徴を独立したものとして扱い、入力特徴空間における単純な(線形な)関係を認識できないことが多い。
したがって、REColは一般的なデータ前処理手法で、残余のファッションで追加の列を生成する: 各列に対して、他の列に基づいてその値を予測し、再構成エラー列を生成する。
REColプリプロセッシングメソッドの有無にかかわらず、さまざまな共通ベースラインアプローチとベンチマークデータセットで実験を行い、生成された再構築エラー機能空間が一般的に一般的な異常検出方法をサポートし、ROC-AUCおよびPR-AUC値を大幅に改善することを示しています。
関連論文リスト
- Spot The Odd One Out: Regularized Complete Cycle Consistent Anomaly
Detector GAN [4.929399529593514]
本研究では,GAN(Generative Adversarial Neural Network)のパワーを活用した,現実の応用における異常検出のための逆方向検出手法を提案する。
従来の手法は、あらゆる種類の異常に適用できないような、クラス単位での精度のばらつきに悩まされていた。
RCALADという手法は,この構造に新たな識別器を導入し,より効率的な学習プロセスを実現することで,この問題を解決しようとするものである。
論文 参考訳(メタデータ) (2023-04-16T13:05:39Z) - Diversity-Measurable Anomaly Detection [106.07413438216416]
本稿では,再構成の多様性を高めるため,DMAD(Diversity-Measurable Anomaly Detection)フレームワークを提案する。
PDMは基本的に、変形を埋め込みから分離し、最終的な異常スコアをより信頼性を高める。
論文 参考訳(メタデータ) (2023-03-09T05:52:42Z) - CNTS: Cooperative Network for Time Series [7.356583983200323]
本稿では,協調ネットワーク時系列法(Cooperative Network Time Series approach)と呼ばれる,教師なし異常検出のための新しい手法を提案する。
CNTSの中心的な側面は多目的最適化の問題であり、協調的な解法戦略によって解決される。
実世界の3つのデータセットの実験は、CNTSの最先端性能を示し、検出器と再構成器の協調的有効性を確認する。
論文 参考訳(メタデータ) (2023-02-20T06:55:10Z) - AER: Auto-Encoder with Regression for Time Series Anomaly Detection [12.418290128163882]
時系列データの異常検出は、様々な産業領域でますます一般的になっている。
最近の教師なし機械学習手法は、この問題に対処する上で顕著な進歩を遂げている。
本稿では,バニラオートエンコーダとLSTM回帰器を組み合わせたジョイントモデルであるAER(Auto-encoder with Regression)を提案する。
論文 参考訳(メタデータ) (2022-12-27T17:22:21Z) - Causality-Based Multivariate Time Series Anomaly Detection [63.799474860969156]
我々は、因果的観点から異常検出問題を定式化し、多変量データを生成するための通常の因果的メカニズムに従わない事例として、異常を考察する。
次に、まずデータから因果構造を学習し、次に、あるインスタンスが局所因果機構に対して異常であるかどうかを推定する因果検出手法を提案する。
我々は、実世界のAIOpsアプリケーションに関するケーススタディと同様に、シミュレートされたデータセットとパブリックなデータセットの両方を用いて、私たちのアプローチを評価します。
論文 参考訳(メタデータ) (2022-06-30T06:00:13Z) - Distributionally Robust Multi-Output Regression Ranking [3.9318191265352196]
DRMRR(Distributedally Robust Multi-output Regression Ranking)と呼ばれるリストワイズ学習ランクモデルを導入する。
DRMRRは分散ロバスト最適化フレームワークを使用して、経験的データ分布の近傍で最も有害な分布の下でのマルチ出力損失関数を最小化する。
本実験は,医用文書検索と薬物反応予測の2つの実世界の応用について行った。
論文 参考訳(メタデータ) (2021-09-27T05:19:27Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - CASTLE: Regularization via Auxiliary Causal Graph Discovery [89.74800176981842]
因果構造学習(CASTLE)の正規化を導入し,変数間の因果関係を共同学習することでニューラルネットワークの正規化を提案する。
CASTLEは因果的隣り合いを持つ因果的DAGの特徴のみを効率的に再構成する一方、再構成ベース正規化器は全ての入力特徴を過度に再構成する。
論文 参考訳(メタデータ) (2020-09-28T09:49:38Z) - TadGAN: Time Series Anomaly Detection Using Generative Adversarial
Networks [73.01104041298031]
TadGANは、GAN(Generative Adversarial Networks)上に構築された教師なしの異常検出手法である。
時系列の時間相関を捉えるために,ジェネレータと批評家のベースモデルとしてLSTMリカレントニューラルネットワークを用いる。
提案手法の性能と一般化性を示すため,いくつかの異常スコアリング手法を検証し,最も適した手法を報告する。
論文 参考訳(メタデータ) (2020-09-16T15:52:04Z) - Unsupervised Anomaly Detection with Adversarial Mirrored AutoEncoders [51.691585766702744]
本稿では,識別器のミラー化ワッサースタイン損失を利用して,よりセマンティックレベルの再構築を行う逆自動エンコーダの変種を提案する。
我々は,再建基準の代替として,異常スコアの代替尺度を提案した。
提案手法は,OOD検出ベンチマークにおける異常検出の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-03-24T08:26:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。