論文の概要: Anomaly detection on streamed data
- arxiv url: http://arxiv.org/abs/2006.03487v1
- Date: Fri, 5 Jun 2020 14:42:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-25 03:00:48.700944
- Title: Anomaly detection on streamed data
- Title(参考訳): ストリームデータによる異常検出
- Authors: Thomas Cochrane and Peter Foster and Terry Lyons and Imanol Perez
Arribas
- Abstract要約: 正常な観察のコーパスに対して異常な観察を識別するための、強力だが簡単な手法を導入する。
我々のアプローチはコーパスの選択と特徴写像に依存するが、写像のアフィン変換には不変である。
複数のデータセットに対して評価することで,本手法の適用性と有効性を示す。
- 参考スコア(独自算出の注目度): 0.688204255655161
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce powerful but simple methodology for identifying anomalous
observations against a corpus of `normal' observations. All data are observed
through a vector-valued feature map. Our approach depends on the choice of
corpus and that feature map but is invariant to affine transformations of the
map and has no other external dependencies, such as choices of metric; we call
it conformance. Applying this method to (signatures) of time series and other
types of streamed data we provide an effective methodology of broad
applicability for identifying anomalous complex multimodal sequential data. We
demonstrate the applicability and effectiveness of our method by evaluating it
against multiple data sets. Based on quantifying performance using the receiver
operating characteristic (ROC) area under the curve (AUC), our method yields an
AUC score of 98.9\% for the PenDigits data set; in a subsequent experiment
involving marine vessel traffic data our approach yields an AUC score of
89.1\%. Based on comparison involving univariate time series from the UEA \&
UCR time series repository with performance quantified using balanced accuracy
and assuming an optimal operating point, our approach outperforms a
state-of-the-art shapelet method for 19 out of 28 data sets.
- Abstract(参考訳): 我々は,「正常」観測のコーパスに対して異常観測を識別するための,強力だが簡単な手法を導入する。
すべてのデータはベクトル値特徴マップを通して観測される。
我々のアプローチはコーパスの選択と特徴写像に依存するが、地図のアフィン変換には不変であり、計量の選択のような外部依存は存在しない。
この手法を時系列や他のストリームデータの種類に応用することにより、異常な複雑なマルチモーダルシーケンシャルデータを特定するための幅広い適用可能性の効果的な方法論を提供する。
複数のデータセットに対して評価することで,本手法の適用性と有効性を示す。
提案手法は, 曲線(AUC)下での受信機動作特性(ROC)の定量化性能に基づいて, ペンディジットデータセットのAUCスコア98.9\%を出力し, その後の海洋船舶交通データを含む実験では, AUCスコア89.1\%を出力する。
uea \& ucr時系列リポジトリからの不定時系列と、バランスのとれた精度で定量化され、最適な操作ポイントを仮定したパフォーマンスの比較に基づいて、28のデータセットのうち19のシェープレット法を上回った。
関連論文リスト
- Multi-Source and Test-Time Domain Adaptation on Multivariate Signals using Spatio-Temporal Monge Alignment [59.75420353684495]
コンピュータビジョンやバイオメディカルデータなどの信号に対する機械学習の応用は、ハードウェアデバイスやセッション記録にまたがる変動のため、しばしば課題に直面している。
本研究では,これらの変動を緩和するために,時空間モンジュアライメント(STMA)を提案する。
我々はSTMAが、非常に異なる設定で取得したデータセット間で、顕著で一貫したパフォーマンス向上をもたらすことを示す。
論文 参考訳(メタデータ) (2024-07-19T13:33:38Z) - Gappy local conformal auto-encoders for heterogeneous data fusion: in
praise of rigidity [6.1152340690876095]
本稿では,このタスクのためのマルチオートエンコーダニューラルネットワークアーキテクチャの形で,エンドツーエンドの計算パイプラインを提案する。
パイプラインへの入力はいくつかの部分的な観測の集合であり、その結果は全世界的に一貫した潜在空間となり、すべての測定を調和させる(剛性化、融合)。
簡単な2次元データセットから始まり、Wi-Fiのローカライゼーション問題へと進む。
論文 参考訳(メタデータ) (2023-12-20T16:18:51Z) - Low-rank extended Kalman filtering for online learning of neural
networks from streaming data [71.97861600347959]
非定常データストリームから非線形関数のパラメータを推定するための効率的なオンライン近似ベイズ推定アルゴリズムを提案する。
この方法は拡張カルマンフィルタ (EKF) に基づいているが、新しい低ランク+斜角行列分解法を用いている。
変分推論に基づく手法とは対照的に,本手法は完全に決定論的であり,ステップサイズチューニングを必要としない。
論文 参考訳(メタデータ) (2023-05-31T03:48:49Z) - Multi-Fidelity Covariance Estimation in the Log-Euclidean Geometry [0.0]
対称正定値多様体の対数ユークリッド幾何学を利用する共分散行列の多値推定器を導入する。
固定予算が与えられた推定器の平均二乗誤差を最小化する最適サンプル割り当て方式を開発した。
物理アプリケーションからのデータによるアプローチの評価は、ベンチマークと比較すると、より正確なメトリック学習と1桁以上のスピードアップを示している。
論文 参考訳(メタデータ) (2023-01-31T16:33:46Z) - Convolutional Filtering on Sampled Manifolds [122.06927400759021]
サンプル多様体上の畳み込みフィルタリングは連続多様体フィルタリングに収束することを示す。
本研究は,ナビゲーション制御の問題点を実証的に明らかにした。
論文 参考訳(メタデータ) (2022-11-20T19:09:50Z) - Real-time Anomaly Detection for Multivariate Data Streams [0.0]
本稿では,PEWMA(Probabilistic Exponentially Weighted Average)に基づくデータストリームに対するリアルタイム多変量異常検出アルゴリズムを提案する。
我々の定式化は、データの(突然の過渡的、急激な分布的、段階的な分布的な)シフトに対して弾力性がある。
提案する異常検出アルゴリズムは,ラベル付きサンプルを不要にすることなく,教師なしで動作する。
論文 参考訳(メタデータ) (2022-09-26T03:40:37Z) - Improving Diffusion Models for Inverse Problems using Manifold Constraints [55.91148172752894]
我々は,現在の解法がデータ多様体からサンプルパスを逸脱し,エラーが蓄積することを示す。
この問題に対処するため、多様体の制約に着想を得た追加の補正項を提案する。
本手法は理論上も経験上も従来の方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-06-02T09:06:10Z) - Efficient CDF Approximations for Normalizing Flows [64.60846767084877]
正規化フローの微分同相性に基づいて、閉領域上の累積分布関数(CDF)を推定する。
一般的なフローアーキテクチャとUCIデータセットに関する実験は,従来の推定器と比較して,サンプル効率が著しく向上したことを示している。
論文 参考訳(メタデータ) (2022-02-23T06:11:49Z) - Machine Learning and Variational Algorithms for Lattice Field Theory [1.198562319289569]
格子量子場論の研究において、格子理論を定義するパラメータは連続体物理学にアクセスする臨界性に向けて調整されなければならない。
経路積分の領域に適用される輪郭変形に基づいてモンテカルロ推定器を「変形」する手法を提案する。
我々は,フローベースMCMCが臨界減速を緩和し,オブザーシフォールドが原理的応用のばらつきを指数関数的に低減できることを実証した。
論文 参考訳(メタデータ) (2021-06-03T16:37:05Z) - Semi-orthogonal Embedding for Efficient Unsupervised Anomaly
Segmentation [6.135577623169028]
我々は,ロバスト近似のための半直交埋め込みに,ランダムな特徴選択というアドホックな手法を一般化する。
アブレーション研究の精査により,提案手法はMVTec AD, KolektorSDD, KolektorSDD2, mSTCデータセットに対して,新たな最先端技術を実現する。
論文 参考訳(メタデータ) (2021-05-31T07:02:20Z) - Benign Overfitting of Constant-Stepsize SGD for Linear Regression [122.70478935214128]
帰納バイアスは 経験的に過剰フィットを防げる中心的存在です
この研究は、この問題を最も基本的な設定として考慮している: 線形回帰に対する定数ステップサイズ SGD。
我々は、(正規化されていない)SGDで得られるアルゴリズム正則化と、通常の最小二乗よりも多くの顕著な違いを反映する。
論文 参考訳(メタデータ) (2021-03-23T17:15:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。