論文の概要: Distribution Agnostic Symbolic Representations for Time Series
Dimensionality Reduction and Online Anomaly Detection
- arxiv url: http://arxiv.org/abs/2105.09592v1
- Date: Thu, 20 May 2021 08:35:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-21 13:24:20.794274
- Title: Distribution Agnostic Symbolic Representations for Time Series
Dimensionality Reduction and Online Anomaly Detection
- Title(参考訳): 時系列次元減少とオンライン異常検出のための分布非依存記号表現
- Authors: Konstantinos Bountrogiannis, George Tzagkarakis, Panagiotis Tsakalides
- Abstract要約: 本稿では,データ駆動型SAXに基づく2つのシンボル表現を提案する。
提案した表現は, 従来のSAX法の魅力を全て有している。
- 参考スコア(独自算出の注目度): 8.00114449574708
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Due to the importance of the lower bounding distances and the attractiveness
of symbolic representations, the family of symbolic aggregate approximations
(SAX) has been used extensively for encoding time series data. However, typical
SAX-based methods rely on two restrictive assumptions; the Gaussian
distribution and equiprobable symbols. This paper proposes two novel
data-driven SAX-based symbolic representations, distinguished by their
discretization steps. The first representation, oriented for general data
compaction and indexing scenarios, is based on the combination of kernel
density estimation and Lloyd-Max quantization to minimize the information loss
and mean squared error in the discretization step. The second method, oriented
for high-level mining tasks, employs the Mean-Shift clustering method and is
shown to enhance anomaly detection in the lower-dimensional space. Besides, we
verify on a theoretical basis a previously observed phenomenon of the intrinsic
process that results in a lower than the expected variance of the intermediate
piecewise aggregate approximation. This phenomenon causes an additional
information loss but can be avoided with a simple modification. The proposed
representations possess all the attractive properties of the conventional SAX
method. Furthermore, experimental evaluation on real-world datasets
demonstrates their superiority compared to the traditional SAX and an
alternative data-driven SAX variant.
- Abstract(参考訳): 低境界距離の重要性と記号表現の魅力のため、記号集合近似(SAX)の族は時系列データの符号化に広く用いられている。
しかし、SAXベースの典型的な手法は、ガウス分布と等確率記号の2つの制限的な仮定に依存している。
本稿では,データ駆動型SAXに基づく2つのシンボル表現を提案する。
一般データ圧縮とインデックス化のシナリオを指向した最初の表現は、カーネル密度推定とロイド-マックス量子化の組み合わせに基づいて、情報損失と離散化ステップにおける平均二乗誤差を最小化する。
第2の方法は,高レベルマイニングタスクを指向し,平均シフトクラスタリング法を採用し,低次元空間における異常検出を強化する。
さらに, 従来観測されていた内在過程の現象を理論的に検証し, 中間集合体近似の期待分散よりも低い値となることを検証した。
この現象は付加的な情報損失を引き起こすが、簡単な修正で避けることができる。
提案した表現は,従来のSAX手法の魅力を全て有している。
さらに、実世界のデータセットに対する実験的な評価は、従来のSAXと代替データ駆動型SAXと比較して優位性を示す。
関連論文リスト
- Distributed Markov Chain Monte Carlo Sampling based on the Alternating
Direction Method of Multipliers [143.6249073384419]
本論文では,乗算器の交互方向法に基づく分散サンプリング手法を提案する。
我々は,アルゴリズムの収束に関する理論的保証と,その最先端性に関する実験的証拠の両方を提供する。
シミュレーションでは,線形回帰タスクとロジスティック回帰タスクにアルゴリズムを配置し,その高速収束を既存の勾配法と比較した。
論文 参考訳(メタデータ) (2024-01-29T02:08:40Z) - Anomaly Detection Under Uncertainty Using Distributionally Robust
Optimization Approach [0.9217021281095907]
異常検出は、大多数のパターンに従わないデータポイントを見つける問題として定義される。
1クラスのサポートベクトルマシン(SVM)メソッドは、通常のデータポイントと異常を区別するための決定境界を見つけることを目的としている。
誤分類の確率が低い分布的に頑健な確率制約モデルを提案する。
論文 参考訳(メタデータ) (2023-12-03T06:13:22Z) - Fast Estimation of Bayesian State Space Models Using Amortized
Simulation-Based Inference [0.0]
本稿では,ベイズ状態空間モデルの隠れ状態を推定するための高速アルゴリズムを提案する。
事前トレーニングの後、データセットの後方分布を見つけるには、100分の1秒から10分の1秒かかる。
論文 参考訳(メタデータ) (2022-10-13T16:37:05Z) - Federated Representation Learning via Maximal Coding Rate Reduction [109.26332878050374]
本稿では,複数のクライアントに分散したデータセットから低次元表現を学習する手法を提案する。
提案手法はFLOWと呼ばれ, MCR2を選択の対象とし, その結果, クラス間判別とクラス内圧縮の両方が可能な表現が得られた。
論文 参考訳(メタデータ) (2022-10-01T15:43:51Z) - Interpolation-based Correlation Reduction Network for Semi-Supervised
Graph Learning [49.94816548023729]
補間型相関低減ネットワーク(ICRN)と呼ばれる新しいグラフコントラスト学習手法を提案する。
提案手法では,決定境界のマージンを大きくすることで,潜在特徴の識別能力を向上させる。
この2つの設定を組み合わせることで、豊富なラベル付きノードと稀に価値あるラベル付きノードから豊富な監視情報を抽出し、離散表現学習を行う。
論文 参考訳(メタデータ) (2022-06-06T14:26:34Z) - Hyperspectral Image Denoising Using Non-convex Local Low-rank and Sparse
Separation with Spatial-Spectral Total Variation Regularization [49.55649406434796]
本研究では,HSI復調のためのロバストな主成分分析のための新しい非特異なアプローチを提案する。
我々は、ランクとスパースコンポーネントの両方に対する正確な近似を開発する。
シミュレーションと実HSIの両方の実験により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2022-01-08T11:48:46Z) - Riemannian classification of EEG signals with missing values [67.90148548467762]
本稿では脳波の分類に欠落したデータを扱うための2つの方法を提案する。
第1のアプローチでは、インプットされたデータと$k$-nearestの隣人アルゴリズムとの共分散を推定し、第2のアプローチでは、期待最大化アルゴリズム内で観測データの可能性を活用することにより、観測データに依存する。
その結果, 提案手法は観測データに基づく分類よりも優れており, 欠落したデータ比が増大しても高い精度を維持することができることがわかった。
論文 参考訳(メタデータ) (2021-10-19T14:24:50Z) - Manifold learning-based polynomial chaos expansions for high-dimensional
surrogate models [0.0]
システム記述における不確実性定量化(UQ)のための多様体学習に基づく手法を提案する。
提案手法は高精度な近似を達成でき、UQタスクの大幅な高速化につながる。
論文 参考訳(メタデータ) (2021-07-21T00:24:15Z) - Hierarchical regularization networks for sparsification based learning
on noisy datasets [0.0]
階層は、連続的により微細なスケールで特定される近似空間から従う。
各スケールでのモデル一般化を促進するため,複数次元にわたる新規な射影型ペナルティ演算子も導入する。
その結果、合成データセットと実データセットの両方において、データ削減およびモデリング戦略としてのアプローチの性能が示された。
論文 参考訳(メタデータ) (2020-06-09T18:32:24Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。