論文の概要: Calculating the matrix profile from noisy data
- arxiv url: http://arxiv.org/abs/2306.10151v1
- Date: Fri, 16 Jun 2023 19:41:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-22 00:05:27.098441
- Title: Calculating the matrix profile from noisy data
- Title(参考訳): 雑音データから行列プロファイルを計算する
- Authors: Colin Hehir and Alan F. Smeaton
- Abstract要約: 行列プロファイル(英: matrix profile、MP)は、時系列から計算されたデータ構造であり、モチーフや不一致を見つけるのに必要なデータを符号化する。
従来の時系列データと同一データから生成したMPとの類似度をノイズデータを追加して測定する。
結果から,MP生成は少量のノイズに耐性があることが示唆されるが,ノイズの量が増えるとレジリエンスは消失する。
- 参考スコア(独自算出の注目度): 3.236217153362305
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The matrix profile (MP) is a data structure computed from a time series which
encodes the data required to locate motifs and discords, corresponding to
recurring patterns and outliers respectively. When the time series contains
noisy data then the conventional approach is to pre-filter it in order to
remove noise but this cannot apply in unsupervised settings where patterns and
outliers are not annotated. The resilience of the algorithm used to generate
the MP when faced with noisy data remains unknown. We measure the similarities
between the MP from original time series data with MPs generated from the same
data with noisy data added under a range of parameter settings including adding
duplicates and adding irrelevant data. We use three real world data sets drawn
from diverse domains for these experiments Based on dissimilarities between the
MPs, our results suggest that MP generation is resilient to a small amount of
noise being introduced into the data but as the amount of noise increases this
resilience disappears
- Abstract(参考訳): 行列プロファイル(英: matrix profile、MP)は、時系列から計算されたデータ構造であり、繰り返しパターンと外れ値に対応するモチーフと不一致を見つけるために必要なデータを符号化する。
時系列がノイズの多いデータを含む場合、従来の手法ではノイズを取り除くために事前フィルタリングを行うが、パターンや外れ値がアノテートされていない教師なしの設定では適用できない。
ノイズの多いデータに直面したMPを生成するアルゴリズムのレジリエンスは未だ不明である。
同一データから生成されたMPと同一データから生成されたMPとの類似度を、重複の追加や無関係データの追加を含むパラメータ設定の範囲で測定する。
我々は、これらの実験のために様々な領域から抽出された3つの実世界のデータセットを用いて、MP間の相違に基づき、MP生成は、データに少量のノイズがもたらされるのに対して、回復力があることを示唆する。
関連論文リスト
- Noise Variance Optimization in Differential Privacy: A Game-Theoretic Approach Through Per-Instance Differential Privacy [7.264378254137811]
差分プライバシー(DP)は、個人をターゲットデータセットに含めることによる分布の変化を観察することにより、プライバシー損失を測定することができる。
DPは、AppleやGoogleのような業界巨人の機械学習におけるデータセットの保護において際立っている。
本稿では,PDPを制約として提案し,各データインスタンスのプライバシ損失を測定し,個々のインスタンスに適したノイズを最適化する。
論文 参考訳(メタデータ) (2024-04-24T06:51:16Z) - SoftPatch: Unsupervised Anomaly Detection with Noisy Data [67.38948127630644]
本稿では,画像センサ異常検出におけるラベルレベルのノイズを初めて考察する。
本稿では,メモリベースの非教師付きAD手法であるSoftPatchを提案する。
既存の手法と比較して、SoftPatchは通常のデータの強力なモデリング能力を維持し、コアセットにおける過信問題を軽減する。
論文 参考訳(メタデータ) (2024-03-21T08:49:34Z) - Time Series Synthesis Using the Matrix Profile for Anonymization [32.22243483781984]
多くの研究者は、プライバシー規制や秘密のビジネス情報漏洩を恐れてデータを公開できない。
本稿では, 行列プロファイル (TSSUMP) を用いた時系列合成を提案する。
我々は,ECGとジェンダーマスキング予測のケーススタディにおいて,本手法を検証した。
論文 参考訳(メタデータ) (2023-11-05T04:27:24Z) - SEAM: Searching Transferable Mixed-Precision Quantization Policy through
Large Margin Regularization [50.04951511146338]
混合精度量子化(MPQ)は各層に対して最適なビット幅割り当てを求めるのに時間を要する。
本稿では,小規模なプロキシデータセットを用いて効率的なMPQポリシーを効率的に検索する手法を提案する。
論文 参考訳(メタデータ) (2023-02-14T05:47:45Z) - PMP: Privacy-Aware Matrix Profile against Sensitive Pattern Inference
for Time Series [12.855499575586753]
本稿では,長文パターンに対する悪質な推論の防止という,新たなプライバシ保護問題を提案する。
マトリックスプロファイル(MP)は具体的な形状の漏洩を防止できるが,MPインデックスの正準相関はなおも感度の高い長パターンの位置を明らかにすることができる。
局所相関を摂動し,MPインデックスベクトルの正準相関を破るPMP(Privacy-Aware Matrix Profile)を提案する。
論文 参考訳(メタデータ) (2023-01-04T22:11:38Z) - Randomized Quantization: A Generic Augmentation for Data Agnostic
Self-supervised Learning [89.00646449740606]
自己監督型表現学習は、データの一部を保持し、残りの部分から予測するようにネットワークに指示するパラダイムに従っている。
データ拡張は、情報ギャップを作るためのコアにあります。
本稿では,精度の冗長性を利用した汎用データ拡張のためのチャネル次元について検討する。
論文 参考訳(メタデータ) (2022-12-19T18:59:57Z) - Noise-Aware Statistical Inference with Differentially Private Synthetic
Data [0.0]
DP合成データをまるで本物であるかのように単純に分析することは、人口レベルの推定に有効でないことを示す。
本稿では,多重計算分野の合成データ解析技術と合成データ生成技術を組み合わせることで,この問題に対処する。
我々は,最大エントロピーの原理を用いたノイズ対応合成データ生成アルゴリズム NAPSU-MQ を開発した。
論文 参考訳(メタデータ) (2022-05-28T16:59:46Z) - Noise-Resistant Deep Metric Learning with Probabilistic Instance
Filtering [59.286567680389766]
ノイズラベルは現実世界のデータによく見られ、ディープニューラルネットワークの性能劣化を引き起こす。
DMLのための確率的ランク付けに基づくメモリを用いたインスタンス選択(PRISM)手法を提案する。
PRISMはラベルがクリーンである確率を計算し、潜在的にノイズの多いサンプルをフィルタリングする。
論文 参考訳(メタデータ) (2021-08-03T12:15:25Z) - Noise-resistant Deep Metric Learning with Ranking-based Instance
Selection [59.286567680389766]
PRISM(Probabilistic Ranking-based Instance Selection with Memory)と呼ばれるDMLの耐騒音トレーニング技術を提案する。
PRISMは、ニューラルネットワークの以前のバージョンから抽出された画像特徴との平均的類似性を用いて、ミニバッチ内のノイズデータを識別する。
メモリバンクが生み出す高い計算コストを緩和するために,個々のデータポイントをクラスセンタに置き換える高速化手法を提案する。
論文 参考訳(メタデータ) (2021-03-30T03:22:17Z) - Improving Face Recognition by Clustering Unlabeled Faces in the Wild [77.48677160252198]
極値理論に基づく新しいアイデンティティ分離法を提案する。
重なり合うラベルノイズによる問題を大幅に低減する。
制御された設定と実際の設定の両方の実験は、我々のメソッドの一貫性のある改善を示している。
論文 参考訳(メタデータ) (2020-07-14T12:26:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。