論文の概要: Time Series Synthesis Using the Matrix Profile for Anonymization
- arxiv url: http://arxiv.org/abs/2311.02563v1
- Date: Sun, 5 Nov 2023 04:27:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-07 16:50:30.273091
- Title: Time Series Synthesis Using the Matrix Profile for Anonymization
- Title(参考訳): 匿名化のための行列プロファイルを用いた時系列合成
- Authors: Audrey Der, Chin-Chia Michael Yeh, Yan Zheng, Junpeng Wang, Huiyuan
Chen, Zhongfang Zhuang, Liang Wang, Wei Zhang, Eamonn Keogh
- Abstract要約: 多くの研究者は、プライバシー規制や秘密のビジネス情報漏洩を恐れてデータを公開できない。
本稿では, 行列プロファイル (TSSUMP) を用いた時系列合成を提案する。
我々は,ECGとジェンダーマスキング予測のケーススタディにおいて,本手法を検証した。
- 参考スコア(独自算出の注目度): 32.22243483781984
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Publishing and sharing data is crucial for the data mining community,
allowing collaboration and driving open innovation. However, many researchers
cannot release their data due to privacy regulations or fear of leaking
confidential business information. To alleviate such issues, we propose the
Time Series Synthesis Using the Matrix Profile (TSSUMP) method, where
synthesized time series can be released in lieu of the original data. The
TSSUMP method synthesizes time series by preserving similarity join information
(i.e., Matrix Profile) while reducing the correlation between the synthesized
and the original time series. As a result, neither the values for the
individual time steps nor the local patterns (or shapes) from the original data
can be recovered, yet the resulting data can be used for downstream tasks that
data analysts are interested in. We concentrate on similarity joins because
they are one of the most widely applied time series data mining routines across
different data mining tasks. We test our method on a case study of ECG and
gender masking prediction. In this case study, the gender information is not
only removed from the synthesized time series, but the synthesized time series
also preserves enough information from the original time series. As a result,
unmodified data mining tools can obtain near-identical performance on the
synthesized time series as on the original time series.
- Abstract(参考訳): データマイニングコミュニティにとってデータの公開と共有は不可欠であり、コラボレーションとオープンイノベーションの推進を可能にする。
しかし、多くの研究者はプライバシー規制や秘密のビジネス情報漏洩を恐れてデータを公開できない。
このような問題を緩和するために,行列プロファイル(TSSUMP)法を用いた時系列合成を提案する。
TSSUMP法は、類似結合情報(行列プロファイル)を保存することにより時系列を合成し、合成された時系列と元の時系列との相関を小さくする。
結果として、個々のタイムステップの値も、元のデータからのローカルパターン(または形状)も回収できないが、結果として得られたデータは、データアナリストが興味を持っている下流タスクに使用できる。
類似性結合は、様々なデータマイニングタスクにまたがる最も広く適用されている時系列データマイニングルーチンの1つである。
我々は,ECGとジェンダーマスキング予測のケーススタディにおいて,本手法を検証した。
このケーススタディでは、性別情報は合成された時系列から削除されるだけでなく、合成された時系列は元の時系列から十分な情報を保存する。
その結果、修正されていないデータマイニングツールは、元の時系列と同様に合成された時系列でほぼ同一の性能を得ることができる。
関連論文リスト
- Towards Foundation Time Series Model: To Synthesize Or Not To
Synthesize? [2.8707270250981094]
本論では,合成データに基づく基礎モデルの学習に有利であるか,限られた実例のみを利用する方がよいか,という課題について考察する。
本実験は,通常の時系列のみを対象として実施し,実時間時系列のみを活用することを優先して述べる。
論文 参考訳(メタデータ) (2024-03-04T23:03:17Z) - TimeSiam: A Pre-Training Framework for Siamese Time-Series Modeling [67.02157180089573]
時系列事前トレーニングは、最近、ラベルのコストを削減し、下流の様々なタスクに利益をもたらす可能性があるとして、広く注目を集めている。
本稿では,シームズネットワークに基づく時系列の簡易かつ効果的な自己教師型事前学習フレームワークとしてTimeSiamを提案する。
論文 参考訳(メタデータ) (2024-02-04T13:10:51Z) - Graph Spatiotemporal Process for Multivariate Time Series Anomaly
Detection with Missing Values [67.76168547245237]
本稿では,グラフ時間過程と異常スコアラを用いて異常を検出するGST-Proという新しいフレームワークを提案する。
実験結果から,GST-Pro法は時系列データ中の異常を効果的に検出し,最先端の手法より優れていることがわかった。
論文 参考訳(メタデータ) (2024-01-11T10:10:16Z) - Continual Release of Differentially Private Synthetic Data from Longitudinal Data Collections [19.148874215745135]
本研究では,縦方向のデータ収集から微分プライベートな合成データを連続的に放出する問題について検討する。
各ステップごとに、各ステップが新しいデータ要素をレポートするモデルを導入します。
本稿では,2種類のクエリを連続的に保存する合成データ生成アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-06-13T16:22:08Z) - TSGM: A Flexible Framework for Generative Modeling of Synthetic Time Series [61.436361263605114]
時系列データは、研究者と産業組織間のデータの共有を妨げるため、しばしば不足または非常に敏感である。
本稿では,合成時系列の生成モデリングのためのオープンソースフレームワークである時系列生成モデリング(TSGM)を紹介する。
論文 参考訳(メタデータ) (2023-05-19T10:11:21Z) - Synthcity: facilitating innovative use cases of synthetic data in
different data modalities [86.52703093858631]
Synthcityは、MLフェアネス、プライバシ、拡張における合成データの革新的なユースケースのための、オープンソースのソフトウェアパッケージである。
Synthcityは、実践者に対して、合成データにおける最先端の研究とツールへの単一のアクセスポイントを提供する。
論文 参考訳(メタデータ) (2023-01-18T14:49:54Z) - HyperTime: Implicit Neural Representation for Time Series [131.57172578210256]
暗黙の神経表現(INR)は、データの正確で解像度に依存しないエンコーディングを提供する強力なツールとして最近登場した。
本稿では、INRを用いて時系列の表現を分析し、再構成精度とトレーニング収束速度の点で異なるアクティベーション関数を比較した。
本稿では,INRを利用して時系列データセット全体の圧縮潜在表現を学習するハイパーネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-08-11T14:05:51Z) - Deep Time Series Models for Scarce Data [8.673181404172963]
時系列データは多くの領域で爆発的な速度で成長し、時系列モデリング研究の急増を刺激している。
データ希少性は、膨大なデータ分析の問題で発生する普遍的な問題です。
論文 参考訳(メタデータ) (2021-03-16T22:16:54Z) - Learning summary features of time series for likelihood free inference [93.08098361687722]
時系列データから要約機能を自動的に学習するためのデータ駆動型戦略を提案する。
以上の結果から,データから要約的特徴を学習することで,手作りの値に基づいてLFI手法よりも優れる可能性が示唆された。
論文 参考訳(メタデータ) (2020-12-04T19:21:37Z) - Time Series Data Imputation: A Survey on Deep Learning Approaches [4.4458738910060775]
時系列データ計算は、様々なカテゴリのメソッドでよく研究されている問題である。
ディープラーニングに基づく時系列手法は、RNNのようなモデルの使用によって進歩している。
我々は,それらのモデルアーキテクチャ,その長所,短所,短所,および時系列計算手法の開発を示す効果をレビューし,議論する。
論文 参考訳(メタデータ) (2020-11-23T11:57:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。