論文の概要: An efficient aggregation method for the symbolic representation of
temporal data
- arxiv url: http://arxiv.org/abs/2201.05697v1
- Date: Fri, 14 Jan 2022 22:51:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-22 19:08:00.759717
- Title: An efficient aggregation method for the symbolic representation of
temporal data
- Title(参考訳): 時間データの記号表現のための効率的な集約法
- Authors: Xinye Chen and Stefan G\"uttel
- Abstract要約: 本稿では,適応的ブラウン橋型アグリゲーション法 (ABBA) の新たな変種であるfABBAを提案する。
この変種は、時系列の断片表現に合わせた新しい集約アプローチを利用する。
従来の手法とは対照的に、新しいアプローチでは事前に指定する時系列シンボルの数を必要としない。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Symbolic representations are a useful tool for the dimension reduction of
temporal data, allowing for the efficient storage of and information retrieval
from time series. They can also enhance the training of machine learning
algorithms on time series data through noise reduction and reduced sensitivity
to hyperparameters. The adaptive Brownian bridge-based aggregation (ABBA)
method is one such effective and robust symbolic representation, demonstrated
to accurately capture important trends and shapes in time series. However, in
its current form the method struggles to process very large time series. Here
we present a new variant of the ABBA method, called fABBA. This variant
utilizes a new aggregation approach tailored to the piecewise representation of
time series. By replacing the k-means clustering used in ABBA with a
sorting-based aggregation technique, and thereby avoiding repeated
sum-of-squares error computations, the computational complexity is
significantly reduced. In contrast to the original method, the new approach
does not require the number of time series symbols to be specified in advance.
Through extensive tests we demonstrate that the new method significantly
outperforms ABBA with a considerable reduction in runtime while also
outperforming the popular SAX and 1d-SAX representations in terms of
reconstruction accuracy. We further demonstrate that fABBA can compress other
data types such as images.
- Abstract(参考訳): 記号表現は時間データの次元削減に有用なツールであり、時系列からの効率的な記憶と情報検索を可能にする。
また、ノイズ低減とハイパーパラメータへの感度の低減を通じて、時系列データによる機械学習アルゴリズムのトレーニングを強化することもできる。
適応的ブラウンブリッジベースアグリゲーション (ABBA) 法はそのような効果的で堅牢なシンボル表現であり、時系列における重要な傾向や形状を正確に捉えることを実証している。
しかし、現在の方法では、非常に大きな時系列を処理するのに苦労している。
ここでは、ABBA法の新しい変種であるfABBAを提案する。
この変種は、時系列の断片表現に合わせた新しい集約アプローチを利用する。
ABBAで使用されるk平均クラスタリングをソートベースアグリゲーション技術に置き換えることで、繰り返し発生する2乗誤差計算を避けることにより、計算複雑性を著しく低減する。
従来の手法とは対照的に、新しいアプローチでは事前に指定する時系列シンボルの数を必要としない。
大規模なテストにより,新しい手法はABBAよりも大幅に性能が向上し,SAXおよび1d-SAX表現の再現精度も優れていた。
さらに、fABBAが画像などの他のデータ型を圧縮できることを実証する。
関連論文リスト
- Quantized symbolic time series approximation [0.28675177318965045]
本稿では,新しい量子化に基づくABBA記号近似手法,QABBAを提案する。
QABBAは、元の速度とシンボル再構成の精度を維持しながら、ストレージ効率を向上させる。
時系列回帰のための大規模言語モデル(LLM)を用いたQABBAの応用についても述べる。
論文 参考訳(メタデータ) (2024-11-20T10:32:22Z) - An Efficient Algorithm for Clustered Multi-Task Compressive Sensing [60.70532293880842]
クラスタ化マルチタスク圧縮センシングは、複数の圧縮センシングタスクを解決する階層モデルである。
このモデルに対する既存の推論アルゴリズムは計算コストが高く、高次元ではうまくスケールしない。
本稿では,これらの共分散行列を明示的に計算する必要をなくし,モデル推論を大幅に高速化するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-09-30T15:57:14Z) - Decreasing the Computing Time of Bayesian Optimization using
Generalizable Memory Pruning [56.334116591082896]
本稿では,任意のサロゲートモデルと取得関数で使用可能なメモリプルーニングとバウンダリ最適化のラッパーを示す。
BOを高次元または大規模データセット上で実行することは、この時間の複雑さのために難解になる。
すべてのモデル実装はMIT Supercloudの最先端コンピューティングハードウェア上で実行される。
論文 参考訳(メタデータ) (2023-09-08T14:05:56Z) - HyperTime: Implicit Neural Representation for Time Series [131.57172578210256]
暗黙の神経表現(INR)は、データの正確で解像度に依存しないエンコーディングを提供する強力なツールとして最近登場した。
本稿では、INRを用いて時系列の表現を分析し、再構成精度とトレーニング収束速度の点で異なるアクティベーション関数を比較した。
本稿では,INRを利用して時系列データセット全体の圧縮潜在表現を学習するハイパーネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-08-11T14:05:51Z) - COSTI: a New Classifier for Sequences of Temporal Intervals [0.0]
時間間隔のシーケンスを直接操作する新しい分類法を開発した。
提案手法は高い精度を保ち、変換データの操作に接続する欠点を回避しつつ、より良い性能が得られる。
論文 参考訳(メタデータ) (2022-04-28T12:55:06Z) - High-Dimensional Sparse Bayesian Learning without Covariance Matrices [66.60078365202867]
共分散行列の明示的な構成を避ける新しい推論手法を提案する。
本手法では, 数値線形代数と共役勾配アルゴリズムの対角線推定結果とを結合する。
いくつかのシミュレーションにおいて,本手法は計算時間とメモリにおける既存手法よりも拡張性が高い。
論文 参考訳(メタデータ) (2022-02-25T16:35:26Z) - Elastic Product Quantization for Time Series [19.839572576189187]
本稿では,時間ゆらぎの時間系列の効率的な類似度に基づく比較に製品量子化を用いることを提案する。
提案手法は, 時系列アプリケーションにおける弾性測度を, 高効率(メモリ使用量と時間の両方)で置き換える手法として現れる。
論文 参考訳(メタデータ) (2022-01-04T09:23:06Z) - MrSQM: Fast Time Series Classification with Symbolic Representations [11.853438514668207]
MrSQMは複数のシンボル表現と効率的なシーケンスマイニングを使用して重要な時系列特徴を抽出する。
本研究は, 完全教師付きから非教師付き, ハイブリッドまで, 記号列の4つの特徴選択手法について検討する。
UEA/UCRベンチマークの112のデータセットに対する実験では、MrSQMがすぐに有用な特徴を抽出できることが示されている。
論文 参考訳(メタデータ) (2021-09-02T15:54:46Z) - SreaMRAK a Streaming Multi-Resolution Adaptive Kernel Algorithm [60.61943386819384]
既存のKRRの実装では、すべてのデータがメインメモリに格納される必要がある。
KRRのストリーミング版であるStreaMRAKを提案する。
本稿では,2つの合成問題と2重振り子の軌道予測について紹介する。
論文 参考訳(メタデータ) (2021-08-23T21:03:09Z) - Covariance-Free Sparse Bayesian Learning [62.24008859844098]
共分散行列の明示的な反転を回避する新しいSBL推論アルゴリズムを導入する。
私たちの手法は、既存のベースラインよりも数千倍も高速です。
我々は,SBLが高次元信号回復問題に難なく対処できる新しいアルゴリズムについて紹介する。
論文 参考訳(メタデータ) (2021-05-21T16:20:07Z) - ABBA: Adaptive Brownian bridge-based symbolic aggregation of time series [0.0]
ABBAと呼ばれる新しい時間の記号表現が導入される。
これは級数列への時系列の適応多角形連鎖近似に基づいている。
この表現の再構成誤差は、始点と終点をピン留めしたランダムウォークとしてモデル化できることを示す。
論文 参考訳(メタデータ) (2020-03-27T15:30:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。