論文の概要: Motiflets -- Simple and Accurate Detection of Motifs in Time Series
- arxiv url: http://arxiv.org/abs/2206.03735v2
- Date: Tue, 16 Apr 2024 20:38:33 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-18 20:09:36.149306
- Title: Motiflets -- Simple and Accurate Detection of Motifs in Time Series
- Title(参考訳): Motiflets -- 時系列におけるMotifの簡易かつ正確な検出
- Authors: Patrick Schäfer, Ulf Leser,
- Abstract要約: 時系列のモチーフは直感的に、より大きな時系列の中でほぼ同じことを繰り返す短い時系列である。
モチーフ発見(MD)は、与えられた入力系列においてそのようなモチーフを見つけるタスクである。
そこで我々は,k-Motifletの正確な近似アルゴリズムを提案し,その複雑性を解析する。
- 参考スコア(独自算出の注目度): 3.6463708995502273
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A time series motif intuitively is a short time series that repeats itself approximately the same within a larger time series. Such motifs often represent concealed structures, such as heart beats in an ECG recording, the riff in a pop song, or sleep spindles in EEG sleep data. Motif discovery (MD) is the task of finding such motifs in a given input series. As there are varying definitions of what exactly a motif is, a number of different algorithms exist. As central parameters they all take the length l of the motif and the maximal distance r between the motif's occurrences. In practice, however, especially suitable values for r are very hard to determine upfront, and found motifs show a high variability even for very similar r values. Accordingly, finding an interesting motif requires extensive trial-and-error. In this paper, we present a different approach to the MD problem. We define k-Motiflets as the set of exactly k occurrences of a motif of length l, whose maximum pairwise distance is minimal. This turns the MD problem upside-down: The central parameter of our approach is not the distance threshold r, but the desired number of occurrence k of the motif, which we show is considerably more intuitive and easier to set. Based on this definition, we present exact and approximate algorithms for finding k-Motiflets and analyze their complexity. To further ease the use of our method, we describe statistical tools to automatically determine meaningful values for its input parameters. By evaluation on several real-world data sets and comparison to four SotA MD algorithms, we show that our proposed algorithm is both quantitatively superior to its competitors, finding larger motif sets at higher similarity, and qualitatively better, leading to clearer and easier to interpret motifs without any need for manual tuning.
- Abstract(参考訳): 時系列のモチーフは直感的に、より大きな時系列の中でほぼ同じことを繰り返す短い時系列である。
このようなモチーフは、心電図記録の心拍数、ポップソングのリフ、脳波睡眠データのスリープスピンドルなどの隠された構造を表すことが多い。
モチーフ発見(MD)は、与えられた入力系列においてそのようなモチーフを見つけるタスクである。
モチーフが何であるかには様々な定義があるため、多くの異なるアルゴリズムが存在する。
中心的なパラメータとして、それらはすべてモチーフの長さ l とモチーフの発生の間の最大距離 r を取る。
しかし、実際には、特に r に対する適切な値は事前決定が非常に困難であり、非常に類似した r 値であっても、モチーフは高い可変性を示す。
したがって、興味深いモチーフを見つけるには、広範な試行錯誤が必要となる。
本稿では,MD問題に対して異なるアプローチを示す。
k-モティフレットを、最大対距離が最小となる長さ l のモチーフの正確な k 発生の集合として定義する。
我々のアプローチの中心パラメータは距離しきい値 r ではなく、モチーフの所望数 k であり、より直感的で設定が容易である。
この定義に基づき、k-Motiflet の正確な近似アルゴリズムを示し、それらの複雑性を解析する。
提案手法をより簡単にするために,入力パラメータの有意な値を自動的に決定する統計ツールについて述べる。
実世界の複数のデータセットの評価と4つのSotA MDアルゴリズムとの比較により、提案アルゴリズムは競合アルゴリズムよりも定量的に優れていることを示し、高い類似度でより大きなモチーフセットを見つけ、質的に優れていることを示し、手動チューニングを必要とせず、より明確で容易にモチーフを解釈できることを示した。
関連論文リスト
- Discovering Leitmotifs in Multidimensional Time Series [3.6463708995502273]
本稿では,MDTSのための新しい,効率的かつ高効率なリートモチーフ探索アルゴリズムLAMAを提案する。
LAMAは2つの中核主成分に依存している: (a) リートモチーフは、まだ未知の数のサブディメンジョンしか与えられていない ― 少なすぎる、あるいは多すぎる、そして (b) サブディメンジョンの集合は、見つかった最良のパターンから独立していない。
論文 参考訳(メタデータ) (2024-10-16T06:50:45Z) - Representation Learning for Frequent Subgraph Mining [64.32430554934021]
Subgraph Pattern Miner (SPMiner) は、大きなターゲットグラフに頻繁なサブグラフを見つけるための新しいニューラルネットワークである。
5ノードと6ノードのモチーフでは、SPMinerは正確な列挙法よりも100倍速く、最も頻繁なモチーフをほぼ完全に識別できる。
SPMinerは、10ノードの頻繁なモチーフを確実に特定できる。
論文 参考訳(メタデータ) (2024-02-22T08:11:22Z) - LoCoMotif: Discovering time-warped motifs in time series [7.265353600305124]
時系列モチーフディスカバリ(英: Time Series Motif Discovery、TSMD)とは、時系列で何回も発生するパターンを識別するタスクである。
既存のTSMDの手法には以下の制限がある。
制限のないLoCoMotifという新しい方法を提案する。
論文 参考訳(メタデータ) (2023-11-29T12:18:46Z) - Complexity-Based Prompting for Multi-Step Reasoning [72.0057198610614]
大規模言語モデルに対して,多段階推論を行うための課題について検討する。
中心的な疑問は、どの推論例が最も効果的なプロンプトを作るかである。
多段階推論のためのシンプルで効果的な例選択方式である複雑性ベースのプロンプトを提案する。
論文 参考訳(メタデータ) (2022-10-03T05:33:27Z) - Multi-scale Anomaly Detection for Big Time Series of Industrial Sensors [50.6434162489902]
そこで本研究では,自然にスムーズな時系列を復号・符号化する手法であるMissGANを提案する。
MissGANはラベルを必要としないし、通常のインスタンスのラベルだけを必要とするので、広く適用できます。
論文 参考訳(メタデータ) (2022-04-18T04:34:15Z) - OPP-Miner: Order-preserving sequential pattern mining [26.997138010841347]
本稿では時系列データの順序関係に基づいてパターンを表現した順序保存シーケンシャルパターン(OPP)マイニング手法を提案する。
実験により、OPP-Minerは効率的でスケーラブルであるだけでなく、時系列で類似したサブシーケンスを発見できることが示された。
論文 参考訳(メタデータ) (2022-01-09T11:06:26Z) - odeN: Simultaneous Approximation of Multiple Motif Counts in Large
Temporal Networks [7.025709586759655]
時間的モチーフを研究する際の主な合併症の1つは、構築できる多くのモチーフである。
そこで我々は,すべてのモチーフを正確に近似したサンプリングベースアルゴリズムodeNを提案する。
論文 参考訳(メタデータ) (2021-08-19T15:06:05Z) - Determinantal Beam Search [75.84501052642361]
ビームサーチは、ニューラルシーケンスモデルをデコードするためのゴーツー戦略である。
複数のソリューションを要求するユースケースでは、多様あるいは代表的なセットがしばしば望まれる。
ビームサーチを一連の部分決定問題として繰り返し行うことにより、アルゴリズムを多種多様なサブセット選択プロセスに変換することができる。
論文 参考訳(メタデータ) (2021-06-14T13:01:46Z) - When Liebig's Barrel Meets Facial Landmark Detection: A Practical Model [87.25037167380522]
正確で、堅牢で、効率的で、一般化可能で、エンドツーエンドのトレーニングが可能なモデルを提案する。
精度を向上させるために,2つの軽量モジュールを提案する。
DQInitは、インプットからデコーダのクエリを動的に初期化し、複数のデコーダ層を持つものと同じ精度でモデルを実現する。
QAMemは、共有するクエリではなく、それぞれのクエリに別々のメモリ値を割り当てることで、低解像度のフィーチャーマップ上のクエリの識別能力を高めるように設計されている。
論文 参考訳(メタデータ) (2021-05-27T13:51:42Z) - Finding Geometric Models by Clustering in the Consensus Space [61.65661010039768]
本稿では,未知数の幾何学的モデル,例えばホモグラフィーを求めるアルゴリズムを提案する。
複数の幾何モデルを用いることで精度が向上するアプリケーションをいくつか提示する。
これには、複数の一般化されたホモグラフからのポーズ推定、高速移動物体の軌道推定が含まれる。
論文 参考訳(メタデータ) (2021-03-25T14:35:07Z) - Motif Difference Field: A Simple and Effective Image Representation of
Time Series for Classification [3.419406971620478]
モチーフベースの時系列クラスタリングは、時系列データの高階パターンや構造の発見に使用される。
時系列の画像表現に基づく畳み込みニューラルネットワーク(CNN)分類器にインスパイアされたモチーフ差分場(MDF)を提案する。
論文 参考訳(メタデータ) (2020-01-21T14:48:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。