論文の概要: TaSPM: Targeted Sequential Pattern Mining
- arxiv url: http://arxiv.org/abs/2202.13202v1
- Date: Sat, 26 Feb 2022 17:49:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-01 17:19:25.208896
- Title: TaSPM: Targeted Sequential Pattern Mining
- Title(参考訳): TaSPM: ターゲットとしたシーケンスパターンマイニング
- Authors: Gengsen Huang, Wensheng Gan, and Philip S. Yu
- Abstract要約: 本稿では,高速CM-SPAMアルゴリズムに基づく汎用フレームワークTaSPMを提案する。
また,マイニングプロセスにおける無意味な操作を減らすために,いくつかのプルーニング戦略を提案する。
実験の結果,新たなターゲットマイニングアルゴリズムであるTaSPMは実行時間を短縮し,メモリ消費を低減できることがわかった。
- 参考スコア(独自算出の注目度): 53.234101208024335
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sequential pattern mining (SPM) is an important technique of pattern mining,
which has many applications in reality. Although many efficient sequential
pattern mining algorithms have been proposed, there are few studies can focus
on target sequences. Targeted querying sequential patterns can not only reduce
the number of sequences generated by SPM, but also improve the efficiency of
users in performing pattern analysis. The current algorithms available on
targeted sequence querying are based on specific scenarios and cannot be
generalized to other applications. In this paper, we formulate the problem of
targeted sequential pattern mining and propose a generic framework namely
TaSPM, based on the fast CM-SPAM algorithm. What's more, to improve the
efficiency of TaSPM on large-scale datasets and multiple-items-based sequence
datasets, we propose several pruning strategies to reduce meaningless
operations in mining processes. Totally four pruning strategies are designed in
TaSPM, and hence it can terminate unnecessary pattern extensions quickly and
achieve better performance. Finally, we conduct extensive experiments on
different datasets to compare the existing SPM algorithms with TaSPM.
Experiments show that the novel targeted mining algorithm TaSPM can achieve
faster running time and less memory consumption.
- Abstract(参考訳): 逐次パターンマイニング(SPM)はパターンマイニングの重要な手法であり、現実には多くの応用がある。
多くの効率的なシーケンシャルパターンマイニングアルゴリズムが提案されているが、ターゲットシーケンスにフォーカスできる研究はほとんどない。
シーケンシャルパターンをターゲットとしたクエリは、SPMによって生成されるシーケンス数を削減できるだけでなく、パターン解析を行う際のユーザの効率も向上する。
ターゲットとするシーケンスクエリで利用可能な現在のアルゴリズムは、特定のシナリオに基づいており、他のアプリケーションに一般化することはできない。
本稿では,ターゲットとする逐次パターンマイニングの問題を定式化し,高速CM-SPAMアルゴリズムに基づく汎用フレームワークTaSPMを提案する。
さらに,大規模データセットやマルチitemsベースのシーケンスデータセットにおけるtaspmの効率を向上させるために,マイニングプロセスにおける意味のない操作を減らすためのいくつかのプルーニング戦略を提案する。
トータル4つのプルーニング戦略はTaSPMで設計されており、不要なパターン拡張を迅速に終了させ、より良い性能を実現することができる。
最後に、既存のSPMアルゴリズムとTaSPMを比較するために、異なるデータセットに対する広範な実験を行う。
実験により,新しい目標マイニングアルゴリズム taspm が,実行時間の短縮とメモリ消費の低減を実現した。
関連論文リスト
- tSPM+; a high-performance algorithm for mining transitive sequential
patterns from clinical data [5.340674706271038]
本稿では,tSPMアルゴリズムの高性能な実装であるtSPM+アルゴリズムについて述べる。
tSPM+アルゴリズムは最大980倍の高速化と最大48倍のメモリ消費向上を実現している。
論文 参考訳(メタデータ) (2023-09-08T17:47:31Z) - HUSP-SP: Faster Utility Mining on Sequence Data [48.0426095077918]
高実用性シーケンシャルパターンマイニング (HUSPM) が重要視されている。
シークエンスプロジェクション(seqPro)と呼ばれるコンパクトな構造を設計し、シークエンスプロ構造(HUSP-SP)を用いた効率的なアルゴリズムを提案する。
HUSP-SPは, 実行時間, メモリ使用量, 検索空間のプルーニング効率, スケーラビリティにおいて, 最先端のアルゴリズムを著しく上回っている。
論文 参考訳(メタデータ) (2022-12-29T10:56:17Z) - Towards Correlated Sequential Rules [4.743965372344134]
高実用性シーケンシャルルールマイニング(HUSRM)は、結果のシーケンシャルパターンの発生を予測できる信頼度や確率を調査するために設計された。
HUSRMと呼ばれる既存のアルゴリズムは、生成されたシーケンシャルルール間の相関を無視しながら、すべての許容ルールを抽出することに制限されている。
本稿では,HUSRMに相関の概念を統合するために,CoUSR(Cocorlation High-utility Sequence Rule Minr)と呼ばれる新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-10-27T17:27:23Z) - Towards Target Sequential Rules [52.4562332499155]
ターゲット・シーケンシャル・ルール・マイニング(TaSRM)と呼ばれる効率的なアルゴリズムを提案する。
新たなアルゴリズムであるTaSRMとその変種は,既存のベースラインアルゴリズムと比較して実験性能がよいことを示す。
論文 参考訳(メタデータ) (2022-06-09T18:59:54Z) - Towards Target High-Utility Itemsets [2.824395407508717]
応用インテリジェンスでは、ユーティリティ駆動型パターン探索アルゴリズムは、データベースの洞察力と有用なパターンを識別することができる。
重要な研究課題として、ターゲットとした高ユーティリティアイテムセットマイニングが登場している。
本稿では,マイニングプロセス中に高ユーティリティなアイテムセットを迅速にマッチングしてターゲットパターンを選択することができるTHUIMを提案する。
論文 参考訳(メタデータ) (2022-06-09T18:42:58Z) - US-Rule: Discovering Utility-driven Sequential Rules [52.68017415747925]
我々は,高ユーティリティシーケンシャルルールを効率的にマイニングする,US-Ruleと呼ばれる高速アルゴリズムを提案する。
より厳密な上界(LEEU, REEU, LERSU, RERSU)とそれに対応する刈り取り戦略を提案する。
US-Ruleは実行時間、メモリ消費、スケーラビリティの点でパフォーマンスが向上する。
論文 参考訳(メタデータ) (2021-11-29T23:38:28Z) - MLE-guided parameter search for task loss minimization in neural
sequence modeling [83.83249536279239]
ニューラル自己回帰シーケンスモデルは、さまざまな自然言語処理(NLP)タスクのシーケンスを生成するために使用される。
本稿では,現在のパラメータとその周辺における乱探索の混合である更新方向の分布から,最大至適勾配の分布をサンプリングする,最大至適誘導パラメータ探索(MGS)を提案する。
以上の結果から,MGS は,機械翻訳における最小リスクトレーニングに比べて,繰り返しや非終端の大幅な削減を図り,シーケンスレベルの損失を最適化できることが示唆された。
論文 参考訳(メタデータ) (2020-06-04T22:21:22Z) - Improving a State-of-the-Art Heuristic for the Minimum Latency Problem
with Data Mining [69.00394670035747]
ハイブリッドメタヒューリスティックスは、オペレーション研究のトレンドとなっている。
成功例は、Greedy Randomized Adaptive Search Procedures (GRASP)とデータマイニング技術を組み合わせたものだ。
論文 参考訳(メタデータ) (2019-08-28T13:12:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。