論文の概要: US-Rule: Discovering Utility-driven Sequential Rules
- arxiv url: http://arxiv.org/abs/2111.15020v1
- Date: Mon, 29 Nov 2021 23:38:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-01 15:52:01.981685
- Title: US-Rule: Discovering Utility-driven Sequential Rules
- Title(参考訳): US-Rule: ユーティリティ駆動のシーケンスルールを発見する
- Authors: Gengsen Huang, Wensheng Gan, Jian Weng, and Philip S. Yu
- Abstract要約: 我々は,高ユーティリティシーケンシャルルールを効率的にマイニングする,US-Ruleと呼ばれる高速アルゴリズムを提案する。
より厳密な上界(LEEU, REEU, LERSU, RERSU)とそれに対応する刈り取り戦略を提案する。
US-Ruleは実行時間、メモリ消費、スケーラビリティの点でパフォーマンスが向上する。
- 参考スコア(独自算出の注目度): 52.68017415747925
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Utility-driven mining is an important task in data science and has many
applications in real life. High utility sequential pattern mining (HUSPM) is
one kind of utility-driven mining. HUSPM aims to discover all sequential
patterns with high utility. However, the existing algorithms of HUSPM can not
provide an accurate probability to deal with some scenarios for prediction or
recommendation. High-utility sequential rule mining (HUSRM) was proposed to
discover all sequential rules with high utility and high confidence. There is
only one algorithm proposed for HUSRM, which is not enough efficient. In this
paper, we propose a faster algorithm, called US-Rule, to efficiently mine
high-utility sequential rules. It utilizes rule estimated utility co-occurrence
pruning strategy (REUCP) to avoid meaningless computation. To improve the
efficiency on dense and long sequence datasets, four tighter upper bounds
(LEEU, REEU, LERSU, RERSU) and their corresponding pruning strategies (LEEUP,
REEUP, LERSUP, RERSUP) are proposed. Besides, US-Rule proposes rule estimated
utility recomputing pruning strategy (REURP) to deal with sparse datasets. At
last, a large number of experiments on different datasets compared to the
state-of-the-art algorithm demonstrate that US-Rule can achieve better
performance in terms of execution time, memory consumption and scalability.
- Abstract(参考訳): ユーティリティ駆動マイニングはデータサイエンスにおいて重要なタスクであり、実生活で多くの応用がある。
高実用性シーケンシャルパターンマイニング(HUSPM)は、実用性駆動型マイニングの一種である。
HUSPMは、すべてのシーケンシャルパターンを高ユーティリティで発見することを目的としている。
しかし、HUSPMの既存のアルゴリズムは、予測やレコメンデーションのためにいくつかのシナリオを扱う正確な確率を提供することができない。
高実用性シーケンシャルルールマイニング (HUSRM) は、高実用性と高い信頼性を持つ全てのシーケンシャルルールを発見するために提案された。
HUSRMには1つのアルゴリズムしか提案されていないが、効率は十分ではない。
本稿では,高ユーティリティシーケンシャルルールを効率的にマイニングする,US-Ruleと呼ばれる高速アルゴリズムを提案する。
ルール推定ユーティリティ共起プルーニング戦略(REUCP)を用いて、無意味な計算を避ける。
密度および長周期データセットの効率を改善するため、より厳密な4つの上限(LEEU, REEU, LERSU, RERSU)とその対応するプルーニング戦略(LEEUP, REEUP, LERSUP, RERSUP)を提案する。
さらにUS-Ruleは、スパースデータセットを扱うために、ルール推定ユーティリティ再計算プルーニング戦略(REURP)を提案する。
最終的に、最先端のアルゴリズムと比較して、異なるデータセットに対する多数の実験は、US-Ruleが実行時間、メモリ消費、スケーラビリティの点でより良いパフォーマンスを達成できることを示した。
関連論文リスト
- HUSP-SP: Faster Utility Mining on Sequence Data [48.0426095077918]
高実用性シーケンシャルパターンマイニング (HUSPM) が重要視されている。
シークエンスプロジェクション(seqPro)と呼ばれるコンパクトな構造を設計し、シークエンスプロ構造(HUSP-SP)を用いた効率的なアルゴリズムを提案する。
HUSP-SPは, 実行時間, メモリ使用量, 検索空間のプルーニング効率, スケーラビリティにおいて, 最先端のアルゴリズムを著しく上回っている。
論文 参考訳(メタデータ) (2022-12-29T10:56:17Z) - Towards Sequence Utility Maximization under Utility Occupancy Measure [53.234101208024335]
データベースでは、ユーティリティは各パターンに対して柔軟な基準であるが、ユーティリティ共有を無視するため、より絶対的な基準である。
まず、まず、シーケンスデータに対するユーティリティの占有を定義し、高ユーティリティ・アクシデント・パターンマイニングの問題を提起する。
SuMU(Sequence Utility Maximization with Utility cccupancy measure)と呼ばれるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-20T17:28:53Z) - Towards Correlated Sequential Rules [4.743965372344134]
高実用性シーケンシャルルールマイニング(HUSRM)は、結果のシーケンシャルパターンの発生を予測できる信頼度や確率を調査するために設計された。
HUSRMと呼ばれる既存のアルゴリズムは、生成されたシーケンシャルルール間の相関を無視しながら、すべての許容ルールを抽出することに制限されている。
本稿では,HUSRMに相関の概念を統合するために,CoUSR(Cocorlation High-utility Sequence Rule Minr)と呼ばれる新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-10-27T17:27:23Z) - Totally-ordered Sequential Rules for Utility Maximization [49.57003933142011]
提案するアルゴリズムはTotalSRとTotalSR+である。
TotalSRは、先行するサポートを効率的に計算できるユーティリティテーブルと、残りのユーティリティをシーケンスのO(1)時間で計算できるユーティリティプレフィックスの和リストを作成する。
実データと合成データの両方において、TotalSRはプルーニング戦略の少ないアルゴリズムよりもはるかに効率的であることを示す実験結果が多数存在する。
論文 参考訳(メタデータ) (2022-09-27T16:17:58Z) - A Generic Algorithm for Top-K On-Shelf Utility Mining [47.729883172648876]
オンシェルフユーティリティマイニング(OSUM)は、データマイニングにおける新たな研究方向である。
販売期間中に高い相対効用を有するアイテムセットを発見することを目的としている。
オンシェルフ高ユーティリティアイテムセットの適切な量をマイニングするための最小限の閾値ミニユーティリティを定義するのは難しい。
そこで我々はTop-k On-Shelf hIgh-utility patternsをマイニングするための汎用アルゴリズムTOITを提案する。
論文 参考訳(メタデータ) (2022-08-27T03:08:00Z) - Towards Target Sequential Rules [52.4562332499155]
ターゲット・シーケンシャル・ルール・マイニング(TaSRM)と呼ばれる効率的なアルゴリズムを提案する。
新たなアルゴリズムであるTaSRMとその変種は,既存のベースラインアルゴリズムと比較して実験性能がよいことを示す。
論文 参考訳(メタデータ) (2022-06-09T18:59:54Z) - TaSPM: Targeted Sequential Pattern Mining [53.234101208024335]
本稿では,高速CM-SPAMアルゴリズムに基づく汎用フレームワークTaSPMを提案する。
また,マイニングプロセスにおける無意味な操作を減らすために,いくつかのプルーニング戦略を提案する。
実験の結果,新たなターゲットマイニングアルゴリズムであるTaSPMは実行時間を短縮し,メモリ消費を低減できることがわかった。
論文 参考訳(メタデータ) (2022-02-26T17:49:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。