論文の概要: A Generic Algorithm for Top-K On-Shelf Utility Mining
- arxiv url: http://arxiv.org/abs/2208.14230v1
- Date: Sat, 27 Aug 2022 03:08:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-31 13:28:01.720752
- Title: A Generic Algorithm for Top-K On-Shelf Utility Mining
- Title(参考訳): top-k on-shelfユーティリティマイニングのための汎用アルゴリズム
- Authors: Jiahui Chen, Xu Guo, Wensheng Gan, Shichen Wan, and Philip S. Yu
- Abstract要約: オンシェルフユーティリティマイニング(OSUM)は、データマイニングにおける新たな研究方向である。
販売期間中に高い相対効用を有するアイテムセットを発見することを目的としている。
オンシェルフ高ユーティリティアイテムセットの適切な量をマイニングするための最小限の閾値ミニユーティリティを定義するのは難しい。
そこで我々はTop-k On-Shelf hIgh-utility patternsをマイニングするための汎用アルゴリズムTOITを提案する。
- 参考スコア(独自算出の注目度): 47.729883172648876
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: On-shelf utility mining (OSUM) is an emerging research direction in data
mining. It aims to discover itemsets that have high relative utility in their
selling time period. Compared with traditional utility mining, OSUM can find
more practical and meaningful patterns in real-life applications. However,
there is a major drawback to traditional OSUM. For normal users, it is hard to
define a minimum threshold minutil for mining the right amount of on-shelf high
utility itemsets. On one hand, if the threshold is set too high, the number of
patterns would not be enough. On the other hand, if the threshold is set too
low, too many patterns will be discovered and cause an unnecessary waste of
time and memory consumption. To address this issue, the user usually directly
specifies a parameter k, where only the top-k high relative utility itemsets
would be considered. Therefore, in this paper, we propose a generic algorithm
named TOIT for mining Top-k On-shelf hIgh-utility paTterns to solve this
problem. TOIT applies a novel strategy to raise the minutil based on the
on-shelf datasets. Besides, two novel upper-bound strategies named subtree
utility and local utility are applied to prune the search space. By adopting
the strategies mentioned above, the TOIT algorithm can narrow the search space
as early as possible, improve the mining efficiency, and reduce the memory
consumption, so it can obtain better performance than other algorithms. A
series of experiments have been conducted on real datasets with different
styles to compare the effects with the state-of-the-art KOSHU algorithm. The
experimental results showed that TOIT outperforms KOSHU in both running time
and memory consumption.
- Abstract(参考訳): オンシェルフユーティリティマイニング(OSUM)は、データマイニングにおける新たな研究方向である。
販売期間中に高い相対的効用を持つアイテムセットを見つけることを目的としている。
従来のユーティリティマイニングと比較して、OSUMは現実のアプリケーションでより実用的で意味のあるパターンを見つけることができる。
しかし、伝統的なオサムには大きな欠点がある。
一般ユーザーにとっては、正しい量の高ユーティリティアイテムセットをマイニングするための最小しきい値minutilを定義するのは難しい。
一方、しきい値が高すぎるとパターンの数は不十分になる。
一方、しきい値が低すぎると、あまりに多くのパターンが発見され、不要な時間とメモリ消費の無駄が発生する。
この問題に対処するために、ユーザは通常、パラメータkを直接指定し、トップkの高い相対的ユーティリティアイテムセットのみが考慮される。
そこで本研究では,Top-k On-Shelf hIgh-utility paTterns をマイニングする汎用アルゴリズム TOIT を提案する。
TOITは、オンシェルフデータセットに基づいてミニユーティリティを上げるための新しい戦略を適用している。
さらに,検索空間を熟成するために,サブツリーユーティリティとローカルユーティリティという2つの新しい上界戦略を適用した。
上記の戦略を採用することで、TOITアルゴリズムは検索スペースをできるだけ早く絞り込み、マイニング効率を向上し、メモリ消費を低減し、他のアルゴリズムよりも優れた性能を得ることができる。
異なるスタイルの実際のデータセットに対して、その効果を最先端のKOSHUアルゴリズムと比較する一連の実験が実施されている。
実験の結果,TOIT は動作時間とメモリ消費の両方において KoSHU よりも優れていた。
関連論文リスト
- HUSP-SP: Faster Utility Mining on Sequence Data [48.0426095077918]
高実用性シーケンシャルパターンマイニング (HUSPM) が重要視されている。
シークエンスプロジェクション(seqPro)と呼ばれるコンパクトな構造を設計し、シークエンスプロ構造(HUSP-SP)を用いた効率的なアルゴリズムを提案する。
HUSP-SPは, 実行時間, メモリ使用量, 検索空間のプルーニング効率, スケーラビリティにおいて, 最先端のアルゴリズムを著しく上回っている。
論文 参考訳(メタデータ) (2022-12-29T10:56:17Z) - Towards Sequence Utility Maximization under Utility Occupancy Measure [53.234101208024335]
データベースでは、ユーティリティは各パターンに対して柔軟な基準であるが、ユーティリティ共有を無視するため、より絶対的な基準である。
まず、まず、シーケンスデータに対するユーティリティの占有を定義し、高ユーティリティ・アクシデント・パターンマイニングの問題を提起する。
SuMU(Sequence Utility Maximization with Utility cccupancy measure)と呼ばれるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-20T17:28:53Z) - Totally-ordered Sequential Rules for Utility Maximization [49.57003933142011]
提案するアルゴリズムはTotalSRとTotalSR+である。
TotalSRは、先行するサポートを効率的に計算できるユーティリティテーブルと、残りのユーティリティをシーケンスのO(1)時間で計算できるユーティリティプレフィックスの和リストを作成する。
実データと合成データの両方において、TotalSRはプルーニング戦略の少ないアルゴリズムよりもはるかに効率的であることを示す実験結果が多数存在する。
論文 参考訳(メタデータ) (2022-09-27T16:17:58Z) - Itemset Utility Maximization with Correlation Measure [8.581840054840335]
高ユーティリティアイテムセットマイニング(HUIM)は、興味深いが隠された情報(例えば、利益とリスク)を見つけるために使用される。
本稿では,Coium(Coium)を用いたアイテムセット実用性最大化という新しいアルゴリズムを提案する。
2つの上界と4つのプルーニング戦略を用いて探索空間を効果的にプルークする。また、適用された上界を線形時間と空間で計算・保存するために、ユーティリティービンと呼ばれる簡潔なアレイ構造を用いる。
論文 参考訳(メタデータ) (2022-08-26T10:06:24Z) - Temporal Fuzzy Utility Maximization with Remaining Measure [1.642022526257133]
TFUMと呼ばれる新しい一相時間ファジィユーティリティーアイテムセットマイニング手法を提案する。
TFUMは、時間的ファジィリストを更新して、メモリ内の潜在的高時間的ファジィユーティリティアイテムセットに関する情報を少なくする。
その後、短い時間で本当に興味深いパターンの完全なセットを発見する。
論文 参考訳(メタデータ) (2022-08-26T05:09:56Z) - Towards Target High-Utility Itemsets [2.824395407508717]
応用インテリジェンスでは、ユーティリティ駆動型パターン探索アルゴリズムは、データベースの洞察力と有用なパターンを識別することができる。
重要な研究課題として、ターゲットとした高ユーティリティアイテムセットマイニングが登場している。
本稿では,マイニングプロセス中に高ユーティリティなアイテムセットを迅速にマッチングしてターゲットパターンを選択することができるTHUIMを提案する。
論文 参考訳(メタデータ) (2022-06-09T18:42:58Z) - US-Rule: Discovering Utility-driven Sequential Rules [52.68017415747925]
我々は,高ユーティリティシーケンシャルルールを効率的にマイニングする,US-Ruleと呼ばれる高速アルゴリズムを提案する。
より厳密な上界(LEEU, REEU, LERSU, RERSU)とそれに対応する刈り取り戦略を提案する。
US-Ruleは実行時間、メモリ消費、スケーラビリティの点でパフォーマンスが向上する。
論文 参考訳(メタデータ) (2021-11-29T23:38:28Z) - IRLI: Iterative Re-partitioning for Learning to Index [104.72641345738425]
分散環境でのロードバランスとスケーラビリティを維持しながら、高い精度を得る方法とのトレードオフが必要だ。
クエリ項目関連データから直接バケットを学習することで、アイテムを反復的に分割するIRLIと呼ばれる新しいアプローチを提案する。
我々は,irliが極めて自然な仮定の下で高い確率で正しい項目を検索し,優れた負荷分散を実現することを数学的に示す。
論文 参考訳(メタデータ) (2021-03-17T23:13:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。