論文の概要: Towards Target High-Utility Itemsets
- arxiv url: http://arxiv.org/abs/2206.06157v1
- Date: Thu, 9 Jun 2022 18:42:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-14 17:06:21.083601
- Title: Towards Target High-Utility Itemsets
- Title(参考訳): ターゲットの高機能化に向けて
- Authors: Jinbao Miao, Wensheng Gan, Shicheng Wan, Yongdong Wu, Philippe
Fournier-Viger
- Abstract要約: 応用インテリジェンスでは、ユーティリティ駆動型パターン探索アルゴリズムは、データベースの洞察力と有用なパターンを識別することができる。
重要な研究課題として、ターゲットとした高ユーティリティアイテムセットマイニングが登場している。
本稿では,マイニングプロセス中に高ユーティリティなアイテムセットを迅速にマッチングしてターゲットパターンを選択することができるTHUIMを提案する。
- 参考スコア(独自算出の注目度): 2.824395407508717
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For applied intelligence, utility-driven pattern discovery algorithms can
identify insightful and useful patterns in databases. However, in these
techniques for pattern discovery, the number of patterns can be huge, and the
user is often only interested in a few of those patterns. Hence, targeted
high-utility itemset mining has emerged as a key research topic, where the aim
is to find a subset of patterns that meet a targeted pattern constraint instead
of all patterns. This is a challenging task because efficiently finding
tailored patterns in a very large search space requires a targeted mining
algorithm. A first algorithm called TargetUM has been proposed, which adopts an
approach similar to post-processing using a tree structure, but the running
time and memory consumption are unsatisfactory in many situations. In this
paper, we address this issue by proposing a novel list-based algorithm with
pattern matching mechanism, named THUIM (Targeted High-Utility Itemset Mining),
which can quickly match high-utility itemsets during the mining process to
select the targeted patterns. Extensive experiments were conducted on different
datasets to compare the performance of the proposed algorithm with
state-of-the-art algorithms. Results show that THUIM performs very well in
terms of runtime and memory consumption, and has good scalability compared to
TargetUM.
- Abstract(参考訳): 応用インテリジェンスでは、ユーティリティ駆動型パターン探索アルゴリズムがデータベースの洞察力と有用なパターンを識別する。
しかし、これらのパターン発見技術では、パターンの数は膨大であり、ユーザはこれらのパターンにのみ興味を持つことが多い。
したがって、対象とする高可用性アイテムセットマイニングは重要な研究テーマとして登場し、すべてのパターンではなく、対象パターン制約を満たすパターンのサブセットを見つけることを目的としている。
なぜなら、非常に大きな検索空間で効率的に調整されたパターンを見つけるには、ターゲットとなるマイニングアルゴリズムが必要であるからだ。
TargetUMと呼ばれる最初のアルゴリズムが提案され、木構造を用いた後処理と同様のアプローチを採用するが、実行時間とメモリ消費は多くの状況で不満足である。
本稿では,パターンマッチング機構を備えた新しいリストベースアルゴリズムであるthumm(targeted high-utility itemset mining)を提案する。
提案アルゴリズムの性能を最先端アルゴリズムと比較するために,異なるデータセット上で広範な実験を行った。
その結果、THUIMは実行時およびメモリ消費において非常によく機能し、TargetUMと比較して優れたスケーラビリティを有することがわかった。
関連論文リスト
- Towards Sequence Utility Maximization under Utility Occupancy Measure [53.234101208024335]
データベースでは、ユーティリティは各パターンに対して柔軟な基準であるが、ユーティリティ共有を無視するため、より絶対的な基準である。
まず、まず、シーケンスデータに対するユーティリティの占有を定義し、高ユーティリティ・アクシデント・パターンマイニングの問題を提起する。
SuMU(Sequence Utility Maximization with Utility cccupancy measure)と呼ばれるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-20T17:28:53Z) - Towards Correlated Sequential Rules [4.743965372344134]
高実用性シーケンシャルルールマイニング(HUSRM)は、結果のシーケンシャルパターンの発生を予測できる信頼度や確率を調査するために設計された。
HUSRMと呼ばれる既存のアルゴリズムは、生成されたシーケンシャルルール間の相関を無視しながら、すべての許容ルールを抽出することに制限されている。
本稿では,HUSRMに相関の概念を統合するために,CoUSR(Cocorlation High-utility Sequence Rule Minr)と呼ばれる新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-10-27T17:27:23Z) - Efficient Non-Parametric Optimizer Search for Diverse Tasks [93.64739408827604]
興味のあるタスクを直接検索できる,スケーラブルで汎用的なフレームワークを初めて提示する。
基礎となる数学表現の自然木構造に着想を得て、空間を超木に再配置する。
我々は,モンテカルロ法を木探索に適用し,レジェクションサンプリングと等価形状検出を備える。
論文 参考訳(メタデータ) (2022-09-27T17:51:31Z) - A Generic Algorithm for Top-K On-Shelf Utility Mining [47.729883172648876]
オンシェルフユーティリティマイニング(OSUM)は、データマイニングにおける新たな研究方向である。
販売期間中に高い相対効用を有するアイテムセットを発見することを目的としている。
オンシェルフ高ユーティリティアイテムセットの適切な量をマイニングするための最小限の閾値ミニユーティリティを定義するのは難しい。
そこで我々はTop-k On-Shelf hIgh-utility patternsをマイニングするための汎用アルゴリズムTOITを提案する。
論文 参考訳(メタデータ) (2022-08-27T03:08:00Z) - TaSPM: Targeted Sequential Pattern Mining [53.234101208024335]
本稿では,高速CM-SPAMアルゴリズムに基づく汎用フレームワークTaSPMを提案する。
また,マイニングプロセスにおける無意味な操作を減らすために,いくつかのプルーニング戦略を提案する。
実験の結果,新たなターゲットマイニングアルゴリズムであるTaSPMは実行時間を短縮し,メモリ消費を低減できることがわかった。
論文 参考訳(メタデータ) (2022-02-26T17:49:47Z) - Flexible Pattern Discovery and Analysis [2.075126998649103]
フレキシブルな高ユーティリティ占有パターンのマイニングのためのアルゴリズムを導入する。
提案アルゴリズムは,実世界のデータセットと合成データセットの両方に対して,抽出したパターンの長さを効果的に制御することができる。
論文 参考訳(メタデータ) (2021-11-24T01:25:15Z) - Pre-Clustering Point Clouds of Crop Fields Using Scalable Methods [14.06711982797654]
この問題に対する現在の最先端技術と、一般的な密度に基づくクラスタリングアルゴリズムであるQuickshiftの類似性を示す。
汎用的でスケーラブルなプラントセグメンテーションアルゴリズムを作成することを目的とした,新しいアプリケーション固有アルゴリズムを提案する。
フィールドスケールの表現型システムに組み込む場合、提案アルゴリズムは、結果の精度を大幅に向上させる代替品として機能する。
論文 参考訳(メタデータ) (2021-07-22T22:47:22Z) - Automated Decision-based Adversarial Attacks [48.01183253407982]
我々は、実用的で挑戦的な意思決定ベースのブラックボックスの敵意設定を考える。
この設定では、攻撃者はターゲットモデルに問い合わせるだけで最終分類ラベルを取得できる。
意思決定に基づく攻撃アルゴリズムを自動的に発見する。
論文 参考訳(メタデータ) (2021-05-09T13:15:10Z) - Towards Optimally Efficient Tree Search with Deep Learning [76.64632985696237]
本稿では,線形モデルから信号整数を推定する古典整数最小二乗問題について検討する。
問題はNPハードであり、信号処理、バイオインフォマティクス、通信、機械学習といった様々な応用でしばしば発生する。
本稿では, 深いニューラルネットワークを用いて, 単純化されたメモリバウンドA*アルゴリズムの最適推定を推定し, HATSアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-01-07T08:00:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。