論文の概要: Flexible Pattern Discovery and Analysis
- arxiv url: http://arxiv.org/abs/2111.12218v1
- Date: Wed, 24 Nov 2021 01:25:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-25 16:14:35.781296
- Title: Flexible Pattern Discovery and Analysis
- Title(参考訳): 柔軟なパターン発見と分析
- Authors: Chien-Ming Chen, Lili Chen, and Wensheng Gan
- Abstract要約: フレキシブルな高ユーティリティ占有パターンのマイニングのためのアルゴリズムを導入する。
提案アルゴリズムは,実世界のデータセットと合成データセットの両方に対して,抽出したパターンの長さを効果的に制御することができる。
- 参考スコア(独自算出の注目度): 2.075126998649103
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Based on the analysis of the proportion of utility in the supporting
transactions used in the field of data mining, high utility-occupancy pattern
mining (HUOPM) has recently attracted widespread attention. Unlike high-utility
pattern mining (HUPM), which involves the enumeration of high-utility (e.g.,
profitable) patterns, HUOPM aims to find patterns representing a collection of
existing transactions. In practical applications, however, not all patterns are
used or valuable. For example, a pattern might contain too many items, that is,
the pattern might be too specific and therefore lack value for users in real
life. To achieve qualified patterns with a flexible length, we constrain the
minimum and maximum lengths during the mining process and introduce a novel
algorithm for the mining of flexible high utility-occupancy patterns. Our
algorithm is referred to as HUOPM+. To ensure the flexibility of the patterns
and tighten the upper bound of the utility-occupancy, a strategy called the
length upper-bound (LUB) is presented to prune the search space. In addition, a
utility-occupancy nested list (UO-nlist) and a frequency-utility-occupancy
table (FUO-table) are employed to avoid multiple scans of the database.
Evaluation results of the subsequent experiments confirm that the proposed
algorithm can effectively control the length of the derived patterns, for both
real-world and synthetic datasets. Moreover, it can decrease the execution time
and memory consumption.
- Abstract(参考訳): 近年,データマイニング分野における支援取引における効用率の分析により,HUOPM (High utility-occupancy pattern mining) が注目されている。
高ユーティリティパターンマイニング(HUPM)とは異なり、HUOPMは既存のトランザクションの集合を表すパターンを見つけることを目的としている。
しかし、実際的な応用では、すべてのパターンが使われるか価値があるわけではない。
例えば、パターンにはアイテムが多すぎる場合があり、そのパターンが具体的すぎるため、現実のユーザにとっての価値が欠落している場合があります。
フレキシブルな長さで適度なパターンを実現するために,マイニング過程の最小長と最大長を制約し,フレキシブルな高ユーティリティ占有パターンをマイニングするための新しいアルゴリズムを導入する。
我々のアルゴリズムはHUOPM+と呼ばれる。
パターンの柔軟性を確保し、実用能力の上限を締め付けるために、長さ上界(LUB)と呼ばれる戦略を提示し、探索空間を熟成する。
さらに、複数のデータベースのスキャンを避けるために、ユーティリティ占有リスト(UO-nlist)と周波数利用占有テーブル(FUO-table)を用いる。
実験の結果,提案手法は実世界と合成データの両方において,導出パターンの長さを効果的に制御できることが確認された。
さらに、実行時間とメモリ消費を削減できる。
関連論文リスト
- Minimally Supervised Learning using Topological Projections in
Self-Organizing Maps [55.31182147885694]
自己組織化マップ(SOM)におけるトポロジカルプロジェクションに基づく半教師付き学習手法を提案する。
提案手法は,まずラベル付きデータ上でSOMを訓練し,最小限のラベル付きデータポイントをキーベストマッチングユニット(BMU)に割り当てる。
提案した最小教師付きモデルが従来の回帰手法を大幅に上回ることを示す。
論文 参考訳(メタデータ) (2024-01-12T22:51:48Z) - Large Language Models as General Pattern Machines [64.75501424160748]
我々は,事前訓練された大規模言語モデル (LLM) が,複雑なトークンシーケンスを自動回帰的に完了することを示す。
驚いたことに、語彙からランダムにサンプリングされたトークンを用いてシーケンスが表現された場合でも、パターン完了の習熟度を部分的に保持することができる。
本研究では,ロボット工学における問題に対して,これらのゼロショット機能がどのように適用されるかを検討する。
論文 参考訳(メタデータ) (2023-07-10T17:32:13Z) - Towards Sequence Utility Maximization under Utility Occupancy Measure [53.234101208024335]
データベースでは、ユーティリティは各パターンに対して柔軟な基準であるが、ユーティリティ共有を無視するため、より絶対的な基準である。
まず、まず、シーケンスデータに対するユーティリティの占有を定義し、高ユーティリティ・アクシデント・パターンマイニングの問題を提起する。
SuMU(Sequence Utility Maximization with Utility cccupancy measure)と呼ばれるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-20T17:28:53Z) - A Generic Algorithm for Top-K On-Shelf Utility Mining [47.729883172648876]
オンシェルフユーティリティマイニング(OSUM)は、データマイニングにおける新たな研究方向である。
販売期間中に高い相対効用を有するアイテムセットを発見することを目的としている。
オンシェルフ高ユーティリティアイテムセットの適切な量をマイニングするための最小限の閾値ミニユーティリティを定義するのは難しい。
そこで我々はTop-k On-Shelf hIgh-utility patternsをマイニングするための汎用アルゴリズムTOITを提案する。
論文 参考訳(メタデータ) (2022-08-27T03:08:00Z) - Temporal Fuzzy Utility Maximization with Remaining Measure [1.642022526257133]
TFUMと呼ばれる新しい一相時間ファジィユーティリティーアイテムセットマイニング手法を提案する。
TFUMは、時間的ファジィリストを更新して、メモリ内の潜在的高時間的ファジィユーティリティアイテムセットに関する情報を少なくする。
その後、短い時間で本当に興味深いパターンの完全なセットを発見する。
論文 参考訳(メタデータ) (2022-08-26T05:09:56Z) - Towards Target High-Utility Itemsets [2.824395407508717]
応用インテリジェンスでは、ユーティリティ駆動型パターン探索アルゴリズムは、データベースの洞察力と有用なパターンを識別することができる。
重要な研究課題として、ターゲットとした高ユーティリティアイテムセットマイニングが登場している。
本稿では,マイニングプロセス中に高ユーティリティなアイテムセットを迅速にマッチングしてターゲットパターンを選択することができるTHUIMを提案する。
論文 参考訳(メタデータ) (2022-06-09T18:42:58Z) - TaSPM: Targeted Sequential Pattern Mining [53.234101208024335]
本稿では,高速CM-SPAMアルゴリズムに基づく汎用フレームワークTaSPMを提案する。
また,マイニングプロセスにおける無意味な操作を減らすために,いくつかのプルーニング戦略を提案する。
実験の結果,新たなターゲットマイニングアルゴリズムであるTaSPMは実行時間を短縮し,メモリ消費を低減できることがわかった。
論文 参考訳(メタデータ) (2022-02-26T17:49:47Z) - Capturing the temporal constraints of gradual patterns [0.0]
段階的パターンマイニング(Gradual pattern mining)は、「Xを多くすればYを多くする」といった段階的規則を通じて属性相関を抽出することを可能にする。
例えば、研究者は段階的なパターンマイニングを適用して、データセットのどの属性が不慣れな相関を示すかを決定することで、より深い探索や分析のためにそれらを分離することができる。
この作業は、私たちの社会のほぼすべての領域でIoTアプリケーションの普及によって動機付けられています。
論文 参考訳(メタデータ) (2021-06-28T06:45:48Z) - MCRapper: Monte-Carlo Rademacher Averages for Poset Families and
Approximate Pattern Mining [22.88915237311897]
モンテカルロ実験ラデマチャー平均値(MCERA)の効率的な計算アルゴリズムであるMCRapperを提案する。
MCRapperは、利用可能なデータが未知の分布からのサンプルと見なされるときの統計的に重要な関数(パターンなど)と、利用可能なデータが大きなデータセットからの小さなサンプルであるときの高次関数(頻繁なパターンなど)の集合の近似の両方を計算する。
論文 参考訳(メタデータ) (2020-06-16T11:42:56Z) - Improving a State-of-the-Art Heuristic for the Minimum Latency Problem
with Data Mining [69.00394670035747]
ハイブリッドメタヒューリスティックスは、オペレーション研究のトレンドとなっている。
成功例は、Greedy Randomized Adaptive Search Procedures (GRASP)とデータマイニング技術を組み合わせたものだ。
論文 参考訳(メタデータ) (2019-08-28T13:12:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。