論文の概要: Towards Sequence Utility Maximization under Utility Occupancy Measure
- arxiv url: http://arxiv.org/abs/2212.10452v1
- Date: Tue, 20 Dec 2022 17:28:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-21 17:00:05.922788
- Title: Towards Sequence Utility Maximization under Utility Occupancy Measure
- Title(参考訳): 実用的占有法の下でのシーケンシャル・ユーティリティーの最大化に向けて
- Authors: Gengsen Huang, Wensheng Gan, and Philip S. Yu
- Abstract要約: データベースでは、ユーティリティは各パターンに対して柔軟な基準であるが、ユーティリティ共有を無視するため、より絶対的な基準である。
まず、まず、シーケンスデータに対するユーティリティの占有を定義し、高ユーティリティ・アクシデント・パターンマイニングの問題を提起する。
SuMU(Sequence Utility Maximization with Utility cccupancy measure)と呼ばれるアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 53.234101208024335
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The discovery of utility-driven patterns is a useful and difficult research
topic. It can extract significant and interesting information from specific and
varied databases, increasing the value of the services provided. In practice,
the measure of utility is often used to demonstrate the importance, profit, or
risk of an object or a pattern. In the database, although utility is a flexible
criterion for each pattern, it is a more absolute criterion due to the neglect
of utility sharing. This leads to the derived patterns only exploring partial
and local knowledge from a database. Utility occupancy is a recently proposed
model that considers the problem of mining with high utility but low occupancy.
However, existing studies are concentrated on itemsets that do not reveal the
temporal relationship of object occurrences. Therefore, this paper towards
sequence utility maximization. We first define utility occupancy on sequence
data and raise the problem of High Utility-Occupancy Sequential Pattern Mining
(HUOSPM). Three dimensions, including frequency, utility, and occupancy, are
comprehensively evaluated in HUOSPM. An algorithm called Sequence Utility
Maximization with Utility occupancy measure (SUMU) is proposed. Furthermore,
two data structures for storing related information about a pattern,
Utility-Occupancy-List-Chain (UOL-Chain) and Utility-Occupancy-Table (UO-Table)
with six associated upper bounds, are designed to improve efficiency. Empirical
experiments are carried out to evaluate the novel algorithm's efficiency and
effectiveness. The influence of different upper bounds and pruning strategies
is analyzed and discussed. The comprehensive results suggest that the work of
our algorithm is intelligent and effective.
- Abstract(参考訳): ユーティリティ駆動型パターンの発見は有用で難しい研究トピックである。
特定のデータベースから重要で興味深い情報を抽出し、提供されたサービスの価値を高めることができる。
実際には、実用性の測定は、オブジェクトやパターンの重要性、利益、リスクを示すためにしばしば用いられる。
データベースでは、ユーティリティは各パターンの柔軟な基準であるが、ユーティリティの共有が無視されるため、より絶対的な基準である。
これにより、データベースから部分的および局所的な知識のみを探索するパターンが導出されます。
実用性は近年提案されているモデルであり、高い実用性を持つが低い占有力を有する鉱業の問題を考える。
しかし、既存の研究は、物体の発生の時間的関係を明らかにしないアイテムセットに集中している。
そこで本稿では,シーケンシャル・ユーティリティの最大化について述べる。
まず,シーケンシャルデータ上のユーティリティ占有度を定義し,高ユーティリティ占有度シーケンシャルパターンマイニング(huospm)の問題を提起する。
周波数、ユーティリティ、占有率を含む3次元は、huospmにおいて包括的に評価される。
SuMU(Sequence Utility Maximization with Utility cccupancy measure)と呼ばれるアルゴリズムを提案する。
さらに、6つの関連する上限を持つユーティリティー占有リスト(uol-chain)とユーティリティー占有テーブル(uo-table)というパターンに関する関連情報を格納する2つのデータ構造により効率性が向上する。
実験により,新しいアルゴリズムの有効性と有効性を評価する。
異なる上界と刈り取り戦略の影響を分析し, 考察した。
その結果,アルゴリズムの動作は知的かつ効果的であることが示唆された。
関連論文リスト
- Scalable Sampling for High Utility Patterns [1.2154569665167423]
大規模量データベースのための新しい高能率パターンサンプリングアルゴリズムとそのオンディスクバージョンを提案する。
提案手法は,ユーザ中心方式に必要な対話性と,ランダムサンプリングによる強い統計的保証の両方を保証する。
提案手法の興味を示すために,考古学的知識グラフによる発見を応用した,魅力的なユースケースを提案する。
論文 参考訳(メタデータ) (2024-10-30T12:22:54Z) - ACE : Off-Policy Actor-Critic with Causality-Aware Entropy Regularization [52.5587113539404]
因果関係を考慮したエントロピー(entropy)という用語を導入し,効率的な探索を行うための潜在的影響の高いアクションを効果的に識別し,優先順位付けする。
提案アルゴリズムであるACE:Off-policy Actor-critic with Causality-aware Entropy regularizationは,29種類の連続制御タスクに対して,大幅な性能上の優位性を示す。
論文 参考訳(メタデータ) (2024-02-22T13:22:06Z) - HUSP-SP: Faster Utility Mining on Sequence Data [48.0426095077918]
高実用性シーケンシャルパターンマイニング (HUSPM) が重要視されている。
シークエンスプロジェクション(seqPro)と呼ばれるコンパクトな構造を設計し、シークエンスプロ構造(HUSP-SP)を用いた効率的なアルゴリズムを提案する。
HUSP-SPは, 実行時間, メモリ使用量, 検索空間のプルーニング効率, スケーラビリティにおいて, 最先端のアルゴリズムを著しく上回っている。
論文 参考訳(メタデータ) (2022-12-29T10:56:17Z) - A Generic Algorithm for Top-K On-Shelf Utility Mining [47.729883172648876]
オンシェルフユーティリティマイニング(OSUM)は、データマイニングにおける新たな研究方向である。
販売期間中に高い相対効用を有するアイテムセットを発見することを目的としている。
オンシェルフ高ユーティリティアイテムセットの適切な量をマイニングするための最小限の閾値ミニユーティリティを定義するのは難しい。
そこで我々はTop-k On-Shelf hIgh-utility patternsをマイニングするための汎用アルゴリズムTOITを提案する。
論文 参考訳(メタデータ) (2022-08-27T03:08:00Z) - Itemset Utility Maximization with Correlation Measure [8.581840054840335]
高ユーティリティアイテムセットマイニング(HUIM)は、興味深いが隠された情報(例えば、利益とリスク)を見つけるために使用される。
本稿では,Coium(Coium)を用いたアイテムセット実用性最大化という新しいアルゴリズムを提案する。
2つの上界と4つのプルーニング戦略を用いて探索空間を効果的にプルークする。また、適用された上界を線形時間と空間で計算・保存するために、ユーティリティービンと呼ばれる簡潔なアレイ構造を用いる。
論文 参考訳(メタデータ) (2022-08-26T10:06:24Z) - Temporal Fuzzy Utility Maximization with Remaining Measure [1.642022526257133]
TFUMと呼ばれる新しい一相時間ファジィユーティリティーアイテムセットマイニング手法を提案する。
TFUMは、時間的ファジィリストを更新して、メモリ内の潜在的高時間的ファジィユーティリティアイテムセットに関する情報を少なくする。
その後、短い時間で本当に興味深いパターンの完全なセットを発見する。
論文 参考訳(メタデータ) (2022-08-26T05:09:56Z) - Compactness Score: A Fast Filter Method for Unsupervised Feature
Selection [66.84571085643928]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。
提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文 参考訳(メタデータ) (2022-01-31T13:01:37Z) - US-Rule: Discovering Utility-driven Sequential Rules [52.68017415747925]
我々は,高ユーティリティシーケンシャルルールを効率的にマイニングする,US-Ruleと呼ばれる高速アルゴリズムを提案する。
より厳密な上界(LEEU, REEU, LERSU, RERSU)とそれに対応する刈り取り戦略を提案する。
US-Ruleは実行時間、メモリ消費、スケーラビリティの点でパフォーマンスが向上する。
論文 参考訳(メタデータ) (2021-11-29T23:38:28Z) - Flexible Pattern Discovery and Analysis [2.075126998649103]
フレキシブルな高ユーティリティ占有パターンのマイニングのためのアルゴリズムを導入する。
提案アルゴリズムは,実世界のデータセットと合成データセットの両方に対して,抽出したパターンの長さを効果的に制御することができる。
論文 参考訳(メタデータ) (2021-11-24T01:25:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。