論文の概要: Mining Weighted Sequential Patterns in Incremental Uncertain Databases
- arxiv url: http://arxiv.org/abs/2404.00746v1
- Date: Sun, 31 Mar 2024 17:32:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-04 02:01:08.994291
- Title: Mining Weighted Sequential Patterns in Incremental Uncertain Databases
- Title(参考訳): インクリメンタル不確かさデータベースにおける重み付きシーケンスパターンのマイニング
- Authors: Kashob Kumar Roy, Md Hasibul Haque Moon, Md Mahmudur Rahman, Chowdhury Farhan Ahmed, Carson Kai-Sang Leung,
- Abstract要約: 我々は不確実なデータベースに頻繁なシーケンスをマイニングするアルゴリズムを開発した。
データベースがインクリメンタルな場合、マイニングのための2つの新しい手法を提案しました。
- 参考スコア(独自算出の注目度): 2.668038211242538
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Due to the rapid development of science and technology, the importance of imprecise, noisy, and uncertain data is increasing at an exponential rate. Thus, mining patterns in uncertain databases have drawn the attention of researchers. Moreover, frequent sequences of items from these databases need to be discovered for meaningful knowledge with great impact. In many real cases, weights of items and patterns are introduced to find interesting sequences as a measure of importance. Hence, a constraint of weight needs to be handled while mining sequential patterns. Besides, due to the dynamic nature of databases, mining important information has become more challenging. Instead of mining patterns from scratch after each increment, incremental mining algorithms utilize previously mined information to update the result immediately. Several algorithms exist to mine frequent patterns and weighted sequences from incremental databases. However, these algorithms are confined to mine the precise ones. Therefore, we have developed an algorithm to mine frequent sequences in an uncertain database in this work. Furthermore, we have proposed two new techniques for mining when the database is incremental. Extensive experiments have been conducted for performance evaluation. The analysis showed the efficiency of our proposed framework.
- Abstract(参考訳): 科学技術の急速な発展により、不正確、ノイズ、不確実なデータの重要性は指数的な速度で増大している。
このように、不確実なデータベースのマイニングパターンが研究者の注目を集めている。
さらに、これらのデータベースからのアイテムの頻繁なシーケンスは、大きな影響を与える有意義な知識のために見つける必要がある。
多くの実例では、重要度として興味深いシーケンスを見つけるために、アイテムやパターンの重みが導入された。
したがって、シーケンシャルなパターンをマイニングしながら、重みの制約を扱う必要がある。
さらに、データベースの動的な性質のため、重要な情報をマイニングすることがより困難になっている。
インクリメンタルマイニングアルゴリズムは、各インクリメンタルマイニング後のスクラッチからパターンをマイニングする代わりに、それまでのマイニング情報を利用して結果を即座に更新する。
インクリメンタルデータベースから頻繁なパターンと重み付きシーケンスをマイニングするアルゴリズムがいくつか存在する。
しかし、これらのアルゴリズムは正確なアルゴリズムのマイニングに限られている。
そこで本研究では,不確実なデータベースに頻繁なシーケンスをマイニングするアルゴリズムを開発した。
さらに,データベースのインクリメンタルなマイニングには,2つの新しい手法を提案する。
性能評価のための大規模な実験が実施されている。
分析の結果,提案手法の有効性が示された。
関連論文リスト
- RPS: A Generic Reservoir Patterns Sampler [1.09784964592609]
本稿では,ストリーミングバッチデータからの直接パターンサンプリングを容易にするために,重み付き貯水池を利用する手法を提案する。
本稿では、時間的バイアスに対処し、逐次的、重み付け、および非重み付けを含む様々なパターンタイプを処理できる汎用アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-31T16:25:21Z) - Localized Gaussians as Self-Attention Weights for Point Clouds Correspondence [92.07601770031236]
本稿では,エンコーダのみのトランスフォーマーアーキテクチャのアテンションヘッドにおける意味的意味パターンについて検討する。
注意重みの修正はトレーニングプロセスの促進だけでなく,最適化の安定性の向上にも寄与する。
論文 参考訳(メタデータ) (2024-09-20T07:41:47Z) - State-Space Modeling in Long Sequence Processing: A Survey on Recurrence in the Transformer Era [59.279784235147254]
このサーベイは、シーケンシャルなデータ処理の反復モデルに基づく最新のアプローチの詳細な概要を提供する。
新たなイメージは、標準のバックプロパゲーション・オブ・タイムから外れた学習アルゴリズムによって構成される、新しいルートを考える余地があることを示唆している。
論文 参考訳(メタデータ) (2024-06-13T12:51:22Z) - Regularization-Based Methods for Ordinal Quantification [49.606912965922504]
順序の場合、すなわち n>2 クラスの集合上で全順序が定義される場合について研究する。
本稿では,従来のアルゴリズムよりも優れた正規化OQアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-10-13T16:04:06Z) - Towards Sequence Utility Maximization under Utility Occupancy Measure [53.234101208024335]
データベースでは、ユーティリティは各パターンに対して柔軟な基準であるが、ユーティリティ共有を無視するため、より絶対的な基準である。
まず、まず、シーケンスデータに対するユーティリティの占有を定義し、高ユーティリティ・アクシデント・パターンマイニングの問題を提起する。
SuMU(Sequence Utility Maximization with Utility cccupancy measure)と呼ばれるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-20T17:28:53Z) - Research Trends and Applications of Data Augmentation Algorithms [77.34726150561087]
我々は,データ拡張アルゴリズムの適用分野,使用するアルゴリズムの種類,重要な研究動向,時間経過に伴う研究の進展,およびデータ拡張文学における研究ギャップを同定する。
我々は、読者がデータ拡張の可能性を理解し、将来の研究方向を特定し、データ拡張研究の中で質問を開くことを期待する。
論文 参考訳(メタデータ) (2022-07-18T11:38:32Z) - Towards Target High-Utility Itemsets [2.824395407508717]
応用インテリジェンスでは、ユーティリティ駆動型パターン探索アルゴリズムは、データベースの洞察力と有用なパターンを識別することができる。
重要な研究課題として、ターゲットとした高ユーティリティアイテムセットマイニングが登場している。
本稿では,マイニングプロセス中に高ユーティリティなアイテムセットを迅速にマッチングしてターゲットパターンを選択することができるTHUIMを提案する。
論文 参考訳(メタデータ) (2022-06-09T18:42:58Z) - Incremental Mining of Frequent Serial Episodes Considering Multiple
Occurrence [11.387440344044315]
基本的な研究方向の1つは、データストリーム上のシーケンシャルパターンをマイニングすることだ。
アイテムセットストリームのウィンドウ上のパターンとその複数の発生は、パターンの本質的な特徴を認識する追加の機能を提供する。
本稿では,探索空間を効率よく創出するための新しい戦略を持つ,効率の良いシーケンシャルマイニング手法を提案する。
論文 参考訳(メタデータ) (2022-01-27T17:10:16Z) - Parallel algorithms for mining of frequent itemsets [0.0]
分散メモリ並列計算機上で頻繁なアイテムセットをマイニングする並列手法を開発した。
提案手法は,10プロセッサで6の高速化を実現する。
論文 参考訳(メタデータ) (2021-08-11T05:22:52Z) - Multi-source Data Mining for e-Learning [3.8673630752805432]
パターンマイニングは、データから興味深い頻繁なパターンを抽出する。
データ量の増加に伴い、この領域では、マルチソースおよび異種データが新たな課題となっている。
この課題は、興味深い頻繁なパターンを抽出するために、マルチソースデータをマイニングする作業の中心となるものです。
論文 参考訳(メタデータ) (2020-09-17T15:39:45Z) - Faster Secure Data Mining via Distributed Homomorphic Encryption [108.77460689459247]
ホモモルフィック暗号化(HE)は、最近、暗号化されたフィールド上で計算を行う能力により、ますます注目を集めている。
本稿では,スケーリング問題の解決に向けて,新しい分散HEベースのデータマイニングフレームワークを提案する。
各種データマイニングアルゴリズムとベンチマークデータセットを用いて,新しいフレームワークの有効性と有効性を検証する。
論文 参考訳(メタデータ) (2020-06-17T18:14:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。