論文の概要: Incremental Mining of Frequent Serial Episodes Considering Multiple
Occurrence
- arxiv url: http://arxiv.org/abs/2201.11650v1
- Date: Thu, 27 Jan 2022 17:10:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-28 17:14:59.730907
- Title: Incremental Mining of Frequent Serial Episodes Considering Multiple
Occurrence
- Title(参考訳): 多重発生を考慮した頻度シリアルエピソードのインクリメンタルマイニング
- Authors: Thomas Guyet, Wenbin Zhang and Albert Bifet
- Abstract要約: 基本的な研究方向の1つは、データストリーム上のシーケンシャルパターンをマイニングすることだ。
アイテムセットストリームのウィンドウ上のパターンとその複数の発生は、パターンの本質的な特徴を認識する追加の機能を提供する。
本稿では,探索空間を効率よく創出するための新しい戦略を持つ,効率の良いシーケンシャルマイニング手法を提案する。
- 参考スコア(独自算出の注目度): 11.387440344044315
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: The need to analyze information from streams arises in a variety of
applications. One of the fundamental research directions is to mine sequential
patterns over data streams. Current studies mine series of items based on the
existence of the pattern in transactions but pay no attention to the series of
itemsets and their multiple occurrences. The pattern over a window of itemsets
stream and their multiple occurrences, however, provides additional capability
to recognize the essential characteristics of the patterns and the
inter-relationships among them that are unidentifiable by the existing items
and existence based studies. In this paper, we study such a new sequential
pattern mining problem and propose a corresponding efficient sequential miner
with novel strategies to prune search space efficiently. Experiments on both
real and synthetic data show the utility of our approach.
- Abstract(参考訳): ストリームから情報を分析する必要性は、さまざまなアプリケーションに現れます。
基本的な研究方向の1つは、データストリーム上のシーケンシャルパターンをマイニングすることだ。
最近の研究では、取引におけるパターンの存在に基づいて一連のアイテムを発掘するが、一連のアイテムセットとその複数発生には注意を払わない。
しかし、アイテムセットストリームのウィンドウ上のパターンとその複数の発生は、既存のアイテムや存在に基づく研究では識別できないパターンの本質的特徴と相互関係を認識する付加的な能力を提供する。
本稿では,このような新たな逐次パターンマイニング問題について検討し,探索空間を効率的にプルーンする新しい戦略を持つ効率的な逐次マイナを提案する。
実データと合成データの両方の実験は、我々のアプローチの有用性を示している。
関連論文リスト
- RPS: A Generic Reservoir Patterns Sampler [1.09784964592609]
本稿では,ストリーミングバッチデータからの直接パターンサンプリングを容易にするために,重み付き貯水池を利用する手法を提案する。
本稿では、時間的バイアスに対処し、逐次的、重み付け、および非重み付けを含む様々なパターンタイプを処理できる汎用アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-31T16:25:21Z) - SEMINAR: Search Enhanced Multi-modal Interest Network and Approximate Retrieval for Lifelong Sequential Recommendation [16.370075234443245]
本稿では,SEMINAR-Search Enhanced Multi-Modal Interest Network と Approximate Retrieval という,一生涯にわたるマルチモーダルシーケンスモデルを提案する。
具体的には、Pretraining Search Unitと呼ばれるネットワークが、事前トレーニング-ファインタニング方式で、マルチモーダルクエリ-イテムペアの寿命のシーケンスを学習する。
マルチモーダル埋め込みのオンライン検索速度を高速化するために,マルチモーダルなコードブックベースの製品量子化戦略を提案する。
論文 参考訳(メタデータ) (2024-07-15T13:33:30Z) - State-Space Modeling in Long Sequence Processing: A Survey on Recurrence in the Transformer Era [59.279784235147254]
このサーベイは、シーケンシャルなデータ処理の反復モデルに基づく最新のアプローチの詳細な概要を提供する。
新たなイメージは、標準のバックプロパゲーション・オブ・タイムから外れた学習アルゴリズムによって構成される、新しいルートを考える余地があることを示唆している。
論文 参考訳(メタデータ) (2024-06-13T12:51:22Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Mutual Exclusivity Training and Primitive Augmentation to Induce
Compositionality [84.94877848357896]
最近のデータセットは、標準的なシーケンス・ツー・シーケンスモデルにおける体系的な一般化能力の欠如を露呈している。
本稿では,セq2seqモデルの振る舞いを分析し,相互排他バイアスの欠如と全例を記憶する傾向の2つの要因を同定する。
広範に使用されている2つの構成性データセット上で、標準的なシーケンス・ツー・シーケンスモデルを用いて、経験的改善を示す。
論文 参考訳(メタデータ) (2022-11-28T17:36:41Z) - Diversifying Design of Nucleic Acid Aptamers Using Unsupervised Machine
Learning [54.247560894146105]
短い一本鎖RNAとDNA配列(アプタマー)の逆設計は、一連の望ましい基準を満たす配列を見つけるタスクである。
我々は、Pottsモデルとして知られる教師なし機械学習モデルを用いて、制御可能なシーケンスの多様性を持つ新しい有用なシーケンスを発見することを提案する。
論文 参考訳(メタデータ) (2022-08-10T13:30:58Z) - TaSPM: Targeted Sequential Pattern Mining [53.234101208024335]
本稿では,高速CM-SPAMアルゴリズムに基づく汎用フレームワークTaSPMを提案する。
また,マイニングプロセスにおける無意味な操作を減らすために,いくつかのプルーニング戦略を提案する。
実験の結果,新たなターゲットマイニングアルゴリズムであるTaSPMは実行時間を短縮し,メモリ消費を低減できることがわかった。
論文 参考訳(メタデータ) (2022-02-26T17:49:47Z) - OPP-Miner: Order-preserving sequential pattern mining [26.997138010841347]
本稿では時系列データの順序関係に基づいてパターンを表現した順序保存シーケンシャルパターン(OPP)マイニング手法を提案する。
実験により、OPP-Minerは効率的でスケーラブルであるだけでなく、時系列で類似したサブシーケンスを発見できることが示された。
論文 参考訳(メタデータ) (2022-01-09T11:06:26Z) - Novel Features for Time Series Analysis: A Complex Networks Approach [62.997667081978825]
時系列データは、気候、経済、医療などいくつかの領域で広く使われている。
最近の概念的アプローチは、複雑なネットワークへの時系列マッピングに依存している。
ネットワーク分析は、異なるタイプの時系列を特徴付けるのに使うことができる。
論文 参考訳(メタデータ) (2021-10-11T13:46:28Z) - Extracting Seasonal Gradual Patterns from Temporal Sequence Data Using
Periodic Patterns Mining [0.0]
季節的段階的パターンは「Xが増加/減少するとYが増加/減少する」という形で複雑な属性の共変を捉える
多くの時系列データにおいて、同じ時間間隔で定期的に現れる漸進的なパターンを抽出する手法は提案されていない。
本稿では,複数のシークエンスに共通する周期的パターンのマイニングに基づく抽出手法を提案する。
論文 参考訳(メタデータ) (2020-10-20T14:03:37Z) - Multi-source Data Mining for e-Learning [3.8673630752805432]
パターンマイニングは、データから興味深い頻繁なパターンを抽出する。
データ量の増加に伴い、この領域では、マルチソースおよび異種データが新たな課題となっている。
この課題は、興味深い頻繁なパターンを抽出するために、マルチソースデータをマイニングする作業の中心となるものです。
論文 参考訳(メタデータ) (2020-09-17T15:39:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。