論文の概要: Exploring the Trie of Rules: a fast data structure for the
representation of association rules
- arxiv url: http://arxiv.org/abs/2310.17355v1
- Date: Thu, 26 Oct 2023 12:44:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-27 20:29:55.653830
- Title: Exploring the Trie of Rules: a fast data structure for the
representation of association rules
- Title(参考訳): ルールのトライを探求する: 関連ルールの表現のための高速なデータ構造
- Authors: Mikhail Kudriavtsev, Dr Marija Bezbradica, Dr Andrew McCarren
- Abstract要約: 関連ルールマイニング技術は、トランザクションデータベース上に実装された場合、大量のシーケンシャルデータを生成することができる。
本稿では,アソシエーションルールマイニングによって生成されるルールセットを格納するための,ルールのトライ(True of Rule)と呼ばれる新しいデータ構造を提案する。
特定のルールの検索やソートといった基本的な操作の時間的メリットの観点から、ほとんどデータ損失や利益を伴わないルールセットを圧縮する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Association rule mining techniques can generate a large volume of sequential
data when implemented on transactional databases. Extracting insights from a
large set of association rules has been found to be a challenging process. When
examining a ruleset, the fundamental question is how to summarise and represent
meaningful mined knowledge efficiently. Many algorithms and strategies have
been developed to address issue of knowledge extraction; however, the
effectiveness of this process can be limited by the data structures. A better
data structure can sufficiently affect the speed of the knowledge extraction
process. This paper proposes a novel data structure, called the Trie of rules,
for storing a ruleset that is generated by association rule mining. The
resulting data structure is a prefix-tree graph structure made of pre-mined
rules. This graph stores the rules as paths within the prefix-tree in a way
that similar rules overlay each other. Each node in the tree represents a rule
where a consequent is this node, and an antecedent is a path from this node to
the root of the tree. The evaluation showed that the proposed representation
technique is promising. It compresses a ruleset with almost no data loss and
benefits in terms of time for basic operations such as searching for a specific
rule and sorting, which is the base for many knowledge discovery methods.
Moreover, our method demonstrated a significant improvement in traversing time,
achieving an 8-fold increase compared to traditional data structures.
- Abstract(参考訳): アソシエーションルールマイニング技術は、トランザクショナルデータベースに実装されると大量のシーケンシャルデータを生成することができる。
関連ルールの集合から洞察を抽出することは、難しいプロセスであることが判明した。
ルールセットを調べる場合、基本的な問題は、有意義な知識を効率的に要約し、表現する方法である。
多くのアルゴリズムと戦略が知識抽出の問題に対処するために開発されたが、このプロセスの有効性はデータ構造によって制限される。
より良いデータ構造は、知識抽出プロセスの速度に十分に影響を与え得る。
本稿では,アソシエーションルールマイニングによって生成されるルールセットを格納するための新しいデータ構造,the trie of rulesを提案する。
結果として得られるデータ構造は、プリミネートされたルールで構成されたプレフィックスツリーグラフ構造である。
このグラフは、ルールをプレフィックスツリー内のパスとして、同様のルールが相互にオーバーレイするように格納する。
ツリーの各ノードは、列がこのノードであるルールを表し、先行ノードは、このノードからツリーの根へのパスである。
評価の結果,提案手法は有望であった。
特定のルールの検索やソートといった、多くの知識発見手法の基盤となる基本的な操作の時間的な観点で、データロスやメリットをほとんど持たないルールセットを圧縮する。
さらに,従来のデータ構造に比べて8倍に向上し,トラバース時間を大幅に改善した。
関連論文リスト
- Mining Path Association Rules in Large Property Graphs (with Appendix) [15.11494401922146]
アソシエーション・ルール・マイニングはアイテムセットやサブストラクチャにおける規則的なパターンをうまく発見する。
パス・アソシエーション・ルール・マイニング(PARM)の問題点について紹介する。
我々は,探索空間を効果的に創り出すために,対単調性特性を利用した効率的でスケーラブルなアルゴリズムPIONEERを開発した。
論文 参考訳(メタデータ) (2024-08-04T13:39:57Z) - From Chain to Tree: Refining Chain-like Rules into Tree-like Rules on
Knowledge Graphs [26.237564631208354]
本稿では,知識グラフのツリーライクなルールの概念を提案し,適用範囲を拡大する。
本稿では,チェーンライクなルールをツリーライクなルールに書き換えるための効果的なフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-08T07:55:42Z) - PipeNet: Question Answering with Semantic Pruning over Knowledge Graphs [56.5262495514563]
本稿では,雑音の多い計算ノードに対して,グラウンドング・プルーニング・レゾニング・パイプラインを提案する。
また,グラフアテンションネットワーク(GAT)をベースとしたサブグラフデータに基づくモジュールを提案する。
論文 参考訳(メタデータ) (2024-01-31T01:37:33Z) - ChatRule: Mining Logical Rules with Large Language Models for Knowledge
Graph Reasoning [107.61997887260056]
そこで我々は,知識グラフ上の論理ルールをマイニングするための大規模言語モデルの力を解き放つ新しいフレームワークChatRuleを提案する。
具体的には、このフレームワークは、KGのセマンティック情報と構造情報の両方を活用するLLMベースのルールジェネレータで開始される。
生成されたルールを洗練させるために、ルールランキングモジュールは、既存のKGから事実を取り入れてルール品質を推定する。
論文 参考訳(メタデータ) (2023-09-04T11:38:02Z) - Self-Supervised Temporal Graph learning with Temporal and Structural Intensity Alignment [53.72873672076391]
時間グラフ学習は、動的情報を用いたグラフベースのタスクのための高品質な表現を生成することを目的としている。
本稿では,時間的および構造的情報の両方を抽出する時間的グラフ学習のためのS2Tという自己教師型手法を提案する。
S2Tは、いくつかのデータセットにおける最先端の競合と比較して、少なくとも10.13%のパフォーマンス改善を実現している。
論文 参考訳(メタデータ) (2023-02-15T06:36:04Z) - Efficient learning of large sets of locally optimal classification rules [0.0]
従来のルール学習アルゴリズムは、単純なルールの集合を見つけることを目的としており、各ルールは可能な限り多くの例をカバーする。
本稿では、この方法で発見されたルールは、それらがカバーする例のそれぞれに対して最適な説明ではないかもしれないと論じる。
本稿では,1つの特殊化ループと1つの一般化ループからなるグリーディ最適化において,各トレーニング例をカバーする最良のルールを見つけることを目的とした,効率的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-01-24T11:40:28Z) - RulE: Knowledge Graph Reasoning with Rule Embedding [69.31451649090661]
我々は、論理ルールを活用してKG推論を強化する、textbfRulE(ルール埋め込みのためのスタンド)と呼ばれる原則的なフレームワークを提案する。
RulEは、既存の三重項と一階規則からルールの埋め込みを学習し、統一された埋め込み空間において、textbfentities、textbfrelations、textbflogical rulesを共同で表現する。
複数のベンチマークの結果、我々のモデルは既存の埋め込みベースのアプローチやルールベースのアプローチよりも優れています。
論文 参考訳(メタデータ) (2022-10-24T06:47:13Z) - Reinforcement Learning Based Query Vertex Ordering Model for Subgraph
Matching [58.39970828272366]
グラフマッチングアルゴリズムは、クエリグラフの埋め込みをデータグラフGに列挙する。
マッチング順序は、これらのバックトラックに基づくサブグラフマッチングアルゴリズムの時間効率において重要な役割を果たす。
本稿では,Reinforcement Learning (RL) と Graph Neural Networks (GNN) 技術を適用して,グラフマッチングアルゴリズムの高品質なマッチング順序を生成する。
論文 参考訳(メタデータ) (2022-01-25T00:10:03Z) - Building Rule Hierarchies for Efficient Logical Rule Learning from
Knowledge Graphs [20.251630903853016]
本稿では,ルール階層を用いて非プロミッシングルールを抽出する新しい手法を提案する。
HPMの応用は非プロムルールの除去に有効であることを示す。
論文 参考訳(メタデータ) (2020-06-29T16:33:30Z) - Towards Learning Instantiated Logical Rules from Knowledge Graphs [20.251630903853016]
本稿では,知識グラフから一階述語論理規則を抽出するために最適化された確率論的学習ルールGPFLを提案する。
GPFLは、抽出された経路を非循環的な抽象規則であるテンプレートに一般化する新しい2段階ルール生成機構を利用する。
オーバーフィッティングルールの存在、予測性能への影響、およびオーバーフィッティングルールをフィルタリングする単純なバリデーション手法の有効性を明らかにする。
論文 参考訳(メタデータ) (2020-03-13T00:32:46Z) - Graph Inference Learning for Semi-supervised Classification [50.55765399527556]
半教師付きノード分類の性能を高めるためのグラフ推論学習フレームワークを提案する。
推論過程の学習には,トレーニングノードから検証ノードへの構造関係のメタ最適化を導入する。
4つのベンチマークデータセットの総合的な評価は、最先端の手法と比較して提案したGILの優位性を示している。
論文 参考訳(メタデータ) (2020-01-17T02:52:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。