論文の概要: Apriori_Goal algorithm for constructing association rules for a database with a given classification
- arxiv url: http://arxiv.org/abs/2411.00615v2
- Date: Mon, 10 Feb 2025 15:43:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-11 14:24:00.741711
- Title: Apriori_Goal algorithm for constructing association rules for a database with a given classification
- Title(参考訳): 与えられた分類を持つデータベースの関連ルール構築のためのApriori_Goalアルゴリズム
- Authors: Vladimir Billig,
- Abstract要約: リレーショナルデータベースにおける関連ルール構築に有効なApriori_Goalアルゴリズムを提案する。
生成したルールの質は、ルール周波数を2つ、ルールの信頼性を2つ、ルールの4つの基準を重み付けした合計である。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: An efficient Apriori_Goal algorithm is proposed for constructing association rules in a relational database with predefined classification. The target parameter of the database specifies a finite number of goals $Goal_k$, for each of which the algorithm constructs association rules of the form $X \Rightarrow Goal_k$. The quality of the generated rules is characterized by five criteria: two represent rule frequency, two reflect rule reliability, and the fifth is a weighted sum of these four criteria. The algorithm initially generates rules with single premises, where the correlation criterion between the premise $X$ and the conclusion $Goal_k$ exceeds a specified threshold. Then, rules with extended premises are built based on the anti-monotonicity of rule frequency criteria and the monotonicity of rule reliability criteria. Newly constructed rules tend to decrease in frequency while increasing in reliability. The article proves several statements that justify the rule construction process. The algorithm enables the construction of both high-frequency and rare rules with low occurrence frequency but high reliability. It also allows for the generation of negative rules with negative correlation between the premise and conclusion, which can be valuable in practical applications for filtering out undesired goals. The efficiency of the algorithm is based on two factors: the method of encoding the database and its partitioning into subsets linked to the target parameter. Time complexity estimates for rule construction are provided using a medical database as an example.
- Abstract(参考訳): Apriori_Goalアルゴリズムは、事前定義された分類を持つ関係データベースにおいて、関連ルールを構築するために提案される。
データベースのターゲットパラメータは、アルゴリズムが$X \Rightarrow Goal_k$という形式のアソシエーションルールを構成する各目標に対して、$Goal_k$という有限個の値を指定する。
生成したルールの質は、ルール周波数を2つ、ルールの信頼性を2つ、ルールの4つの基準を重み付けした合計である。
アルゴリズムは最初、前提の$X$と結論の$Goal_k$との相関基準が指定された閾値を超えるような、単一の前提でルールを生成する。
次に、規則周波数基準の反単調性と規則信頼性基準の単調性に基づいて、拡張前提付きルールを構築する。
新しく構築された規則は信頼性を高めながら周波数を減少させる傾向がある。
この記事では、ルール構築プロセスを正当化するいくつかのステートメントを証明します。
このアルゴリズムは、発生頻度は低いが信頼性が高い高周波ルールと稀なルールの両方を構築することができる。
また、前提と結論の間に負の相関を持つ負の規則の生成も可能であり、これは望ましくない目標をフィルタリングする実践的な応用に有用である。
アルゴリズムの効率は、データベースを符号化する方法と、ターゲットパラメータにリンクされたサブセットに分割する方法の2つの要素に基づいている。
ルール構築のための時間複雑性推定は、医療データベースを例に挙げる。
関連論文リスト
- On Socially Fair Low-Rank Approximation and Column Subset Selection [62.44413238556872]
低ランク近似と列サブセット選択は、豊富な機械学習アプリケーションに適用される2つの基本的および関連する問題である。
驚くべきことに、一定要素の近似であっても、特定の標準複雑性仮説の下では指数時間を必要とすることが示される。
一定の数の群と一定要素の精度で、na"ive $ntextpoly(k)$ではなく2textpoly(k)$ timeで実行されるような、公平な低ランク近似のアルゴリズムを与える。
論文 参考訳(メタデータ) (2024-12-08T20:34:16Z) - SHINE: Saliency-aware HIerarchical NEgative Ranking for Compositional Temporal Grounding [52.98133831401225]
時間的グラウンドディング(英: Temporal grounding、ビデオモーメント検索(英語版))は、所定のクエリ文に対応するビデオセグメントを特定することを目的としている。
本稿では, GPT-3.5-Turbo を用いた負のクエリ構築のための大規模言語モデル駆動手法を提案する。
本稿では,ビデオと階層的負のクエリ間の多粒度意味的関係を学習するモデルを提案する。
論文 参考訳(メタデータ) (2024-07-06T16:08:17Z) - Scalable Rule Lists Learning with Sampling [9.681286056736292]
大規模データセットからほぼ最適なルールリストを学習するための新しいアプローチを提案する。
本アルゴリズムは,最適規則リストの近似を効率的に取得するためにサンプリングを用いる。
我々のアルゴリズムは、最先端の正確なアプローチに対して最大2桁の速度で、ほぼ最適なルールリストを識別する。
論文 参考訳(メタデータ) (2024-06-18T17:15:00Z) - ChatRule: Mining Logical Rules with Large Language Models for Knowledge
Graph Reasoning [107.61997887260056]
そこで我々は,知識グラフ上の論理ルールをマイニングするための大規模言語モデルの力を解き放つ新しいフレームワークChatRuleを提案する。
具体的には、このフレームワークは、KGのセマンティック情報と構造情報の両方を活用するLLMベースのルールジェネレータで開始される。
生成されたルールを洗練させるために、ルールランキングモジュールは、既存のKGから事実を取り入れてルール品質を推定する。
論文 参考訳(メタデータ) (2023-09-04T11:38:02Z) - Towards Target Sequential Rules [52.4562332499155]
ターゲット・シーケンシャル・ルール・マイニング(TaSRM)と呼ばれる効率的なアルゴリズムを提案する。
新たなアルゴリズムであるTaSRMとその変種は,既存のベースラインアルゴリズムと比較して実験性能がよいことを示す。
論文 参考訳(メタデータ) (2022-06-09T18:59:54Z) - US-Rule: Discovering Utility-driven Sequential Rules [52.68017415747925]
我々は,高ユーティリティシーケンシャルルールを効率的にマイニングする,US-Ruleと呼ばれる高速アルゴリズムを提案する。
より厳密な上界(LEEU, REEU, LERSU, RERSU)とそれに対応する刈り取り戦略を提案する。
US-Ruleは実行時間、メモリ消費、スケーラビリティの点でパフォーマンスが向上する。
論文 参考訳(メタデータ) (2021-11-29T23:38:28Z) - Interpretable and Fair Boolean Rule Sets via Column Generation [18.08486863429421]
整数プログラムは、規則単純性のために最適に分類精度を交換するように定式化される。
公平性の設定を考慮し、分類パリティの2つの異なる尺度に関する明示的な制約を含むように定式化を拡張した。
他の公正かつ解釈可能な分類器と比較して、我々の手法は、公正性のより厳密な概念に適合する規則セットを精度の低いトレードオフで見つけることができる。
論文 参考訳(メタデータ) (2021-11-16T13:40:28Z) - Discovering Useful Compact Sets of Sequential Rules in a Long Sequence [57.684967309375274]
COSSUは、小さな、意味のある一連の規則をマイニングするアルゴリズムである。
COSSUは、長いシーケンスから、関連するクローズド・シーケンシャル・ルールの集合を検索できることを示す。
論文 参考訳(メタデータ) (2021-09-15T18:25:18Z) - Better Short than Greedy: Interpretable Models through Optimal Rule
Boosting [10.938624307941197]
ルールアンサンブルは、予測精度とモデル解釈可能性の間の有用なトレードオフを提供するように設計されている。
与えられたアンサンブルサイズに対して最大予測力の規則アンサンブルを適合させる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-01-21T01:03:48Z) - Building Rule Hierarchies for Efficient Logical Rule Learning from
Knowledge Graphs [20.251630903853016]
本稿では,ルール階層を用いて非プロミッシングルールを抽出する新しい手法を提案する。
HPMの応用は非プロムルールの除去に有効であることを示す。
論文 参考訳(メタデータ) (2020-06-29T16:33:30Z) - Towards Learning Instantiated Logical Rules from Knowledge Graphs [20.251630903853016]
本稿では,知識グラフから一階述語論理規則を抽出するために最適化された確率論的学習ルールGPFLを提案する。
GPFLは、抽出された経路を非循環的な抽象規則であるテンプレートに一般化する新しい2段階ルール生成機構を利用する。
オーバーフィッティングルールの存在、予測性能への影響、およびオーバーフィッティングルールをフィルタリングする単純なバリデーション手法の有効性を明らかにする。
論文 参考訳(メタデータ) (2020-03-13T00:32:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。