論文の概要: Apriori_Goal algorithm for constructing association rules for a database with a given classification
- arxiv url: http://arxiv.org/abs/2411.00615v1
- Date: Fri, 01 Nov 2024 14:23:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-05 21:27:42.660116
- Title: Apriori_Goal algorithm for constructing association rules for a database with a given classification
- Title(参考訳): 与えられた分類を持つデータベースの関連ルール構築のためのApriori_Goalアルゴリズム
- Authors: Vladimir Billig,
- Abstract要約: Apriori_Goalは、与えられた分類を持つ関係データベースの関連ルールを構築するために提案される。
プリプロセッサは、元のデータベースの列で表されるオブジェクトのプロパティをバイナリプロパティに変換し、各レコードを1つの整数としてエンコードする。
メモリの保存に加えて、提案フォーマットでは、元のレコードを表すバイナリプロパティに関する情報を完全に保存することができる。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: An efficient algorithm, Apriori_Goal, is proposed for constructing association rules for a relational database with a given classification. The algorithm's features are related to the specifics of the database and the method of encoding its records. The algorithm proposes five criteria that characterize the quality of the rules being constructed. Different criteria are also proposed for filtering the sets used when constructing association rules. The proposed method of encoding records allows for an efficient implementation of the basic operation underlying the computation of rule characteristics. The algorithm works with a relational database, where the columns can be of different types, both continuous and discrete. Among the columns, a target discrete column is distinguished, which defines the classification of the records. This allows the original database to be divided into $n$ subsets according to the number of categories of the target parameter. A classical example of such databases is medical databases, where the target parameter is the diagnosis established by doctors. A preprocessor, which is an important part of the algorithm, converts the properties of the objects represented by the columns of the original database into binary properties and encodes each record as a single integer. In addition to saving memory, the proposed format allows the complete preservation of information about the binary properties representing the original record. More importantly, the computationally intensive operations on records, required for calculating rule characteristics, are performed almost instantly in this format using a pair of logical operations on integers.
- Abstract(参考訳): Apriori_Goalというアルゴリズムは、与えられた分類を持つ関係データベースの関連ルールを構築するために提案される。
アルゴリズムの特徴は、データベースの仕様と、そのレコードを符号化する方法に関係している。
このアルゴリズムは、構築中のルールの品質を特徴付ける5つの基準を提案する。
また、アソシエーションルールを構成する際に使用される集合をフィルタリングするために異なる基準が提案される。
提案手法は,ルール特性の計算を基礎とした基本動作の効率的な実装を可能にする。
アルゴリズムはリレーショナルデータベースで動作し、カラムは連続型と離散型の両方で異なるタイプのものになり得る。
列のうち、対象の離散列を区別し、レコードの分類を定義する。
これにより、元のデータベースをターゲットパラメータのカテゴリ数に応じて$n$サブセットに分割することができる。
そのようなデータベースの古典的な例は医学データベースであり、ターゲットパラメータは医師が確立した診断である。
アルゴリズムの重要な部分であるプリプロセッサは、元のデータベースの列で表されるオブジェクトのプロパティをバイナリプロパティに変換し、各レコードを1つの整数としてエンコードする。
メモリの保存に加えて、提案フォーマットでは、元のレコードを表すバイナリプロパティに関する情報を完全に保存することができる。
さらに重要なことに、ルール特性を計算するのに必要なレコードに対する計算集約的な操作は、整数上の論理演算のペアを使用して、この形式でほぼ瞬時に実行される。
関連論文リスト
- On Socially Fair Low-Rank Approximation and Column Subset Selection [62.44413238556872]
低ランク近似と列サブセット選択は、豊富な機械学習アプリケーションに適用される2つの基本的および関連する問題である。
驚くべきことに、一定要素の近似であっても、特定の標準複雑性仮説の下では指数時間を必要とすることが示される。
一定の数の群と一定要素の精度で、na"ive $ntextpoly(k)$ではなく2textpoly(k)$ timeで実行されるような、公平な低ランク近似のアルゴリズムを与える。
論文 参考訳(メタデータ) (2024-12-08T20:34:16Z) - SHINE: Saliency-aware HIerarchical NEgative Ranking for Compositional Temporal Grounding [52.98133831401225]
時間的グラウンドディング(英: Temporal grounding、ビデオモーメント検索(英語版))は、所定のクエリ文に対応するビデオセグメントを特定することを目的としている。
本稿では, GPT-3.5-Turbo を用いた負のクエリ構築のための大規模言語モデル駆動手法を提案する。
本稿では,ビデオと階層的負のクエリ間の多粒度意味的関係を学習するモデルを提案する。
論文 参考訳(メタデータ) (2024-07-06T16:08:17Z) - Scalable Rule Lists Learning with Sampling [9.681286056736292]
大規模データセットからほぼ最適なルールリストを学習するための新しいアプローチを提案する。
本アルゴリズムは,最適規則リストの近似を効率的に取得するためにサンプリングを用いる。
我々のアルゴリズムは、最先端の正確なアプローチに対して最大2桁の速度で、ほぼ最適なルールリストを識別する。
論文 参考訳(メタデータ) (2024-06-18T17:15:00Z) - ChatRule: Mining Logical Rules with Large Language Models for Knowledge
Graph Reasoning [107.61997887260056]
そこで我々は,知識グラフ上の論理ルールをマイニングするための大規模言語モデルの力を解き放つ新しいフレームワークChatRuleを提案する。
具体的には、このフレームワークは、KGのセマンティック情報と構造情報の両方を活用するLLMベースのルールジェネレータで開始される。
生成されたルールを洗練させるために、ルールランキングモジュールは、既存のKGから事実を取り入れてルール品質を推定する。
論文 参考訳(メタデータ) (2023-09-04T11:38:02Z) - Towards Target Sequential Rules [52.4562332499155]
ターゲット・シーケンシャル・ルール・マイニング(TaSRM)と呼ばれる効率的なアルゴリズムを提案する。
新たなアルゴリズムであるTaSRMとその変種は,既存のベースラインアルゴリズムと比較して実験性能がよいことを示す。
論文 参考訳(メタデータ) (2022-06-09T18:59:54Z) - US-Rule: Discovering Utility-driven Sequential Rules [52.68017415747925]
我々は,高ユーティリティシーケンシャルルールを効率的にマイニングする,US-Ruleと呼ばれる高速アルゴリズムを提案する。
より厳密な上界(LEEU, REEU, LERSU, RERSU)とそれに対応する刈り取り戦略を提案する。
US-Ruleは実行時間、メモリ消費、スケーラビリティの点でパフォーマンスが向上する。
論文 参考訳(メタデータ) (2021-11-29T23:38:28Z) - Interpretable and Fair Boolean Rule Sets via Column Generation [18.08486863429421]
整数プログラムは、規則単純性のために最適に分類精度を交換するように定式化される。
公平性の設定を考慮し、分類パリティの2つの異なる尺度に関する明示的な制約を含むように定式化を拡張した。
他の公正かつ解釈可能な分類器と比較して、我々の手法は、公正性のより厳密な概念に適合する規則セットを精度の低いトレードオフで見つけることができる。
論文 参考訳(メタデータ) (2021-11-16T13:40:28Z) - Discovering Useful Compact Sets of Sequential Rules in a Long Sequence [57.684967309375274]
COSSUは、小さな、意味のある一連の規則をマイニングするアルゴリズムである。
COSSUは、長いシーケンスから、関連するクローズド・シーケンシャル・ルールの集合を検索できることを示す。
論文 参考訳(メタデータ) (2021-09-15T18:25:18Z) - Better Short than Greedy: Interpretable Models through Optimal Rule
Boosting [10.938624307941197]
ルールアンサンブルは、予測精度とモデル解釈可能性の間の有用なトレードオフを提供するように設計されている。
与えられたアンサンブルサイズに対して最大予測力の規則アンサンブルを適合させる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-01-21T01:03:48Z) - Building Rule Hierarchies for Efficient Logical Rule Learning from
Knowledge Graphs [20.251630903853016]
本稿では,ルール階層を用いて非プロミッシングルールを抽出する新しい手法を提案する。
HPMの応用は非プロムルールの除去に有効であることを示す。
論文 参考訳(メタデータ) (2020-06-29T16:33:30Z) - Towards Learning Instantiated Logical Rules from Knowledge Graphs [20.251630903853016]
本稿では,知識グラフから一階述語論理規則を抽出するために最適化された確率論的学習ルールGPFLを提案する。
GPFLは、抽出された経路を非循環的な抽象規則であるテンプレートに一般化する新しい2段階ルール生成機構を利用する。
オーバーフィッティングルールの存在、予測性能への影響、およびオーバーフィッティングルールをフィルタリングする単純なバリデーション手法の有効性を明らかにする。
論文 参考訳(メタデータ) (2020-03-13T00:32:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。