論文の概要: Apriori_Goal algorithm for constructing association rules for a database with a given classification
- arxiv url: http://arxiv.org/abs/2411.00615v1
- Date: Fri, 01 Nov 2024 14:23:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-05 21:27:42.660116
- Title: Apriori_Goal algorithm for constructing association rules for a database with a given classification
- Title(参考訳): 与えられた分類を持つデータベースの関連ルール構築のためのApriori_Goalアルゴリズム
- Authors: Vladimir Billig,
- Abstract要約: Apriori_Goalは、与えられた分類を持つ関係データベースの関連ルールを構築するために提案される。
プリプロセッサは、元のデータベースの列で表されるオブジェクトのプロパティをバイナリプロパティに変換し、各レコードを1つの整数としてエンコードする。
メモリの保存に加えて、提案フォーマットでは、元のレコードを表すバイナリプロパティに関する情報を完全に保存することができる。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: An efficient algorithm, Apriori_Goal, is proposed for constructing association rules for a relational database with a given classification. The algorithm's features are related to the specifics of the database and the method of encoding its records. The algorithm proposes five criteria that characterize the quality of the rules being constructed. Different criteria are also proposed for filtering the sets used when constructing association rules. The proposed method of encoding records allows for an efficient implementation of the basic operation underlying the computation of rule characteristics. The algorithm works with a relational database, where the columns can be of different types, both continuous and discrete. Among the columns, a target discrete column is distinguished, which defines the classification of the records. This allows the original database to be divided into $n$ subsets according to the number of categories of the target parameter. A classical example of such databases is medical databases, where the target parameter is the diagnosis established by doctors. A preprocessor, which is an important part of the algorithm, converts the properties of the objects represented by the columns of the original database into binary properties and encodes each record as a single integer. In addition to saving memory, the proposed format allows the complete preservation of information about the binary properties representing the original record. More importantly, the computationally intensive operations on records, required for calculating rule characteristics, are performed almost instantly in this format using a pair of logical operations on integers.
- Abstract(参考訳): Apriori_Goalというアルゴリズムは、与えられた分類を持つ関係データベースの関連ルールを構築するために提案される。
アルゴリズムの特徴は、データベースの仕様と、そのレコードを符号化する方法に関係している。
このアルゴリズムは、構築中のルールの品質を特徴付ける5つの基準を提案する。
また、アソシエーションルールを構成する際に使用される集合をフィルタリングするために異なる基準が提案される。
提案手法は,ルール特性の計算を基礎とした基本動作の効率的な実装を可能にする。
アルゴリズムはリレーショナルデータベースで動作し、カラムは連続型と離散型の両方で異なるタイプのものになり得る。
列のうち、対象の離散列を区別し、レコードの分類を定義する。
これにより、元のデータベースをターゲットパラメータのカテゴリ数に応じて$n$サブセットに分割することができる。
そのようなデータベースの古典的な例は医学データベースであり、ターゲットパラメータは医師が確立した診断である。
アルゴリズムの重要な部分であるプリプロセッサは、元のデータベースの列で表されるオブジェクトのプロパティをバイナリプロパティに変換し、各レコードを1つの整数としてエンコードする。
メモリの保存に加えて、提案フォーマットでは、元のレコードを表すバイナリプロパティに関する情報を完全に保存することができる。
さらに重要なことに、ルール特性を計算するのに必要なレコードに対する計算集約的な操作は、整数上の論理演算のペアを使用して、この形式でほぼ瞬時に実行される。
関連論文リスト
- Binning as a Pretext Task: Improving Self-Supervised Learning in Tabular Domains [0.565395466029518]
そこで本研究では,古典的ビンニング手法に基づく新しいプレテキストタスクを提案する。
その考え方は単純で、元の値ではなく、binインデックス(順序またはクラス)を再構築する。
我々の実証調査では、ビンニングの利点がいくつか確認されている。
論文 参考訳(メタデータ) (2024-05-13T01:23:14Z) - Gödel Number based Clustering Algorithm with Decimal First Degree Cellular Automata [0.0]
本稿では,FDCAに基づくクラスタリングアルゴリズムを提案する。
データオブジェクトは、G"odel番号ベースのエンコーディングを使用して十進文字列にエンコードされる。
既存のクラスタリングアルゴリズムと比較して,提案アルゴリズムは性能が向上する。
論文 参考訳(メタデータ) (2024-05-08T08:30:34Z) - SortNet: Learning To Rank By a Neural-Based Sorting Algorithm [5.485151775727742]
本稿では、ニューラルネットワークをコンパレータとしてオブジェクトを順序付けする適応的なランキングアルゴリズムであるSoltNetを提案する。
提案アルゴリズムをLETORデータセット上で評価し,他の手法と比較して有望な性能を示す。
論文 参考訳(メタデータ) (2023-11-03T12:14:26Z) - Uni-Parser: Unified Semantic Parser for Question Answering on Knowledge
Base and Database [86.03294330305097]
知識ベース(KB)とデータベース(DB)の両方で質問応答(QA)を統一した意味的要素を提案する。
フレームワークに不可欠な要素としてプリミティブ(KBのリレーションとエンティティ、テーブル名、列名、DBのセル値)を導入します。
生成元を利用して、異なる操作でトップランクプリミティブを変更・構成することで、最終的な論理形式を予測する。
論文 参考訳(メタデータ) (2022-11-09T19:33:27Z) - Language Model Decoding as Likelihood-Utility Alignment [54.70547032876017]
モデルの有効性がタスク固有の実用性の概念とどのように一致しているかについて、暗黙の仮定に基づいて、デコード戦略をグループ化する分類法を導入する。
具体的には、様々なタスクの集合における予測の可能性と有用性の相関を解析することにより、提案された分類を裏付ける最初の実証的証拠を提供する。
論文 参考訳(メタデータ) (2022-10-13T17:55:51Z) - A Method for Application of a Quantum Search Algorithm to Classical
Databases [2.635832975589208]
本稿では,Groverの探索アルゴリズムを用いて,真のデータベース検索を行う方法を提案する。
次に,Grover による候補解のデータベース検索に基づく Diffie-Hellman 暗号システムに対する攻撃の可能性を示す。
論文 参考訳(メタデータ) (2022-06-08T14:56:55Z) - Knowledge Base Question Answering by Case-based Reasoning over Subgraphs [81.22050011503933]
本モデルでは,既存のKG補完アルゴリズムよりも複雑な推論パターンを必要とする問合せに対して,より効果的に答えることを示す。
提案モデルは、KBQAベンチマークの最先端モデルよりも優れているか、競合的に動作する。
論文 参考訳(メタデータ) (2022-02-22T01:34:35Z) - Estimating leverage scores via rank revealing methods and randomization [50.591267188664666]
任意のランクの正方形密度あるいはスパース行列の統計レバレッジスコアを推定するアルゴリズムについて検討した。
提案手法は,高密度およびスパースなランダム化次元性還元変換の合成と階調明細化法を組み合わせることに基づく。
論文 参考訳(メタデータ) (2021-05-23T19:21:55Z) - New advances in enumerative biclustering algorithms with online
partitioning [80.22629846165306]
さらに、数値データセットの列に定数値を持つ最大二クラスタの効率的で完全で正しい非冗長列挙を実現できる二クラスタリングアルゴリズムであるRIn-Close_CVCを拡張した。
改良されたアルゴリズムはRIn-Close_CVC3と呼ばれ、RIn-Close_CVCの魅力的な特性を保ちます。
論文 参考訳(メタデータ) (2020-03-07T14:54:26Z) - Optimal Clustering from Noisy Binary Feedback [75.17453757892152]
本稿では,二元的ユーザフィードバックから一組のアイテムをクラスタリングする問題について検討する。
最小クラスタ回復誤差率のアルゴリズムを考案する。
適応選択のために,情報理論的誤差下界の導出にインスパイアされたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2019-10-14T09:18:26Z) - QCBA: Improving Rule Classifiers Learned from Quantitative Data by
Recovering Information Lost by Discretisation [5.667821885065119]
本稿では、離散化における損失情報を復元することを目的とした新しいルールチューニング手順と新しいプルーニング手法について述べる。
提案したQCBA法は,アソシエーション(CBA)アルゴリズムに基づく分類によって生成されたモデルの定量的属性を後処理するために開発された。
UCIリポジトリの22のデータセットのベンチマークでは、FOIL2+QCBAの7つのベースラインと比較して、サイズが小さく、全体的な最高の予測性能を示している。
論文 参考訳(メタデータ) (2017-11-28T08:09:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。