論文の概要: Neurosymbolic Association Rule Mining from Tabular Data
- arxiv url: http://arxiv.org/abs/2504.19354v1
- Date: Sun, 27 Apr 2025 20:43:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:54.250165
- Title: Neurosymbolic Association Rule Mining from Tabular Data
- Title(参考訳): タブラルデータからのニューロシンボリックアソシエーションルールマイニング
- Authors: Erkan Karabulut, Paul Groth, Victoria Degeler,
- Abstract要約: アソシエーションルールマイニング(アソシエーションルールマイニング、アソシエーションルールマイニング)は、論理ルールの形式でデータ特徴間のパターンをマイニングするタスクである。
Aerial+は、データのニューラル表現を生成し、特徴間の関連をキャプチャする、新しいニューロシンボリックARMメソッドである。
モデルの再構成機構を利用して、このニューラル表現からルールを抽出する。
- 参考スコア(独自算出の注目度): 1.3886978730184498
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Association Rule Mining (ARM) is the task of mining patterns among data features in the form of logical rules, with applications across a myriad of domains. However, high-dimensional datasets often result in an excessive number of rules, increasing execution time and negatively impacting downstream task performance. Managing this rule explosion remains a central challenge in ARM research. To address this, we introduce Aerial+, a novel neurosymbolic ARM method. Aerial+ leverages an under-complete autoencoder to create a neural representation of the data, capturing associations between features. It extracts rules from this neural representation by exploiting the model's reconstruction mechanism. Extensive evaluations on five datasets against seven baselines demonstrate that Aerial+ achieves state-of-the-art results by learning more concise, high-quality rule sets with full data coverage. When integrated into rule-based interpretable machine learning models, Aerial+ significantly reduces execution time while maintaining or improving accuracy.
- Abstract(参考訳): Association Rule Mining(ARM)は、論理ルールという形でデータ特徴間のパターンをマイニングするタスクである。
しかし、高次元データセットは、しばしば過剰な数のルールをもたらし、実行時間を増やし、下流タスクのパフォーマンスに悪影響を及ぼす。
このルールの爆発を管理することは、ARM研究における中心的な課題である。
そこで我々は,新しい神経象徴的ARM法であるAerial+を紹介する。
Aerial+は、未完成のオートエンコーダを利用してデータのニューラル表現を作成し、特徴間の関連をキャプチャする。
モデルの再構成機構を利用して、このニューラル表現からルールを抽出する。
7つのベースラインに対する5つのデータセットの大規模な評価は、Aerial+がより簡潔で高品質なルールセットを完全なデータカバレッジで学習することで、最先端の結果を達成することを示す。
ルールベースの解釈可能な機械学習モデルに統合されると、Aerial+は正確性を維持したり改善したりしながら実行時間を著しく短縮する。
関連論文リスト
- Towards Generalizable Trajectory Prediction Using Dual-Level Representation Learning And Adaptive Prompting [107.4034346788744]
既存の車両軌道予測モデルは、一般化可能性、予測の不確実性、複雑な相互作用を扱う。
本研究では,(1)自己拡張(SD)とマスドレコンストラクション(MR)による二重レベル表現学習,グローバルコンテキストと細部の詳細の収集,(2)レジスタベースのクエリと事前学習の強化,クラスタリングと抑圧の必要性の排除,(3)微調整中の適応型プロンプトチューニング,メインアーキテクチャの凍結,および少数のプロンプトの最適化といった,新たなトラジェクタ予測フレームワークであるPerceiverを提案する。
論文 参考訳(メタデータ) (2025-01-08T20:11:09Z) - ARC: A Generalist Graph Anomaly Detector with In-Context Learning [62.202323209244]
ARCは汎用的なGADアプローチであり、一対一のGADモデルで様々なグラフデータセットの異常を検出することができる。
ARCはコンテキスト内学習を備えており、ターゲットデータセットからデータセット固有のパターンを直接抽出することができる。
各種領域からの複数のベンチマークデータセットに対する大規模な実験は、ARCの優れた異常検出性能、効率、一般化性を示す。
論文 参考訳(メタデータ) (2024-05-27T02:42:33Z) - AE SemRL: Learning Semantic Association Rules with Autoencoders [1.3886978730184498]
アソシエーションルールマイニング(アソシエーションルールマイニング、英: Association Rule Mining、ARM)は、データ特徴間の関連を論理ルールの形で学習するタスクである。
本稿では,時系列データから関連ルールを学習し,抽出するためのオートエンコーダに基づく手法を提案する。
実験の結果,オートエンコーダが生成した潜在表現から意味的関連ルールを抽出できることが示唆された。
論文 参考訳(メタデータ) (2024-03-26T22:28:43Z) - Minimally Supervised Learning using Topological Projections in
Self-Organizing Maps [55.31182147885694]
自己組織化マップ(SOM)におけるトポロジカルプロジェクションに基づく半教師付き学習手法を提案する。
提案手法は,まずラベル付きデータ上でSOMを訓練し,最小限のラベル付きデータポイントをキーベストマッチングユニット(BMU)に割り当てる。
提案した最小教師付きモデルが従来の回帰手法を大幅に上回ることを示す。
論文 参考訳(メタデータ) (2024-01-12T22:51:48Z) - MADS: Modulated Auto-Decoding SIREN for time series imputation [9.673093148930874]
我々は,暗黙のニューラル表現に基づく時系列計算のための新しい自動デコードフレームワークMADSを提案する。
実世界の2つのデータセット上で本モデルを評価し,時系列計算における最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-07-03T09:08:47Z) - Neural Attentive Circuits [93.95502541529115]
我々は、NAC(Neural Attentive Circuits)と呼ばれる汎用的でモジュラーなニューラルアーキテクチャを導入する。
NACは、ドメイン知識を使わずに、ニューラルネットワークモジュールのパラメータ化と疎結合を学習する。
NACは推論時に8倍のスピードアップを達成するが、性能は3%以下である。
論文 参考訳(メタデータ) (2022-10-14T18:00:07Z) - Automatic Rule Induction for Efficient Semi-Supervised Learning [56.91428251227253]
半教師付き学習は、少量のラベル付きデータからNLPモデルを一般化できることを約束している。
事前訓練されたトランスモデルはブラックボックス相関エンジンとして機能し、説明が困難であり、時には信頼性に欠ける振る舞いをする。
本稿では,これらの課題に,簡易かつ汎用的なフレームワークであるAutomatic Rule Injection (ARI) を用いて対処することを提案する。
論文 参考訳(メタデータ) (2022-05-18T16:50:20Z) - R5: Rule Discovery with Reinforced and Recurrent Relational Reasoning [22.299799197937368]
R5は強化学習に基づく関係推論フレームワークである。
R5は強い体系性を持ち、ノイズの多いデータに対して堅牢である。
複数のデータセットに対して広範な評価を行う。
論文 参考訳(メタデータ) (2022-05-13T05:53:32Z) - Rank-R FNN: A Tensor-Based Learning Model for High-Order Data
Classification [69.26747803963907]
Rank-R Feedforward Neural Network (FNN)は、そのパラメータにCanonical/Polyadic分解を課すテンソルベースの非線形学習モデルである。
まず、入力をマルチリニアアレイとして扱い、ベクトル化の必要性を回避し、すべてのデータ次元に沿って構造情報を十分に活用することができる。
Rank-R FNNの普遍的な近似と学習性の特性を確立し、実世界のハイパースペクトルデータセットのパフォーマンスを検証する。
論文 参考訳(メタデータ) (2021-04-11T16:37:32Z) - CARRNN: A Continuous Autoregressive Recurrent Neural Network for Deep
Representation Learning from Sporadic Temporal Data [1.8352113484137622]
本稿では,散発データにおける複数の時間的特徴をモデル化するための新しい深層学習モデルを提案する。
提案モデルはCARRNNと呼ばれ、時間ラグによって変調されたニューラルネットワークを用いてエンドツーエンドにトレーニング可能な一般化された離散時間自己回帰モデルを使用する。
アルツハイマー病進行モデルおよび集中治療単位(ICU)死亡率予測のためのデータを用いて,多変量時系列回帰タスクに適用した。
論文 参考訳(メタデータ) (2021-04-08T12:43:44Z) - Disentangled Recurrent Wasserstein Autoencoder [17.769077848342334]
Recurrent Wasserstein Autoencoder (R-WAE)はシーケンシャルデータの生成モデリングのための新しいフレームワークである。
R-WAEは入力シーケンスの表現を静的および動的因子に切り離す。
私達のモデルは無条件のビデオ生成およびdisentanglementの点では同じ設定の他のベースラインを上回ります。
論文 参考訳(メタデータ) (2021-01-19T07:43:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。