論文の概要: Separate and conquer heuristic allows robust mining of contrast sets
from various types of data
- arxiv url: http://arxiv.org/abs/2204.00497v1
- Date: Fri, 1 Apr 2022 14:57:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-04 13:48:53.488557
- Title: Separate and conquer heuristic allows robust mining of contrast sets
from various types of data
- Title(参考訳): 分離して征服するヒューリスティックは、様々な種類のデータからコントラスト集合をロバストにマイニングする
- Authors: Adam Gudy\'s and Marek Sikora and {\L}ukasz Wr\'obel
- Abstract要約: RuleKit-CSは、シーケンシャルな被覆属性に基づいたコントラストセットマイニングのためのアルゴリズムである。
レグレッションデータセットとサバイバルデータセットのコントラストセットを識別する機能は、Re RuleKit-CSのユーザビリティを拡大する。
- 参考スコア(独自算出の注目度): 0.08594140167290096
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Identifying differences between groups is one of the most important knowledge
discovery problems. The procedure, also known as contrast sets mining, is
applied in a wide range of areas like medicine, industry, or economics. In the
paper we present RuleKit-CS, an algorithm for contrast set mining based on a
sequential covering - a well established heuristic for decision rule induction.
Multiple passes accompanied with an attribute penalization scheme allow
generating contrast sets describing same examples with different attributes,
unlike the standard sequential covering. The ability to identify contrast sets
in regression and survival data sets, the feature not provided by the existing
algorithms, further extends the usability of RuleKit-CS. Experiments on wide
range of data sets confirmed RuleKit-CS to be a useful tool for discovering
differences between defined groups. The algorithm is a part of the RuleKit
suite available at GitHub under GNU AGPL 3 licence
(https://github.com/adaa-polsl/RuleKit).
Keywords: Contrast sets, Sequential covering, Rule induction, Regression,
Survival, Knowledge discovery
- Abstract(参考訳): グループ間の差異を特定することは、最も重要な知識発見問題の1つである。
この手順はコントラストセットマイニングとしても知られ、医療、産業、経済など幅広い分野に適用されている。
本稿では、逐次被覆に基づくコントラストセットマイニングのアルゴリズムであるルールKit-CSについて述べる。
属性ペナリゼーションスキームを伴う複数のパスは、標準的なシーケンシャルカバーとは異なり、異なる属性で同じ例を記述するコントラストセットを生成することができる。
既存のアルゴリズムでは提供されていないレグレッションデータセットとサバイバルデータセットのコントラストセットを識別する機能は、さらにルールKit-CSのユーザビリティを高める。
幅広いデータセットの実験により、ルールKit-CSは定義されたグループ間の差異を発見するのに有用なツールであると確認された。
このアルゴリズムはGitHubのGNU AGPL 3ライセンス(https://github.com/adaa-polsl/RuleKit)で利用できるRe RuleKitスイートの一部である。
キーワード:コントラストセット、シーケンシャルカバー、ルール誘導、回帰、生存、知識発見
関連論文リスト
- Binning as a Pretext Task: Improving Self-Supervised Learning in Tabular Domains [0.565395466029518]
そこで本研究では,古典的ビンニング手法に基づく新しいプレテキストタスクを提案する。
その考え方は単純で、元の値ではなく、binインデックス(順序またはクラス)を再構築する。
我々の実証調査では、ビンニングの利点がいくつか確認されている。
論文 参考訳(メタデータ) (2024-05-13T01:23:14Z) - Combinatorial Stochastic-Greedy Bandit [79.1700188160944]
我々は,選択した$n$のアームセットのジョイント報酬以外の余分な情報が観測されない場合に,マルチアームのバンディット問題に対する新規グリーディ・バンディット(SGB)アルゴリズムを提案する。
SGBは最適化された拡張型コミットアプローチを採用しており、ベースアームの大きなセットを持つシナリオ用に特別に設計されている。
論文 参考訳(メタデータ) (2023-12-13T11:08:25Z) - Boosting Commit Classification with Contrastive Learning [0.8655526882770742]
コミット分類(CC)は、ソフトウェアのメンテナンスにおいて重要なタスクである。
対照的な学習に基づくコミット分類フレームワークを提案する。
われわれのフレームワークはCCの問題をシンプルに解決できるが、スプリットショットのシナリオでは効果的に解決できる。
論文 参考訳(メタデータ) (2023-08-16T10:02:36Z) - ComPtr: Towards Diverse Bi-source Dense Prediction Tasks via A Simple
yet General Complementary Transformer [91.43066633305662]
本稿では,多種多様な二ソース密度予測タスクのためのアンダーラインComPlementaryアンダーライン変換器textbfComPtrを提案する。
ComPtrは異なる入力を等しく扱い、変換器上にシーケンス・ツー・シーケンスの形で効率的な密な相互作用モデルを構築する。
論文 参考訳(メタデータ) (2023-07-23T15:17:45Z) - Association Rules Mining with Auto-Encoders [5.175050215292647]
ARM-AEと呼ばれるマイニングアソシエーションルールに対するオートエンコーダソリューションを提案する。
提案アルゴリズムは,高いサポートと信頼性のルールセットを発見し,従来の手法よりも優れた実行時間を有する。
論文 参考訳(メタデータ) (2023-04-26T17:55:44Z) - Composite Feature Selection using Deep Ensembles [130.72015919510605]
本研究では,事前定義されたグループ化を伴わない予測的特徴群発見の問題について検討する。
本稿では,特徴選択モデルのアンサンブルを用いて予測グループを探索する,新しいディープラーニングアーキテクチャを提案する。
発見群と基底真理の類似性を測定するための新しい尺度を提案する。
論文 参考訳(メタデータ) (2022-11-01T17:49:40Z) - Fair Wrapping for Black-box Predictions [105.10203274098862]
予測を修飾するα木として定義したラッパー関数を学習する。
この修正は, アルファツリーの構成, 一般化, 解釈可能性, および修正された予測とオリジナル予測のKLの相違に関して, 魅力的な性質を有することを示す。
論文 参考訳(メタデータ) (2022-01-31T01:02:39Z) - Memory Regulation and Alignment toward Generalizer RGB-Infrared Person [26.46821443401331]
RGB-IR ReIDは、常に差別的機能を必要としており、見受けられるクラスの過度な機能感度をもたらす。
本稿では,この問題を解決するために,新しい多粒性メモリ制御およびアライメントモジュール(MG-MRA)を提案する。
本手法は,授業の識別的特徴に関するモデルの過度な信頼を緩和する。
論文 参考訳(メタデータ) (2021-09-18T05:55:06Z) - Discovering Useful Compact Sets of Sequential Rules in a Long Sequence [57.684967309375274]
COSSUは、小さな、意味のある一連の規則をマイニングするアルゴリズムである。
COSSUは、長いシーケンスから、関連するクローズド・シーケンシャル・ルールの集合を検索できることを示す。
論文 参考訳(メタデータ) (2021-09-15T18:25:18Z) - Learn to Predict Sets Using Feed-Forward Neural Networks [63.91494644881925]
本稿では、ディープフィードフォワードニューラルネットワークを用いた設定予測の課題に対処する。
未知の置換と基数を持つ集合を予測するための新しい手法を提案する。
関連視覚問題に対する集合定式化の有効性を実証する。
論文 参考訳(メタデータ) (2020-01-30T01:52:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。