論文の概要: Contrast Pattern Mining: A Survey
- arxiv url: http://arxiv.org/abs/2209.13556v1
- Date: Tue, 27 Sep 2022 17:11:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 16:08:37.572119
- Title: Contrast Pattern Mining: A Survey
- Title(参考訳): コントラストパターンマイニング:調査
- Authors: Yao Chen, Wensheng Gan, Yongdong Wu, and Philip S. Yu
- Abstract要約: この分野の研究者が短期間で現場の一般的な状況を理解することは困難である。
まず、識別能力を評価するための基本的な概念、タイプ、採掘戦略、メトリクスを含む、CPMの深い理解を示す。
我々は,CPM法の特徴を,境界ベースアルゴリズム,木ベースアルゴリズム,進化ファジィシステムベースアルゴリズム,決定木ベースアルゴリズム,その他のアルゴリズムに分類する。
- 参考スコア(独自算出の注目度): 54.06874773607785
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Contrast pattern mining (CPM) is an important and popular subfield of data
mining. Traditional sequential patterns cannot describe the contrast
information between different classes of data, while contrast patterns
involving the concept of contrast can describe the significant differences
between datasets under different contrast conditions. Based on the number of
papers published in this field, we find that researchers' interest in CPM is
still active. Since CPM has many research questions and research methods. It is
difficult for new researchers in the field to understand the general situation
of the field in a short period of time. Therefore, the purpose of this article
is to provide an up-to-date comprehensive and structured overview of the
research direction of contrast pattern mining. First, we present an in-depth
understanding of CPM, including basic concepts, types, mining strategies, and
metrics for assessing discriminative ability. Then we classify CPM methods
according to their characteristics into boundary-based algorithms, tree-based
algorithms, evolutionary fuzzy system-based algorithms, decision tree-based
algorithms, and other algorithms. In addition, we list the classical algorithms
of these methods and discuss their advantages and disadvantages. Advanced
topics in CPM are presented. Finally, we conclude our survey with a discussion
of the challenges and opportunities in this field.
- Abstract(参考訳): コントラストパターンマイニング(CPM)はデータマイニングの重要なサブフィールドである。
従来のシーケンシャルパターンは、異なるデータクラス間のコントラスト情報を記述できないが、コントラストの概念を含むコントラストパターンは、異なるコントラスト条件下でのデータセット間の重要な違いを記述できる。
この分野で出版された論文の数から、CPMに対する研究者の関心は依然として活発であることがわかる。
CPMには多くの研究課題や研究方法がある。
現場の新たな研究者が現場の一般的な状況を短時間で理解することは困難である。
そこで本論文の目的は,コントラストパターンマイニング研究の方向性を包括的かつ構造化した最新の概要を提供することである。
まず, 基本的な概念, タイプ, マイニング戦略, および識別能力を評価する指標を含むcpmの詳細な理解について述べる。
次に,CPM法の特徴に基づき,境界系アルゴリズム,木系アルゴリズム,進化ファジィ系アルゴリズム,決定木系アルゴリズム,その他のアルゴリズムに分類する。
さらに,これらの手法の古典的なアルゴリズムをリストアップし,その利点と欠点について考察する。
CPMの高度なトピックが紹介されている。
最後に,この分野における課題と機会について議論し,調査を締めくくった。
関連論文リスト
- A Rapid Review of Clustering Algorithms [5.46715422237599]
クラスタリングアルゴリズムは、データ内の固有のパターンと類似性に基づいて、データをグループまたはクラスタにまとめることを目的としている。
それらは、マーケティングやeコマース、ヘルスケア、データ組織と分析、ソーシャルメディアなど、今日の生活において重要な役割を担っている。
既存のクラスタリングアルゴリズムを分析し、5つの異なる次元で主要なアルゴリズムを分類した。
論文 参考訳(メタデータ) (2024-01-14T23:19:53Z) - Regularization-Based Methods for Ordinal Quantification [49.606912965922504]
順序の場合、すなわち n>2 クラスの集合上で全順序が定義される場合について研究する。
本稿では,従来のアルゴリズムよりも優れた正規化OQアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-10-13T16:04:06Z) - Multivariate Time Series Anomaly Detection: Fancy Algorithms and Flawed
Evaluation Methodology [2.043517674271996]
本稿では、MVTS異常検出の文脈において、正常によいプロトコルが弱点を持つ可能性について論じる。
本稿では,PCA(Principal Components Analysis)に基づくシンプルな,かつ難しいベースラインを提案する。このベースラインは,最近のDeep Learning(DL)ベースのアプローチにおいて,一般的なベンチマークデータセットよりも驚くほど優れています。
論文 参考訳(メタデータ) (2023-08-24T20:24:12Z) - A Diachronic Analysis of Paradigm Shifts in NLP Research: When, How, and
Why? [84.46288849132634]
本稿では、因果発見と推論技術を用いて、科学分野における研究トピックの進化を分析するための体系的な枠組みを提案する。
我々は3つの変数を定義し、NLPにおける研究トピックの進化の多様な側面を包含する。
我々は因果探索アルゴリズムを用いてこれらの変数間の因果関係を明らかにする。
論文 参考訳(メタデータ) (2023-05-22T11:08:00Z) - A Gold Standard Dataset for the Reviewer Assignment Problem [117.59690218507565]
類似度スコア(Similarity score)とは、論文のレビューにおいて、レビュアーの専門知識を数値で見積もるものである。
私たちのデータセットは、58人の研究者による477の自己申告された専門知識スコアで構成されています。
2つの論文をレビュアーに関連付けるタスクは、簡単なケースでは12%~30%、ハードケースでは36%~43%である。
論文 参考訳(メタデータ) (2023-03-23T16:15:03Z) - Clustering with minimum spanning trees: How good can it be? [1.9999259391104391]
低次元分割データクラスタリングタスクにおいて、最小分散木が意味のある範囲を定量化する。
我々は、既存の最先端のMSTベースの分割スキームをレビューし、研究し、拡張し、一般化する。
全体として、Genieと情報理論の手法は、MST以外のアルゴリズムよりも優れていることが多い。
論文 参考訳(メタデータ) (2023-03-10T03:18:03Z) - A survey of Bayesian Network structure learning [8.411014222942168]
本稿では,データからBN構造を学習するための61のアルゴリズムについてレビューする。
各アルゴリズムの基本的アプローチは一貫性のある言葉で説明され、それらの類似点と相違点が強調された。
実世界のデータセットでのデータノイズに対処し、学習プロセスに専門家の知識を取り入れるためのアプローチについても紹介する。
論文 参考訳(メタデータ) (2021-09-23T14:54:00Z) - Explaining Algorithmic Fairness Through Fairness-Aware Causal Path
Decomposition [37.823248189626014]
本稿では,モデルの相違点の同定問題について検討する。
特徴重要度を学習する既存の解釈方法とは異なり,特徴変数間の因果関係を考察する。
我々のフレームワークはまた、モデルに依存しないものであり、様々な量的格差の尺度に適用できる。
論文 参考訳(メタデータ) (2021-08-11T17:23:47Z) - Interpretable Multi-dataset Evaluation for Named Entity Recognition [110.64368106131062]
本稿では,名前付きエンティティ認識(NER)タスクに対する一般的な評価手法を提案する。
提案手法は,モデルとデータセットの違いと,それらの間の相互作用を解釈することを可能にする。
分析ツールを利用可能にすることで、将来の研究者が同様の分析を実行し、この分野の進歩を促進することができる。
論文 参考訳(メタデータ) (2020-11-13T10:53:27Z) - A Survey of Embedding Space Alignment Methods for Language and Knowledge
Graphs [77.34726150561087]
単語,文,知識グラフの埋め込みアルゴリズムに関する現在の研究状況について調査する。
本稿では、関連するアライメント手法の分類と、この研究分野で使用されるベンチマークデータセットについて論じる。
論文 参考訳(メタデータ) (2020-10-26T16:08:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。