論文の概要: Integrating Statistical Significance and Discriminative Power in Pattern
Discovery
- arxiv url: http://arxiv.org/abs/2401.12000v1
- Date: Mon, 22 Jan 2024 14:51:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-23 13:46:35.982251
- Title: Integrating Statistical Significance and Discriminative Power in Pattern
Discovery
- Title(参考訳): パターン発見における統計的意義と判別力の統合
- Authors: Leonardo Alexandre and Rafael S. Costa and Rui Henriques
- Abstract要約: 提案手法は、統計的重要性と識別力の基準を最先端のアルゴリズムに統合する。
評価実験は, 品質劣化を伴わない識別力と統計的意義を顕著に向上させたパターンの発見において, 提案手法が果たす役割を示す。
- 参考スコア(独自算出の注目度): 2.1014808520898667
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Pattern discovery plays a central role in both descriptive and predictive
tasks across multiple domains. Actionable patterns must meet rigorous
statistical significance criteria and, in the presence of target variables,
further uphold discriminative power. Our work addresses the underexplored area
of guiding pattern discovery by integrating statistical significance and
discriminative power criteria into state-of-the-art algorithms while preserving
pattern quality. We also address how pattern quality thresholds, imposed by
some algorithms, can be rectified to accommodate these additional criteria. To
test the proposed methodology, we select the triclustering task as the guiding
pattern discovery case and extend well-known greedy and multi-objective
optimization triclustering algorithms, $\delta$-Trimax and TriGen, that use
various pattern quality criteria, such as Mean Squared Residual (MSR), Least
Squared Lines (LSL), and Multi Slope Measure (MSL). Results from three case
studies show the role of the proposed methodology in discovering patterns with
pronounced improvements of discriminative power and statistical significance
without quality deterioration, highlighting its importance in supervisedly
guiding the search. Although the proposed methodology is motivated over
multivariate time series data, it can be straightforwardly extended to pattern
discovery tasks involving multivariate, N-way (N>3), transactional, and
sequential data structures.
Availability: The code is freely available at
https://github.com/JupitersMight/MOF_Triclustering under the MIT license.
- Abstract(参考訳): パターン発見は、複数のドメインにわたる記述的タスクと予測的タスクにおいて中心的な役割を果たす。
行動可能なパターンは厳密な統計的重要性の基準を満たし、ターゲット変数の存在下では、さらに差別的なパワーを保たなければならない。
本研究は,パターン品質を維持しつつ,統計的意義と判別力の基準を最先端アルゴリズムに統合することにより,パターン発見の未熟な領域に対処した。
また、これらの追加の基準を満たすために、いくつかのアルゴリズムによって課されるパターン品質しきい値をどのように修正できるかについても論じる。
提案手法をテストするため,提案手法はトリクラスタリングタスクをガイドパターン発見のケースとして選択し,よく知られたグリードと多目的最適化のトリクラスタリングアルゴリズムである$\delta$-TrimaxとTriGenを,平均二乗残差(MSR),最小二乗線(LSL),マルチスロープ測度(MSL)などのパターン品質基準を用いて拡張する。
3つのケーススタディの結果から,識別力の顕著な向上と品質劣化を伴わない統計的意義を有するパターンの発見において,提案手法が果たす役割が示唆された。
提案手法は多変量時系列データに基づいて動機付けされているが,多変量,Nウェイ(N>3),トランザクショナル,シーケンシャルなデータ構造を含むパターン発見タスクに容易に拡張できる。
可用性: コードはMITライセンス下でhttps://github.com/JupitersMight/MOF_Triclusteringで無償公開されている。
関連論文リスト
- Unified Generative and Discriminative Training for Multi-modal Large Language Models [88.84491005030316]
生成的トレーニングにより、視覚言語モデル(VLM)は様々な複雑なタスクに取り組むことができる。
CLIPのようなモデルで実証された差別的トレーニングは、ゼロショットイメージテキストの分類と検索に優れています。
本稿では,両パラダイムの強みを統合する統一的アプローチを提案する。
論文 参考訳(メタデータ) (2024-11-01T01:51:31Z) - Pattern based learning and optimisation through pricing for bin packing problem [50.83768979636913]
確率変数の分布のような問題条件が変化すると、以前の状況でうまく機能するパターンはより効果的になるかもしれないと論じる。
本研究では,パターンを効率的に同定し,各条件に対する値の動的定量化を行う新しい手法を提案する。
本手法は,制約を満たす能力と目的値に対する影響に基づいて,パターンの値の定量化を行う。
論文 参考訳(メタデータ) (2024-08-27T17:03:48Z) - A Multitask Deep Learning Model for Classification and Regression of Hyperspectral Images: Application to the large-scale dataset [44.94304541427113]
ハイパースペクトル画像上で複数の分類タスクと回帰タスクを同時に行うマルチタスク深層学習モデルを提案する。
我々は、TAIGAと呼ばれる大規模なハイパースペクトルデータセットに対するアプローチを検証した。
結果の総合的定性的および定量的分析により,提案手法が他の最先端手法よりも有意に優れていることを示す。
論文 参考訳(メタデータ) (2024-07-23T11:14:54Z) - Efficient Discovery of Significant Patterns with Few-Shot Resampling [9.681286056736292]
バイオメディシン、バスケットマーケット分析、ソーシャルネットワークでは、ターゲットと関連するパターンが下位の人口に対して定義されているパターンを見つけることが目的である。
パターンとターゲットの関係を捉える自然な方法は、その統計的意義を考慮し、そのパターンとターゲットの間の独立性の仮説から逸脱を評価することである。
本稿では, 統計的に有意なパターンを同定し, 偽発見の確率を厳密に保証するアルゴリズムFSRを提案する。
論文 参考訳(メタデータ) (2024-06-17T17:49:27Z) - Model Stealing Attack against Graph Classification with Authenticity, Uncertainty and Diversity [80.16488817177182]
GNNは、クエリ許可を通じてターゲットモデルを複製するための悪行であるモデル盗難攻撃に対して脆弱である。
異なるシナリオに対応するために,3つのモデルステルス攻撃を導入する。
論文 参考訳(メタデータ) (2023-12-18T05:42:31Z) - Task-Distributionally Robust Data-Free Meta-Learning [99.56612787882334]
Data-Free Meta-Learning (DFML)は、複数の事前学習モデルを活用することで、独自のトレーニングデータを必要とせずに、新しいタスクを効率的に学習することを目的としている。
TDS(Task-Distribution Shift)とTDC(Task-Distribution Corruption)の2つの大きな課題を初めて明らかにした。
論文 参考訳(メタデータ) (2023-11-23T15:46:54Z) - A new algorithm for Subgroup Set Discovery based on Information Gain [58.720142291102135]
Information Gained Subgroup Discovery (IGSD)は、パターン発見のための新しいSDアルゴリズムである。
IGSDと最先端の2つのSDアルゴリズム(FSSDとSSD++)を比較した。
IGSDはFSSDやSSD++よりもOR値が優れており、パターンとターゲットへの依存度が高い。
論文 参考訳(メタデータ) (2023-07-26T21:42:34Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - Task Agnostic and Post-hoc Unseen Distribution Detection [27.69612483621752]
本稿では,タスク非依存かつポストホックな未確認分布検出(TAPUDD)手法を提案する。
トレーニングデータセットの特徴をクラスタ化し、すべてのクラスタからテストサンプルの最小マハラノビス距離を決定するTAP-Mahalanobisで構成されている。
提案手法は,多様なタスクにまたがる未知のサンプルを効果的に検出し,既存のベースラインと同等あるいは同等に動作することを示す。
論文 参考訳(メタデータ) (2022-07-26T17:55:15Z) - Supervised Multivariate Learning with Simultaneous Feature Auto-grouping
and Dimension Reduction [7.093830786026851]
本稿では,クラスタ化低ランク学習フレームワークを提案する。
2つの合同行列正則化を課し、予測因子を構成する特徴を自動的にグループ化する。
低ランクなモデリングよりも解釈可能であり、変数選択における厳密な空間性仮定を緩和する。
論文 参考訳(メタデータ) (2021-12-17T20:11:20Z) - Minimum-Delay Adaptation in Non-Stationary Reinforcement Learning via
Online High-Confidence Change-Point Detection [7.685002911021767]
非定常環境におけるポリシーを効率的に学習するアルゴリズムを導入する。
これは、リアルタイム、高信頼な変更点検出統計において、潜在的に無限のデータストリームと計算を解析する。
i) このアルゴリズムは, 予期せぬ状況変化が検出されるまでの遅延を最小限に抑え, 迅速な応答を可能にする。
論文 参考訳(メタデータ) (2021-05-20T01:57:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。