論文の概要: Integrating Statistical Significance and Discriminative Power in Pattern
Discovery
- arxiv url: http://arxiv.org/abs/2401.12000v1
- Date: Mon, 22 Jan 2024 14:51:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-23 13:46:35.982251
- Title: Integrating Statistical Significance and Discriminative Power in Pattern
Discovery
- Title(参考訳): パターン発見における統計的意義と判別力の統合
- Authors: Leonardo Alexandre and Rafael S. Costa and Rui Henriques
- Abstract要約: 提案手法は、統計的重要性と識別力の基準を最先端のアルゴリズムに統合する。
評価実験は, 品質劣化を伴わない識別力と統計的意義を顕著に向上させたパターンの発見において, 提案手法が果たす役割を示す。
- 参考スコア(独自算出の注目度): 2.1014808520898667
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Pattern discovery plays a central role in both descriptive and predictive
tasks across multiple domains. Actionable patterns must meet rigorous
statistical significance criteria and, in the presence of target variables,
further uphold discriminative power. Our work addresses the underexplored area
of guiding pattern discovery by integrating statistical significance and
discriminative power criteria into state-of-the-art algorithms while preserving
pattern quality. We also address how pattern quality thresholds, imposed by
some algorithms, can be rectified to accommodate these additional criteria. To
test the proposed methodology, we select the triclustering task as the guiding
pattern discovery case and extend well-known greedy and multi-objective
optimization triclustering algorithms, $\delta$-Trimax and TriGen, that use
various pattern quality criteria, such as Mean Squared Residual (MSR), Least
Squared Lines (LSL), and Multi Slope Measure (MSL). Results from three case
studies show the role of the proposed methodology in discovering patterns with
pronounced improvements of discriminative power and statistical significance
without quality deterioration, highlighting its importance in supervisedly
guiding the search. Although the proposed methodology is motivated over
multivariate time series data, it can be straightforwardly extended to pattern
discovery tasks involving multivariate, N-way (N>3), transactional, and
sequential data structures.
Availability: The code is freely available at
https://github.com/JupitersMight/MOF_Triclustering under the MIT license.
- Abstract(参考訳): パターン発見は、複数のドメインにわたる記述的タスクと予測的タスクにおいて中心的な役割を果たす。
行動可能なパターンは厳密な統計的重要性の基準を満たし、ターゲット変数の存在下では、さらに差別的なパワーを保たなければならない。
本研究は,パターン品質を維持しつつ,統計的意義と判別力の基準を最先端アルゴリズムに統合することにより,パターン発見の未熟な領域に対処した。
また、これらの追加の基準を満たすために、いくつかのアルゴリズムによって課されるパターン品質しきい値をどのように修正できるかについても論じる。
提案手法をテストするため,提案手法はトリクラスタリングタスクをガイドパターン発見のケースとして選択し,よく知られたグリードと多目的最適化のトリクラスタリングアルゴリズムである$\delta$-TrimaxとTriGenを,平均二乗残差(MSR),最小二乗線(LSL),マルチスロープ測度(MSL)などのパターン品質基準を用いて拡張する。
3つのケーススタディの結果から,識別力の顕著な向上と品質劣化を伴わない統計的意義を有するパターンの発見において,提案手法が果たす役割が示唆された。
提案手法は多変量時系列データに基づいて動機付けされているが,多変量,Nウェイ(N>3),トランザクショナル,シーケンシャルなデータ構造を含むパターン発見タスクに容易に拡張できる。
可用性: コードはMITライセンス下でhttps://github.com/JupitersMight/MOF_Triclusteringで無償公開されている。
関連論文リスト
- Model Stealing Attack against Graph Classification with Authenticity,
Uncertainty and Diversity [85.1927483219819]
GNNは、クエリ許可を通じてターゲットモデルを複製するための悪行であるモデル盗難攻撃に対して脆弱である。
異なるシナリオに対応するために,3つのモデルステルス攻撃を導入する。
論文 参考訳(メタデータ) (2023-12-18T05:42:31Z) - Task-Distributionally Robust Data-Free Meta-Learning [99.56612787882334]
Data-Free Meta-Learning (DFML)は、複数の事前学習モデルを活用することで、独自のトレーニングデータを必要とせずに、新しいタスクを効率的に学習することを目的としている。
TDS(Task-Distribution Shift)とTDC(Task-Distribution Corruption)の2つの大きな課題を初めて明らかにした。
論文 参考訳(メタデータ) (2023-11-23T15:46:54Z) - A new algorithm for Subgroup Set Discovery based on Information Gain [58.720142291102135]
Information Gained Subgroup Discovery (IGSD)は、パターン発見のための新しいSDアルゴリズムである。
IGSDと最先端の2つのSDアルゴリズム(FSSDとSSD++)を比較した。
IGSDはFSSDやSSD++よりもOR値が優れており、パターンとターゲットへの依存度が高い。
論文 参考訳(メタデータ) (2023-07-26T21:42:34Z) - On Pitfalls of Test-Time Adaptation [82.8392232222119]
TTA(Test-Time Adaptation)は、分散シフトの下で堅牢性に取り組むための有望なアプローチとして登場した。
TTABは,10の最先端アルゴリズム,多種多様な分散シフト,および2つの評価プロトコルを含むテスト時間適応ベンチマークである。
論文 参考訳(メタデータ) (2023-06-06T09:35:29Z) - TriSig: Assessing the statistical significance of triclusters [2.064612766965483]
本研究は、テンソルデータのパターンの確率を評価するための統計的枠組みを提案し、ヌル期待から逸脱する。
偽陽性発見のための二項検定に関する総合的な議論が欠かせない。
バイオケミカルおよびバイオテクノロジー分野における、異なる実世界のケーススタディに対する最先端のトリクラスタリングアルゴリズムの適用から得られた結果。
論文 参考訳(メタデータ) (2023-06-01T13:08:54Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - Task Agnostic and Post-hoc Unseen Distribution Detection [27.69612483621752]
本稿では,タスク非依存かつポストホックな未確認分布検出(TAPUDD)手法を提案する。
トレーニングデータセットの特徴をクラスタ化し、すべてのクラスタからテストサンプルの最小マハラノビス距離を決定するTAP-Mahalanobisで構成されている。
提案手法は,多様なタスクにまたがる未知のサンプルを効果的に検出し,既存のベースラインと同等あるいは同等に動作することを示す。
論文 参考訳(メタデータ) (2022-07-26T17:55:15Z) - Multiway Spherical Clustering via Degree-Corrected Tensor Block Models [8.147652597876862]
推定精度を保証した次数補正ブロックモデルを開発した。
特に,3次以上のテンソルに対してのみ,本質的な統計的-計算的ギャップが生じることを示す。
本手法の有効性を2つのデータアプリケーションを用いて実証した。
論文 参考訳(メタデータ) (2022-01-19T03:40:22Z) - Supervised Multivariate Learning with Simultaneous Feature Auto-grouping
and Dimension Reduction [7.093830786026851]
本稿では,クラスタ化低ランク学習フレームワークを提案する。
2つの合同行列正則化を課し、予測因子を構成する特徴を自動的にグループ化する。
低ランクなモデリングよりも解釈可能であり、変数選択における厳密な空間性仮定を緩和する。
論文 参考訳(メタデータ) (2021-12-17T20:11:20Z) - Minimum-Delay Adaptation in Non-Stationary Reinforcement Learning via
Online High-Confidence Change-Point Detection [7.685002911021767]
非定常環境におけるポリシーを効率的に学習するアルゴリズムを導入する。
これは、リアルタイム、高信頼な変更点検出統計において、潜在的に無限のデータストリームと計算を解析する。
i) このアルゴリズムは, 予期せぬ状況変化が検出されるまでの遅延を最小限に抑え, 迅速な応答を可能にする。
論文 参考訳(メタデータ) (2021-05-20T01:57:52Z) - Learning while Respecting Privacy and Robustness to Distributional
Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。
目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。
提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文 参考訳(メタデータ) (2020-07-07T18:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。