Fugu-MT 論文翻訳(概要): Integrating Statistical Significance and Discriminative Power in Pattern Discovery

論文の概要: Integrating Statistical Significance and Discriminative Power in Pattern Discovery

arxiv url: http://arxiv.org/abs/2401.12000v1
Date: Mon, 22 Jan 2024 14:51:01 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-23 13:46:35.982251
Title: Integrating Statistical Significance and Discriminative Power in Pattern Discovery
Title（参考訳）: パターン発見における統計的意義と判別力の統合
Authors: Leonardo Alexandre and Rafael S. Costa and Rui Henriques
Abstract要約: 提案手法は、統計的重要性と識別力の基準を最先端のアルゴリズムに統合する。評価実験は, 品質劣化を伴わない識別力と統計的意義を顕著に向上させたパターンの発見において, 提案手法が果たす役割を示す。
参考スコア（独自算出の注目度）: 2.1014808520898667
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Pattern discovery plays a central role in both descriptive and predictive tasks across multiple domains. Actionable patterns must meet rigorous statistical significance criteria and, in the presence of target variables, further uphold discriminative power. Our work addresses the underexplored area of guiding pattern discovery by integrating statistical significance and discriminative power criteria into state-of-the-art algorithms while preserving pattern quality. We also address how pattern quality thresholds, imposed by some algorithms, can be rectified to accommodate these additional criteria. To test the proposed methodology, we select the triclustering task as the guiding pattern discovery case and extend well-known greedy and multi-objective optimization triclustering algorithms, $\delta$-Trimax and TriGen, that use various pattern quality criteria, such as Mean Squared Residual (MSR), Least Squared Lines (LSL), and Multi Slope Measure (MSL). Results from three case studies show the role of the proposed methodology in discovering patterns with pronounced improvements of discriminative power and statistical significance without quality deterioration, highlighting its importance in supervisedly guiding the search. Although the proposed methodology is motivated over multivariate time series data, it can be straightforwardly extended to pattern discovery tasks involving multivariate, N-way (N>3), transactional, and sequential data structures. Availability: The code is freely available at https://github.com/JupitersMight/MOF_Triclustering under the MIT license.
Abstract（参考訳）: パターン発見は、複数のドメインにわたる記述的タスクと予測的タスクにおいて中心的な役割を果たす。行動可能なパターンは厳密な統計的重要性の基準を満たし、ターゲット変数の存在下では、さらに差別的なパワーを保たなければならない。本研究は,パターン品質を維持しつつ,統計的意義と判別力の基準を最先端アルゴリズムに統合することにより,パターン発見の未熟な領域に対処した。また、これらの追加の基準を満たすために、いくつかのアルゴリズムによって課されるパターン品質しきい値をどのように修正できるかについても論じる。提案手法をテストするため,提案手法はトリクラスタリングタスクをガイドパターン発見のケースとして選択し,よく知られたグリードと多目的最適化のトリクラスタリングアルゴリズムである$\delta$-TrimaxとTriGenを,平均二乗残差(MSR),最小二乗線(LSL),マルチスロープ測度(MSL)などのパターン品質基準を用いて拡張する。 3つのケーススタディの結果から,識別力の顕著な向上と品質劣化を伴わない統計的意義を有するパターンの発見において,提案手法が果たす役割が示唆された。提案手法は多変量時系列データに基づいて動機付けされているが,多変量,Nウェイ(N>3),トランザクショナル,シーケンシャルなデータ構造を含むパターン発見タスクに容易に拡張できる。可用性: コードはMITライセンス下でhttps://github.com/JupitersMight/MOF_Triclusteringで無償公開されている。

関連論文リスト

Beyond Raw Detection Scores: Markov-Informed Calibration for Boosting Machine-Generated Text Detection [105.14032334647932]
機械生成テキスト(MGT)は偽情報やフィッシングなどのリスクを生じさせ、信頼性の高い検出の必要性を強調している。 MGTの統計的に区別可能な特徴を抽出するメトリックベース法は、オーバーフィットしがちな複雑なモデルベース法よりも実用的であることが多い。本稿では,2つのコンテキスト検出スコアの関係をモデル化したマルコフ情報を用いたスコアキャリブレーション手法を提案する。
論文参考訳（メタデータ） (2026-02-08T16:06:12Z)
From Sparse Decisions to Dense Reasoning: A Multi-attribute Trajectory Paradigm for Multimodal Moderation [59.27094165576015]
疎度な意思決定から高密度な推論トレースへ移行する新しい学習パラダイム(UniMod)を提案する。モノリシックな意思決定タスクを多次元境界学習プロセスに再構成し,エビデンス,モダリティ評価,リスクマッピング,政策決定,応答生成を含む構造化軌道を構築する。タスク固有のパラメータを分離し、トレーニングダイナミクスを再バランスさせ、マルチタスク学習における多様な目的間の干渉を効果的に解消する、特別な最適化戦略を導入する。
論文参考訳（メタデータ） (2026-01-28T09:29:40Z)
Random Normed k-Means: A Paradigm-Shift in Clustering within Probabilistic Metric Spaces [0.7864304771129751]
確率的距離空間内で機能する文献において、最初のk-平均変種を導入する。確率論的視点を採用することで,本手法は新たなパラダイムを導入するだけでなく,厳密な理論的枠組みも確立する。提案したランダムノルムk平均(RNKM)アルゴリズムは,非線形に分離可能な構造を識別する顕著な能力を示す。
論文参考訳（メタデータ） (2025-04-04T20:48:43Z)
PATH: A Discrete-sequence Dataset for Evaluating Online Unsupervised Anomaly Detection Approaches for Multivariate Time Series [0.01874930567916036]
多変量時系列に対する異常検出手法のベンチマークは、高品質なデータセットが不足しているため、難しい課題である。我々は、最先端のシミュレーションツールによって生成される多種多様な、広範囲で、非自明なデータセットという解決策を提案する。我々のデータセットは離散列問題を表しており、文献でこれまで提案されていた解には未適応のままである。
論文参考訳（メタデータ） (2024-11-21T09:03:12Z)
Unified Generative and Discriminative Training for Multi-modal Large Language Models [88.84491005030316]
生成的トレーニングにより、視覚言語モデル(VLM)は様々な複雑なタスクに取り組むことができる。 CLIPのようなモデルで実証された差別的トレーニングは、ゼロショットイメージテキストの分類と検索に優れています。本稿では,両パラダイムの強みを統合する統一的アプローチを提案する。
論文参考訳（メタデータ） (2024-11-01T01:51:31Z)
Pattern based learning and optimisation through pricing for bin packing problem [50.83768979636913]
確率変数の分布のような問題条件が変化すると、以前の状況でうまく機能するパターンはより効果的になるかもしれないと論じる。本研究では,パターンを効率的に同定し,各条件に対する値の動的定量化を行う新しい手法を提案する。本手法は,制約を満たす能力と目的値に対する影響に基づいて,パターンの値の定量化を行う。
論文参考訳（メタデータ） (2024-08-27T17:03:48Z)
A Multitask Deep Learning Model for Classification and Regression of Hyperspectral Images: Application to the large-scale dataset [44.94304541427113]
ハイパースペクトル画像上で複数の分類タスクと回帰タスクを同時に行うマルチタスク深層学習モデルを提案する。我々は、TAIGAと呼ばれる大規模なハイパースペクトルデータセットに対するアプローチを検証した。結果の総合的定性的および定量的分析により,提案手法が他の最先端手法よりも有意に優れていることを示す。
論文参考訳（メタデータ） (2024-07-23T11:14:54Z)
Efficient Discovery of Significant Patterns with Few-Shot Resampling [9.681286056736292]
バイオメディシン、バスケットマーケット分析、ソーシャルネットワークでは、ターゲットと関連するパターンが下位の人口に対して定義されているパターンを見つけることが目的である。パターンとターゲットの関係を捉える自然な方法は、その統計的意義を考慮し、そのパターンとターゲットの間の独立性の仮説から逸脱を評価することである。本稿では, 統計的に有意なパターンを同定し, 偽発見の確率を厳密に保証するアルゴリズムFSRを提案する。
論文参考訳（メタデータ） (2024-06-17T17:49:27Z)
Model Stealing Attack against Graph Classification with Authenticity, Uncertainty and Diversity [80.16488817177182]
GNNは、クエリ許可を通じてターゲットモデルを複製するための悪行であるモデル盗難攻撃に対して脆弱である。異なるシナリオに対応するために,3つのモデルステルス攻撃を導入する。
論文参考訳（メタデータ） (2023-12-18T05:42:31Z)
Task-Distributionally Robust Data-Free Meta-Learning [99.56612787882334]
Data-Free Meta-Learning (DFML)は、複数の事前学習モデルを活用することで、独自のトレーニングデータを必要とせずに、新しいタスクを効率的に学習することを目的としている。 TDS(Task-Distribution Shift)とTDC(Task-Distribution Corruption)の2つの大きな課題を初めて明らかにした。
論文参考訳（メタデータ） (2023-11-23T15:46:54Z)
A new algorithm for Subgroup Set Discovery based on Information Gain [58.720142291102135]
Information Gained Subgroup Discovery (IGSD)は、パターン発見のための新しいSDアルゴリズムである。 IGSDと最先端の2つのSDアルゴリズム(FSSDとSSD++)を比較した。 IGSDはFSSDやSSD++よりもOR値が優れており、パターンとターゲットへの依存度が高い。
論文参考訳（メタデータ） (2023-07-26T21:42:34Z)
Rethinking Clustering-Based Pseudo-Labeling for Unsupervised Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文参考訳（メタデータ） (2022-09-27T19:04:36Z)
Task Agnostic and Post-hoc Unseen Distribution Detection [27.69612483621752]
本稿では,タスク非依存かつポストホックな未確認分布検出(TAPUDD)手法を提案する。トレーニングデータセットの特徴をクラスタ化し、すべてのクラスタからテストサンプルの最小マハラノビス距離を決定するTAP-Mahalanobisで構成されている。提案手法は,多様なタスクにまたがる未知のサンプルを効果的に検出し,既存のベースラインと同等あるいは同等に動作することを示す。
論文参考訳（メタデータ） (2022-07-26T17:55:15Z)
Supervised Multivariate Learning with Simultaneous Feature Auto-grouping and Dimension Reduction [7.093830786026851]
本稿では,クラスタ化低ランク学習フレームワークを提案する。 2つの合同行列正則化を課し、予測因子を構成する特徴を自動的にグループ化する。低ランクなモデリングよりも解釈可能であり、変数選択における厳密な空間性仮定を緩和する。
論文参考訳（メタデータ） (2021-12-17T20:11:20Z)
Minimum-Delay Adaptation in Non-Stationary Reinforcement Learning via Online High-Confidence Change-Point Detection [7.685002911021767]
非定常環境におけるポリシーを効率的に学習するアルゴリズムを導入する。これは、リアルタイム、高信頼な変更点検出統計において、潜在的に無限のデータストリームと計算を解析する。 i) このアルゴリズムは, 予期せぬ状況変化が検出されるまでの遅延を最小限に抑え, 迅速な応答を可能にする。
論文参考訳（メタデータ） (2021-05-20T01:57:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。