論文の概要: KGroups: A Versatile Univariate Max-Relevance Min-Redundancy Feature Selection Algorithm for High-dimensional Biological Data
- arxiv url: http://arxiv.org/abs/2603.28417v1
- Date: Mon, 30 Mar 2026 13:28:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.412331
- Title: KGroups: A Versatile Univariate Max-Relevance Min-Redundancy Feature Selection Algorithm for High-dimensional Biological Data
- Title(参考訳): KGroups:高次元生体データのための最大関連最小冗長特徴選択アルゴリズム
- Authors: Malick Ebiele, Malika Bendechache, Rob Brennan,
- Abstract要約: 文献における研究の大部分は、特徴選択(FS)手法の関連性や冗長性の推定に焦点が当てられている。
FFSメソッドの予測性能は、関連性や冗長性の推定よりも、選択アルゴリズムに依存するのか?
本稿では、クラスタリングを選択に利用するKGroupsと呼ばれる新しい単変量mRMRを提案する。
- 参考スコア(独自算出の注目度): 0.22940141855172028
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper proposes a new univariate filter feature selection (FFS) algorithm called KGroups. The majority of work in the literature focuses on investigating the relevance or redundancy estimations of feature selection (FS) methods. This has shown promising results and a real improvement of FFS methods' predictive performance. However, limited efforts have been made to investigate alternative FFS algorithms. This raises the following question: how much of the FFS methods' predictive performance depends on the selection algorithm rather than the relevance or the redundancy estimations? The majority of FFS methods fall into two categories: relevance maximisation (Max-Rel, also known as KBest) or simultaneous relevance maximisation and redundancy minimisation (mRMR). KBest is a univariate FFS algorithm that employs sorting (descending) for selection. mRMR is a multivariate FFS algorithm that employs an incremental search algorithm for selection. In this paper, we propose a new univariate mRMR called KGroups that employs clustering for selection. Extensive experiments on 14 high-dimensional biological benchmark datasets showed that KGroups achieves similar predictive performance compared to multivariate mRMR while being up to 821 times faster. KGroups is parameterisable, which leaves room for further predictive performance improvement through hyperparameter finetuning, unlike mRMR and KBest. KGroups outperforms KBest.
- Abstract(参考訳): 本稿では,KGroupsと呼ばれる一変量フィルタ特徴選択(FFS)アルゴリズムを提案する。
文献における研究の大部分は、特徴選択(FS)手法の関連性や冗長性の推定に焦点が当てられている。
これにより,FFS手法の予測性能が向上し,有望な結果が得られた。
しかし、代替FFSアルゴリズムの研究は限られている。
FFSメソッドの予測性能は、関連性や冗長性の推定よりも、選択アルゴリズムに依存するのか?
FFS法の大部分は2つのカテゴリに分類される: 関連性最大化(Max-Rel、KBestとも呼ばれる)または同時関連性最大化と冗長性最小化(mRMR)である。
KBest (KBest) は、選別(選別)にソート(選別)を用いる一変量FFSアルゴリズムである。
mRMRは、選択にインクリメンタル検索アルゴリズムを用いる多変量FFSアルゴリズムである。
本稿では,クラスタリングを用いた一変量mRMR(KGroups)を提案する。
14の高次元生物学的ベンチマークデータセットに対する大規模な実験により、KGroupsは最大821倍高速であるにもかかわらず、多変量mRMRと比較して同様の予測性能が得られた。
KGroupsはパラメータ可能で、mRMRやKBestとは異なり、ハイパーパラメータの微調整によるさらなる予測性能向上の余地を残している。
KGroupsはKBestより優れています。
関連論文リスト
- K*-Means: A Parameter-free Clustering Algorithm [55.20132267309382]
k*-meansは、kや他のパラメータをセットする必要がない新しいクラスタリングアルゴリズムである。
最小記述長の原理を用いて、クラスタの分割とマージによって最適なクラスタ数k*を自動的に決定する。
k*-平均が収束することが保証されることを証明し、kが未知のシナリオにおいて既存のメソッドよりも著しく優れていることを実験的に証明する。
論文 参考訳(メタデータ) (2025-05-17T08:41:07Z) - MUSS: Multilevel Subset Selection for Relevance and Diversity [4.8254343133177295]
レコメンデーションシステムでは、さまざまなレコメンデーションを提供しながら、関連する項目を選択することに興味がある。
本稿では,このタイプの問題を解析するための新しい理論的アプローチを提案し,その手法が最適目的の定数係数近似を実現することを示す。
論文 参考訳(メタデータ) (2025-03-14T06:37:17Z) - Comparison of Clustering Algorithms for Statistical Features of
Vibration Data Sets [0.4806505912512235]
振動データセットの時間と周波数領域から抽出した統計的特徴に対して,クラスタリングアルゴリズムK平均クラスタリング,OPTICS,およびガウス混合モデルクラスタリング(GMM)を広範囲に比較した。
本研究は, 平均的特徴(平均, 中間値), 分散的特徴(標準偏差, 原子間距離)が, 形状的特徴(骨格性, クルトーシス)よりも有意に優れていたことを示した。
クラスタ数の増加に伴い、クラスタリングアルゴリズムは、いくつかの特定のアルゴリズム制限があるにも関わらず、パフォーマンスが向上した。
論文 参考訳(メタデータ) (2023-05-11T12:19:30Z) - Accelerated Fuzzy C-Means Clustering Based on New Affinity Filtering and
Membership Scaling [74.85538972921917]
Fuzzy C-Means (FCM) は広く使われているクラスタリング手法である。
FCMはクラスタリングプロセスの中間から後期の段階で効率が低い。
新しいアフィニティフィルタとメンバシップスケーリング(AMFCM)に基づくFCMを提案する。
論文 参考訳(メタデータ) (2023-02-14T14:20:31Z) - HARRIS: Hybrid Ranking and Regression Forests for Algorithm Selection [75.84584400866254]
両アプローチの強みを両アプローチの弱さを緩和しつつ組み合わせ, 特殊林を利用した新しいアルゴリズムセレクタを提案する。
HARRISの決定は、ハイブリッドランキングと回帰損失関数に基づいて最適化された木を作成する森林モデルに基づいている。
論文 参考訳(メタデータ) (2022-10-31T14:06:11Z) - Subspace Learning for Feature Selection via Rank Revealing QR
Factorization: Unsupervised and Hybrid Approaches with Non-negative Matrix
Factorization and Evolutionary Algorithm [0.0]
ランク明示QR(RRQR)因子化は、新しい教師なし特徴選択技術として最も情報性の高い特徴を得るのに活用される。
フィルタベース手法としてRRQRとラッパーベース手法として遺伝的アルゴリズムを組み合わせたハイブリッド特徴選択アルゴリズムを提案する。
提案アルゴリズムは、教師付き、教師なし、および半教師付き設定における最先端の特徴選択アルゴリズムと比較した場合、信頼性と堅牢性を示す。
論文 参考訳(メタデータ) (2022-10-02T04:04:47Z) - A Tent L\'evy Flying Sparrow Search Algorithm for Feature Selection: A
COVID-19 Case Study [1.6436293069942312]
情報科学の急速な発展によって引き起こされる「次元のカルス」は、大きなデータセットを扱う際に悪影響を及ぼす可能性がある。
本研究では,スナロー探索アルゴリズム(SSA)の変種であるTent L'evy Flying Sparrow Searchアルゴリズム(TFSSA)を提案する。
TFSSAは、分類のためにパッキングパターンにおける機能の最も優れたサブセットを選択するために使用される。
論文 参考訳(メタデータ) (2022-09-20T15:12:10Z) - Compactness Score: A Fast Filter Method for Unsupervised Feature
Selection [66.84571085643928]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。
提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文 参考訳(メタデータ) (2022-01-31T13:01:37Z) - RFCBF: enhance the performance and stability of Fast Correlation-Based
Filter [6.781877756322586]
分類精度を向上させるために再サンプリング技術を組み合わせた新しいFCBF拡張RFCBFを提案する。
実験結果から,RFCBFアルゴリズムは従来の最先端手法よりも,分類精度と実行時間で有意に優れた結果が得られることがわかった。
論文 参考訳(メタデータ) (2021-05-30T12:36:32Z) - Self-supervised Symmetric Nonnegative Matrix Factorization [82.59905231819685]
シンメトリー非負係数行列(SNMF)は、データクラスタリングの強力な方法であることを示した。
より良いクラスタリング結果を求めるアンサンブルクラスタリングにインスパイアされた,自己監視型SNMF(S$3$NMF)を提案する。
SNMFのコード特性に対する感度を、追加情報に頼らずに活用しています。
論文 参考訳(メタデータ) (2021-03-02T12:47:40Z) - Optimal Clustering from Noisy Binary Feedback [75.17453757892152]
本稿では,二元的ユーザフィードバックから一組のアイテムをクラスタリングする問題について検討する。
最小クラスタ回復誤差率のアルゴリズムを考案する。
適応選択のために,情報理論的誤差下界の導出にインスパイアされたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2019-10-14T09:18:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。