論文の概要: BoMGene: Integrating Boruta-mRMR feature selection for enhanced Gene expression classification
- arxiv url: http://arxiv.org/abs/2510.00907v1
- Date: Wed, 01 Oct 2025 13:47:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:20.591891
- Title: BoMGene: Integrating Boruta-mRMR feature selection for enhanced Gene expression classification
- Title(参考訳): BoMGene:改良された遺伝子発現分類のためのBoruta-mRMR特徴選択の統合
- Authors: Bich-Chung Phan, Thanh Ma, Huu-Hoa Nguyen, Thanh-Nghi Do,
- Abstract要約: BoMGene は Boruta と Minimum Redundancy Maximum Relevance (mRMR) を統合したハイブリッド機能選択法である。
提案手法は, マルチクラス遺伝子発現データ解析における精度, 安定性, 実用性において, 明確な優位性を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Feature selection is a crucial step in analyzing gene expression data, enhancing classification performance, and reducing computational costs for high-dimensional datasets. This paper proposes BoMGene, a hybrid feature selection method that effectively integrates two popular techniques: Boruta and Minimum Redundancy Maximum Relevance (mRMR). The method aims to optimize the feature space and enhance classification accuracy. Experiments were conducted on 25 publicly available gene expression datasets, employing widely used classifiers such as Support Vector Machine (SVM), Random Forest, XGBoost (XGB), and Gradient Boosting Machine (GBM). The results show that using the Boruta-mRMR combination cuts down the number of features chosen compared to just using mRMR, which helps to speed up training time while keeping or even improving classification accuracy compared to using individual feature selection methods. The proposed approach demonstrates clear advantages in accuracy, stability, and practical applicability for multi-class gene expression data analysis
- Abstract(参考訳): 特徴選択は、遺伝子発現データの解析、分類性能の向上、高次元データセットの計算コストの削減において重要なステップである。
本稿では,Boruta と Minimum Redundancy Maximum Relevance (mRMR) の2つの手法を効果的に統合したハイブリッド機能選択法である BoMGene を提案する。
本手法は,特徴空間の最適化と分類精度の向上を目的としている。
実験は、SVM(Support Vector Machine)、Random Forest(Random Forest)、XGBoost(XGB)、Gradient Boosting Machine(GBM)など、広く使われている分類器を用いて、公開可能な25の遺伝子発現データセットで実施された。
その結果,Boruta-mRMRの組み合わせは,mRMRのみと比較して選択する特徴の数を削減し,個々の特徴の選択方法と比較して,分類精度を維持したり改善したりしながら,トレーニング時間を短縮できることがわかった。
提案手法は, マルチクラス遺伝子発現データ解析における精度, 安定性, 実用性において, 明確な優位性を示す。
関連論文リスト
- BOLIMES: Boruta and LIME optiMized fEature Selection for Gene Expression Classification [0.0937465283958018]
BOLIMESは、遺伝子発現の分類を強化するために設計された、新しい特徴選択アルゴリズムである。
包括的特徴選択と解釈可能性による洗練を組み合わせ、高次元遺伝子発現解析のための強力なソリューションを提供する。
論文 参考訳(メタデータ) (2025-02-18T17:33:41Z) - Permutation-based multi-objective evolutionary feature selection for high-dimensional data [43.18726655647964]
本稿では,高次元データを対象とした新しい特徴選択手法を提案する。
提案手法は多目的進化アルゴリズムを用いて候補特徴部分集合を探索する。
提案手法の有効性を,24個の高次元データセットを用いて検証した。
論文 参考訳(メタデータ) (2025-01-24T08:11:28Z) - Distance-based mutual congestion feature selection with genetic algorithm for high-dimensional medical datasets [2.6037922505725675]
あらゆるデータ分布に適用可能な、普遍的に最適な特徴選択方法はありません。
本稿では, 応答変数の特徴値と観測値の分布を考慮したフィルタ手法として, 距離に基づくMutual Congestion (DMC)を提案する。
ハイブリッドDMC-GAwARはバイナリ分類データセットに適用でき、最近の研究よりもその優位性を示す実験結果が得られた。
論文 参考訳(メタデータ) (2024-07-22T13:08:50Z) - Feature Selection as Deep Sequential Generative Learning [50.00973409680637]
本研究では, 逐次再構成, 変分, 性能評価器の損失を伴って, 深部変分変圧器モデルを構築した。
提案モデルでは,特徴選択の知識を抽出し,連続的な埋め込み空間を学習し,特徴選択決定シーケンスをユーティリティスコアに関連付けられた埋め込みベクトルにマッピングする。
論文 参考訳(メタデータ) (2024-03-06T16:31:56Z) - Embedded Multi-label Feature Selection via Orthogonal Regression [45.55795914923279]
少なくとも2乗回帰に基づく最先端の組込みマルチラベル特徴選択アルゴリズムは、マルチラベルデータに十分な識別情報を保存できない。
複数ラベルの特徴選択を容易にするために, 組込み多ラベル特徴選択法を提案する。
10個の多ラベルデータセットの大規模な実験結果から,GRROORの有効性が示された。
論文 参考訳(メタデータ) (2024-03-01T06:18:40Z) - Subspace Learning for Feature Selection via Rank Revealing QR
Factorization: Unsupervised and Hybrid Approaches with Non-negative Matrix
Factorization and Evolutionary Algorithm [0.0]
ランク明示QR(RRQR)因子化は、新しい教師なし特徴選択技術として最も情報性の高い特徴を得るのに活用される。
フィルタベース手法としてRRQRとラッパーベース手法として遺伝的アルゴリズムを組み合わせたハイブリッド特徴選択アルゴリズムを提案する。
提案アルゴリズムは、教師付き、教師なし、および半教師付き設定における最先端の特徴選択アルゴリズムと比較した場合、信頼性と堅牢性を示す。
論文 参考訳(メタデータ) (2022-10-02T04:04:47Z) - Compactness Score: A Fast Filter Method for Unsupervised Feature
Selection [66.84571085643928]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。
提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文 参考訳(メタデータ) (2022-01-31T13:01:37Z) - Optimally Combining Classifiers for Semi-Supervised Learning [43.77365242185884]
本稿では,Xgboostとトランスダクティブ支援ベクトルマシンの長所を適応的に組み合わせた半教師付き学習手法を提案する。
UCIデータセットと実商業データセットの実験結果から,提案手法の5つの最先端アルゴリズムよりも優れた分類性能を示した。
論文 参考訳(メタデータ) (2020-06-07T09:28:34Z) - A New Gene Selection Algorithm using Fuzzy-Rough Set Theory for Tumor
Classification [0.0]
本稿では,ファジィ・ルー集合の識別行列を用いた新しい遺伝子選択手法を提案する。
提案手法は、遺伝子選択結果を改善するために、同一のクラスラベルと異なるクラスラベルを持つインスタンスの類似性を考慮に入れている。
実験により, この手法は最先端の手法に比べて効率が良いことを示した。
論文 参考訳(メタデータ) (2020-03-26T13:43:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。