論文の概要: Hybrid gene selection approach using XGBoost and multi-objective genetic
algorithm for cancer classification
- arxiv url: http://arxiv.org/abs/2106.05841v1
- Date: Sun, 30 May 2021 03:43:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-13 13:58:21.153232
- Title: Hybrid gene selection approach using XGBoost and multi-objective genetic
algorithm for cancer classification
- Title(参考訳): xgboostと多目的遺伝的アルゴリズムを用いた癌分類のためのハイブリッド遺伝子選択アプローチ
- Authors: Xiongshi Deng, Min Li, Shaobo Deng, Lei Wang
- Abstract要約: マイクロアレイデータセットにおける癌分類のための極勾配増強(XGBoost)と多目的最適化遺伝的アルゴリズム(XGBoost-MOGA)を組み合わせた2段階遺伝子選択手法を提案する。
XGBoost-MOGAは、精度、Fスコア、精度、リコールなどの様々な評価基準の観点から、従来の最先端アルゴリズムよりもはるかに優れた結果が得られる。
- 参考スコア(独自算出の注目度): 6.781877756322586
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Microarray gene expression data are often accompanied by a large number of
genes and a small number of samples. However, only a few of these genes are
relevant to cancer, resulting in signigicant gene selection challenges. Hence,
we propose a two-stage gene selection approach by combining extreme gradient
boosting (XGBoost) and a multi-objective optimization genetic algorithm
(XGBoost-MOGA) for cancer classification in microarray datasets. In the first
stage, the genes are ranked use an ensemble-based feature selection using
XGBoost. This stage can effectively remove irrelevant genes and yield a group
comprising the most relevant genes related to the class. In the second stage,
XGBoost-MOGA searches for an optimal gene subset based on the most relevant
genes's group using a multi-objective optimization genetic algorithm. We
performed comprehensive experiments to compare XGBoost-MOGA with other
state-of-the-art feature selection methods using two well-known learning
classifiers on 13 publicly available microarray expression datasets. The
experimental results show that XGBoost-MOGA yields significantly better results
than previous state-of-the-art algorithms in terms of various evaluation
criteria, such as accuracy, F-score, precision, and recall.
- Abstract(参考訳): マイクロアレイ遺伝子発現データは、多くの遺伝子と少数のサンプルが伴っていることが多い。
しかし、これらの遺伝子のうち、がんに関連するものはほとんどなく、有意な遺伝子選択が困難となる。
そこで我々は,マイクロアレイデータセットにおける癌分類のための極勾配増強(XGBoost)と多目的最適化遺伝的アルゴリズム(XGBoost-MOGA)を組み合わせた2段階遺伝子選択手法を提案する。
第1段階では、XGBoostを用いたアンサンブルベースの特徴選択を用いてランク付けされる。
この段階は、無関係な遺伝子を効果的に除去し、クラスに関連する最も関連する遺伝子からなる群を生じることができる。
第2段階では、XGBoost-MOGAは、多目的最適化遺伝的アルゴリズムを用いて、最も関連性の高い遺伝子群に基づく最適な遺伝子サブセットを探索する。
xgboost-mogaを13のマイクロアレイ式データセット上で2つのよく知られた学習分類器を用いて,他の最先端特徴選択法と比較する包括的な実験を行った。
実験結果から,XGBoost-MOGAは,精度,Fスコア,精度,リコールなどの様々な評価基準において,従来の最先端アルゴリズムよりも有意に優れた結果が得られることが示された。
関連論文リスト
- Feature Selection via Robust Weighted Score for High Dimensional Binary
Class-Imbalanced Gene Expression Data [1.2891210250935148]
非平衡データに対する頑健な重み付けスコア (ROWSU) は, クラス不均衡問題を用いた高次元遺伝子発現二項分類における最も識別性の高い特徴を選択するために提案される。
ROWSU法の性能を6ドルの遺伝子発現データセットで評価した。
論文 参考訳(メタデータ) (2024-01-23T11:22:03Z) - Genetic heterogeneity analysis using genetic algorithm and network
science [2.6166087473624318]
ゲノムワイド・アソシエーション(GWAS)は、疾患に感受性のある遺伝的変数を同定することができる。
遺伝的効果に絡み合った遺伝的変数は、しばしば低い効果サイズを示す。
本稿では,FCSNet(Feature Co-Selection Network)という,GWASのための新しい特徴選択機構を提案する。
論文 参考訳(メタデータ) (2023-08-12T01:28:26Z) - A Novel Fuzzy Bi-Clustering Algorithm with AFS for Identification of
Co-Regulated Genes [0.799536002595393]
本稿では,共制御遺伝子を同定するファジィ・ビクラスタリングアルゴリズムを提案する。
提案アルゴリズムは、遺伝子発現データの事前知識なしに、協調制御された遺伝子を効果的に検出することができる。
論文 参考訳(メタデータ) (2023-02-03T08:35:49Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - Natural language processing for clusterization of genes according to
their functions [62.997667081978825]
本稿では,数千の遺伝子の解析を減らし,複数のクラスタの解析を行うアプローチを提案する。
これらの記述は、事前訓練された言語モデル(BERT)といくつかのテキスト処理アプローチを用いてベクトルとして符号化される。
論文 参考訳(メタデータ) (2022-07-17T12:59:34Z) - rfPhen2Gen: A machine learning based association study of brain imaging
phenotypes to genotypes [71.1144397510333]
56個の脳画像QTを用いてSNPを予測する機械学習モデルを学習した。
アルツハイマー病(AD)リスク遺伝子APOEのSNPは、ラスソとランダムな森林に対して最低のRMSEを有していた。
ランダム・フォレストは、線形モデルによって優先順位付けされなかったが、脳関連疾患と関連があることが知られている追加のSNPを特定した。
論文 参考訳(メタデータ) (2022-03-31T20:15:22Z) - Cancer Gene Profiling through Unsupervised Discovery [49.28556294619424]
低次元遺伝子バイオマーカーを発見するための,新しい,自動かつ教師なしのフレームワークを提案する。
本手法は,高次元中心型非監視クラスタリングアルゴリズムLP-Stabilityアルゴリズムに基づく。
私達の署名は免疫炎症および免疫砂漠の腫瘍の区別の有望な結果報告します。
論文 参考訳(メタデータ) (2021-02-11T09:04:45Z) - Feature reduction for machine learning on molecular features: The
GeneScore [58.720142291102135]
GeneScoreは、バイオメディカルデータの機械学習分析のための機能削減の概念です。
GeneScoreは癌実体の分類において二項行列よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-01-14T10:58:39Z) - Handling highly correlated genes in prediction analysis of genomic
studies [0.0]
遺伝子間の高い相関は、多系統問題のような技術的な問題を導入し、信頼性の低い予測モデルをもたらす。
本稿では,高相関遺伝子をグループとして扱うグループ化アルゴリズムを提案する。
まず、遺伝子群の共通パターンを用いることで、条件変化下での予測をより堅牢で信頼性の高いものにする。
論文 参考訳(メタデータ) (2020-07-05T22:14:03Z) - A Novel Granular-Based Bi-Clustering Method of Deep Mining the
Co-Expressed Genes [76.84066556597342]
ビクラスタリング法は、サンプル(遺伝子)のサブセットが試験条件下で協調的に制御されるバイクラスタをマイニングするために用いられる。
残念ながら、従来の二クラスタ法はそのような二クラスタを発見するのに完全には効果がない。
本稿では,グラニュラーコンピューティングの理論を取り入れた新しい2クラスタリング手法を提案する。
論文 参考訳(メタデータ) (2020-05-12T02:04:40Z) - A New Gene Selection Algorithm using Fuzzy-Rough Set Theory for Tumor
Classification [0.0]
本稿では,ファジィ・ルー集合の識別行列を用いた新しい遺伝子選択手法を提案する。
提案手法は、遺伝子選択結果を改善するために、同一のクラスラベルと異なるクラスラベルを持つインスタンスの類似性を考慮に入れている。
実験により, この手法は最先端の手法に比べて効率が良いことを示した。
論文 参考訳(メタデータ) (2020-03-26T13:43:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。