論文の概要: Hybrid gene selection approach using XGBoost and multi-objective genetic
algorithm for cancer classification
- arxiv url: http://arxiv.org/abs/2106.05841v1
- Date: Sun, 30 May 2021 03:43:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-13 13:58:21.153232
- Title: Hybrid gene selection approach using XGBoost and multi-objective genetic
algorithm for cancer classification
- Title(参考訳): xgboostと多目的遺伝的アルゴリズムを用いた癌分類のためのハイブリッド遺伝子選択アプローチ
- Authors: Xiongshi Deng, Min Li, Shaobo Deng, Lei Wang
- Abstract要約: マイクロアレイデータセットにおける癌分類のための極勾配増強(XGBoost)と多目的最適化遺伝的アルゴリズム(XGBoost-MOGA)を組み合わせた2段階遺伝子選択手法を提案する。
XGBoost-MOGAは、精度、Fスコア、精度、リコールなどの様々な評価基準の観点から、従来の最先端アルゴリズムよりもはるかに優れた結果が得られる。
- 参考スコア(独自算出の注目度): 6.781877756322586
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Microarray gene expression data are often accompanied by a large number of
genes and a small number of samples. However, only a few of these genes are
relevant to cancer, resulting in signigicant gene selection challenges. Hence,
we propose a two-stage gene selection approach by combining extreme gradient
boosting (XGBoost) and a multi-objective optimization genetic algorithm
(XGBoost-MOGA) for cancer classification in microarray datasets. In the first
stage, the genes are ranked use an ensemble-based feature selection using
XGBoost. This stage can effectively remove irrelevant genes and yield a group
comprising the most relevant genes related to the class. In the second stage,
XGBoost-MOGA searches for an optimal gene subset based on the most relevant
genes's group using a multi-objective optimization genetic algorithm. We
performed comprehensive experiments to compare XGBoost-MOGA with other
state-of-the-art feature selection methods using two well-known learning
classifiers on 13 publicly available microarray expression datasets. The
experimental results show that XGBoost-MOGA yields significantly better results
than previous state-of-the-art algorithms in terms of various evaluation
criteria, such as accuracy, F-score, precision, and recall.
- Abstract(参考訳): マイクロアレイ遺伝子発現データは、多くの遺伝子と少数のサンプルが伴っていることが多い。
しかし、これらの遺伝子のうち、がんに関連するものはほとんどなく、有意な遺伝子選択が困難となる。
そこで我々は,マイクロアレイデータセットにおける癌分類のための極勾配増強(XGBoost)と多目的最適化遺伝的アルゴリズム(XGBoost-MOGA)を組み合わせた2段階遺伝子選択手法を提案する。
第1段階では、XGBoostを用いたアンサンブルベースの特徴選択を用いてランク付けされる。
この段階は、無関係な遺伝子を効果的に除去し、クラスに関連する最も関連する遺伝子からなる群を生じることができる。
第2段階では、XGBoost-MOGAは、多目的最適化遺伝的アルゴリズムを用いて、最も関連性の高い遺伝子群に基づく最適な遺伝子サブセットを探索する。
xgboost-mogaを13のマイクロアレイ式データセット上で2つのよく知られた学習分類器を用いて,他の最先端特徴選択法と比較する包括的な実験を行った。
実験結果から,XGBoost-MOGAは,精度,Fスコア,精度,リコールなどの様々な評価基準において,従来の最先端アルゴリズムよりも有意に優れた結果が得られることが示された。
関連論文リスト
- An Evolutional Neural Network Framework for Classification of Microarray Data [0.0]
本研究の目的は,遺伝的アルゴリズムとニューラルネットワークのハイブリッドモデルを用いて,情報的遺伝子のサブセット選択において問題を克服することである。
実験の結果,提案手法は,他の機械学習アルゴリズムと比較して,高い精度と最小数の選択遺伝子が示唆された。
論文 参考訳(メタデータ) (2024-11-20T13:48:40Z) - Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.13058298388101]
遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。
BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。
BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文 参考訳(メタデータ) (2024-06-05T06:42:27Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - Exhaustive Exploitation of Nature-inspired Computation for Cancer Screening in an Ensemble Manner [20.07173196364489]
本研究では、遺伝子発現データからがん分類のためのアンサンブル学習を改善するために、進化最適化逆アンサンブル学習(EODE)と呼ばれるフレームワークを提案する。
各種癌種を含む35の遺伝子発現ベンチマークデータセットを対象に実験を行った。
論文 参考訳(メタデータ) (2024-04-06T08:07:48Z) - Feature Selection via Robust Weighted Score for High Dimensional Binary
Class-Imbalanced Gene Expression Data [1.2891210250935148]
非平衡データに対する頑健な重み付けスコア (ROWSU) は, クラス不均衡問題を用いた高次元遺伝子発現二項分類における最も識別性の高い特徴を選択するために提案される。
ROWSU法の性能を6ドルの遺伝子発現データセットで評価した。
論文 参考訳(メタデータ) (2024-01-23T11:22:03Z) - A Novel Fuzzy Bi-Clustering Algorithm with AFS for Identification of
Co-Regulated Genes [0.799536002595393]
本稿では,共制御遺伝子を同定するファジィ・ビクラスタリングアルゴリズムを提案する。
提案アルゴリズムは、遺伝子発現データの事前知識なしに、協調制御された遺伝子を効果的に検出することができる。
論文 参考訳(メタデータ) (2023-02-03T08:35:49Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - Natural language processing for clusterization of genes according to
their functions [62.997667081978825]
本稿では,数千の遺伝子の解析を減らし,複数のクラスタの解析を行うアプローチを提案する。
これらの記述は、事前訓練された言語モデル(BERT)といくつかのテキスト処理アプローチを用いてベクトルとして符号化される。
論文 参考訳(メタデータ) (2022-07-17T12:59:34Z) - Cancer Gene Profiling through Unsupervised Discovery [49.28556294619424]
低次元遺伝子バイオマーカーを発見するための,新しい,自動かつ教師なしのフレームワークを提案する。
本手法は,高次元中心型非監視クラスタリングアルゴリズムLP-Stabilityアルゴリズムに基づく。
私達の署名は免疫炎症および免疫砂漠の腫瘍の区別の有望な結果報告します。
論文 参考訳(メタデータ) (2021-02-11T09:04:45Z) - A Novel Granular-Based Bi-Clustering Method of Deep Mining the
Co-Expressed Genes [76.84066556597342]
ビクラスタリング法は、サンプル(遺伝子)のサブセットが試験条件下で協調的に制御されるバイクラスタをマイニングするために用いられる。
残念ながら、従来の二クラスタ法はそのような二クラスタを発見するのに完全には効果がない。
本稿では,グラニュラーコンピューティングの理論を取り入れた新しい2クラスタリング手法を提案する。
論文 参考訳(メタデータ) (2020-05-12T02:04:40Z) - A New Gene Selection Algorithm using Fuzzy-Rough Set Theory for Tumor
Classification [0.0]
本稿では,ファジィ・ルー集合の識別行列を用いた新しい遺伝子選択手法を提案する。
提案手法は、遺伝子選択結果を改善するために、同一のクラスラベルと異なるクラスラベルを持つインスタンスの類似性を考慮に入れている。
実験により, この手法は最先端の手法に比べて効率が良いことを示した。
論文 参考訳(メタデータ) (2020-03-26T13:43:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。