論文の概要: A Novel Bio-Inspired Hybrid Multi-Filter Wrapper Gene Selection Method
with Ensemble Classifier for Microarray Data
- arxiv url: http://arxiv.org/abs/2101.00819v1
- Date: Mon, 4 Jan 2021 07:57:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-12 06:54:17.980705
- Title: A Novel Bio-Inspired Hybrid Multi-Filter Wrapper Gene Selection Method
with Ensemble Classifier for Microarray Data
- Title(参考訳): マイクロアレイデータのためのアンサンブル分類器を用いた新しいバイオインスパイアハイブリッドマルチフィルタラッパー遺伝子選択法
- Authors: Babak Nouri-Moghaddam, Mehdi Ghazanfari, Mohammad Fathian
- Abstract要約: 遺伝子選択問題を解き、エンサンブルアルゴリズムを構築するために、新しいハイブリッドソリューションが提示される。
ACMOFOAはデータセットの寸法を小さくし、KELMを最適化し、分類の精度を高めることを目的としたラッパー法として提示される。
提案アルゴリズムの性能は,9つのマイクロアレイデータセット上で評価された。
- 参考スコア(独自算出の注目度): 0.8594140167290097
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Microarray technology is known as one of the most important tools for
collecting DNA expression data. This technology allows researchers to
investigate and examine types of diseases and their origins. However,
microarray data are often associated with challenges such as small sample size,
a significant number of genes, imbalanced data, etc. that make classification
models inefficient. Thus, a new hybrid solution based on multi-filter and
adaptive chaotic multi-objective forest optimization algorithm (AC-MOFOA) is
presented to solve the gene selection problem and construct the Ensemble
Classifier. In the proposed solution, to reduce the dataset's dimensions, a
multi-filter model uses a combination of five filter methods to remove
redundant and irrelevant genes. Then, an AC-MOFOA based on the concepts of
non-dominated sorting, crowding distance, chaos theory, and adaptive operators
is presented. AC-MOFOA as a wrapper method aimed at reducing dataset
dimensions, optimizing KELM, and increasing the accuracy of the classification,
simultaneously. Next, in this method, an ensemble classifier model is presented
using AC-MOFOA results to classify microarray data. The performance of the
proposed algorithm was evaluated on nine public microarray datasets, and its
results were compared in terms of the number of selected genes, classification
efficiency, execution time, time complexity, and hypervolume indicator
criterion with five hybrid multi-objective methods. According to the results,
the proposed hybrid method could increase the accuracy of the KELM in most
datasets by reducing the dataset's dimensions and achieve similar or superior
performance compared to other multi-objective methods. Furthermore, the
proposed Ensemble Classifier model could provide better classification accuracy
and generalizability in microarray data compared to conventional ensemble
methods.
- Abstract(参考訳): マイクロアレイ技術はDNA発現データを収集するための最も重要なツールの1つとして知られている。
この技術により、研究者は病気の種類とその起源を調査し、調査することができる。
しかしながら、マイクロアレイデータは、小さなサンプルサイズ、かなりの数の遺伝子、不均衡なデータなどの課題としばしば関連づけられる。
分類モデルが非効率になります
そこで,マルチフィルタと適応型カオス型多目的フォレスト最適化アルゴリズム(ac-mofoa)に基づく新しいハイブリッドソリューションを提案し,遺伝子選択問題を解き,アンサンブル分類器を構築する。
提案手法では、データセットの次元を減らすために、5つのフィルタ法を組み合わせて冗長で無関係な遺伝子を除去する。
そこで,非支配的ソート,群集距離,カオス理論,適応演算子の概念に基づくAC-MOFOAを提案する。
AC-MOFOAは,データセット次元の削減,KELMの最適化,分類精度の向上を目的としたラッパー手法である。
次に、AC-MOFOA結果を用いてアンサンブル分類器モデルを示し、マイクロアレイデータの分類を行う。
提案アルゴリズムの性能を9つの公開マイクロアレイデータセットで評価し, 選択された遺伝子数, 分類効率, 実行時間, 時間複雑性, および5つのハイブリッドマルチオブジェクト法によるハイパーボリュームインジケータ基準と比較した。
その結果,提案手法は,データセットの次元を小さくすることで,ほとんどのデータセットにおけるKELMの精度を向上し,他の多目的手法と比較して類似あるいは優れた性能が得られることがわかった。
さらに,従来のアンサンブル法と比較して,マイクロアレイデータの分類精度と一般化性の向上が期待できる。
関連論文リスト
- Dual-stage optimizer for systematic overestimation adjustment applied to
multi-objective genetic algorithms for biomarker selection [0.18648070031379424]
特徴選択法を用いたバイオマーカー同定は,特徴数における予測能力とパシモニーのトレードオフを伴う多目的問題として扱うことができる。
提案するDOSA-MOは多目的最適化ラッパーアルゴリズムで,元の推定値,分散度,および解の特徴セットサイズが過大評価を予測する。
論文 参考訳(メタデータ) (2023-12-27T16:13:14Z) - Convolutional autoencoder-based multimodal one-class classification [80.52334952912808]
1クラス分類は、単一のクラスからのデータを用いた学習のアプローチを指す。
マルチモーダルデータに適した深層学習一クラス分類法を提案する。
論文 参考訳(メタデータ) (2023-09-25T12:31:18Z) - Optimizations of Autoencoders for Analysis and Classification of
Microscopic In Situ Hybridization Images [68.8204255655161]
同様のレベルの遺伝子発現を持つ顕微鏡画像の領域を検出・分類するためのディープラーニングフレームワークを提案する。
分析するデータには教師なし学習モデルが必要です。
論文 参考訳(メタデータ) (2023-04-19T13:45:28Z) - A model-free feature selection technique of feature screening and random
forest based recursive feature elimination [0.0]
質量特徴を持つ超高次元データのモデルフリー特徴選択法を提案する。
提案手法は選択整合性を示し, 弱正則条件下では$L$整合性を示す。
論文 参考訳(メタデータ) (2023-02-15T03:39:16Z) - A distribution-free mixed-integer optimization approach to hierarchical modelling of clustered and longitudinal data [0.0]
我々は,新しいデータポイントに対するクラスタ効果を評価する革新的なアルゴリズムを導入し,このモデルのロバスト性や精度を高める。
このアプローチの推論的および予測的効果は、学生のスコアリングとタンパク質発現に適用することでさらに説明される。
論文 参考訳(メタデータ) (2023-02-06T23:34:51Z) - Hybrid Ensemble optimized algorithm based on Genetic Programming for
imbalanced data classification [0.0]
本稿では,2種類の不均衡データ分類のための遺伝的プログラミング(GP)に基づくハイブリッドアンサンブルアルゴリズムを提案する。
実験結果から,提案手法をトレーニングセットのサイズで指定したデータセット上での性能は,マイノリティクラス予測の他の次元よりも40%,50%高い精度を示した。
論文 参考訳(メタデータ) (2021-06-02T14:14:38Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Generalized Matrix Factorization: efficient algorithms for fitting
generalized linear latent variable models to large data arrays [62.997667081978825]
一般化線形潜在変数モデル(GLLVM)は、そのような因子モデルを非ガウス応答に一般化する。
GLLVMのモデルパラメータを推定する現在のアルゴリズムは、集約的な計算を必要とし、大規模なデータセットにスケールしない。
本稿では,GLLVMを高次元データセットに適用するための新しい手法を提案する。
論文 参考訳(メタデータ) (2020-10-06T04:28:19Z) - Multi-View Spectral Clustering with High-Order Optimal Neighborhood
Laplacian Matrix [57.11971786407279]
マルチビュースペクトルクラスタリングは、データ間の固有のクラスタ構造を効果的に明らかにすることができる。
本稿では,高次最適近傍ラプラシア行列を学習するマルチビュースペクトルクラスタリングアルゴリズムを提案する。
提案アルゴリズムは, 1次ベースと高次ベースの両方の線形結合の近傍を探索し, 最適ラプラシア行列を生成する。
論文 参考訳(メタデータ) (2020-08-31T12:28:40Z) - A New Validity Index for Fuzzy-Possibilistic C-Means Clustering [6.174448419090291]
Fuzzy-Possibilistic (FP)指数は、形状や密度の異なるクラスターの存在下でうまく機能する。
FPCMはファジィの度合いと典型性の度合いを事前選択する必要がある。
論文 参考訳(メタデータ) (2020-05-19T01:48:13Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。