論文の概要: A Study of Feature Selection and Extraction Algorithms for Cancer
Subtype Prediction
- arxiv url: http://arxiv.org/abs/2109.14648v1
- Date: Wed, 29 Sep 2021 18:11:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-01 14:48:52.084820
- Title: A Study of Feature Selection and Extraction Algorithms for Cancer
Subtype Prediction
- Title(参考訳): 癌サブタイプ予測のための特徴選択と抽出アルゴリズムの検討
- Authors: Vaibhav Sinha, Siladitya Dash, Nazma Naskar, and Sk Md Mosaddek
Hossain
- Abstract要約: 既存の特徴選択法は,個別に適用した場合に計算コストがかかることを示す。
これらのアルゴリズムを逐次適用することにより,計算コストの低減と予測性能の向上に寄与する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this work, we study and analyze different feature selection algorithms
that can be used to classify cancer subtypes in case of highly varying
high-dimensional data. We apply three different feature selection methods on
five different types of cancers having two separate omics each. We show that
the existing feature selection methods are computationally expensive when
applied individually. Instead, we apply these algorithms sequentially which
helps in lowering the computational cost and improving the predictive
performance. We further show that reducing the number of features using some
dimension reduction techniques can improve the performance of machine learning
models in some cases. We support our findings through comprehensive data
analysis and visualization.
- Abstract(参考訳): 本研究では,高度に異なる高次元データを用いて,癌サブタイプの分類に使用できる特徴選択アルゴリズムについて検討し,解析する。
2つの異なるオミクスを持つ5種類の癌に対して3つの異なる特徴選択法を適用した。
個別に適用した場合,既存の特徴選択手法は計算コストが高いことを示す。
代わりに、これらのアルゴリズムを順次適用することで、計算コストの低減と予測性能の向上に寄与します。
さらに,いくつかの次元縮小手法を用いて特徴量を減らすことで,機械学習モデルの性能を向上できることを示す。
包括的データ分析と可視化により,この知見を裏付ける。
関連論文リスト
- Feature Selection as Deep Sequential Generative Learning [50.00973409680637]
本研究では, 逐次再構成, 変分, 性能評価器の損失を伴って, 深部変分変圧器モデルを構築した。
提案モデルでは,特徴選択の知識を抽出し,連続的な埋め込み空間を学習し,特徴選択決定シーケンスをユーティリティスコアに関連付けられた埋め込みベクトルにマッピングする。
論文 参考訳(メタデータ) (2024-03-06T16:31:56Z) - Different Algorithms (Might) Uncover Different Patterns: A Brain-Age
Prediction Case Study [8.597209503064128]
脳波研究による脳年齢予測の確立された仮説が、アルゴリズム全体にわたって検証されるかどうかを検討する。
使用した特定のデータセットに対して最先端のパフォーマンスを達成したモデルはほとんどありません。
論文 参考訳(メタデータ) (2024-02-08T19:55:07Z) - A Contrast Based Feature Selection Algorithm for High-dimensional Data
set in Machine Learning [9.596923373834093]
本稿では,異なるクラス間で示される相違点に基づいて識別的特徴を抽出する新しいフィルタ特徴選択手法であるContrastFSを提案する。
提案手法の有効性と有効性について検証し,提案手法が無視可能な計算で良好に動作することを示す。
論文 参考訳(メタデータ) (2024-01-15T05:32:35Z) - Dual-stage optimizer for systematic overestimation adjustment applied to
multi-objective genetic algorithms for biomarker selection [0.18648070031379424]
特徴選択法を用いたバイオマーカー同定は,特徴数における予測能力とパシモニーのトレードオフを伴う多目的問題として扱うことができる。
提案するDOSA-MOは多目的最適化ラッパーアルゴリズムで,元の推定値,分散度,および解の特徴セットサイズが過大評価を予測する。
論文 参考訳(メタデータ) (2023-12-27T16:13:14Z) - Compactness Score: A Fast Filter Method for Unsupervised Feature
Selection [66.84571085643928]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。
提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文 参考訳(メタデータ) (2022-01-31T13:01:37Z) - Expressivity of Parameterized and Data-driven Representations in Quality
Diversity Search [111.06379262544911]
2つの異なる検索空間で実施した品質多様性進化探索の出力多様性を比較する。
学習モデルは、未知の例への外挿や拡大よりも、既知のデータポイント間の補間が優れている。
論文 参考訳(メタデータ) (2021-05-10T10:27:43Z) - Auto-weighted Multi-view Feature Selection with Graph Optimization [90.26124046530319]
グラフ学習に基づく新しい教師なしマルチビュー特徴選択モデルを提案する。
1) 特徴選択過程において, 異なる視点で共有されたコンセンサス類似度グラフが学習される。
各種データセットを用いた実験により,提案手法が最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-11T03:25:25Z) - Feature Selection Using Reinforcement Learning [0.0]
特定の関心の予測因子を特徴付けるために使用できる変数や特徴の空間は指数関数的に増大し続けている。
モデルのバイアスを損なうことなく分散を最小化する最も特徴的な特徴を特定することは、マシンラーニングモデルのトレーニングを成功させる上で非常に重要です。
論文 参考訳(メタデータ) (2021-01-23T09:24:37Z) - Theoretical Insights Into Multiclass Classification: A High-dimensional
Asymptotic View [82.80085730891126]
線形多クラス分類の最初の現代的精度解析を行う。
分析の結果,分類精度は分布に依存していることがわかった。
得られた洞察は、他の分類アルゴリズムの正確な理解の道を開くかもしれない。
論文 参考訳(メタデータ) (2020-11-16T05:17:29Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Analysis of ensemble feature selection for correlated high-dimensional
RNA-Seq cancer data [0.24366811507669126]
本研究は、関連する変数の発見のための2つのアプローチを比較する。
最も有益な特徴は、4つの特徴選択アルゴリズムを用いて識別される。
残念なことに、特徴選択アルゴリズムのアンサンブルから得られた特徴集合に基づいて構築されたモデルは、個々のアルゴリズムから得られた特徴集合に基づいて開発されたモデルよりは良くなかった。
論文 参考訳(メタデータ) (2020-04-28T20:38:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。