論文の概要: Unsupervised Feature Selection for Tumor Profiles using Autoencoders and
Kernel Methods
- arxiv url: http://arxiv.org/abs/2007.06106v1
- Date: Sun, 12 Jul 2020 21:59:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-11 05:37:47.832356
- Title: Unsupervised Feature Selection for Tumor Profiles using Autoencoders and
Kernel Methods
- Title(参考訳): オートエンコーダとカーネル法による腫瘍プロファイルの教師なし特徴選択
- Authors: Martin Palazzo, Pierre Beauseroy, Patricio Yankilevich
- Abstract要約: 本研究は,腫瘍サンプルの有意義かつ低次元的表現を学習し,腫瘍サブタイプのクラスターを見つけることを目的とする。
The proposed method called Latent Kernel Feature Selection (LKFS) is an unsupervised approach for gene selection in tumor gene expression profiles。
- 参考スコア(独自算出の注目度): 1.9078991171384014
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Molecular data from tumor profiles is high dimensional. Tumor profiles can be
characterized by tens of thousands of gene expression features. Due to the size
of the gene expression feature set machine learning methods are exposed to
noisy variables and complexity. Tumor types present heterogeneity and can be
subdivided in tumor subtypes. In many cases tumor data does not include tumor
subtype labeling thus unsupervised learning methods are necessary for tumor
subtype discovery. This work aims to learn meaningful and low dimensional
representations of tumor samples and find tumor subtype clusters while keeping
biological signatures without using tumor labels. The proposed method named
Latent Kernel Feature Selection (LKFS) is an unsupervised approach for gene
selection in tumor gene expression profiles. By using Autoencoders a low
dimensional and denoised latent space is learned as a target representation to
guide a Multiple Kernel Learning model that selects a subset of genes. By using
the selected genes a clustering method is used to group samples. In order to
evaluate the performance of the proposed unsupervised feature selection method
the obtained features and clusters are analyzed by clinical significance. The
proposed method has been applied on three tumor datasets which are Brain, Renal
and Lung, each one composed by two tumor subtypes. When compared with benchmark
unsupervised feature selection methods the results obtained by the proposed
method reveal lower redundancy in the selected features and a better clustering
performance.
- Abstract(参考訳): 腫瘍プロファイルからの分子データは高次元である。
腫瘍のプロファイルは数万の遺伝子発現の特徴によって特徴づけられる。
遺伝子発現機能セットのサイズのため、機械学習手法はノイズの多い変数や複雑さにさらされる。
腫瘍タイプは異種であり、腫瘍サブタイプに分類できる。
多くの場合、腫瘍データは腫瘍サブタイプラベリングを含まないため、腫瘍サブタイプ発見には教師なし学習法が必要である。
本研究の目的は,腫瘍サンプルの有意義かつ低次元表現を学習し,腫瘍ラベルを用いずに,生体信号を維持しながら腫瘍サブタイプのクラスターを探索することである。
提案手法であるlatent kernel feature selection(lkfs)は、腫瘍遺伝子発現プロファイルにおける遺伝子選択の教師なしアプローチである。
オートエンコーダを用いることで、低次元かつ離散化された潜在空間を目標表現として学習し、遺伝子のサブセットを選択する多重カーネル学習モデルを導出する。
選択された遺伝子を用いてサンプルをグループ化する。
提案手法の有効性を評価するために, 得られた特徴量とクラスタを臨床的意義から分析した。
提案手法は脳,腎,肺の3つの腫瘍データセットに適用され,それぞれ2つの腫瘍サブタイプからなる。
教師なし特徴選択法と比較すると,提案手法により得られた結果から,選択した特徴の冗長性が低下し,クラスタリング性能が向上することがわかった。
関連論文リスト
- Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - Automated Cancer Subtyping via Vector Quantization Mutual Information
Maximization [10.191396978971168]
そこで本研究では,遺伝子プロファイルを利用してサブタイプを非教師付きで識別する新たなクラスタリング手法を提案する。
本手法は既存の論争を呼んだラベルを精製し,さらに医学的な分析により癌生存率と高い相関があることが証明された。
論文 参考訳(メタデータ) (2022-06-22T01:55:08Z) - Optimize Deep Learning Models for Prediction of Gene Mutations Using
Unsupervised Clustering [6.494144125433731]
ディープ・ラーニング(Deep Learning)は、全スライディングのデジタル病理画像の解析と解釈において、主流の方法論選択となっている。
本稿では, 教師なしクラスタリングに基づくマルチインスタンス学習を提案するとともに, 3種類の癌からのWSIを用いた遺伝子変異予測のための深層学習モデルの構築に本手法を適用した。
画像パッチの教師なしクラスタリングは, 予測パッチの同定, 予測情報の欠如を排除し, 3種類の癌における遺伝子変異の予測を改善できることを示した。
論文 参考訳(メタデータ) (2022-03-31T11:48:21Z) - Gene Transformer: Transformers for the Gene Expression-based
Classification of Cancer Subtypes [0.0]
本稿では,多頭部自己認識モジュールによる高次元遺伝子発現の複雑さに対処するエンド・ツー・エンドのディープラーニング手法であるGene Transformerを提案する。
Gene Transformerは、がんのサブタイプを分類するための効率的なアプローチであり、計算生物学におけるディープラーニングモデルの改善は、この領域でもよく反映できることを示している。
論文 参考訳(メタデータ) (2021-08-26T15:02:55Z) - Triplet Contrastive Learning for Brain Tumor Classification [99.07846518148494]
本稿では,脳腫瘍の深層埋め込みを直接学習する手法を提案する。
本手法は,27種類の腫瘍群からなる広範囲な脳腫瘍データセットを用いて評価し,そのうち13種は稀である。
論文 参考訳(メタデータ) (2021-08-08T11:26:34Z) - Cancer Gene Profiling through Unsupervised Discovery [49.28556294619424]
低次元遺伝子バイオマーカーを発見するための,新しい,自動かつ教師なしのフレームワークを提案する。
本手法は,高次元中心型非監視クラスタリングアルゴリズムLP-Stabilityアルゴリズムに基づく。
私達の署名は免疫炎症および免疫砂漠の腫瘍の区別の有望な結果報告します。
論文 参考訳(メタデータ) (2021-02-11T09:04:45Z) - Topological Data Analysis of copy number alterations in cancer [70.85487611525896]
癌ゲノム情報に含まれる情報を新しいトポロジに基づくアプローチで捉える可能性を探る。
本手法は, 癌体性遺伝データに有意な低次元表現を抽出する可能性を秘めている。
論文 参考訳(メタデータ) (2020-11-22T17:31:23Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Latent regularization for feature selection using kernel methods in
tumor classification [1.9078991171384014]
特徴選択は、腫瘍の分類に役立つ重要な遺伝子を選択するための有用なアプローチである。
本稿では,遺伝子とカスタムカーネルのサブセットを減らし,マルチカーネル学習に基づく特徴選択手法を提案する。
新しい未確認試験試料の腫瘍分類性能により, 一般化能力の向上と評価を行った。
論文 参考訳(メタデータ) (2020-04-10T00:46:02Z) - A New Gene Selection Algorithm using Fuzzy-Rough Set Theory for Tumor
Classification [0.0]
本稿では,ファジィ・ルー集合の識別行列を用いた新しい遺伝子選択手法を提案する。
提案手法は、遺伝子選択結果を改善するために、同一のクラスラベルと異なるクラスラベルを持つインスタンスの類似性を考慮に入れている。
実験により, この手法は最先端の手法に比べて効率が良いことを示した。
論文 参考訳(メタデータ) (2020-03-26T13:43:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。