論文の概要: Cancer Subtyping by Improved Transcriptomic Features Using Vector
Quantized Variational Autoencoder
- arxiv url: http://arxiv.org/abs/2207.09783v1
- Date: Wed, 20 Jul 2022 09:47:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-21 12:42:19.679170
- Title: Cancer Subtyping by Improved Transcriptomic Features Using Vector
Quantized Variational Autoencoder
- Title(参考訳): ベクトル量子化変分オートエンコーダを用いたトランスクリプトーム特性の改善による癌治療
- Authors: Zheng Chen, Ziwei Yang, Lingwei Zhu, Guang Shi, Kun Yue, Takashi
Matsubara, Shigehiko Kanaya, MD Altaf-Ul-Amin
- Abstract要約: 本稿では,Vector Quantized Variational AutoEncoder (VQ-VAE)を提案する。
VQ-VAEは厳密な仮定を課さないため、その潜在機能は入力のより良い表現であり、メインストリームのクラスタリング手法で優れたクラスタリング性能を得ることができる。
- 参考スコア(独自算出の注目度): 10.835673227875615
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Defining and separating cancer subtypes is essential for facilitating
personalized therapy modality and prognosis of patients. The definition of
subtypes has been constantly recalibrated as a result of our deepened
understanding. During this recalibration, researchers often rely on clustering
of cancer data to provide an intuitive visual reference that could reveal the
intrinsic characteristics of subtypes. The data being clustered are often omics
data such as transcriptomics that have strong correlations to the underlying
biological mechanism. However, while existing studies have shown promising
results, they suffer from issues associated with omics data: sample scarcity
and high dimensionality. As such, existing methods often impose unrealistic
assumptions to extract useful features from the data while avoiding overfitting
to spurious correlations. In this paper, we propose to leverage a recent strong
generative model, Vector Quantized Variational AutoEncoder (VQ-VAE), to tackle
the data issues and extract informative latent features that are crucial to the
quality of subsequent clustering by retaining only information relevant to
reconstructing the input. VQ-VAE does not impose strict assumptions and hence
its latent features are better representations of the input, capable of
yielding superior clustering performance with any mainstream clustering method.
Extensive experiments and medical analysis on multiple datasets comprising 10
distinct cancers demonstrate the VQ-VAE clustering results can significantly
and robustly improve prognosis over prevalent subtyping systems.
- Abstract(参考訳): がんサブタイプの定義と分離は、患者のパーソナライズされた治療様式と予後の促進に不可欠である。
サブタイプの定義は、より深い理解の結果、常に再検討されてきた。
この再調整の間、研究者は、サブタイプの固有の特徴を明らかにする直感的な視覚的参照を提供するために、がんデータのクラスタリングに依存することが多い。
クラスタ化されているデータは、下層の生物学的メカニズムと強い相関を持つ転写学のようなオミクスデータであることが多い。
しかしながら、既存の研究は有望な結果を示しているが、オミクスデータに関連する問題(サンプル不足と高次元)に苦しんでいる。
そのため、既存の手法ではデータから有用な特徴を抽出するために非現実的な仮定を課すことが多い。
本稿では,近年の強力な生成モデルであるvector quantized variational autoencoder (vq-vae) を活用して,データ問題に取り組み,入力の再構成に関連する情報のみを保持することで,その後のクラスタリングの質に不可欠な情報的潜在特徴を抽出することを提案する。
VQ-VAEは厳密な仮定を課さないため、その潜在機能は入力のより良い表現であり、メインストリームクラスタリング法で優れたクラスタリング性能を得ることができる。
10の異なるがんからなる複数のデータセットに対する大規模な実験と医療分析により、VQ-VAEクラスタリングの結果は、一般的なサブタイピングシステムよりも大きく、堅牢に予後を改善することができることを示した。
関連論文リスト
- DEDUCE: Multi-head attention decoupled contrastive learning to discover cancer subtypes based on multi-omics data [7.049723871585993]
マルチオミクスのがんデータを解析するための教師なしコントラスト学習のためのモデルDDUCEを提案する。
このモデルは教師なしのSMAEを採用し、マルチオミクスデータからコンテキストの特徴や長距離依存を深く抽出することができる。
サブタイプは、マルチオミクスデータの特徴空間とサンプル空間の両方におけるサンプル間の類似性を計算することでクラスタ化される。
論文 参考訳(メタデータ) (2023-07-09T00:53:23Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - A cost-based multi-layer network approach for the discovery of patient
phenotypes [2.816539638885011]
コミュニティ検出手法を用いて表現型を検出するためのコストベース層セレクタモデルを提案する。
私たちのゴールは、その品質を維持しながら、これらの表現型を構築するのに使用される機能の数を最小化することです。
いくつかの後処理変数では、COBALTの表現型を特徴とする予測子は、従来のクラスタリング法で検出された表現型よりも優れていた。
論文 参考訳(メタデータ) (2022-09-19T14:07:10Z) - Cancer Subtyping via Embedded Unsupervised Learning on Transcriptomics
Data [5.232428469965068]
教師なし学習の観点から,自動サブタイピングについて検討する。
具体的には、典型的には存在するが教師なしの学習サブタイプ文学では失敗する強いガウス性仮定をバイパスする。
提案手法は, 潜在空間の特徴をよりよく把握し, 分子レベルでの癌サブタイプの発現をモデル化する。
論文 参考訳(メタデータ) (2022-04-02T11:44:58Z) - Multiple Organ Failure Prediction with Classifier-Guided Generative
Adversarial Imputation Networks [4.040013871160853]
多臓器不全 (MOF) は集中治療室 (ICU) 患者の死亡率が高い重篤な症候群である。
機械学習モデルを電子健康記録に適用することは、欠落した値の広範性のために難しい。
論文 参考訳(メタデータ) (2021-06-22T15:49:01Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Temporal Phenotyping using Deep Predictive Clustering of Disease
Progression [97.88605060346455]
我々は、時系列データをクラスタリングするためのディープラーニングアプローチを開発し、各クラスタは、同様の将来的な結果を共有する患者から構成される。
2つの実世界のデータセットに対する実験により、我々のモデルは最先端のベンチマークよりも優れたクラスタリング性能が得られることが示された。
論文 参考訳(メタデータ) (2020-06-15T20:48:43Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。