論文の概要: Label scarcity in biomedicine: Data-rich latent factor discovery
enhances phenotype prediction
- arxiv url: http://arxiv.org/abs/2110.06135v1
- Date: Tue, 12 Oct 2021 16:25:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-13 15:35:05.956984
- Title: Label scarcity in biomedicine: Data-rich latent factor discovery
enhances phenotype prediction
- Title(参考訳): バイオメディシンにおけるラベル不足:データ豊富な潜伏因子の発見は表現型予測を促進する
- Authors: Marc-Andre Schulz, Bertrand Thirion, Alexandre Gramfort, Ga\"el
Varoquaux, Danilo Bzdok
- Abstract要約: 低次元の埋め込み空間は、健康指標、ライフスタイル、および人口動態の予測をデータスカース化するために、英国バイオバンクの人口データセットから導出することができる。
半超越的アプローチによるパフォーマンス向上は、おそらく様々な医学データサイエンス応用にとって重要な要素となるだろう。
- 参考スコア(独自算出の注目度): 102.23901690661916
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-quality data accumulation is now becoming ubiquitous in the health
domain. There is increasing opportunity to exploit rich data from normal
subjects to improve supervised estimators in specific diseases with notorious
data scarcity. We demonstrate that low-dimensional embedding spaces can be
derived from the UK Biobank population dataset and used to enhance data-scarce
prediction of health indicators, lifestyle and demographic characteristics.
Phenotype predictions facilitated by Variational Autoencoder manifolds
typically scaled better with increasing unlabeled data than dimensionality
reduction by PCA or Isomap. Performances gains from semisupervison approaches
will probably become an important ingredient for various medical data science
applications.
- Abstract(参考訳): 高品質なデータ蓄積は、今では健康領域で広く普及している。
健常者からの豊富なデータを利用して、悪名高いデータ不足のある特定の疾患における教師付き推定値を改善する機会が増えている。
低次元の埋め込み空間は、イギリスのバイオバンク人口データセットから導出され、健康指標、生活習慣、人口特性の予測データを強化するために使用される。
変分自己エンコーダ多様体により促進される現象型予測は, PCA や Isomap による次元減少よりもラベルなしデータの増大により, 典型的に向上した。
semisupervisonのアプローチによるパフォーマンス向上は、様々な医療データサイエンスアプリケーションにとって重要な要素になるだろう。
関連論文リスト
- MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Application of data engineering approaches to address challenges in
microbiome data for optimal medical decision-making [0.0]
この研究は、マイクロバイオームのデータセットに固有の問題に対処し、パーソナライズされた医療を提供するのに非常に有益である可能性がある。
この研究で使用されたプロトタイプは、マイクロバイオームのデータセットに固有の問題に対処し、パーソナライズされた医療を提供するのに非常に有益である。
論文 参考訳(メタデータ) (2023-06-30T05:36:39Z) - An end-to-end framework for gene expression classification by
integrating a background knowledge graph: application to cancer prognosis
prediction [1.5484595752241122]
我々は、一次データの分類モデルを構築するために、二次データを扱うエンドツーエンドフレームワークを提案した。
我々はこの枠組みを,遺伝子発現データと生物学的ネットワークを用いた癌予後予測に応用した。
論文 参考訳(メタデータ) (2023-06-29T11:20:47Z) - Generative models improve fairness of medical classifiers under
distribution shifts [49.10233060774818]
データから現実的な拡張を自動的に学習することは、生成モデルを用いてラベル効率の良い方法で可能であることを示す。
これらの学習の強化は、モデルをより堅牢で統計的に公平に配布できることを示した。
論文 参考訳(メタデータ) (2023-04-18T18:15:38Z) - Unsupervised EHR-based Phenotyping via Matrix and Tensor Decompositions [0.6875312133832078]
本稿では,低ランク近似に基づく計算表現法について概観する。
近年,様々な制約を組み込んだ低ランクデータ近似手法が開発され,解釈可能性の向上が図られている。
論文 参考訳(メタデータ) (2022-09-01T09:47:27Z) - Cancer Subtyping by Improved Transcriptomic Features Using Vector
Quantized Variational Autoencoder [10.835673227875615]
本稿では,Vector Quantized Variational AutoEncoder (VQ-VAE)を提案する。
VQ-VAEは厳密な仮定を課さないため、その潜在機能は入力のより良い表現であり、メインストリームのクラスタリング手法で優れたクラスタリング性能を得ることができる。
論文 参考訳(メタデータ) (2022-07-20T09:47:53Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - SumGNN: Multi-typed Drug Interaction Prediction via Efficient Knowledge
Graph Summarization [64.56399911605286]
本稿では,サブグラフ抽出モジュールによって実現された知識要約グラフニューラルネットワークSumGNNを提案する。
SumGNNは5.54%まで最高のベースラインを上回り、データ関係の低いタイプでは特にパフォーマンスの向上が顕著である。
論文 参考訳(メタデータ) (2020-10-04T00:14:57Z) - Trajectories, bifurcations and pseudotime in large clinical datasets:
applications to myocardial infarction and diabetes data [94.37521840642141]
混合データ型と欠落値を特徴とする大規模臨床データセット分析のための半教師付き方法論を提案する。
この手法は、次元の減少、データの可視化、クラスタリング、特徴の選択と、部分的に順序付けられた観測列における測地距離(擬時)の定量化のタスクを同時に扱うことのできる弾性主グラフの適用に基づいている。
論文 参考訳(メタデータ) (2020-07-07T21:04:55Z) - Teacher-Student Domain Adaptation for Biosensor Models [0.0]
本稿では、ソースドメインからのデータが豊富であり、対象ドメインからのラベル付きデータが限定的または存在しない場合、および少量のペア化されたソースターゲットデータが利用可能である場合、ドメイン適応へのアプローチを提案する。
本手法は, 消費者級携帯型バイオセンサーのデータに基づいて, 医療状況を検出する深層学習モデルの開発を目的としている。
論文 参考訳(メタデータ) (2020-03-17T19:09:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。