論文の概要: Unsupervised EHR-based Phenotyping via Matrix and Tensor Decompositions
- arxiv url: http://arxiv.org/abs/2209.00322v1
- Date: Thu, 1 Sep 2022 09:47:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-02 13:33:31.368406
- Title: Unsupervised EHR-based Phenotyping via Matrix and Tensor Decompositions
- Title(参考訳): マトリックスとテンソル分解による非教師付きEHRによるヘノタイピング
- Authors: Florian Becker, Age K. Smilde, Evrim Acar
- Abstract要約: 本稿では,低ランク近似に基づく計算表現法について概観する。
近年,様々な制約を組み込んだ低ランクデータ近似手法が開発され,解釈可能性の向上が図られている。
- 参考スコア(独自算出の注目度): 0.6875312133832078
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Computational phenotyping allows for unsupervised discovery of subgroups of
patients as well as corresponding co-occurring medical conditions from
electronic health records (EHR). Typically, EHR data contains demographic
information, diagnoses and laboratory results. Discovering (novel) phenotypes
has the potential to be of prognostic and therapeutic value. Providing medical
practitioners with transparent and interpretable results is an important
requirement and an essential part for advancing precision medicine. Low-rank
data approximation methods such as matrix (e.g., non-negative matrix
factorization) and tensor decompositions (e.g., CANDECOMP/PARAFAC) have
demonstrated that they can provide such transparent and interpretable insights.
Recent developments have adapted low-rank data approximation methods by
incorporating different constraints and regularizations that facilitate
interpretability further. In addition, they offer solutions for common
challenges within EHR data such as high dimensionality, data sparsity and
incompleteness. Especially extracting temporal phenotypes from longitudinal EHR
has received much attention in recent years. In this paper, we provide a
comprehensive review of low-rank approximation-based approaches for
computational phenotyping. The existing literature is categorized into temporal
vs. static phenotyping approaches based on matrix vs. tensor decompositions.
Furthermore, we outline different approaches for the validation of phenotypes,
i.e., the assessment of clinical significance.
- Abstract(参考訳): 計算的表現型付けは、患者のサブグループの教師なしの発見と、電子健康記録(EHR)からの関連医療状況の発見を可能にする。
通常、EHRデータには人口統計情報、診断、実験結果が含まれる。
ノーベル表現型を発見することは、予後および治療的価値の可能性がある。
医療従事者に透明で解釈可能な結果を提供することは、精密医療を進める上で重要な要件であり、重要な部分である。
行列(例えば非負行列分解)やテンソル分解(例えば、CANDECOMP/PARAFAC)のような低ランクデータ近似法は、そのような透明で解釈可能な洞察を提供できることを示した。
近年,様々な制約を組み込んだ低ランクデータ近似手法が開発され,解釈可能性の向上が図られている。
さらに、高次元性、データ空間性、不完全性など、EHRデータ内の共通の課題に対する解決策を提供する。
特に縦型ehrからの時間的表現型抽出は近年注目されている。
本稿では,計算表現のための低ランク近似に基づくアプローチについて概説する。
既存の文献は、行列対テンソル分解に基づく時間対静的表現型アプローチに分類される。
さらに,表現型を検証するための異なるアプローチ,すなわち臨床的意義の評価について概説する。
関連論文リスト
- Utilising Bayesian Networks to combine multimodal data and expert
opinion for the robust prediction of depression and its symptoms [65.28160163774274]
我々は,抑うつ,抑うつ症状,および,胸腺で収集された音声,表情,認知ゲームデータから得られる特徴の関連性を把握するためにベイズ的枠組みを適用した。
論文 参考訳(メタデータ) (2022-11-09T14:48:13Z) - A cost-based multi-layer network approach for the discovery of patient
phenotypes [2.816539638885011]
コミュニティ検出手法を用いて表現型を検出するためのコストベース層セレクタモデルを提案する。
私たちのゴールは、その品質を維持しながら、これらの表現型を構築するのに使用される機能の数を最小化することです。
いくつかの後処理変数では、COBALTの表現型を特徴とする予測子は、従来のクラスタリング法で検出された表現型よりも優れていた。
論文 参考訳(メタデータ) (2022-09-19T14:07:10Z) - Enabling scalable clinical interpretation of ML-based phenotypes using
real world data [0.0]
本研究では,大規模なERHデータセットを用いて患者層化分析を行う手法について検討した。
本研究は, 患者層分類結果の臨床的評価と解釈を容易にするためのいくつかのツールを開発した。
論文 参考訳(メタデータ) (2022-08-02T17:31:03Z) - Cancer Subtyping by Improved Transcriptomic Features Using Vector
Quantized Variational Autoencoder [10.835673227875615]
本稿では,Vector Quantized Variational AutoEncoder (VQ-VAE)を提案する。
VQ-VAEは厳密な仮定を課さないため、その潜在機能は入力のより良い表現であり、メインストリームのクラスタリング手法で優れたクラスタリング性能を得ることができる。
論文 参考訳(メタデータ) (2022-07-20T09:47:53Z) - Benchmarking Heterogeneous Treatment Effect Models through the Lens of
Interpretability [82.29775890542967]
治療のパーソナライズされた効果を見積もるのは複雑だが、普及している問題である。
ヘテロジニアス処理効果推定に関する機械学習文献の最近の進歩は、洗練されたが不透明なツールの多くを生み出した。
我々は、ポストホックな特徴重要度法を用いて、モデルの予測に影響を及ぼす特徴を特定する。
論文 参考訳(メタデータ) (2022-06-16T17:59:05Z) - Label scarcity in biomedicine: Data-rich latent factor discovery
enhances phenotype prediction [102.23901690661916]
低次元の埋め込み空間は、健康指標、ライフスタイル、および人口動態の予測をデータスカース化するために、英国バイオバンクの人口データセットから導出することができる。
半超越的アプローチによるパフォーマンス向上は、おそらく様々な医学データサイエンス応用にとって重要な要素となるだろう。
論文 参考訳(メタデータ) (2021-10-12T16:25:50Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Variational Knowledge Distillation for Disease Classification in Chest
X-Rays [102.04931207504173]
我々は,X線に基づく疾患分類のための新しい確率的推論フレームワークである反復的知識蒸留(VKD)を提案する。
提案手法の有効性を,X線画像とEHRを用いた3つの公開ベンチマークデータセットに示す。
論文 参考訳(メタデータ) (2021-03-19T14:13:56Z) - Learning Inter-Modal Correspondence and Phenotypes from Multi-Modal
Electronic Health Records [15.658012300789148]
本稿では,複数モーダル間の対応を表現型発見と併用して推測するcHITFを提案する。
実世界のMIMIC-IIIデータセットを用いて行った実験は、cHITFが臨床的に意味のあるモーダル間通信を効果的に推論することを示した。
論文 参考訳(メタデータ) (2020-11-12T10:30:29Z) - Bidirectional Representation Learning from Transformers using Multimodal
Electronic Health Record Data to Predict Depression [11.1492931066686]
うつ病の予測のために,ERHシーケンス上で双方向の表現学習を行うための時間的深層学習モデルを提案する。
このモデルでは, 曲線(PRAUC)下において, 最良ベースラインモデルと比較して, 抑うつ予測において0.70から0.76まで, 精度・リコール面積の最大値が得られた。
論文 参考訳(メタデータ) (2020-09-26T17:56:37Z) - Trajectories, bifurcations and pseudotime in large clinical datasets:
applications to myocardial infarction and diabetes data [94.37521840642141]
混合データ型と欠落値を特徴とする大規模臨床データセット分析のための半教師付き方法論を提案する。
この手法は、次元の減少、データの可視化、クラスタリング、特徴の選択と、部分的に順序付けられた観測列における測地距離(擬時)の定量化のタスクを同時に扱うことのできる弾性主グラフの適用に基づいている。
論文 参考訳(メタデータ) (2020-07-07T21:04:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。