論文の概要: POPDx: An Automated Framework for Patient Phenotyping across 392,246
Individuals in the UK Biobank Study
- arxiv url: http://arxiv.org/abs/2208.11223v1
- Date: Tue, 23 Aug 2022 22:43:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-25 13:10:41.315360
- Title: POPDx: An Automated Framework for Patient Phenotyping across 392,246
Individuals in the UK Biobank Study
- Title(参考訳): popdx: 英国バイオバンク研究における392,246人の患者表現型の自動フレームワーク
- Authors: Lu Yang, Sheng Wang, and Russ B. Altman
- Abstract要約: 本稿では,すべての英国バイオバンク参加者に対して,表現型符号を暗示する表現型認識法について述べる。
英国バイオバンクから392,246人の表現型および健康関連情報を抽出した。
POPDxは1,538個の表現型符号の確率を同時に推定するバイリニア機械学習フレームワークである。
- 参考スコア(独自算出の注目度): 8.888983935373574
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Objective For the UK Biobank standardized phenotype codes are associated with
patients who have been hospitalized but are missing for many patients who have
been treated exclusively in an outpatient setting. We describe a method for
phenotype recognition that imputes phenotype codes for all UK Biobank
participants. Materials and Methods POPDx (Population-based Objective
Phenotyping by Deep Extrapolation) is a bilinear machine learning framework for
simultaneously estimating the probabilities of 1,538 phenotype codes. We
extracted phenotypic and health-related information of 392,246 individuals from
the UK Biobank for POPDx development and evaluation. A total of 12,803 ICD-10
diagnosis codes of the patients were converted to 1,538 Phecodes as gold
standard labels. The POPDx framework was evaluated and compared to other
available methods on automated multi-phenotype recognition. Results POPDx can
predict phenotypes that are rare or even unobserved in training. We demonstrate
substantial improvement of automated multi-phenotype recognition across 22
disease categories, and its application in identifying key epidemiological
features associated with each phenotype. Conclusions POPDx helps provide
well-defined cohorts for downstream studies. It is a general purpose method
that can be applied to other biobanks with diverse but incomplete data.
- Abstract(参考訳): 目的 英国バイオバンクの標準化された表現型コードは、入院しているが外来でのみ治療を受けた多くの患者に欠けている患者に関連付けられている。
本稿では,全英国バイオバンク参加者に対して表現型コードを含む表現型認識手法について述べる。
Materials and Methods POPDx (Population-based Objective Phenotyping by Deep Extrapolation)は1,538個の表現型符号の確率を同時に推定するバイリニア機械学習フレームワークである。
英国バイオバンクから392,246人の表現型および健康関連情報を抽出し,POPDxの開発と評価を行った。
12,803件のICD-10診断コードを金標準ラベルとして1,538件に換算した。
POPDxフレームワークは, 自動マルチフェノタイプ認識における他の手法と比較し, 評価を行った。
結果 popdx は、訓練において珍しい、あるいは観察できない表現型を予測できる。
22の病種にまたがる自動多表現型認識の大幅な改善と,各表現型に関連する重要な疫学的特徴の同定への応用を示す。
結論 POPDx は下流の研究によく定義されたコホートを提供する。
多様なが不完全なデータを持つ他のバイオバンクに適用できる汎用的手法である。
関連論文リスト
- Causal Representation Learning from Multimodal Biological Observations [57.00712157758845]
我々は,マルチモーダルデータに対するフレキシブルな識別条件の開発を目指している。
我々は、各潜伏成分の識別可能性を保証するとともに、サブスペース識別結果を事前の作業から拡張する。
我々の重要な理論的要素は、異なるモーダル間の因果関係の構造的空間性である。
論文 参考訳(メタデータ) (2024-11-10T16:40:27Z) - MixEHR-Nest: Identifying Subphenotypes within Electronic Health Records through Hierarchical Guided-Topic Modeling [11.338180666952894]
マルチモーダルEHRデータを用いて,数千の疾患からサブフェノタイプトピックを推定する,ガイド付きトピックモデルMixEHR-Nestを提案する。
MixEHR-Nestは、疾患の進行と重症度を予測する表現型ごとに異なるパターンを持つ亜フェノタイプを同定することができる。
論文 参考訳(メタデータ) (2024-10-17T04:48:06Z) - Clustering of Disease Trajectories with Explainable Machine Learning: A Case Study on Postoperative Delirium Phenotypes [13.135589459700865]
本稿では,パーソナライズされたPODリスク予測のための教師付き機械学習と,潜在的POD表現型を明らかにするための教師なしクラスタリング技術を組み合わせたアプローチを提案する。
SHAPの特徴空間におけるクラスタリング患者は,真の表現型を回復し,生の特徴空間におけるクラスタリングに優れることを示した。
論文 参考訳(メタデータ) (2024-05-06T10:05:46Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - BiomedGPT: A Generalist Vision-Language Foundation Model for Diverse Biomedical Tasks [68.39821375903591]
汎用AIは、さまざまなデータ型を解釈する汎用性のために、制限に対処する可能性を秘めている。
本稿では,最初のオープンソースかつ軽量な視覚言語基盤モデルであるBiomedGPTを提案する。
論文 参考訳(メタデータ) (2023-05-26T17:14:43Z) - PheME: A deep ensemble framework for improving phenotype prediction from
multi-modal data [42.56953523499849]
PheMEは, 構造化EHRのマルチモーダルデータを用いたアンサンブル・フレームワークであり, 非構造化臨床ノートを用いて, 正確なフェノタイプ予測を行う。
我々はアンサンブル学習を活用し、単一モーダルモデルと多モーダルモデルからの出力を組み合わせて表現型予測を改善する。
論文 参考訳(メタデータ) (2023-03-19T23:41:04Z) - A cost-based multi-layer network approach for the discovery of patient
phenotypes [2.816539638885011]
コミュニティ検出手法を用いて表現型を検出するためのコストベース層セレクタモデルを提案する。
私たちのゴールは、その品質を維持しながら、これらの表現型を構築するのに使用される機能の数を最小化することです。
いくつかの後処理変数では、COBALTの表現型を特徴とする予測子は、従来のクラスタリング法で検出された表現型よりも優れていた。
論文 参考訳(メタデータ) (2022-09-19T14:07:10Z) - Unsupervised EHR-based Phenotyping via Matrix and Tensor Decompositions [0.6875312133832078]
本稿では,低ランク近似に基づく計算表現法について概観する。
近年,様々な制約を組み込んだ低ランクデータ近似手法が開発され,解釈可能性の向上が図られている。
論文 参考訳(メタデータ) (2022-09-01T09:47:27Z) - Label scarcity in biomedicine: Data-rich latent factor discovery
enhances phenotype prediction [102.23901690661916]
低次元の埋め込み空間は、健康指標、ライフスタイル、および人口動態の予測をデータスカース化するために、英国バイオバンクの人口データセットから導出することができる。
半超越的アプローチによるパフォーマンス向上は、おそらく様々な医学データサイエンス応用にとって重要な要素となるだろう。
論文 参考訳(メタデータ) (2021-10-12T16:25:50Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Personalized pathology test for Cardio-vascular disease: Approximate
Bayesian computation with discriminative summary statistics learning [48.7576911714538]
近似計算を用いて生物学的に有意なパラメータを推定するための血小板沈着モデルと推論手法を提案する。
この研究は、CVDの検出と治療のためのパーソナライズされた病理検査の先例のない機会を開く。
論文 参考訳(メタデータ) (2020-10-13T15:20:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。