論文の概要: Targeting Underrepresented Populations in Precision Medicine: A
Federated Transfer Learning Approach
- arxiv url: http://arxiv.org/abs/2108.12112v1
- Date: Fri, 27 Aug 2021 04:04:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-30 14:20:49.399195
- Title: Targeting Underrepresented Populations in Precision Medicine: A
Federated Transfer Learning Approach
- Title(参考訳): 精密医療における未表現人口のターゲット:フェデレート・トランスファー学習アプローチ
- Authors: Sai Li, Tianxi Cai, Rui Duan
- Abstract要約: 多様な人口と複数の医療機関の異種データを統合した双方向データ統合戦略を提案する。
提案手法は, 人口の予測精度と予測精度を向上し, 人口間のモデル性能のギャップを小さくすることを示す。
- 参考スコア(独自算出の注目度): 7.467496975496821
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The limited representation of minorities and disadvantaged populations in
large-scale clinical and genomics research has become a barrier to translating
precision medicine research into practice. Due to heterogeneity across
populations, risk prediction models are often found to be underperformed in
these underrepresented populations, and therefore may further exacerbate known
health disparities. In this paper, we propose a two-way data integration
strategy that integrates heterogeneous data from diverse populations and from
multiple healthcare institutions via a federated transfer learning approach.
The proposed method can handle the challenging setting where sample sizes from
different populations are highly unbalanced. With only a small number of
communications across participating sites, the proposed method can achieve
performance comparable to the pooled analysis where individual-level data are
directly pooled together. We show that the proposed method improves the
estimation and prediction accuracy in underrepresented populations, and reduces
the gap of model performance across populations. Our theoretical analysis
reveals how estimation accuracy is influenced by communication budgets, privacy
restrictions, and heterogeneity across populations. We demonstrate the
feasibility and validity of our methods through numerical experiments and a
real application to a multi-center study, in which we construct polygenic risk
prediction models for Type II diabetes in AA population.
- Abstract(参考訳): 大規模臨床・ゲノム研究におけるマイノリティと不利な人口の限られた表現は、精密医学研究を実践に翻訳する障壁となっている。
集団間の不均一性のため、リスク予測モデルがこれらの人口の過小評価されることが多く、したがって既知の健康格差をさらに悪化させる可能性がある。
本稿では,多種多様な医療機関からの異種データをフェデレート・トランスファー・ラーニング・アプローチにより統合する双方向データ統合戦略を提案する。
提案手法は,異なる集団のサンプルサイズが極めてバランスの取れない,困難な状況に対処できる。
提案手法は,参加サイト間で少数の通信しか行わず,個別レベルのデータが直接プールされるプール解析に匹敵する性能を実現することができる。
提案手法は,過疎人口における推定と予測精度を向上し,個体群間でのモデル性能の差を低減できることを示す。
理論解析により,推定精度がコミュニケーション予算,プライバシー制限,集団間の多様性にどのように影響するかが明らかになった。
数値実験により本手法の有効性と妥当性を実証し,AA群におけるII型糖尿病の発症リスク予測モデルを構築した多施設研究への実例を示した。
関連論文リスト
- Sample Selection Bias in Machine Learning for Healthcare [17.549969100454803]
サンプル選択バイアス(英: sample selection bias, SSB)とは、研究対象の人口が減少し、偏りがあり潜在的に有害な決定につながることを指す。
SSBは文献でよく知られているが、医療のための機械学習についてはほとんど研究されていない。
偏り補正ではなく,対象集団の同定に基づいて,SSBに対処するための新たな研究方向を提案する。
論文 参考訳(メタデータ) (2024-05-13T15:30:35Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Multiply Robust Federated Estimation of Targeted Average Treatment
Effects [0.0]
多地点データを用いて,対象個体群に対する有効な因果推論を導出する手法を提案する。
提案手法では,移動学習を組み込んでアンサンブル重みを推定し,ソースサイトからの情報を組み合わせる。
論文 参考訳(メタデータ) (2023-09-22T03:15:08Z) - Multi-dimensional domain generalization with low-rank structures [18.565189720128856]
統計的および機械学習の手法では、テストデータがトレーニングデータと同一に分散されていると仮定されるのが一般的である。
この仮定は必ずしも成り立たないが、特にトレーニングデータに対象の個体群がよく表現されていないアプリケーションでは顕著である。
線形回帰モデルにおいて,この問題に対処するための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2023-09-18T08:07:58Z) - Improving genetic risk prediction across diverse population by
disentangling ancestry representations [10.803542340843368]
本稿では,表現型関連情報から祖先を遠ざける新しいディープラーニングフレームワークを提案する。
祖先が混ざり合った表現は、少数民族の間でより良いパフォーマンスを示すリスク予測器を構築するのに使うことができる。
論文 参考訳(メタデータ) (2022-05-10T05:05:37Z) - Adversarial Sample Enhanced Domain Adaptation: A Case Study on
Predictive Modeling with Electronic Health Records [57.75125067744978]
ドメイン適応を容易にするデータ拡張手法を提案する。
逆生成したサンプルはドメイン適応時に使用される。
その結果,本手法の有効性とタスクの一般性が確認された。
論文 参考訳(メタデータ) (2021-01-13T03:20:20Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Variational Disentanglement for Rare Event Modeling [21.269897066024306]
本稿では,不均衡な分類問題における希少事象から学ぶための変分非絡み合い手法を提案する。
具体的には、潜在空間に課せられる極端分布の挙動を利用して、低頻度事象から情報を抽出する。
論文 参考訳(メタデータ) (2020-09-17T21:35:36Z) - Predictive Modeling of ICU Healthcare-Associated Infections from
Imbalanced Data. Using Ensembles and a Clustering-Based Undersampling
Approach [55.41644538483948]
本研究は,集中治療室における危険因子の同定と医療関連感染症の予測に焦点をあてる。
感染発生率の低減に向けた意思決定を支援することを目的とする。
論文 参考訳(メタデータ) (2020-05-07T16:13:12Z) - Survival Cluster Analysis [93.50540270973927]
異なるリスクプロファイルを持つサブポピュレーションを特定するために、生存分析には未解決の必要性がある。
このニーズに対処するアプローチは、個々の成果のキャラクタリゼーションを改善する可能性が高い。
論文 参考訳(メタデータ) (2020-02-29T22:41:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。