論文の概要: Targeting Underrepresented Populations in Precision Medicine: A
Federated Transfer Learning Approach
- arxiv url: http://arxiv.org/abs/2108.12112v1
- Date: Fri, 27 Aug 2021 04:04:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-30 14:20:49.399195
- Title: Targeting Underrepresented Populations in Precision Medicine: A
Federated Transfer Learning Approach
- Title(参考訳): 精密医療における未表現人口のターゲット:フェデレート・トランスファー学習アプローチ
- Authors: Sai Li, Tianxi Cai, Rui Duan
- Abstract要約: 多様な人口と複数の医療機関の異種データを統合した双方向データ統合戦略を提案する。
提案手法は, 人口の予測精度と予測精度を向上し, 人口間のモデル性能のギャップを小さくすることを示す。
- 参考スコア(独自算出の注目度): 7.467496975496821
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The limited representation of minorities and disadvantaged populations in
large-scale clinical and genomics research has become a barrier to translating
precision medicine research into practice. Due to heterogeneity across
populations, risk prediction models are often found to be underperformed in
these underrepresented populations, and therefore may further exacerbate known
health disparities. In this paper, we propose a two-way data integration
strategy that integrates heterogeneous data from diverse populations and from
multiple healthcare institutions via a federated transfer learning approach.
The proposed method can handle the challenging setting where sample sizes from
different populations are highly unbalanced. With only a small number of
communications across participating sites, the proposed method can achieve
performance comparable to the pooled analysis where individual-level data are
directly pooled together. We show that the proposed method improves the
estimation and prediction accuracy in underrepresented populations, and reduces
the gap of model performance across populations. Our theoretical analysis
reveals how estimation accuracy is influenced by communication budgets, privacy
restrictions, and heterogeneity across populations. We demonstrate the
feasibility and validity of our methods through numerical experiments and a
real application to a multi-center study, in which we construct polygenic risk
prediction models for Type II diabetes in AA population.
- Abstract(参考訳): 大規模臨床・ゲノム研究におけるマイノリティと不利な人口の限られた表現は、精密医学研究を実践に翻訳する障壁となっている。
集団間の不均一性のため、リスク予測モデルがこれらの人口の過小評価されることが多く、したがって既知の健康格差をさらに悪化させる可能性がある。
本稿では,多種多様な医療機関からの異種データをフェデレート・トランスファー・ラーニング・アプローチにより統合する双方向データ統合戦略を提案する。
提案手法は,異なる集団のサンプルサイズが極めてバランスの取れない,困難な状況に対処できる。
提案手法は,参加サイト間で少数の通信しか行わず,個別レベルのデータが直接プールされるプール解析に匹敵する性能を実現することができる。
提案手法は,過疎人口における推定と予測精度を向上し,個体群間でのモデル性能の差を低減できることを示す。
理論解析により,推定精度がコミュニケーション予算,プライバシー制限,集団間の多様性にどのように影響するかが明らかになった。
数値実験により本手法の有効性と妥当性を実証し,AA群におけるII型糖尿病の発症リスク予測モデルを構築した多施設研究への実例を示した。
関連論文リスト
- Targeted Data Fusion for Causal Survival Analysis Under Distribution Shift [46.84912148188679]
因果推論は、科学的発見の一般化可能性、輸送性、複製性を改善する可能性がある。
既存のデータ融合手法はバイナリや連続的な結果に重点を置いている。
マルチソース因果サバイバル分析のための2つの新しい手法を提案する。
論文 参考訳(メタデータ) (2025-01-30T23:21:25Z) - U-aggregation: Unsupervised Aggregation of Multiple Learning Algorithms [4.871473117968554]
新人口の強化とロバスト化のための教師なしモデルアグリゲーション手法U-アグリゲーションを提案する。
既存の教師付きモデルアグリゲーションや超学習者アプローチとは異なり、U-アグリゲーションは対象人口の観測されたラベルや成果を仮定しない。
複雑な形質の遺伝的リスク予測を高めるために,U凝集を用いた実世界の応用の可能性を示す。
論文 参考訳(メタデータ) (2025-01-30T01:42:51Z) - Sample Selection Bias in Machine Learning for Healthcare [17.549969100454803]
サンプル選択バイアス(SSB, sample selection bias)は, 対象個体群が対象個体群に比例しない特定の種類の偏見である。
既存の機械学習技術は、主に研究と対象個体群の分布のバランスをとることによってバイアスを補正しようとする。
偏り補正ではなく,対象集団の同定に基づいて,SSBに対処するための新たな研究方向を提案する。
論文 参考訳(メタデータ) (2024-05-13T15:30:35Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Multiply Robust Federated Estimation of Targeted Average Treatment
Effects [0.0]
多地点データを用いて,対象個体群に対する有効な因果推論を導出する手法を提案する。
提案手法では,移動学習を組み込んでアンサンブル重みを推定し,ソースサイトからの情報を組み合わせる。
論文 参考訳(メタデータ) (2023-09-22T03:15:08Z) - Multi-dimensional domain generalization with low-rank structures [18.565189720128856]
統計的および機械学習の手法では、テストデータがトレーニングデータと同一に分散されていると仮定されるのが一般的である。
この仮定は必ずしも成り立たないが、特にトレーニングデータに対象の個体群がよく表現されていないアプリケーションでは顕著である。
線形回帰モデルにおいて,この問題に対処するための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2023-09-18T08:07:58Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Predictive Modeling of ICU Healthcare-Associated Infections from
Imbalanced Data. Using Ensembles and a Clustering-Based Undersampling
Approach [55.41644538483948]
本研究は,集中治療室における危険因子の同定と医療関連感染症の予測に焦点をあてる。
感染発生率の低減に向けた意思決定を支援することを目的とする。
論文 参考訳(メタデータ) (2020-05-07T16:13:12Z) - Survival Cluster Analysis [93.50540270973927]
異なるリスクプロファイルを持つサブポピュレーションを特定するために、生存分析には未解決の必要性がある。
このニーズに対処するアプローチは、個々の成果のキャラクタリゼーションを改善する可能性が高い。
論文 参考訳(メタデータ) (2020-02-29T22:41:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。