論文の概要: Privacy-preserving federated prediction of pain intensity change based on multi-center survey data
- arxiv url: http://arxiv.org/abs/2409.07997v1
- Date: Thu, 12 Sep 2024 12:41:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-13 16:39:03.522902
- Title: Privacy-preserving federated prediction of pain intensity change based on multi-center survey data
- Title(参考訳): マルチセンターサーベイデータに基づく痛み強度変化のプライバシ保存フェデレーション予測
- Authors: Supratim Das, Mahdie Rafie, Paula Kammer, Søren T. Skou, Dorte T. Grønne, Ewa M. Roos, André Hajek, Hans-Helmut König, Md Shihab Ullaha, Niklas Probul, Jan Baumbacha, Linda Baumbach,
- Abstract要約: 患者が報告した調査データは、医療改善を目的とした予後モデルをトレーニングするために使用される。
局所的に訓練されたモデルは、正確でなく、堅牢で、一般化可能である。
予後モデル構築のためのプライバシ保護フェデレーション機械学習技術を提案し,適用する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Background: Patient-reported survey data are used to train prognostic models aimed at improving healthcare. However, such data are typically available multi-centric and, for privacy reasons, cannot easily be centralized in one data repository. Models trained locally are less accurate, robust, and generalizable. We present and apply privacy-preserving federated machine learning techniques for prognostic model building, where local survey data never leaves the legally safe harbors of the medical centers. Methods: We used centralized, local, and federated learning techniques on two healthcare datasets (GLA:D data from the five health regions of Denmark and international SHARE data of 27 countries) to predict two different health outcomes. We compared linear regression, random forest regression, and random forest classification models trained on local data with those trained on the entire data in a centralized and in a federated fashion. Results: In GLA:D data, federated linear regression (R2 0.34, RMSE 18.2) and federated random forest regression (R2 0.34, RMSE 18.3) models outperform their local counterparts (i.e., R2 0.32, RMSE 18.6, R2 0.30, RMSE 18.8) with statistical significance. We also found that centralized models (R2 0.34, RMSE 18.2, R2 0.32, RMSE 18.5, respectively) did not perform significantly better than the federated models. In SHARE, the federated model (AC 0.78, AUROC: 0.71) and centralized model (AC 0.84, AUROC: 0.66) perform significantly better than the local models (AC: 0.74, AUROC: 0.69). Conclusion: Federated learning enables the training of prognostic models from multi-center surveys without compromising privacy and with only minimal or no compromise regarding model performance.
- Abstract(参考訳): 背景: 患者報告調査データを用いて, 医療改善を目的とした予後モデルを訓練する。
しかし、そのようなデータは一般的にマルチ中心で利用可能であり、プライバシー上の理由から、単一のデータリポジトリに簡単に集中することはできない。
局所的に訓練されたモデルは、正確でなく、堅牢で、一般化可能である。
我々は,地域調査データが医療センターの法的に安全な港を決して残さない,予後モデル構築のためのプライバシ保護フェデレーション機械学習手法を提示し,適用する。
方法: デンマークの5つの保健地域から得られたGLA:Dデータと27カ国の国際SHAREデータを用いて, 2つの異なる健康結果を予測する。
我々は、局所データに基づいて訓練された線形回帰、ランダムな森林回帰、ランダムな森林分類モデルと、中央集権的および連合的な方法で訓練されたデータ全体を比較した。
結果: GLA:Dデータ, 連合線形回帰(R2 0.34, RMSE 18.2)および連合ランダム森林回帰(R2 0.34, RMSE 18.3)モデルは, 統計的に有意な局部回帰(R2 0.32, RMSE 18.6, R2 0.30, RMSE 18.8)を上回った。
また, 集中型モデル (R2 0.34, RMSE 18.2, R2 0.32, RMSE 18.5) は, 連合型モデルよりも性能が良くないことがわかった。
SHAREでは、連合モデル(AC 0.78, AUROC: 0.71)と集中モデル(AC 0.84, AUROC: 0.66)は、局所モデル(AC 0.74, AUROC: 0.69)よりも大幅に優れている。
結論: フェデレートされた学習は、プライバシを損なうことなく、モデルパフォーマンスに関する最小限の妥協なしに、マルチセンタの調査から予測モデルをトレーニングすることを可能にする。
関連論文リスト
- Comparing Federated Stochastic Gradient Descent and Federated Averaging for Predicting Hospital Length of Stay [0.0]
入院期間(LOS)を確実に予測することは,病院における資源配分の効率化に不可欠である。
従来の予測モデリングツールは、医療機関がプライバシー規則を定めているため、十分なデータと多様なデータを取得するのが難しいことが多い。
このモデリング手法は、病院外の機密データを抽出することなく、異なる病院からの分散データソースをモデル化することで協調的なモデルトレーニングを促進する。
論文 参考訳(メタデータ) (2024-07-17T17:00:20Z) - Bayesian Federated Inference for Survival Models [0.0]
がん研究において、全体的な生存と進行の自由生存は、しばしばコックスモデルで分析される。
異なる医療センターのデータセットをマージすることは役に立つかもしれないが、厳格なプライバシー法とロジスティックな困難のために、これは必ずしも可能ではない。
近年,一般化線形モデルに対するベイズ連邦推論(BFI)戦略が提案されている。
論文 参考訳(メタデータ) (2024-04-26T15:05:26Z) - Bayesian Federated Inference for regression models based on non-shared multicenter data sets from heterogeneous populations [0.0]
回帰モデルでは、サンプルサイズは予測器の数に対して十分な大きさでなければならない。
異なる(医療)センターで収集された異なるデータセットからデータをポーリングすることはこの問題を軽減するが、プライバシー規制やロジスティックな問題のためにしばしば実現不可能である。
別の方法は、センター内のローカルデータを別々に分析し、統計的推測結果とベイズ連邦推論(BFI)手法を組み合わせることである。
このアプローチの目的は、組み合わせたデータに対して統計的解析を行った場合、何を発見したのかを、別々の中心における推論結果から計算することである。
論文 参考訳(メタデータ) (2024-02-05T11:10:27Z) - Decentralized Gossip Mutual Learning (GML) for automatic head and neck
tumor segmentation [0.7402598986326535]
フェデレートラーニング(FL)は、データ共有を必要とせずに、異なる医療センターから複雑な機械学習モデルを協調的にトレーニングするための有望な戦略として登場した。
我々は,Gossipプロトコルをピアツーピア通信に直接適用した分散協調学習フレームワークであるGossip Mutual Learning (GML)を提案する。
GMLはDice similarity Coefficient (DSC) を3.2%, 4.6%, 10.4%改善できることを示した。
論文 参考訳(メタデータ) (2024-01-11T01:04:30Z) - Think Twice Before Selection: Federated Evidential Active Learning for Medical Image Analysis with Domain Shifts [11.562953837452126]
多様なドメインから得られたローカルデータの情報性を評価するための最初の試みを行う。
本稿では,ドメインシフト下でのデータ評価を校正する新しい手法であるFederated Evidential Active Learning(FEAL)を提案する。
論文 参考訳(メタデータ) (2023-12-05T08:32:27Z) - GREAT Score: Global Robustness Evaluation of Adversarial Perturbation using Generative Models [60.48306899271866]
GREATスコア(GREAT Score)と呼ばれる新しいフレームワークを提案する。
我々は,ロバストベンチにおける攻撃ベースモデルと比較し,高い相関性を示し,GREATスコアのコストを大幅に削減した。
GREAT Scoreは、プライバシーに敏感なブラックボックスモデルのリモート監査に使用することができる。
論文 参考訳(メタデータ) (2023-04-19T14:58:27Z) - Practical Challenges in Differentially-Private Federated Survival
Analysis of Medical Data [57.19441629270029]
本稿では,ニューラルネットワークの本質的特性を活用し,生存分析モデルの訓練過程を関連づける。
小さな医療データセットと少数のデータセンターの現実的な設定では、このノイズはモデルを収束させるのが難しくなります。
DPFed-post は,私的フェデレート学習方式に後処理の段階を追加する。
論文 参考訳(メタデータ) (2022-02-08T10:03:24Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Deep learning-based COVID-19 pneumonia classification using chest CT
images: model generalizability [54.86482395312936]
深層学習(DL)分類モデルは、異なる国の3DCTデータセット上で、COVID-19陽性患者を特定するために訓練された。
我々は、データセットと72%の列車、8%の検証、20%のテストデータを組み合わせたDLベースの9つの同一分類モデルを訓練した。
複数のデータセットでトレーニングされ、トレーニングに使用されるデータセットの1つからテストセットで評価されたモデルは、よりよいパフォーマンスを示した。
論文 参考訳(メタデータ) (2021-02-18T21:14:52Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Automatic sleep stage classification with deep residual networks in a
mixed-cohort setting [63.52264764099532]
我々は,大規模コホートの一般化性を評価するために,新しいディープニューラルネットワークモデルを開発した。
総合的な分類精度はトレーニングデータの分数を増やして向上した。
論文 参考訳(メタデータ) (2020-08-21T10:48:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。