論文の概要: Practical Challenges in Differentially-Private Federated Survival
Analysis of Medical Data
- arxiv url: http://arxiv.org/abs/2202.03758v1
- Date: Tue, 8 Feb 2022 10:03:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-09 16:17:08.300035
- Title: Practical Challenges in Differentially-Private Federated Survival
Analysis of Medical Data
- Title(参考訳): 医療データの個人別フェデレーション・サバイバル分析の実践的課題
- Authors: Shadi Rahimian, Raouf Kerkouche, Ina Kurth, Mario Fritz
- Abstract要約: 本稿では,ニューラルネットワークの本質的特性を活用し,生存分析モデルの訓練過程を関連づける。
小さな医療データセットと少数のデータセンターの現実的な設定では、このノイズはモデルを収束させるのが難しくなります。
DPFed-post は,私的フェデレート学習方式に後処理の段階を追加する。
- 参考スコア(独自算出の注目度): 57.19441629270029
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Survival analysis or time-to-event analysis aims to model and predict the
time it takes for an event of interest to happen in a population or an
individual. In the medical context this event might be the time of dying,
metastasis, recurrence of cancer, etc. Recently, the use of neural networks
that are specifically designed for survival analysis has become more popular
and an attractive alternative to more traditional methods. In this paper, we
take advantage of the inherent properties of neural networks to federate the
process of training of these models. This is crucial in the medical domain
since data is scarce and collaboration of multiple health centers is essential
to make a conclusive decision about the properties of a treatment or a disease.
To ensure the privacy of the datasets, it is common to utilize differential
privacy on top of federated learning. Differential privacy acts by introducing
random noise to different stages of training, thus making it harder for an
adversary to extract details about the data. However, in the realistic setting
of small medical datasets and only a few data centers, this noise makes it
harder for the models to converge. To address this problem, we propose
DPFed-post which adds a post-processing stage to the private federated learning
scheme. This extra step helps to regulate the magnitude of the noisy average
parameter update and easier convergence of the model. For our experiments, we
choose 3 real-world datasets in the realistic setting when each health center
has only a few hundred records, and we show that DPFed-post successfully
increases the performance of the models by an average of up to $17\%$ compared
to the standard differentially private federated learning scheme.
- Abstract(参考訳): サバイバル分析(Survival analysis)またはタイム・ツー・イベント分析(Time-to-event analysis)は、集団や個人において、関心事が起こるのにかかる時間をモデル化し、予測することを目的としている。
医学的な文脈では、この出来事は、死亡、転移、がんの再発などの時期かもしれません。
近年,生存分析に特化して設計されたニューラルネットワークの利用が普及し,従来の手法に代わる魅力的な選択肢となっている。
本稿では,ニューラルネットワークの本質的特性を利用して,これらのモデルのトレーニングプロセスを統合する。
医療分野において、データが不足し、複数の医療センターの連携が、治療や疾患の性質について決定的に決定する上で不可欠であるため、これは重要である。
データセットのプライバシを確保するために、フェデレーション学習の上に差分プライバシーを利用するのが一般的である。
異なるプライバシは、トレーニングの異なる段階にランダムノイズを導入することで作用するため、相手がデータの詳細を抽出することが難しくなる。
しかし、小さな医療データセットと少数のデータセンターの現実的な設定では、このノイズによってモデルが収束することが難しくなる。
この問題に対処するために,プライベートフェデレーション学習方式に後処理段階を追加するdpfed-postを提案する。
この追加ステップは、ノイズの平均パラメータ更新の大きさとモデルの収束を容易にするのに役立つ。
実験では,各保健所が数百レコードしか保持していない現実的な環境で3つの実世界データセットを選択し,dpfed-postが,標準の差分型フェデレート学習方式と比較して,最大17-%のコストでモデルの性能を向上できることを示した。
関連論文リスト
- Comparing Federated Stochastic Gradient Descent and Federated Averaging for Predicting Hospital Length of Stay [0.0]
入院期間(LOS)を確実に予測することは,病院における資源配分の効率化に不可欠である。
従来の予測モデリングツールは、医療機関がプライバシー規則を定めているため、十分なデータと多様なデータを取得するのが難しいことが多い。
このモデリング手法は、病院外の機密データを抽出することなく、異なる病院からの分散データソースをモデル化することで協調的なモデルトレーニングを促進する。
論文 参考訳(メタデータ) (2024-07-17T17:00:20Z) - Federated Data Model [16.62770246342126]
人工知能(AI)、特にディープラーニングでは、データ多様性とボリュームがモデル開発において重要な役割を果たす。
我々はFDM(Federated Data Model)と呼ばれる手法を開発し、様々な場所で堅牢なディープラーニングモデルを訓練した。
その結果,本手法でトレーニングしたモデルは,当初トレーニングしたデータと,他のサイトのデータの両方で良好に動作することがわかった。
論文 参考訳(メタデータ) (2024-03-13T18:16:54Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Medical Federated Model with Mixture of Personalized and Sharing
Components [31.068735334318088]
本稿では,その問題に対処するための新しい個人化学習フレームワークを提案する。
ローカルデータ間の類似性を認識したパーソナライズされたモデルが得られる。
また,計算効率を大幅に向上させる効率的な計算コスト削減手法を提案する。
論文 参考訳(メタデータ) (2023-06-26T07:50:32Z) - Decentralized Distributed Learning with Privacy-Preserving Data
Synthesis [9.276097219140073]
医療分野では、患者と臨床データの均一性を生かして、多施設共同研究がより一般化可能な発見をもたらすことがしばしばある。
最近のプライバシー規制は、データの共有を妨げ、その結果、診断と予後をサポートする機械学習ベースのソリューションを考案する。
ローカルノードの機能を統合する分散分散手法を提案し、プライバシを維持しながら複数のデータセットをまたいで一般化可能なモデルを提供する。
論文 参考訳(メタデータ) (2022-06-20T23:49:38Z) - LifeLonger: A Benchmark for Continual Disease Classification [59.13735398630546]
MedMNISTコレクションの連続的な疾患分類のためのベンチマークであるLifeLongerを紹介する。
タスクとクラスでの病気の漸進的な学習は、モデルをスクラッチから再トレーニングすることなく、新しいサンプルを分類する問題に対処する。
クロスドメインインクリメンタル学習は、これまで得られた知識を維持しながら、異なる機関から派生したデータセットを扱う問題に対処する。
論文 参考訳(メタデータ) (2022-04-12T12:25:05Z) - When Accuracy Meets Privacy: Two-Stage Federated Transfer Learning
Framework in Classification of Medical Images on Limited Data: A COVID-19
Case Study [77.34726150561087]
新型コロナウイルスのパンデミックが急速に広がり、世界の医療資源が不足している。
CNNは医療画像の解析に広く利用され、検証されている。
論文 参考訳(メタデータ) (2022-03-24T02:09:41Z) - FLOP: Federated Learning on Medical Datasets using Partial Networks [84.54663831520853]
新型コロナウイルスの感染拡大で医療資源が不足している。
新型コロナウイルスの診断を緩和するために、さまざまなデータ駆動型ディープラーニングモデルが開発されている。
患者のプライバシー上の懸念から、データそのものはまだ乏しい。
我々は、textbfPartial Networks (FLOP) を用いた、シンプルで効果的な textbfFederated textbfL textbfon Medical データセットを提案する。
論文 参考訳(メタデータ) (2021-02-10T01:56:58Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Multi-site fMRI Analysis Using Privacy-preserving Federated Learning and
Domain Adaptation: ABIDE Results [13.615292855384729]
高品質なディープラーニングモデルを訓練するには,大量の患者情報を集める必要がある。
患者データのプライバシを保護する必要があるため、複数の機関から中央データベースを組み立てることは困難である。
フェデレート・ラーニング(Federated Learning)は、エンティティのデータを集中化せずに、人口レベルのモデルをトレーニングすることを可能にする。
論文 参考訳(メタデータ) (2020-01-16T04:49:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。