論文の概要: Differentially Private Federated Learning for Cancer Prediction
- arxiv url: http://arxiv.org/abs/2101.02997v2
- Date: Wed, 24 Mar 2021 12:47:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-10 05:08:59.267187
- Title: Differentially Private Federated Learning for Cancer Prediction
- Title(参考訳): がん予測のための個人的フェデレーション学習
- Authors: Constance Beguier, Jean Ogier du Terrail, Iqraa Meah, Mathieu Andreux,
Eric W. Tramel
- Abstract要約: NIHが出資したiDASHは2014年から毎年、ゲノムデータのためのプライベートコンピューティングに関するコンペを開催している。
本稿では、このコンペティションの2020年イテレーションへの3位の提案について紹介する。
- 参考スコア(独自算出の注目度): 0.3721528851694675
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Since 2014, the NIH funded iDASH (integrating Data for Analysis,
Anonymization, SHaring) National Center for Biomedical Computing has hosted
yearly competitions on the topic of private computing for genomic data. For one
track of the 2020 iteration of this competition, participants were challenged
to produce an approach to federated learning (FL) training of genomic cancer
prediction models using differential privacy (DP), with submissions ranked
according to held-out test accuracy for a given set of DP budgets. More
precisely, in this track, we are tasked with training a supervised model for
the prediction of breast cancer occurrence from genomic data split between two
virtual centers while ensuring data privacy with respect to model transfer via
DP. In this article, we present our 3rd place submission to this competition.
During the competition, we encountered two main challenges discussed in this
article: i) ensuring correctness of the privacy budget evaluation and ii)
achieving an acceptable trade-off between prediction performance and privacy
budget.
- Abstract(参考訳): 2014年以降、NIHはiDASH (Data for Analysis, Anonymization, SHaring) National Center for Biomedical Computingに出資し、ゲノムデータのプライベートコンピューティングに関する年次大会を開催している。
このコンペの2020年イテレーションの1つのトラックでは、参加者は差分プライバシー(dp)を用いたゲノムがん予測モデルのフェデレーション学習(fl)トレーニングに挑戦され、所定のdp予算の保留テスト精度に応じて応募がランク付けされた。
より正確には、我々は2つの仮想センター間で分割されたゲノムデータから乳がんの発生を予測するための教師付きモデルを訓練し、DPによるモデル転送に関してデータのプライバシーを確保する。
本稿では,このコンペティションへの3位提案について述べる。
コンペでは,プライバシ予算評価の正しさの確保と,予測性能とプライバシ予算とのトレードオフを許容できるものにすること,という2つの課題に遭遇した。
関連論文リスト
- Privacy-Preserving Customer Churn Prediction Model in the Context of Telecommunication Industry [1.0428401220897083]
クラウド環境におけるプライバシ保護型顧客チャーン予測モデルのためのフレームワークを提案する。
我々は,GAN(Generative Adversarial Networks)とアダプティブウェイト・オブ・エビデンス(Adaptive Weight-of-Evidence,aWOE)を組み合わせた新しいアプローチを提案する。
論文 参考訳(メタデータ) (2024-11-03T06:08:59Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Learning across Data Owners with Joint Differential Privacy [13.531808240117645]
データ所有者は、共同微分プライバシーと呼ばれるプライバシー概念の下で、機械学習モデルを協調的に訓練する環境について検討する。
この設定では、各データ所有者のためにトレーニングされたモデルは、プライバシを考慮していない$j$のデータと、異なるプライバシを保証する他の所有者のデータを使用します。
本稿では,DP-SGDの変種であるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-05-25T05:11:40Z) - Private, fair and accurate: Training large-scale, privacy-preserving AI models in medical imaging [47.99192239793597]
我々は,AIモデルのプライバシ保護トレーニングが,非プライベートトレーニングと比較して精度と公平性に与える影響を評価した。
我々の研究は、実際の臨床データセットの困難な現実的な状況下では、診断深層学習モデルのプライバシー保護トレーニングは、優れた診断精度と公正さで可能であることを示しています。
論文 参考訳(メタデータ) (2023-02-03T09:49:13Z) - Practical Challenges in Differentially-Private Federated Survival
Analysis of Medical Data [57.19441629270029]
本稿では,ニューラルネットワークの本質的特性を活用し,生存分析モデルの訓練過程を関連づける。
小さな医療データセットと少数のデータセンターの現実的な設定では、このノイズはモデルを収束させるのが難しくなります。
DPFed-post は,私的フェデレート学習方式に後処理の段階を追加する。
論文 参考訳(メタデータ) (2022-02-08T10:03:24Z) - Training Differentially Private Models with Secure Multiparty
Computation [12.628792164922864]
複数のデータ所有者に起源を持つデータから機械学習モデルを学習する問題に対処する。
差分プライバシー(DP)に基づく既存のソリューションは、精度の低下を犠牲にしてこれを達成している。
提案手法はモデルトレーニングのためのMPCプロトコルと,学習したモデル係数をLaplaceノイズで摂動するMPCプロトコルに依存している。
論文 参考訳(メタデータ) (2022-02-05T20:00:37Z) - Data Sharing Markets [95.13209326119153]
我々は、各エージェントがデータの買い手および売り手の両方になり得る設定について検討する。
両データ交換(データ付きトレーディングデータ)と一方データ交換(お金付きトレーディングデータ)の2つの事例を考察する。
論文 参考訳(メタデータ) (2021-07-19T06:00:34Z) - Test-time Collective Prediction [73.74982509510961]
マシンラーニングの複数のパーティは、将来のテストポイントを共同で予測したいと考えています。
エージェントは、すべてのエージェントの集合の集合的な専門知識の恩恵を受けることを望んでいるが、データやモデルパラメータを解放する意思はないかもしれない。
我々は、各エージェントの事前学習モデルを利用して、テスト時に集合的な予測を行う分散型メカニズムを探索する。
論文 参考訳(メタデータ) (2021-06-22T18:29:58Z) - OpenKBP: The open-access knowledge-based planning grand challenge [0.6157382820537718]
我々は,2020年のAAPMグランドチャレンジであるOpenKBPを主催し,参加者にCT画像の量を予測する最善の方法の開発を依頼した。
1)3次元線量分布を評価する線量スコアと,(2)DVH測定値を評価する線量ヒストグラム(DVH)スコアの2つの異なるスコアで評価した。
チャレンジには28カ国から195人の参加者が参加し、73人の参加者が検証段階で44のチームを編成し、合計で1750の応募を受けた。
論文 参考訳(メタデータ) (2020-11-28T06:45:06Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。