論文の概要: Federated Learning in Genetics: Extended Analysis of Accuracy, Performance and Privacy Trade-offs
- arxiv url: http://arxiv.org/abs/2402.14527v2
- Date: Fri, 23 May 2025 08:56:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-26 18:08:33.37231
- Title: Federated Learning in Genetics: Extended Analysis of Accuracy, Performance and Privacy Trade-offs
- Title(参考訳): 遺伝学におけるフェデレートラーニング:正確性、性能、プライバシトレードオフの強化分析
- Authors: Anika Hannemann, Jan Ewald, Leo Seeger, Erik Buchmann,
- Abstract要約: 大規模なゲノムまたは転写データの機械学習は、多くの新しい健康アプリケーションにとって重要である。
プライバシーと規制上の理由から、信頼できるサードパーティですべてのデータを集約することも問題となる。
フェデレートされた学習は、生データを交換することなく、分散化された機械学習を可能にするため、このジレンマに対する有望な解決策である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning on large-scale genomic or transcriptomic data is important for many novel health applications. For example, precision medicine tailors medical treatments to patients on the basis of individual biomarkers, cellular and molecular states, etc. However, the data required is sensitive, voluminous, heterogeneous, and typically distributed across locations where dedicated machine learning hardware is not available. Due to privacy and regulatory reasons, it is also problematic to aggregate all data at a trusted third party. Federated learning is a promising solution to this dilemma, because it enables decentralized, collaborative machine learning without exchanging raw data. In this paper, we perform comparative experiments with the federated learning frameworks TensorFlow Federated and Flower. Our test case is the training of disease prognosis and cell type classification models. We train the models with distributed transcriptomic data, considering both data heterogeneity and architectural heterogeneity. We measure model quality, robustness against privacy-enhancing noise and computational performance. We evaluate the resource overhead of a federated system from both client and global perspectives and assess benefits and limitations. Each of the federated learning frameworks has different strengths. However, our experiments confirm that both frameworks can readily build models on transcriptomic data, without transferring personal raw data to a third party with abundant computational resources. This paper is the extended version of https://link.springer.com/chapter/10.1007/978-3-031-63772-8_26.
- Abstract(参考訳): 大規模なゲノムまたは転写データの機械学習は、多くの新しい健康アプリケーションにとって重要である。
例えば、精密医療は、個々のバイオマーカー、細胞および分子状態などに基づいて、患者に対する治療を調整する。
しかし、必要なデータはセンシティブで、揮発性で、異種であり、通常、専用の機械学習ハードウェアが利用できない場所に分散している。
プライバシーと規制上の理由から、信頼できるサードパーティですべてのデータを集約することも問題となる。
このジレンマに対するフェデレーション学習は、生データを交換することなく、分散型で協調的な機械学習を可能にするため、有望なソリューションである。
本稿では、TensorFlow Federated and Flowerというフェデレーション学習フレームワークを用いて比較実験を行う。
検査症例は, 疾患予後の訓練と細胞型分類モデルである。
我々は、データの不均一性とアーキテクチャの不均一性の両方を考慮して、分散トランスクリプトームデータでモデルを訓練する。
我々は、モデル品質、プライバシー強化ノイズに対する堅牢性、および計算性能を測定する。
我々は、クライアントとグローバルの両方の観点から、フェデレートされたシステムのリソースオーバーヘッドを評価し、利点と制限を評価する。
各連合学習フレームワークには、それぞれ異なる長所がある。
しかし,本実験では,双方のフレームワークが,大量の計算資源を持つ第三者に個人的生データを転送することなく,転写データのモデルを簡単に構築できることを確認した。
本論文は、https://link.springer.com/chapter/10.1007/978-3-031-63772-8_26の拡張版である。
関連論文リスト
- Federated Impression for Learning with Distributed Heterogeneous Data [19.50235109938016]
フェデレートラーニング(FL)は、データを共有することなく、クライアント間で分散データセットから学習できるパラダイムを提供する。
FLでは、データ収集プロトコルや患者人口の多様さにより、異なる保健所のデータに準最適収束が一般的である。
我々は,グローバル情報を表す合成データをフェデレーションとして復元することで,破滅的な忘れを緩和するFedImpresを提案する。
論文 参考訳(メタデータ) (2024-09-11T15:37:52Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Federated Learning for Data and Model Heterogeneity in Medical Imaging [19.0931609571649]
Federated Learning(FL)は、複数のクライアントがデータを互いに中央サーバと共有することなく、協調学習に参加する、進化する機械学習手法である。
病院や産業などの現実世界のアプリケーションでは、FLはデータ不均一性とモデル不均一性の課題に対処する。
このような問題を解決するためにMDH-FL(Exploiting Model and Data Heterogeneity in FL)を提案する。
論文 参考訳(メタデータ) (2023-07-31T21:08:45Z) - Application of Federated Learning in Building a Robust COVID-19 Chest
X-ray Classification Model [0.0]
フェデレートラーニング(FL)は、すべてのデータを中央サーバに移動させることなく、AIモデルの一般化を支援する。
我々は、新型コロナウイルスの有無を予測するバイナリ分類問題を解決するために、ディープラーニングモデルを訓練した。
論文 参考訳(メタデータ) (2022-04-22T05:21:50Z) - Practical Challenges in Differentially-Private Federated Survival
Analysis of Medical Data [57.19441629270029]
本稿では,ニューラルネットワークの本質的特性を活用し,生存分析モデルの訓練過程を関連づける。
小さな医療データセットと少数のデータセンターの現実的な設定では、このノイズはモデルを収束させるのが難しくなります。
DPFed-post は,私的フェデレート学習方式に後処理の段階を追加する。
論文 参考訳(メタデータ) (2022-02-08T10:03:24Z) - Federated Learning of Molecular Properties in a Heterogeneous Setting [79.00211946597845]
これらの課題に対処するために、フェデレーションヘテロジニアス分子学習を導入する。
フェデレートラーニングにより、エンドユーザは、独立したクライアント上に分散されたトレーニングデータを保存しながら、グローバルモデルを協調的に構築できる。
FedChemは、化学におけるAI改善のための新しいタイプのコラボレーションを可能にする必要がある。
論文 参考訳(メタデータ) (2021-09-15T12:49:13Z) - Handling Data Heterogeneity with Generative Replay in Collaborative
Learning for Medical Imaging [21.53220262343254]
本稿では,協調学習手法におけるデータ不均一性の課題に対処する新たな再生戦略を提案する。
一次モデルは所望のタスクを学習し、補助的な「生成再生モデル」は入力画像によく似た画像を合成するか、潜伏変数の抽出を支援する。
生成的再生戦略は柔軟であり、既存の協調学習手法に組み込んで、機関間のデータの均一性を扱う能力を向上させるか、あるいはコミュニケーションコストを削減するために、新しい個別の協調学習フレームワーク(FedReplayと称される)として使用される。
論文 参考訳(メタデータ) (2021-06-24T17:39:55Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。
グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。
まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文 参考訳(メタデータ) (2020-06-11T17:29:53Z) - Self-Training with Improved Regularization for Sample-Efficient Chest
X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。
その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文 参考訳(メタデータ) (2020-05-03T02:36:00Z) - Multi-site fMRI Analysis Using Privacy-preserving Federated Learning and
Domain Adaptation: ABIDE Results [13.615292855384729]
高品質なディープラーニングモデルを訓練するには,大量の患者情報を集める必要がある。
患者データのプライバシを保護する必要があるため、複数の機関から中央データベースを組み立てることは困難である。
フェデレート・ラーニング(Federated Learning)は、エンティティのデータを集中化せずに、人口レベルのモデルをトレーニングすることを可能にする。
論文 参考訳(メタデータ) (2020-01-16T04:49:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。