論文の概要: Scaling Survival Analysis in Healthcare with Federated Survival Forests:
A Comparative Study on Heart Failure and Breast Cancer Genomics
- arxiv url: http://arxiv.org/abs/2308.02382v1
- Date: Fri, 4 Aug 2023 15:25:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-07 12:34:43.541868
- Title: Scaling Survival Analysis in Healthcare with Federated Survival Forests:
A Comparative Study on Heart Failure and Breast Cancer Genomics
- Title(参考訳): フェデレーション・サバイバル・フォレストによる医療のスケール・サバイバル分析 : 心不全と乳癌ゲノムの比較研究
- Authors: Alberto Archetti, Francesca Ieva, Matteo Matteucci
- Abstract要約: 現実世界のアプリケーションでは、生存データは不完全、検閲、分散、機密であることが多い。
我々はFedSurF++と呼ばれるFederated Survival Forestアルゴリズムの拡張を提案する。
- 参考スコア(独自算出の注目度): 7.967995669387532
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Survival analysis is a fundamental tool in medicine, modeling the time until
an event of interest occurs in a population. However, in real-world
applications, survival data are often incomplete, censored, distributed, and
confidential, especially in healthcare settings where privacy is critical. The
scarcity of data can severely limit the scalability of survival models to
distributed applications that rely on large data pools. Federated learning is a
promising technique that enables machine learning models to be trained on
multiple datasets without compromising user privacy, making it particularly
well-suited for addressing the challenges of survival data and large-scale
survival applications. Despite significant developments in federated learning
for classification and regression, many directions remain unexplored in the
context of survival analysis. In this work, we propose an extension of the
Federated Survival Forest algorithm, called FedSurF++. This federated ensemble
method constructs random survival forests in heterogeneous federations.
Specifically, we investigate several new tree sampling methods from client
forests and compare the results with state-of-the-art survival models based on
neural networks. The key advantage of FedSurF++ is its ability to achieve
comparable performance to existing methods while requiring only a single
communication round to complete. The extensive empirical investigation results
in a significant improvement from the algorithmic and privacy preservation
perspectives, making the original FedSurF algorithm more efficient, robust, and
private. We also present results on two real-world datasets demonstrating the
success of FedSurF++ in real-world healthcare studies. Our results underscore
the potential of FedSurF++ to improve the scalability and effectiveness of
survival analysis in distributed settings while preserving user privacy.
- Abstract(参考訳): 生存分析は医学における基本的な道具であり、集団で興味のある出来事が起こるまでの時間をモデル化する。
しかしながら、現実世界のアプリケーションでは、サバイバルデータは、特にプライバシが重要なヘルスケア環境では、不完全、検閲、分散、機密化されることが多い。
データの不足は、大規模なデータプールに依存する分散アプリケーションに対する生存モデルのスケーラビリティを著しく制限する可能性がある。
フェデレーション学習(federated learning)は、ユーザのプライバシを損なうことなく、マシンラーニングモデルを複数のデータセットでトレーニング可能にする、有望なテクニックである。
分類と回帰のための連合学習の著しい発展にもかかわらず、生存分析の文脈では多くの方向が未検討のままである。
本研究では,federated survival forestアルゴリズムの拡張であるfederated survival forest法を提案する。
この連合型アンサンブル法は異種連邦における無作為生存林を構成する。
具体的には,クライアントフォレストから木を採取する手法をいくつか検討し,ニューラルネットワークに基づく最新サバイバルモデルと比較した。
FedSurF++の重要な利点は、既存のメソッドと同等のパフォーマンスを達成できると同時に、1回の通信ラウンドしか完了できないことだ。
広範な実証調査の結果、アルゴリズムとプライバシ保護の観点から大幅に改善され、オリジナルのFedSurFアルゴリズムがより効率的で堅牢でプライベートになった。
また、実世界の医療研究におけるFedSurF++の成功を示す2つの実世界のデータセットの結果を示す。
この結果から,FedSurF++がユーザプライバシを保ちながら分散環境での生存分析のスケーラビリティと有効性を向上する可能性が示唆された。
関連論文リスト
- HACSurv: A Hierarchical Copula-based Approach for Survival Analysis with Dependent Competing Risks [51.95824566163554]
HACSurvは、競合するリスクを持つデータから構造や原因特異的生存関数を学習する生存分析手法である。
リスクと検閲の間の依存関係をキャプチャすることで、HACSurvはより良い生存予測を実現する。
論文 参考訳(メタデータ) (2024-10-19T18:52:18Z) - Deep End-to-End Survival Analysis with Temporal Consistency [49.77103348208835]
本稿では,大規模長手データの処理を効率的に行うために,Survival Analysisアルゴリズムを提案する。
我々の手法における中心的な考え方は、時間とともにデータにおける過去と将来の成果が円滑に進化するという仮説である時間的一貫性である。
我々のフレームワークは、安定したトレーニング信号を提供することで、時間的一貫性を大きなデータセットに独自に組み込む。
論文 参考訳(メタデータ) (2024-10-09T11:37:09Z) - Developing Federated Time-to-Event Scores Using Heterogeneous Real-World
Survival Data [8.3734832069509]
既存のサバイバルスコアの構築方法は、データが単一のソースに由来することを前提としている。
本稿では,多地点生存のための統合スコアリングシステムを構築するための新しいフレームワークを提案する。
参加者各サイトからのデータセットのテストにおいて,提案するフェデレーションスコアリングシステムは,すべての局所モデルより一貫して優れていた。
論文 参考訳(メタデータ) (2024-03-08T11:32:00Z) - Source-Free Collaborative Domain Adaptation via Multi-Perspective
Feature Enrichment for Functional MRI Analysis [55.03872260158717]
安静時MRI機能(rs-fMRI)は、神経疾患の分析を助けるために多地点で研究されている。
ソース領域とターゲット領域の間のfMRIの不均一性を低減するための多くの手法が提案されている。
しかし、マルチサイト研究における懸念やデータストレージの負担のため、ソースデータの取得は困難である。
我々は、fMRI解析のためのソースフリー協調ドメイン適応フレームワークを設計し、事前訓練されたソースモデルとラベルなしターゲットデータのみにアクセスできるようにする。
論文 参考訳(メタデータ) (2023-08-24T01:30:18Z) - SurvivalGAN: Generating Time-to-Event Data for Survival Analysis [121.84429525403694]
検閲と時間的地平線の不均衡は、生成モデルに生存分析に特有の3つの新しい障害モードを経験させる。
本稿では,検閲やイベントの地平線における不均衡に対処し,生存データを扱う生成モデルであるSurvivalGANを提案する。
医療データセットに関する広範な実験により,本手法の評価を行った。
論文 参考訳(メタデータ) (2023-02-24T17:03:51Z) - Federated Survival Forests [9.413131350284083]
本稿では,最も成功した生存モデルであるランダム生存林に基づく生存分析のための新しいアルゴリズムを提案する。
単一のコミュニケーションラウンドでFedSurFは、数百回のイテレーションでトレーニングされたディープラーニングベースのフェデレーションモデルに匹敵する差別的なパワーを得る。
論文 参考訳(メタデータ) (2023-02-06T14:31:51Z) - Heterogeneous Datasets for Federated Survival Analysis Simulation [6.489759672413373]
本研究では、既存の非フェデレーションデータセットから再現可能な方法で開始することで、現実的な異種データセットを構築する新しい手法を提案する。
具体的には、ディリクレ分布に基づく2つの新しいデータセット分割アルゴリズムを提供し、各データサンプルを慎重に選択したクライアントに割り当てる。
提案手法の実装は,フェデレートされた環境をシミュレートしてサバイバル分析を行うことを推奨し,広く普及している。
論文 参考訳(メタデータ) (2023-01-28T11:37:07Z) - FedPseudo: Pseudo value-based Deep Learning Models for Federated
Survival Analysis [9.659041001051415]
我々はフェデプゼウドと呼ばれるフェデレーションサバイバル分析のための擬似値ベース深層学習モデルを提案する。
提案するFLフレームワークは,最良に訓練された深層生存分析モデルと同等の性能を達成している。
論文 参考訳(メタデータ) (2022-07-12T01:10:36Z) - Practical Challenges in Differentially-Private Federated Survival
Analysis of Medical Data [57.19441629270029]
本稿では,ニューラルネットワークの本質的特性を活用し,生存分析モデルの訓練過程を関連づける。
小さな医療データセットと少数のデータセンターの現実的な設定では、このノイズはモデルを収束させるのが難しくなります。
DPFed-post は,私的フェデレート学習方式に後処理の段階を追加する。
論文 参考訳(メタデータ) (2022-02-08T10:03:24Z) - FLOP: Federated Learning on Medical Datasets using Partial Networks [84.54663831520853]
新型コロナウイルスの感染拡大で医療資源が不足している。
新型コロナウイルスの診断を緩和するために、さまざまなデータ駆動型ディープラーニングモデルが開発されている。
患者のプライバシー上の懸念から、データそのものはまだ乏しい。
我々は、textbfPartial Networks (FLOP) を用いた、シンプルで効果的な textbfFederated textbfL textbfon Medical データセットを提案する。
論文 参考訳(メタデータ) (2021-02-10T01:56:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。