論文の概要: FedCVD: The First Real-World Federated Learning Benchmark on Cardiovascular Disease Data
- arxiv url: http://arxiv.org/abs/2411.07050v1
- Date: Mon, 28 Oct 2024 02:24:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-17 09:02:08.203861
- Title: FedCVD: The First Real-World Federated Learning Benchmark on Cardiovascular Disease Data
- Title(参考訳): FedCVD: 心臓血管疾患データに関する世界初のリアルタイムフェデレーションラーニングベンチマーク
- Authors: Yukun Zhang, Guanzhong Chen, Zenglin Xu, Jianyong Wang, Dun Zeng, Junfan Li, Jinghua Wang, Yuan Qi, Irwin King,
- Abstract要約: 心臓血管疾患(CVD)は、現在世界でも主要な死因であり、早期診断と治療の要点を浮き彫りにしている。
機械学習(ML)手法はCVDの早期診断に役立つが、その性能は高品質なデータへのアクセスに依存している。
本稿では、FedCVDという心臓血管疾患検出のための、世界初の実世界のFLベンチマークを示す。
- 参考スコア(独自算出の注目度): 52.55123685248105
- License:
- Abstract: Cardiovascular diseases (CVDs) are currently the leading cause of death worldwide, highlighting the critical need for early diagnosis and treatment. Machine learning (ML) methods can help diagnose CVDs early, but their performance relies on access to substantial data with high quality. However, the sensitive nature of healthcare data often restricts individual clinical institutions from sharing data to train sufficiently generalized and unbiased ML models. Federated Learning (FL) is an emerging approach, which offers a promising solution by enabling collaborative model training across multiple participants without compromising the privacy of the individual data owners. However, to the best of our knowledge, there has been limited prior research applying FL to the cardiovascular disease domain. Moreover, existing FL benchmarks and datasets are typically simulated and may fall short of replicating the complexity of natural heterogeneity found in realistic datasets that challenges current FL algorithms. To address these gaps, this paper presents the first real-world FL benchmark for cardiovascular disease detection, named FedCVD. This benchmark comprises two major tasks: electrocardiogram (ECG) classification and echocardiogram (ECHO) segmentation, based on naturally scattered datasets constructed from the CVD data of seven institutions. Our extensive experiments on these datasets reveal that FL faces new challenges with real-world non-IID and long-tail data. The code and datasets of FedCVD are available https://github.com/SMILELab-FL/FedCVD.
- Abstract(参考訳): 心臓血管疾患(CVD)は、現在世界でも主要な死因であり、早期診断と治療の要点を浮き彫りにしている。
機械学習(ML)手法はCVDの早期診断に役立つが、その性能は高品質なデータへのアクセスに依存している。
しかしながら、医療データの繊細な性質は、個々の臨床機関がデータを共有することを制限し、十分に一般化された、偏りのないMLモデルを訓練する。
フェデレートラーニング(FL)は新たなアプローチであり、個々のデータオーナのプライバシを損なうことなく、複数の参加者間で協調的なモデルトレーニングを可能にする、有望なソリューションを提供する。
しかし、私たちの知る限りでは、FLを心血管疾患領域に適用する以前の研究は限られている。
さらに、既存のFLベンチマークとデータセットは典型的にはシミュレートされ、現在のFLアルゴリズムに挑戦する現実的なデータセットに見られる自然な不均一性の複雑さを複製することができない可能性がある。
このギャップに対処するため,本研究ではFedCVDという,心臓血管疾患検出のためのFed-world FLベンチマークを初めて提示する。
このベンチマークは、心電図分類(ECG)と心エコー法(ECHO)セグメンテーションの2つの主要なタスクからなる。
これらのデータセットに関する広範な実験により、FLは現実世界の非IIDデータとロングテールデータで新たな課題に直面していることが明らかとなった。
FedCVDのコードとデータセットはhttps://github.com/SMILELab-FL/FedCVD.comで入手できる。
関連論文リスト
- SMILE-UHURA Challenge -- Small Vessel Segmentation at Mesoscopic Scale from Ultra-High Resolution 7T Magnetic Resonance Angiograms [60.35639972035727]
公開されている注釈付きデータセットの欠如は、堅牢で機械学習駆動のセグメンテーションアルゴリズムの開発を妨げている。
SMILE-UHURAチャレンジは、7T MRIで取得したTime-of-Flightアンジオグラフィーの注釈付きデータセットを提供することで、公開されている注釈付きデータセットのギャップに対処する。
Diceスコアは、それぞれのデータセットで0.838 $pm$0.066と0.716 $pm$ 0.125まで到達し、平均パフォーマンスは0.804 $pm$ 0.15までになった。
論文 参考訳(メタデータ) (2024-11-14T17:06:00Z) - On the Impact of Data Heterogeneity in Federated Learning Environments with Application to Healthcare Networks [3.9058850780464884]
Federated Learning(FL)は、プライバシに敏感なアプリケーションが、情報を開示することなく、グローバルモデル構築のためにデータセットを活用することを可能にする。
これらの領域の1つは医療であり、サイロのグループは、精度と一般化を改善したグローバルな予測器を生成するために協力する。
本稿では,医学データの複雑さに着目し,FL環境における不均一性の数学的形式化と分類を包括的に調査する。
論文 参考訳(メタデータ) (2024-04-29T09:05:01Z) - Multi-Modal Federated Learning for Cancer Staging over Non-IID Datasets with Unbalanced Modalities [9.476402318365446]
本研究では,データサンプルの不均一性だけでなく,機関間のデータモダリティの固有不均一性と不均一性を両立する新しいFLアーキテクチャを提案する。
マルチモーダルFLに適した分散勾配ブレンディングと近接対応クライアント重み付け戦略を考案した。
論文 参考訳(メタデータ) (2024-01-07T23:45:01Z) - A Compact LSTM-SVM Fusion Model for Long-Duration Cardiovascular
Diseases Detection [0.0]
世界的には、心臓血管疾患(CVD)が主な死因であり、毎年1790万人が死亡している。
重要な臨床目的の1つは、心電図(ECG)データによるCVDの早期検出である。
機械学習とディープラーニングに基づく最近の進歩は、この分野において大きな進歩を遂げている。
論文 参考訳(メタデータ) (2023-11-20T10:57:11Z) - Uncovering Promises and Challenges of Federated Learning to Detect
Cardiovascular Diseases: A Scoping Literature Review [18.421588999399376]
心臓血管疾患(CVD)は世界的な死因であり、早期発見は患者の予後を著しく改善する。
機械学習(ML)モデルはCVDの早期診断に役立つが、その性能はモデルトレーニングで利用可能なデータによって制限される。
フェデレートラーニング(FL)は、機械学習の新たなアプローチであり、個々のデータオーナのプライバシを損なうことなく、複数のソースのデータ上でモデルをトレーニングすることができる。
論文 参考訳(メタデータ) (2023-08-26T00:19:44Z) - Federated Learning with Privacy-Preserving Ensemble Attention
Distillation [63.39442596910485]
Federated Learning(FL)は、多くのローカルノードがトレーニングデータを分散化しながら、中央モデルを協調的にトレーニングする機械学習パラダイムである。
本稿では,未ラベル公開データを利用した一方向オフライン知識蒸留のためのプライバシー保護FLフレームワークを提案する。
我々の技術は、既存のFLアプローチのような分散的で異質なローカルデータを使用するが、より重要なのは、プライバシー漏洩のリスクを著しく低減することです。
論文 参考訳(メタデータ) (2022-10-16T06:44:46Z) - Label-Efficient Self-Supervised Federated Learning for Tackling Data
Heterogeneity in Medical Imaging [23.08596805950814]
医用画像解析のための頑健でラベル効率の良い自己教師型FLフレームワークを提案する。
具体的には,既存のFLパイプラインに分散自己教師型事前学習パラダイムを導入する。
自己教師付きFLアルゴリズムは,分布外データに対してよく一般化し,限定ラベルのシナリオにおいてより効果的にフェデレーションモデルを学習することを示す。
論文 参考訳(メタデータ) (2022-05-17T18:33:43Z) - When Accuracy Meets Privacy: Two-Stage Federated Transfer Learning
Framework in Classification of Medical Images on Limited Data: A COVID-19
Case Study [77.34726150561087]
新型コロナウイルスのパンデミックが急速に広がり、世界の医療資源が不足している。
CNNは医療画像の解析に広く利用され、検証されている。
論文 参考訳(メタデータ) (2022-03-24T02:09:41Z) - FLOP: Federated Learning on Medical Datasets using Partial Networks [84.54663831520853]
新型コロナウイルスの感染拡大で医療資源が不足している。
新型コロナウイルスの診断を緩和するために、さまざまなデータ駆動型ディープラーニングモデルが開発されている。
患者のプライバシー上の懸念から、データそのものはまだ乏しい。
我々は、textbfPartial Networks (FLOP) を用いた、シンプルで効果的な textbfFederated textbfL textbfon Medical データセットを提案する。
論文 参考訳(メタデータ) (2021-02-10T01:56:58Z) - Uncovering the structure of clinical EEG signals with self-supervised
learning [64.4754948595556]
教師付き学習パラダイムは、しばしば利用可能なラベル付きデータの量によって制限される。
この現象は脳波(EEG)などの臨床関連データに特に問題となる。
ラベルのないデータから情報を抽出することで、ディープニューラルネットワークとの競合性能に到達することができるかもしれない。
論文 参考訳(メタデータ) (2020-07-31T14:34:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。