論文の概要: Federated Learning on Heterogenous Data using Chest CT
- arxiv url: http://arxiv.org/abs/2303.13567v1
- Date: Thu, 23 Mar 2023 13:38:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-27 17:10:04.832565
- Title: Federated Learning on Heterogenous Data using Chest CT
- Title(参考訳): 胸部CTを用いた異種データのフェデレーション学習
- Authors: Edward H. Lee, Brendan Kelly, Emre Altinmakas, Hakan Dogan, Errol
Colak, Steve Fu, Olivia Choudhury, Ujjwal Ratan, Felipe Kitamura, Hernan
Chaves, Mourad Said, Eduardo Reis, Jaekwang Lim, Patricia Yokoo, Corie
Mitchell, Jimmy Zheng, Maryam Mohammadzadeh, Golnaz Houshmand, Wendy Qiu,
Joel Hayden, Farnaz Rafiee, C Klochko, Nicholas Bevins, Simon S. Wong, Safwan
Halabi, Kristen W. Yeom
- Abstract要約: フェデレーション・ラーニング(FL)は、データ共有なしに病院間での学習を可能にするAI開発のための潜在的経路の1つである。
本研究では,最大かつ多種多様な胸部CTデータセットの1つであるFL戦略について検討した。
- 参考スコア(独自算出の注目度): 0.9598881864102923
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large data have accelerated advances in AI. While it is well known that
population differences from genetics, sex, race, diet, and various
environmental factors contribute significantly to disease, AI studies in
medicine have largely focused on locoregional patient cohorts with less diverse
data sources. Such limitation stems from barriers to large-scale data share in
medicine and ethical concerns over data privacy. Federated learning (FL) is one
potential pathway for AI development that enables learning across hospitals
without data share. In this study, we show the results of various FL strategies
on one of the largest and most diverse COVID-19 chest CT datasets: 21
participating hospitals across five continents that comprise >10,000 patients
with >1 million images. We present three techniques: Fed Averaging (FedAvg),
Incremental Institutional Learning (IIL), and Cyclical Incremental
Institutional Learning (CIIL). We also propose an FL strategy that leverages
synthetically generated data to overcome class imbalances and data size
disparities across centers. We show that FL can achieve comparable performance
to Centralized Data Sharing (CDS) while maintaining high performance across
sites with small, underrepresented data. We investigate the strengths and
weaknesses for all technical approaches on this heterogeneous dataset including
the robustness to non-Independent and identically distributed (non-IID)
diversity of data. We also describe the sources of data heterogeneity such as
age, sex, and site locations in the context of FL and show how even among the
correctly labeled populations, disparities can arise due to these biases.
- Abstract(参考訳): ビッグデータはaiの進歩を加速している。
遺伝学、セックス、人種、ダイエット、および様々な環境要因からの人口差が病気に大きく寄与していることはよく知られているが、医学におけるAI研究は、多種多様なデータソースの少ないロコリージョンの患者コホートに主に焦点を当てている。
このような制限は、医療における大規模なデータ共有とデータのプライバシーに対する倫理的懸念の障壁に起因している。
フェデレーション・ラーニング(FL)は、データ共有なしに病院間での学習を可能にするAI開発のための潜在的経路の1つである。
本研究は,5大陸にまたがる21の参加病院において,100万枚以上の画像を持つ1万枚以上の患者を対象とするFL戦略について検討した。
我々は,feed averaging (fedavg), incremental institutional learning (iil), cyclical incremental institutional learning (ciil)の3つの手法を提案する。
また,クラス不均衡とデータサイズ格差を克服するために合成データを活用するFL戦略を提案する。
flは,低表示データの少ないサイト間で高いパフォーマンスを維持しつつ,集中型データ共有 (cds) と同等の性能を達成できることを示した。
この不均質なデータセットにおけるすべての技術的アプローチの強みと弱みについて,非独立かつ同一の分散(非iid)データの多様性に対するロバスト性について検討する。
また, flの文脈において, 年齢, 性別, 場所等の不均質なデータ源を記述し, これらのバイアスにより, 適切にラベルづけされた個体群のうち, 格差がいかに生じるかを示す。
関連論文リスト
- FedCVD: The First Real-World Federated Learning Benchmark on Cardiovascular Disease Data [52.55123685248105]
心臓血管疾患(CVD)は、現在世界でも主要な死因であり、早期診断と治療の要点を浮き彫りにしている。
機械学習(ML)手法はCVDの早期診断に役立つが、その性能は高品質なデータへのアクセスに依存している。
本稿では、FedCVDという心臓血管疾患検出のための、世界初の実世界のFLベンチマークを示す。
論文 参考訳(メタデータ) (2024-10-28T02:24:01Z) - Future-Proofing Medical Imaging with Privacy-Preserving Federated Learning and Uncertainty Quantification: A Review [14.88874727211064]
AIはすぐに、病気の診断、予後、治療計画、治療後の監視のための臨床実践のルーチンになるかもしれない。
患者のデータを取り巻くプライバシー上の懸念は、医療画像にAIが広く採用される上で大きな障壁となる。
Federated Learning(FL)は、機密データを共有することなく、AIモデルを協調的にトレーニングするためのソリューションを提供する。
論文 参考訳(メタデータ) (2024-09-24T16:55:32Z) - Federated Learning Enables Big Data for Rare Cancer Boundary Detection [98.5549882883963]
6大陸にわたる71の医療機関のデータを含む,これまでで最大のフェデレーテッドML研究の結果を報告する。
グリオ芽腫の稀な疾患に対する腫瘍境界自動検出装置を作製した。
当科では, 外科的に標的とした腫瘍の悪性度を高めるために, 33%の改善率を示し, 腫瘍全体に対する23%の改善率を示した。
論文 参考訳(メタデータ) (2022-04-22T17:27:00Z) - When Accuracy Meets Privacy: Two-Stage Federated Transfer Learning
Framework in Classification of Medical Images on Limited Data: A COVID-19
Case Study [77.34726150561087]
新型コロナウイルスのパンデミックが急速に広がり、世界の医療資源が不足している。
CNNは医療画像の解析に広く利用され、検証されている。
論文 参考訳(メタデータ) (2022-03-24T02:09:41Z) - Advancing COVID-19 Diagnosis with Privacy-Preserving Collaboration in
Artificial Intelligence [79.038671794961]
我々はUCADI(Unified CT-COVID AI Diagnostic Initiative)を立ち上げ、各ホスト機関でAIモデルを分散的にトレーニングし、独立して実行することができる。
本研究は,中国とイギリスに所在する23の病院で採取した3,336例の胸部CT9,573例について検討した。
論文 参考訳(メタデータ) (2021-11-18T00:43:41Z) - Deep learning-based COVID-19 pneumonia classification using chest CT
images: model generalizability [54.86482395312936]
深層学習(DL)分類モデルは、異なる国の3DCTデータセット上で、COVID-19陽性患者を特定するために訓練された。
我々は、データセットと72%の列車、8%の検証、20%のテストデータを組み合わせたDLベースの9つの同一分類モデルを訓練した。
複数のデータセットでトレーニングされ、トレーニングに使用されるデータセットの1つからテストセットで評価されたモデルは、よりよいパフォーマンスを示した。
論文 参考訳(メタデータ) (2021-02-18T21:14:52Z) - FLOP: Federated Learning on Medical Datasets using Partial Networks [84.54663831520853]
新型コロナウイルスの感染拡大で医療資源が不足している。
新型コロナウイルスの診断を緩和するために、さまざまなデータ駆動型ディープラーニングモデルが開発されている。
患者のプライバシー上の懸念から、データそのものはまだ乏しい。
我々は、textbfPartial Networks (FLOP) を用いた、シンプルで効果的な textbfFederated textbfL textbfon Medical データセットを提案する。
論文 参考訳(メタデータ) (2021-02-10T01:56:58Z) - Blockchain-Federated-Learning and Deep Learning Models for COVID-19
detection using CT Imaging [8.280858576611587]
新型コロナウイルスの患者を診断する主な問題は、検査キットの不足と信頼性である。
第2の現実の問題は、世界中の病院間でデータを共有することだ。
第3に,ブロックチェーン技術を用いてグローバルモデルを協調的にトレーニングする手法を設計する。
論文 参考訳(メタデータ) (2020-07-10T11:23:14Z) - Heterogeneity Loss to Handle Intersubject and Intrasubject Variability
in Cancer [11.440201348567681]
深層学習(DL)モデルは、医学領域において顕著な結果を示している。
これらのAI手法は、開発途上国に安価な医療ソリューションとして大きな支援を提供することができる。
この研究は、そのような血液がん診断の応用に焦点をあてている。
論文 参考訳(メタデータ) (2020-03-06T16:16:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。