論文の概要: Federated Learning on Heterogenous Data using Chest CT
- arxiv url: http://arxiv.org/abs/2303.13567v1
- Date: Thu, 23 Mar 2023 13:38:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-27 17:10:04.832565
- Title: Federated Learning on Heterogenous Data using Chest CT
- Title(参考訳): 胸部CTを用いた異種データのフェデレーション学習
- Authors: Edward H. Lee, Brendan Kelly, Emre Altinmakas, Hakan Dogan, Errol
Colak, Steve Fu, Olivia Choudhury, Ujjwal Ratan, Felipe Kitamura, Hernan
Chaves, Mourad Said, Eduardo Reis, Jaekwang Lim, Patricia Yokoo, Corie
Mitchell, Jimmy Zheng, Maryam Mohammadzadeh, Golnaz Houshmand, Wendy Qiu,
Joel Hayden, Farnaz Rafiee, C Klochko, Nicholas Bevins, Simon S. Wong, Safwan
Halabi, Kristen W. Yeom
- Abstract要約: フェデレーション・ラーニング(FL)は、データ共有なしに病院間での学習を可能にするAI開発のための潜在的経路の1つである。
本研究では,最大かつ多種多様な胸部CTデータセットの1つであるFL戦略について検討した。
- 参考スコア(独自算出の注目度): 0.9598881864102923
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large data have accelerated advances in AI. While it is well known that
population differences from genetics, sex, race, diet, and various
environmental factors contribute significantly to disease, AI studies in
medicine have largely focused on locoregional patient cohorts with less diverse
data sources. Such limitation stems from barriers to large-scale data share in
medicine and ethical concerns over data privacy. Federated learning (FL) is one
potential pathway for AI development that enables learning across hospitals
without data share. In this study, we show the results of various FL strategies
on one of the largest and most diverse COVID-19 chest CT datasets: 21
participating hospitals across five continents that comprise >10,000 patients
with >1 million images. We present three techniques: Fed Averaging (FedAvg),
Incremental Institutional Learning (IIL), and Cyclical Incremental
Institutional Learning (CIIL). We also propose an FL strategy that leverages
synthetically generated data to overcome class imbalances and data size
disparities across centers. We show that FL can achieve comparable performance
to Centralized Data Sharing (CDS) while maintaining high performance across
sites with small, underrepresented data. We investigate the strengths and
weaknesses for all technical approaches on this heterogeneous dataset including
the robustness to non-Independent and identically distributed (non-IID)
diversity of data. We also describe the sources of data heterogeneity such as
age, sex, and site locations in the context of FL and show how even among the
correctly labeled populations, disparities can arise due to these biases.
- Abstract(参考訳): ビッグデータはaiの進歩を加速している。
遺伝学、セックス、人種、ダイエット、および様々な環境要因からの人口差が病気に大きく寄与していることはよく知られているが、医学におけるAI研究は、多種多様なデータソースの少ないロコリージョンの患者コホートに主に焦点を当てている。
このような制限は、医療における大規模なデータ共有とデータのプライバシーに対する倫理的懸念の障壁に起因している。
フェデレーション・ラーニング(FL)は、データ共有なしに病院間での学習を可能にするAI開発のための潜在的経路の1つである。
本研究は,5大陸にまたがる21の参加病院において,100万枚以上の画像を持つ1万枚以上の患者を対象とするFL戦略について検討した。
我々は,feed averaging (fedavg), incremental institutional learning (iil), cyclical incremental institutional learning (ciil)の3つの手法を提案する。
また,クラス不均衡とデータサイズ格差を克服するために合成データを活用するFL戦略を提案する。
flは,低表示データの少ないサイト間で高いパフォーマンスを維持しつつ,集中型データ共有 (cds) と同等の性能を達成できることを示した。
この不均質なデータセットにおけるすべての技術的アプローチの強みと弱みについて,非独立かつ同一の分散(非iid)データの多様性に対するロバスト性について検討する。
また, flの文脈において, 年齢, 性別, 場所等の不均質なデータ源を記述し, これらのバイアスにより, 適切にラベルづけされた個体群のうち, 格差がいかに生じるかを示す。
関連論文リスト
- Mind the Gap: Federated Learning Broadens Domain Generalization in
Diagnostic AI Models [2.192472845284658]
5施設の胸部X線写真610,000点を用いて, 診断成績を訓練戦略の機能として評価した。
大規模データセットはFLで最小のパフォーマンス向上を示したが、いくつかのケースでは低下を見せた。
さまざまな外部機関間で協調的にトレーニングを行う場合、AIモデルは、ドメイン外のタスクのためにローカルにトレーニングされたモデルを一貫して上回った。
論文 参考訳(メタデータ) (2023-10-01T18:27:59Z) - Federated Learning Enables Big Data for Rare Cancer Boundary Detection [98.5549882883963]
6大陸にわたる71の医療機関のデータを含む,これまでで最大のフェデレーテッドML研究の結果を報告する。
グリオ芽腫の稀な疾患に対する腫瘍境界自動検出装置を作製した。
当科では, 外科的に標的とした腫瘍の悪性度を高めるために, 33%の改善率を示し, 腫瘍全体に対する23%の改善率を示した。
論文 参考訳(メタデータ) (2022-04-22T17:27:00Z) - When Accuracy Meets Privacy: Two-Stage Federated Transfer Learning
Framework in Classification of Medical Images on Limited Data: A COVID-19
Case Study [77.34726150561087]
新型コロナウイルスのパンデミックが急速に広がり、世界の医療資源が不足している。
CNNは医療画像の解析に広く利用され、検証されている。
論文 参考訳(メタデータ) (2022-03-24T02:09:41Z) - Practical Challenges in Differentially-Private Federated Survival
Analysis of Medical Data [57.19441629270029]
本稿では,ニューラルネットワークの本質的特性を活用し,生存分析モデルの訓練過程を関連づける。
小さな医療データセットと少数のデータセンターの現実的な設定では、このノイズはモデルを収束させるのが難しくなります。
DPFed-post は,私的フェデレート学習方式に後処理の段階を追加する。
論文 参考訳(メタデータ) (2022-02-08T10:03:24Z) - Advancing COVID-19 Diagnosis with Privacy-Preserving Collaboration in
Artificial Intelligence [79.038671794961]
我々はUCADI(Unified CT-COVID AI Diagnostic Initiative)を立ち上げ、各ホスト機関でAIモデルを分散的にトレーニングし、独立して実行することができる。
本研究は,中国とイギリスに所在する23の病院で採取した3,336例の胸部CT9,573例について検討した。
論文 参考訳(メタデータ) (2021-11-18T00:43:41Z) - Deep learning-based COVID-19 pneumonia classification using chest CT
images: model generalizability [54.86482395312936]
深層学習(DL)分類モデルは、異なる国の3DCTデータセット上で、COVID-19陽性患者を特定するために訓練された。
我々は、データセットと72%の列車、8%の検証、20%のテストデータを組み合わせたDLベースの9つの同一分類モデルを訓練した。
複数のデータセットでトレーニングされ、トレーニングに使用されるデータセットの1つからテストセットで評価されたモデルは、よりよいパフォーマンスを示した。
論文 参考訳(メタデータ) (2021-02-18T21:14:52Z) - FLOP: Federated Learning on Medical Datasets using Partial Networks [84.54663831520853]
新型コロナウイルスの感染拡大で医療資源が不足している。
新型コロナウイルスの診断を緩和するために、さまざまなデータ駆動型ディープラーニングモデルが開発されている。
患者のプライバシー上の懸念から、データそのものはまだ乏しい。
我々は、textbfPartial Networks (FLOP) を用いた、シンプルで効果的な textbfFederated textbfL textbfon Medical データセットを提案する。
論文 参考訳(メタデータ) (2021-02-10T01:56:58Z) - Blockchain-Federated-Learning and Deep Learning Models for COVID-19
detection using CT Imaging [8.280858576611587]
新型コロナウイルスの患者を診断する主な問題は、検査キットの不足と信頼性である。
第2の現実の問題は、世界中の病院間でデータを共有することだ。
第3に,ブロックチェーン技術を用いてグローバルモデルを協調的にトレーニングする手法を設計する。
論文 参考訳(メタデータ) (2020-07-10T11:23:14Z) - Heterogeneity Loss to Handle Intersubject and Intrasubject Variability
in Cancer [11.440201348567681]
深層学習(DL)モデルは、医学領域において顕著な結果を示している。
これらのAI手法は、開発途上国に安価な医療ソリューションとして大きな支援を提供することができる。
この研究は、そのような血液がん診断の応用に焦点をあてている。
論文 参考訳(メタデータ) (2020-03-06T16:16:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。