論文の概要: Surgical Aggregation: A Federated Learning Framework for Harmonizing
Distributed Datasets with Diverse Tasks
- arxiv url: http://arxiv.org/abs/2301.06683v1
- Date: Tue, 17 Jan 2023 03:53:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-18 14:56:16.288213
- Title: Surgical Aggregation: A Federated Learning Framework for Harmonizing
Distributed Datasets with Diverse Tasks
- Title(参考訳): 外科的アグリゲーション:多様なタスクで分散データセットを調和させるための連合学習フレームワーク
- Authors: Pranav Kulkarni, Adway Kanhere, Paul H. Yi, Vishwa S. Parekh
- Abstract要約: 本稿では,異なる疾患ラベルを持つ分散データセットから知識を'グローバル'ディープラーニングモデルに集約するフレームワークを提案する。
以上の結果から,外科的アグリゲーションが臨床的に有用な深層学習モデルの開発に有効であることが示唆された。
- 参考スコア(独自算出の注目度): 3.6704226968275258
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: AI-assisted characterization of chest x-rays (CXR) has the potential to
provide substantial benefits across many clinical applications. Many
large-scale public CXR datasets have been curated for detection of
abnormalities using deep learning. However, each of these datasets focus on
detecting a subset of disease labels that could be present in a CXR, thus
limiting their clinical utility. Furthermore, the distributed nature of these
datasets, along with data sharing regulations, make it difficult to share and
create a complete representation of disease labels. We propose surgical
aggregation, a federated learning framework for aggregating knowledge from
distributed datasets with different disease labels into a 'global' deep
learning model. We randomly divided the NIH Chest X-Ray 14 dataset into
training (70%), validation (10%), and test (20%) splits with no patient overlap
and conducted two experiments. In the first experiment, we pruned the disease
labels to create two 'toy' datasets containing 11 and 8 labels respectively
with 4 overlapping labels. For the second experiment, we pruned the disease
labels to create two disjoint 'toy' datasets with 7 labels each. We observed
that the surgically aggregated 'global' model resulted in excellent performance
across both experiments when compared to a 'baseline' model trained on complete
disease labels. The overlapping and disjoint experiments had an AUROC of 0.87
and 0.86 respectively, compared to the baseline AUROC of 0.87. We used surgical
aggregation to harmonize the NIH Chest X-Ray 14 and CheXpert datasets into a
'global' model with an AUROC of 0.85 and 0.83 respectively. Our results show
that surgical aggregation could be used to develop clinically useful deep
learning models by aggregating knowledge from distributed datasets with diverse
tasks, a step forward towards bridging the gap from bench to bedside.
- Abstract(参考訳): AIによる胸部X線の評価(CXR)は、多くの臨床応用において大きなメリットをもたらす可能性がある。
多くの大規模公開CXRデータセットは、ディープラーニングを用いて異常を検出するためにキュレーションされている。
しかし、これらのデータセットは、CXRに存在する可能性のある疾患ラベルのサブセットを検出することに集中しており、臨床効果を制限している。
さらに、これらのデータセットの分散的な性質とデータ共有規則は、病気ラベルの完全な表現の共有と作成を困難にしている。
異なる疾患ラベルを持つ分散データセットから知識を'グローバル'なディープラーニングモデルに集約する,統合学習フレームワークである外科的アグリゲーションを提案する。
NIH Chest X-Ray 14データセットをトレーニング(70%)、検証(10%)、テスト(20%)にランダムに分割し、2つの実験を行った。
最初の実験では、11のラベルと8のラベルを含む2つの「toy」データセットを4つのラベルを重ね合わせて作成した。
2つ目の実験では、病気のラベルを刈り取って、それぞれ7つのラベルを持つ2つの“toy”データセットを作成しました。
その結果,全疾患ラベルをトレーニングした「ベースライン」モデルと比較して,外科的に集約した「グローバル」モデルが両実験とも優れた成績を示した。
重なり合う実験と解離実験はそれぞれ0.87のAUROCと0.86のAUROCを持つ。
NIH Chest X-Ray 14 と CheXpert のデータセットを,AUROC 0.85 と 0.83 の「グローバル」モデルに調和させた。
以上より,多種多様な課題を伴う分散データセットから知識を集約することで,臨床上有用な深層学習モデルの開発に外科的アグリゲーションが活用できる可能性が示唆された。
関連論文リスト
- Unlearning Spurious Correlations in Chest X-ray Classification [4.039245878626345]
我々は、Covid-19胸部X線データセットを用いてディープラーニングモデルをトレーニングする。
このデータセットが、意図しない境界領域によって、どのようにして急激な相関をもたらすかを示す。
XBLは、モデル説明を利用して、対話的に引き起こされる突発的相関を利用して、解釈可能性を超えたディープラーニングアプローチである。
論文 参考訳(メタデータ) (2023-08-02T12:59:10Z) - LifeLonger: A Benchmark for Continual Disease Classification [59.13735398630546]
MedMNISTコレクションの連続的な疾患分類のためのベンチマークであるLifeLongerを紹介する。
タスクとクラスでの病気の漸進的な学習は、モデルをスクラッチから再トレーニングすることなく、新しいサンプルを分類する問題に対処する。
クロスドメインインクリメンタル学習は、これまで得られた知識を維持しながら、異なる機関から派生したデータセットを扱う問題に対処する。
論文 参考訳(メタデータ) (2022-04-12T12:25:05Z) - Adversarially-regularized mixed effects deep learning (ARMED) models for
improved interpretability, performance, and generalization on clustered data [0.974672460306765]
混合効果モデルは、クラスタ固有のランダム効果からクラスター不変、集団レベルの固定効果を分離する。
本稿では,既存ネットワークへの3つの非侵襲的な付加を通じて,Adversarially-Regularized Mixed Effects Deep Learning (ARMED)モデルを構築するための汎用フレームワークを提案する。
この枠組みを, シミュレーション, 認知症予後診断, 細胞顕微鏡などの4つの応用に適用し, DFNN, 畳み込みニューラルネットワーク, オートエンコーダに適用した。
論文 参考訳(メタデータ) (2022-02-23T20:58:22Z) - Cohort Bias Adaptation in Aggregated Datasets for Lesion Segmentation [0.8466401378239363]
マルチソースデータセット間でコホートバイアスを学習し,考慮するための一般化されたアフィン条件付けフレームワークを提案する。
我々は,コホートバイアス適応法により,プールしたデータセット上でのネットワークの性能が向上することを示す。
論文 参考訳(メタデータ) (2021-08-02T08:32:57Z) - Handling Data Heterogeneity with Generative Replay in Collaborative
Learning for Medical Imaging [21.53220262343254]
本稿では,協調学習手法におけるデータ不均一性の課題に対処する新たな再生戦略を提案する。
一次モデルは所望のタスクを学習し、補助的な「生成再生モデル」は入力画像によく似た画像を合成するか、潜伏変数の抽出を支援する。
生成的再生戦略は柔軟であり、既存の協調学習手法に組み込んで、機関間のデータの均一性を扱う能力を向上させるか、あるいはコミュニケーションコストを削減するために、新しい個別の協調学習フレームワーク(FedReplayと称される)として使用される。
論文 参考訳(メタデータ) (2021-06-24T17:39:55Z) - Deep learning-based COVID-19 pneumonia classification using chest CT
images: model generalizability [54.86482395312936]
深層学習(DL)分類モデルは、異なる国の3DCTデータセット上で、COVID-19陽性患者を特定するために訓練された。
我々は、データセットと72%の列車、8%の検証、20%のテストデータを組み合わせたDLベースの9つの同一分類モデルを訓練した。
複数のデータセットでトレーニングされ、トレーニングに使用されるデータセットの1つからテストセットで評価されたモデルは、よりよいパフォーマンスを示した。
論文 参考訳(メタデータ) (2021-02-18T21:14:52Z) - Siloed Federated Learning for Multi-Centric Histopathology Datasets [0.17842332554022694]
本稿では,医学領域における深層学習アーキテクチャのための新しいフェデレーション学習手法を提案する。
局所統計バッチ正規化(BN)層が導入され、協調的に訓練されるが中心に固有のモデルが作られる。
本研究では,Camelyon16およびCamelyon17データセットから抽出した腫瘍組織像の分類法についてベンチマークを行った。
論文 参考訳(メタデータ) (2020-08-17T15:49:30Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Temporal Phenotyping using Deep Predictive Clustering of Disease
Progression [97.88605060346455]
我々は、時系列データをクラスタリングするためのディープラーニングアプローチを開発し、各クラスタは、同様の将来的な結果を共有する患者から構成される。
2つの実世界のデータセットに対する実験により、我々のモデルは最先端のベンチマークよりも優れたクラスタリング性能が得られることが示された。
論文 参考訳(メタデータ) (2020-06-15T20:48:43Z) - Deep Mining External Imperfect Data for Chest X-ray Disease Screening [57.40329813850719]
我々は、外部のCXRデータセットを組み込むことで、不完全なトレーニングデータにつながると論じ、課題を提起する。
本研究は,多ラベル病分類問題を重み付き独立二分課題として分類する。
我々のフレームワークは、ドメインとラベルの相違を同時にモデル化し、対処し、優れた知識マイニング能力を実現する。
論文 参考訳(メタデータ) (2020-06-06T06:48:40Z) - Self-Training with Improved Regularization for Sample-Efficient Chest
X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。
その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文 参考訳(メタデータ) (2020-05-03T02:36:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。