論文の概要: Generative Data Augmentation for Non-IID Problem in Decentralized
Clinical Machine Learning
- arxiv url: http://arxiv.org/abs/2212.01109v1
- Date: Fri, 2 Dec 2022 11:46:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 17:51:28.352902
- Title: Generative Data Augmentation for Non-IID Problem in Decentralized
Clinical Machine Learning
- Title(参考訳): 分散型臨床機械学習における非iid問題の生成的データ拡張
- Authors: Zirui Wang, Shaoming Duan, Chengyue Wu, Wenhao Lin, Xinyu Zha, Peiyi
Han, Chuanyi Liu
- Abstract要約: SL-GANと呼ばれるスワムラーニングにおける生成的拡張フレームワークを提案する。
SL-GANは、参加者から合成データを生成することにより、非IIDデータを増強する。
SLGANは結核、白血病、COVID-19を含む3つの臨床データセットにおいて、最先端の手法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 8.24935363381541
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Swarm learning (SL) is an emerging promising decentralized machine learning
paradigm and has achieved high performance in clinical applications. SL solves
the problem of a central structure in federated learning by combining edge
computing and blockchain-based peer-to-peer network. While there are promising
results in the assumption of the independent and identically distributed (IID)
data across participants, SL suffers from performance degradation as the degree
of the non-IID data increases. To address this problem, we propose a generative
augmentation framework in swarm learning called SL-GAN, which augments the
non-IID data by generating the synthetic data from participants. SL-GAN trains
generators and discriminators locally, and periodically aggregation via a
randomly elected coordinator in SL network. Under the standard assumptions, we
theoretically prove the convergence of SL-GAN using stochastic approximations.
Experimental results demonstrate that SL-GAN outperforms state-of-art methods
on three real world clinical datasets including Tuberculosis, Leukemia,
COVID-19.
- Abstract(参考訳): Swarm Learning(SL)は、将来有望な分散機械学習パラダイムであり、臨床応用で高いパフォーマンスを達成した。
SLはエッジコンピューティングとブロックチェーンベースのピアツーピアネットワークを組み合わせることで、フェデレートラーニングにおける中心構造の問題を解決する。
参加者間での独立および同一分散(IID)データの仮定には有望な結果があるが、非IIDデータの程度が増加するにつれて、SLは性能劣化に悩まされる。
この問題に対処するために,SL-GAN と呼ばれるスワム学習における生成的拡張フレームワークを提案し,参加者から合成データを生成することにより,非IID データを増強する。
SL-GANは発生器と識別器を局所的に訓練し、SLネットワーク内のランダムに選択されたコーディネータを介して定期的に集約する。
標準仮定の下では、確率近似を用いてSL-GANの収束を理論的に証明する。
実験の結果、SL-GANは結核、白血病、COVID-19を含む3つの実世界の臨床データセットにおいて最先端の手法より優れていることが示された。
関連論文リスト
- Wound Tissue Segmentation in Diabetic Foot Ulcer Images Using Deep Learning: A Pilot Study [5.397013836968946]
我々は,創部組織分割アルゴリズムを評価するためのDFUT草案データセットを作成した。
データセットには110枚の画像と、創傷の専門家によってラベル付けされた組織、600枚の未ラベル画像が含まれている。
注釈付きデータの量が限られているため、我々のフレームワークは、教師付き学習(SL)と半教師付き学習(SSL)の両方のフェーズで構成されている。
論文 参考訳(メタデータ) (2024-06-23T05:01:51Z) - On Pretraining Data Diversity for Self-Supervised Learning [57.91495006862553]
我々は、より多様なデータセットを用いたトレーニングが、固定された計算予算の下での自己教師付き学習(SSL)のパフォーマンスに与える影響について検討する。
以上の結果から,事前学習データの多様性の増大はSSL性能を向上させるが,下流データへの分布距離が最小である場合に限る。
論文 参考訳(メタデータ) (2024-03-20T17:59:58Z) - Multi-omics Sampling-based Graph Transformer for Synthetic Lethality
Prediction [20.363977976628792]
合成致死性(SL)予測は、2つの遺伝子の共変異が細胞死をもたらすかどうかを識別するために用いられる。
グラフニューラルネットワーク(GNN)は、メッセージパッシング機構の制限に悩まされる。
SL予測のためのマルチオミクスサンプリンググラフ変換器(MSGT-SL)を提案する。
論文 参考訳(メタデータ) (2023-10-17T09:06:41Z) - Self-Supervision for Tackling Unsupervised Anomaly Detection: Pitfalls
and Opportunities [50.231837687221685]
自己教師付き学習(SSL)は、機械学習とその多くの現実世界のアプリケーションに変化をもたらした。
非教師なし異常検出(AD)は、自己生成性擬似異常によりSSLにも乗じている。
論文 参考訳(メタデータ) (2023-08-28T07:55:01Z) - Convergence Analysis of Sequential Split Learning on Heterogeneous Data [6.937859054591121]
Split Learning(SL)とFederated Averaging(Fed)は、分散機械学習の2つの一般的なパラダイムである。
不均一なデータに基づいてSL/一般SL/非Avgの収束保証を導出する。
極めて不均一なデータに対して,反直観分析の結果を実証的に検証した。
論文 参考訳(メタデータ) (2023-02-03T10:04:44Z) - Does Decentralized Learning with Non-IID Unlabeled Data Benefit from
Self Supervision? [51.00034621304361]
自己教師型学習(SSL)のレンズによるラベルなしデータによる分散学習の研究
本研究では,分散学習環境下でのコントラスト学習アルゴリズムの有効性について検討する。
論文 参考訳(メタデータ) (2022-10-20T01:32:41Z) - Collaborative Intelligence Orchestration: Inconsistency-Based Fusion of
Semi-Supervised Learning and Active Learning [60.26659373318915]
アクティブラーニング(AL)と半教師付きラーニング(SSL)は2つの効果があるが、しばしば孤立している。
本稿では、SSL-ALの潜在的な優位性をさらに調査するために、革新的な一貫性に基づく仮想aDvErialアルゴリズムを提案する。
2つの実世界のケーススタディは、提案したデータサンプリングアルゴリズムの適用と展開の実践的な産業価値を可視化する。
論文 参考訳(メタデータ) (2022-06-07T13:28:43Z) - On the Fairness of Swarm Learning in Skin Lesion Classification [22.896631007125244]
分散および協調学習は、大規模な、異種、分散データソースでのトレーニングモデルを巻き込むアプローチである。
単一 (ノード) トレーニング, SL, 集中訓練の公平性を比較検討し, 実験的検討を行った。
実験により、SLは集中トレーニングに比べて公平性問題を悪化させることはないことが示された。
論文 参考訳(メタデータ) (2021-09-24T20:20:24Z) - Uncovering the structure of clinical EEG signals with self-supervised
learning [64.4754948595556]
教師付き学習パラダイムは、しばしば利用可能なラベル付きデータの量によって制限される。
この現象は脳波(EEG)などの臨床関連データに特に問題となる。
ラベルのないデータから情報を抽出することで、ディープニューラルネットワークとの競合性能に到達することができるかもしれない。
論文 参考訳(メタデータ) (2020-07-31T14:34:47Z) - Continual Learning in Recurrent Neural Networks [67.05499844830231]
リカレントニューラルネットワーク(RNN)を用いた逐次データ処理における連続学習手法の有効性を評価する。
RNNに弾性重み強化などの重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重
そこで本研究では,重み付け手法の性能が処理シーケンスの長さに直接的な影響を受けず,むしろ高動作メモリ要求の影響を受けていることを示す。
論文 参考訳(メタデータ) (2020-06-22T10:05:12Z) - Semi-supervised Medical Image Classification with Global Latent Mixing [8.330337646455957]
ディープラーニングによるコンピュータ支援診断は、大規模な注釈付きデータセットに依存している。
半教師付き学習は、ラベルのないデータを活用することでこの課題を軽減する。
ラベル付きおよびラベルなしデータの線形混合に基づいてニューラルネットワークをトレーニングする新しいSSL手法を提案する。
論文 参考訳(メタデータ) (2020-05-22T14:49:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。