論文の概要: Asynchronous Collaborative Learning Across Data Silos
- arxiv url: http://arxiv.org/abs/2203.12637v1
- Date: Wed, 23 Mar 2022 18:00:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-25 14:25:45.292440
- Title: Asynchronous Collaborative Learning Across Data Silos
- Title(参考訳): データサイロ間の非同期協調学習
- Authors: Tiffany Tuor, Joshua Lockhart, Daniele Magazzeni
- Abstract要約: データサイロ間で機械学習モデルの非同期協調トレーニングを可能にするフレームワークを提案する。
これにより、データサイエンスチームは、データを共有することなく、機械学習モデルを協調的にトレーニングすることができる。
- 参考スコア(独自算出の注目度): 9.094748832034746
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning algorithms can perform well when trained on large datasets.
While large organisations often have considerable data assets, it can be
difficult for these assets to be unified in a manner that makes training
possible. Data is very often 'siloed' in different parts of the organisation,
with little to no access between silos. This fragmentation of data assets is
especially prevalent in heavily regulated industries like financial services or
healthcare. In this paper we propose a framework to enable asynchronous
collaborative training of machine learning models across data silos. This
allows data science teams to collaboratively train a machine learning model,
without sharing data with one another. Our proposed approach enhances
conventional federated learning techniques to make them suitable for this
asynchronous training in this intra-organisation, cross-silo setting. We
validate our proposed approach via extensive experiments.
- Abstract(参考訳): 機械学習アルゴリズムは、大規模なデータセットでトレーニングされた場合、うまく機能する。
大きな組織はしばしばかなりのデータ資産を持っているが、これらの資産を訓練を可能にする方法で統一することは困難である。
データは組織のさまざまな部分で“サイロ化”されることが少なく,サイロ間のアクセスはほとんどない。
このデータ資産の断片化は、金融サービスや医療といった規制の厳しい業界で特に顕著である。
本稿では,データサイロ間の機械学習モデルの非同期協調学習を可能にするフレームワークを提案する。
これにより、データサイエンスチームは、データを共有することなく、機械学習モデルを協調的にトレーニングすることができる。
提案手法は,この組織内クロスサイロ環境での非同期トレーニングに適合するように,従来のフェデレーション学習技術を強化する。
提案手法を広範な実験により検証する。
関連論文リスト
- Towards Multi-User Activity Recognition through Facilitated Training
Data and Deep Learning for Human-Robot Collaboration Applications [2.3274633659223545]
本研究では、シングルユーザに関するデータを収集し、後処理でそれらをマージすることで、マルチユーザアクティビティに関するデータを集める方法を提案する。
同じ設定で記録されたユーザのグループに関するトレーニングデータを使用する場合と比較して、この方法で収集されたデータをHRC設定のペアに使用し、同様のパフォーマンスを得ることができる。
論文 参考訳(メタデータ) (2023-02-11T19:27:07Z) - Privacy-Preserving Machine Learning for Collaborative Data Sharing via
Auto-encoder Latent Space Embeddings [57.45332961252628]
データ共有プロセスにおけるプライバシ保護機械学習は、極めて重要なタスクである。
本稿では、オートエンコーダによる表現学習を用いて、プライバシーを保護した組込みデータを生成する革新的なフレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-10T17:36:58Z) - Non-IID data and Continual Learning processes in Federated Learning: A
long road ahead [58.720142291102135]
フェデレートラーニング(Federated Learning)は、複数のデバイスや機関が、データをプライベートに保存しながら、機械学習モデルを協調的にトレーニングすることを可能にする、新しいフレームワークである。
本研究では,データの統計的不均一性を正式に分類し,それに直面することのできる最も顕著な学習戦略をレビューする。
同時に、継続学習のような他の機械学習フレームワークからのアプローチを導入し、データの不均一性にも対処し、フェデレートラーニング設定に容易に適応できるようにします。
論文 参考訳(メタデータ) (2021-11-26T09:57:11Z) - Understanding the World Through Action [91.3755431537592]
ラベルのないデータを利用するための汎用的で原則的で強力なフレームワークは、強化学習から導き出すことができると私は主張する。
このような手順が、下流の潜在的なタスクとどのように密接に一致しているかについて論じます。
論文 参考訳(メタデータ) (2021-10-24T22:33:52Z) - Fairness-Driven Private Collaborative Machine Learning [7.25130576615102]
我々は、協調機械学習アルゴリズムの公正性を高めるための、実用的なプライバシ保護前処理機構を提案する。
提案手法を用いた実験により, 精度のわずかな妥協だけで, 公平性を著しく向上できることを示す。
論文 参考訳(メタデータ) (2021-09-29T12:22:00Z) - Assisted Learning for Organizations with Limited Imbalanced Data [17.34334881241701]
組織が学習能力を向上させるための支援学習フレームワークを開発する。
当社のフレームワークでは,学習者が時々サービスプロバイダと情報を共有するだけでなく,ニアオーラルなパフォーマンスを実現するモデルも取得できる。
論文 参考訳(メタデータ) (2021-09-20T05:57:52Z) - Federated Learning Versus Classical Machine Learning: A Convergence
Comparison [7.730827805192975]
過去数十年間、機械学習は大規模アプリケーションのためのデータ処理に革命をもたらした。
特に、フェデレーション学習によって、参加者は中央クラウドサーバに機密情報を公開することなく、ローカルデータ上でローカルモデルを協調的にトレーニングすることができる。
シミュレーションの結果,フェデレーション学習は,参加者の匿名性を維持しつつ,限られたコミュニケーションラウンド内で高い収束を実現することが示された。
論文 参考訳(メタデータ) (2021-07-22T17:14:35Z) - The Role of Cross-Silo Federated Learning in Facilitating Data Sharing
in the Agri-Food Sector [5.219568203653523]
データ共有は、アグリフード分野における新興AI技術の採用に関して、依然として大きな障害となっている。
分散データを用いたフェデレーション学習に基づく技術ソリューションを提案する。
我々の手法は、個々のデータソースでトレーニングされた各モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-14T16:00:28Z) - Multi-modal AsynDGAN: Learn From Distributed Medical Image Data without
Sharing Private Information [55.866673486753115]
プライバシーとセキュリティを守るために拡張可能で弾力性のある学習フレームワークを提案します。
提案するフレームワークは分散Asynchronized Discriminator Generative Adrial Networks (AsynDGAN) である。
論文 参考訳(メタデータ) (2020-12-15T20:41:24Z) - Federated Residual Learning [53.77128418049985]
クライアントはローカルモデルを個別に訓練し、サーバ側で共有するモデルと共同で予測を行う。
この新しいフェデレートされた学習フレームワークを使用することで、統合トレーニングが提供するパフォーマンス上のメリットをすべて享受しながら、中央共有モデルの複雑さを最小限にすることができる。
論文 参考訳(メタデータ) (2020-03-28T19:55:24Z) - DeGAN : Data-Enriching GAN for Retrieving Representative Samples from a
Trained Classifier [58.979104709647295]
我々は、トレーニングされたネットワークの将来の学習タスクのために、利用可能なデータの豊富さと関連するデータの欠如の間のギャップを埋める。
利用可能なデータは、元のトレーニングデータセットまたは関連するドメインデータセットの不均衡なサブセットである可能性があるため、代表サンプルを検索するために使用します。
関連ドメインからのデータを活用して最先端のパフォーマンスを実現することを実証する。
論文 参考訳(メタデータ) (2019-12-27T02:05:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。