論文の概要: Demystifying the Effects of Non-Independence in Federated Learning
- arxiv url: http://arxiv.org/abs/2103.11226v1
- Date: Sat, 20 Mar 2021 19:07:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-23 14:24:27.741036
- Title: Demystifying the Effects of Non-Independence in Federated Learning
- Title(参考訳): 連帯学習における非独立性の影響の解明
- Authors: Stefan Arnold, Dilara Yesilbas
- Abstract要約: Federated Learning(FL)は、データセキュリティとユーザーのプライバシーを損なうことなく、ユーザー生成データ上に統計モデルを構築することを可能にします。
ブロック循環サンプリングから生じる非独立データ分布の効果をより深く理解する一歩を踏み出します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Federated Learning (FL) enables statistical models to be built on
user-generated data without compromising data security and user privacy. For
this reason, FL is well suited for on-device learning from mobile devices where
data is abundant and highly privatized. Constrained by the temporal
availability of mobile devices, only a subset of devices is accessible to
participate in the iterative protocol consisting of training and aggregation.
In this study, we take a step toward better understanding the effect of
non-independent data distributions arising from block-cyclic sampling. By
conducting extensive experiments on visual classification, we measure the
effects of block-cyclic sampling (both standalone and in combination with
non-balanced block distributions). Specifically, we measure the alterations
induced by block-cyclic sampling from the perspective of accuracy, fairness,
and convergence rate. Experimental results indicate robustness to cycling over
a two-block structure, e.g., due to time zones. In contrast, drawing data
samples dependently from a multi-block structure significantly degrades the
performance and rate of convergence by up to 26%. Moreover, we find that this
performance degeneration is further aggravated by unbalanced block
distributions to a point that can no longer be adequately compensated by higher
communication and more frequent synchronization.
- Abstract(参考訳): Federated Learning (FL)は、データセキュリティとユーザのプライバシを損なうことなく、ユーザ生成データ上に統計モデルを構築することを可能にする。
このためflは、データが豊富で民営化されたモバイルデバイスからデバイス上での学習に適しています。
モバイルデバイスの時間的可用性に制限されているため、トレーニングとアグリゲーションからなる反復プロトコルに参加するのは、デバイスのサブセットのみである。
本研究では,ブロック循環サンプリングから発生する非独立なデータ分布の影響をよりよく理解するための一歩を踏み出す。
視覚分類に関する広範囲な実験を行い,ブロック循環サンプリング(単独および非平衡ブロック分布と組み合わせて)の効果を測定した。
具体的には, 精度, 公平性, 収束率の観点から, ブロック循環サンプリングによる変化を測定した。
実験結果は、例えば時間帯による2ブロック構造のサイクリングに対する堅牢性を示している。
対照的に、マルチブロック構造からのデータサンプルの描画は、最大26%の収束率と性能を著しく低下させる。
さらに,この性能低下は,通信量の増加や同期頻度の高まりにより,もはや十分な補償が得られない地点への不均衡なブロック分布によってさらに悪化することがわかった。
関連論文リスト
- Probabilistic Contrastive Learning for Long-Tailed Visual Recognition [78.70453964041718]
細長い分布は、少数の少数派が限られた数のサンプルを含む実世界のデータにしばしば現れる。
近年の研究では、教師付きコントラスト学習がデータ不均衡を緩和する有望な可能性を示していることが明らかになっている。
本稿では,特徴空間の各クラスからのサンプルデータ分布を推定する確率論的コントラスト学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-03-11T13:44:49Z) - U-Mixer: An Unet-Mixer Architecture with Stationarity Correction for
Time Series Forecasting [11.55346291812749]
時系列予測における非定常性は、深い層を通しての安定した特徴伝達を阻害し、特徴分布を妨害し、学習データ分布の変化を複雑化する。
異なるパッチとチャネル間の局所的な時間的依存関係を別々にキャプチャするU-Mixerを提案する。
U-Mixerは最先端(SOTA)法よりも14.5%,7.7%改善している。
論文 参考訳(メタデータ) (2024-01-04T12:41:40Z) - Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。
我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文 参考訳(メタデータ) (2023-12-27T09:03:43Z) - Test-Time Compensated Representation Learning for Extreme Traffic
Forecasting [13.859278899032846]
混雑とラッシュアワーは、隣接する時間帯に様々な交差点で車両の速度の相関が低くなる可能性がある。
既存の手法では、テストフェーズ中に、最近および完全に分解されたトレーニングデータに基づいて、将来のシリーズを予測するのが一般的である。
マルチヘッド空間トランスモデルを用いたテスト時間表現学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-16T18:46:34Z) - Adaptive Model Pruning and Personalization for Federated Learning over
Wireless Networks [72.59891661768177]
フェデレーション学習(FL)は、データプライバシを保護しながら、エッジデバイス間での分散学習を可能にする。
これらの課題を克服するために、部分的なモデルプルーニングとパーソナライズを備えたFLフレームワークを検討する。
このフレームワークは、学習モデルを、データ表現を学ぶためにすべてのデバイスと共有されるモデルプルーニングと、特定のデバイスのために微調整されるパーソナライズされた部分とで、グローバルな部分に分割する。
論文 参考訳(メタデータ) (2023-09-04T21:10:45Z) - Probabilistic Learning of Multivariate Time Series with Temporal
Irregularity [25.91078012394032]
不均一な時間間隔やコンポーネントのミスアライメントを含む時間的不規則。
我々は,非ガウス的データ分布を非パラメトリック的に表現する条件フロー表現を開発する。
提案手法の広範な適用性と優位性は,実世界のデータセット上でのアブレーション研究とテストを通じて,既存のアプローチと比較することによって確認される。
論文 参考訳(メタデータ) (2023-06-15T14:08:48Z) - Imbalanced Aircraft Data Anomaly Detection [103.01418862972564]
航空シナリオ下でのセンサーからの時間データの異常検出は実用的だが難しい課題である。
本稿では,グラフィカル・テンポラル・データ分析フレームワークを提案する。
シリーズ・トゥ・イメージ (S2I) と呼ばれる3つのモジュール、ユークリッド距離 (CRD) を用いたクラスタ・ベース・リサンプリング・アプローチ、変数・ベース・ロス (VBL) から構成される。
論文 参考訳(メタデータ) (2023-05-17T09:37:07Z) - Conditional Feature Importance for Mixed Data [1.6114012813668934]
ノックオフサンプリングを用いた条件付き予測インパクト(CPI)フレームワークを開発した。
提案するワークフローは,I型エラーを制御し,高い出力を達成し,他の条件FI測定結果と一致していることを示す。
本研究は,混合データに対して,統計的に適切な,専門的な手法を開発することの必要性を強調した。
論文 参考訳(メタデータ) (2022-10-06T16:52:38Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Towards Fast and Accurate Federated Learning with non-IID Data for
Cloud-Based IoT Applications [22.107854601448906]
フェデレートラーニング(FL)はモノのインターネット(IoT)設計で人気を博している。
IoTデバイスによって収集されたデータが非独立かつ同一に分散された(非IID)方法でスキューされると、バニラFL法の精度が保証されない。
本稿では,非IIDデータのトレーニングにおいて,重み分散のデメリットを効果的に低減できる新しいデータベースデバイスグループ化手法を提案する。
論文 参考訳(メタデータ) (2022-01-29T06:49:08Z) - Differentially Private Federated Learning with Laplacian Smoothing [72.85272874099644]
フェデレートラーニングは、ユーザ間でプライベートデータを共有せずに、協調的にモデルを学習することで、データのプライバシを保護することを目的としている。
敵は、リリースしたモデルを攻撃することによって、プライベートトレーニングデータを推測することができる。
差別化プライバシは、トレーニングされたモデルの正確性や実用性を著しく低下させる価格で、このような攻撃に対する統計的保護を提供する。
論文 参考訳(メタデータ) (2020-05-01T04:28:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。