論文の概要: Distributed sequential federated learning
- arxiv url: http://arxiv.org/abs/2302.00107v1
- Date: Tue, 31 Jan 2023 21:20:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-02 13:53:15.645955
- Title: Distributed sequential federated learning
- Title(参考訳): 逐次学習の分散化
- Authors: Z. F. Wang, X. Y. Zhang, Y-c I. Chang
- Abstract要約: ローカルデータを解析することで,価値ある情報を効率的に効果的に集約するデータ駆動手法を開発した。
我々は、シミュレーションデータの数値的研究と、メキシコの32の病院から収集されたCOVID-19データへの応用を用いている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The analysis of data stored in multiple sites has become more popular,
raising new concerns about the security of data storage and communication.
Federated learning, which does not require centralizing data, is a common
approach to preventing heavy data transportation, securing valued data, and
protecting personal information protection. Therefore, determining how to
aggregate the information obtained from the analysis of data in separate local
sites has become an important statistical issue. The commonly used averaging
methods may not be suitable due to data nonhomogeneity and incomparable results
among individual sites, and applying them may result in the loss of information
obtained from the individual analyses. Using a sequential method in federated
learning with distributed computing can facilitate the integration and
accelerate the analysis process. We develop a data-driven method for
efficiently and effectively aggregating valued information by analyzing local
data without encountering potential issues such as information security and
heavy transportation due to data communication. In addition, the proposed
method can preserve the properties of classical sequential adaptive design,
such as data-driven sample size and estimation precision when applied to
generalized linear models. We use numerical studies of simulated data and an
application to COVID-19 data collected from 32 hospitals in Mexico, to
illustrate the proposed method.
- Abstract(参考訳): 複数のサイトに格納されたデータの分析がより普及し、データストレージと通信のセキュリティに関する新たな懸念が高まっている。
集中的なデータを必要としないフェデレーション学習は、重いデータ転送を防止し、価値あるデータを保護し、個人情報を保護するための一般的なアプローチである。
そのため、別の地域におけるデータ分析から得られる情報を収集する方法が重要な統計問題となっている。
一般的に用いられる平均化手法は,データ不均一性や各サイト間の相容れない結果のために適さない可能性があり,その結果,個々の分析結果から得られる情報の損失が生じる可能性がある。
分散コンピューティングによるフェデレーション学習における逐次的手法を用いることで、分析プロセスの統合と高速化が容易になる。
データ通信による情報セキュリティや重交通といった潜在的な問題に遭遇することなく、ローカルデータを解析することで、価値ある情報を効率的かつ効果的に集約するデータ駆動手法を開発した。
さらに,一般線形モデルに適用した場合のデータ駆動型サンプルサイズや推定精度など,従来の逐次適応設計の特性を保存できることを示す。
シミュレーションデータの数値的研究とメキシコの32の病院から収集したCOVID-19データへの応用を用いて,提案手法を概説した。
関連論文リスト
- A Two-Stage Federated Learning Approach for Industrial Prognostics Using Large-Scale High-Dimensional Signals [1.2277343096128712]
産業統計学は、アセットからの高次元劣化信号を利用して、その故障時間を予測するデータ駆動手法を開発することを目的としている。
実際には、個々の組織は信頼できる予測モデルを独立して訓練するのに十分なデータを持っていないことが多い。
本稿では,複数の組織が共同で予後モデルを訓練できる統計的学習に基づくフェデレーションモデルを提案する。
論文 参考訳(メタデータ) (2024-10-14T21:26:22Z) - Geometry-Aware Instrumental Variable Regression [56.16884466478886]
本稿では,データ導出情報によるデータ多様体の幾何を考慮した移動型IV推定器を提案する。
本手法のプラグイン・アンド・プレイ実装は,標準設定で関連する推定器と同等に動作する。
論文 参考訳(メタデータ) (2024-05-19T17:49:33Z) - Utilizing dataset affinity prediction in object detection to assess training data [4.508868068781057]
車両データセットのヘテロジニアスプールからサンプルを自動的に選択することで、いわゆるデータセット親和性スコアの利点を示す。
その結果、物体検出器は検出精度を損なうことなく、かなりスペーサーなトレーニングサンプルで訓練できることがわかった。
論文 参考訳(メタデータ) (2023-11-16T10:45:32Z) - CEDAR: Communication Efficient Distributed Analysis for Regressions [9.50726756006467]
患者レベルのデータを共有することなく、複数のEHRデータベース上での分散学習への関心が高まっている。
本稿では,局所的な最適推定値を集約する通信効率のよい新しい手法を提案する。
本稿では,統計的推測法と差分プライバシーに関する理論的検討を行い,シミュレーションおよび実データ解析におけるその性能評価を行う。
論文 参考訳(メタデータ) (2022-07-01T09:53:44Z) - Data-SUITE: Data-centric identification of in-distribution incongruous
examples [81.21462458089142]
Data-SUITEは、ID(In-distriion)データの不連続領域を特定するためのデータ中心のフレームワークである。
我々は,Data-SUITEの性能保証とカバレッジ保証を実証的に検証する。
論文 参考訳(メタデータ) (2022-02-17T18:58:31Z) - Local Learning Matters: Rethinking Data Heterogeneity in Federated
Learning [61.488646649045215]
フェデレートラーニング(FL)は、クライアントのネットワーク(エッジデバイス)でプライバシ保護、分散ラーニングを行うための有望な戦略である。
論文 参考訳(メタデータ) (2021-11-28T19:03:39Z) - Learning Bias-Invariant Representation by Cross-Sample Mutual
Information Minimization [77.8735802150511]
対象タスクが誤用したバイアス情報を除去するために,クロスサンプル対逆脱バイアス法(CSAD)を提案する。
相関測定は, 対向的偏り評価において重要な役割を担い, クロスサンプル型相互情報推定器によって行われる。
我々は,提案手法の最先端手法に対する利点を検証するために,公開データセットの徹底的な実験を行った。
論文 参考訳(メタデータ) (2021-08-11T21:17:02Z) - Using Synthetic Data to Enhance the Accuracy of Fingerprint-Based
Localization: A Deep Learning Approach [1.6379393441314491]
合成データを用いた指紋ベースのローカリゼーションにおけるトレーニングデータ収集コストを削減するための新しいアプローチを紹介します。
GAN(Generative Adversarial Network)は、収集されたデータの限られたサンプルの分布を学習するために用いられる。
収集されたデータのフルセットを使用して得られるものと本質的に同様の位置決め精度を得ることができます。
論文 参考訳(メタデータ) (2021-05-05T07:36:01Z) - Graph Embedding with Data Uncertainty [113.39838145450007]
スペクトルベースのサブスペース学習は、多くの機械学習パイプラインにおいて、一般的なデータ前処理ステップである。
ほとんどの部分空間学習法は、不確実性の高いデータにつながる可能性のある測定の不正確さやアーティファクトを考慮していない。
論文 参考訳(メタデータ) (2020-09-01T15:08:23Z) - Learning while Respecting Privacy and Robustness to Distributional
Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。
目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。
提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文 参考訳(メタデータ) (2020-07-07T18:25:25Z) - Sharing Models or Coresets: A Study based on Membership Inference Attack [17.562474629669513]
分散機械学習は、すべてのデータを集中した場所に集めることなく、分散データに基づいてグローバルモデルをトレーニングすることを目的としている。
ローカルモデル(フェデレーション学習)の収集と集約、代表データ要約(コアセット)の収集とトレーニングの2つのアプローチが提案されている。
本実験は,各アプローチの精度・プライバシ・コストのトレードオフを定量化し,モデルトレーニングプロセスの設計の指針となる非自明な比較を明らかにする。
論文 参考訳(メタデータ) (2020-07-06T18:06:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。