論文の概要: Who Trains Matters: Federated Learning under Enrollment and Participation Selection Biases
- arxiv url: http://arxiv.org/abs/2604.26604v1
- Date: Wed, 29 Apr 2026 12:33:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.39354
- Title: Who Trains Matters: Federated Learning under Enrollment and Participation Selection Biases
- Title(参考訳): 誰が重要かを訓練する: 入学と参加選択によるフェデレーション・ラーニング
- Authors: Gota Morishita,
- Abstract要約: フェデレーション学習は、分散クライアントが提供するアップデートから共有モデルをトレーニングする。
実際には、この代表性仮定は2つの異なる段階で失敗し、選択バイアスを引き起こす。
FLを2段階選択モデルで定式化し,逆確率重み付け方式であるtextscFedIPW を導出する。
- 参考スコア(独自算出の注目度): 0.16921396880325776
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Federated learning (FL) trains a shared model from updates contributed by distributed clients, often implicitly assuming that contributing clients are representative of the target population. In practice, this representativeness assumption can fail at two distinct stages, inducing selection bias. First, eligibility rules such as device constraints, software requirements, or user consent determine which clients are ever enrolled and reachable for training, inducing \emph{enrollment bias}. Second, among enrolled clients, user and system factors such as battery state, network status, and local time determine which clients participate in each communication round, inducing \emph{participation bias}. Although existing work has largely addressed round-level participation bias, it has paid far less attention to population-level enrollment bias, which can induce a persistent mismatch between the training objective and the target-population objective. We formalize FL under a two-stage selection model and derive \textsc{FedIPW}, an inverse-probability-weighted aggregation scheme that recovers the target-population mean update under standard ignorability and positivity assumptions. Because client-level covariates are often unavailable for non-enrolled clients, we also introduce a limited-information aggregate-calibration extension that uses known target-population summaries to reweight the enrolled sample, partially correcting enrollment bias. We further provide an algorithm-agnostic optimization analysis under residual weighting error and show that incomplete selection correction can induce a non-vanishing bias floor. Finally, experiments on synthetic federated logistic regression validate the predicted objective mismatch and show that enrollment correction reduces target-population error under two-stage selection.
- Abstract(参考訳): フェデレートラーニング(FL)は、分散クライアントが提供したアップデートから共有モデルをトレーニングする。
実際には、この代表性仮定は2つの異なる段階で失敗し、選択バイアスを引き起こす。
まず、デバイス制約やソフトウェア要件、ユーザ同意といった適格性ルールによって、どのクライアントが登録され、トレーニング用に到達可能かを判断し、‘emph{enrollment bias}’を誘導します。
第二に、登録されたクライアントのうち、バッテリーの状態、ネットワーク状態、ローカル時間などのユーザーおよびシステム要素は、どのクライアントが各通信ラウンドに参加するかを決定し、 \emph{Participation bias} を誘導する。
既存の作業はラウンドレベルの参加バイアスに大きく対処してきたが、人口レベルの参加バイアスにははるかに注意を払わず、トレーニング目標とターゲット人口目標との間に永続的なミスマッチを生じさせる可能性がある。
FLを2段階選択モデルで定式化し、標準の無知と正の仮定の下でターゲット人口平均更新を復元する逆確率重み付け方式である \textsc{FedIPW} を導出する。
クライアントレベルの共変量はしばしば非登録クライアントでは利用できないため、既知のターゲット人口サマリーを用いて、登録されたサンプルを再重み付けし、部分的に登録バイアスを補正する限定情報集約校正拡張も導入する。
さらに、残重み付け誤差下でアルゴリズムに依存しない最適化分析を行い、不完全選択補正が非消滅バイアスフロアを誘導できることを示す。
最後に, 合成フェデレーションによるロジスティック回帰実験により, 予測対象ミスマッチを検証し, 入力補正が2段階選択時のターゲット人口誤差を低減させることを示した。
関連論文リスト
- Evidence-based Distributional Alignment for Large Language Models [58.65469623911573]
LLM分布推定の忠実度とロバスト性を改善する証拠に基づくアライメント手法であるEvi-DAを提案する。
対象国が与えられた場合、Evi-DAは関連するWorld Values Survey項目とその回答分布を検索し、オプション毎に粗いヴェルツェル値シグネチャを予測し、国条件の回答分布を構造化形式で推測する。
論文 参考訳(メタデータ) (2026-03-03T03:34:06Z) - BACSA: A Bias-Aware Client Selection Algorithm for Privacy-Preserving Federated Learning in Wireless Healthcare Networks [0.5524804393257919]
本稿では,ユーザのバイアスを検知し,バイアスプロファイルに基づいてクライアントを戦略的に選択するBias-Aware Client Selection Algorithm (BACSA)を提案する。
BACSAは、Quality of Service(QoS)、プライバシ、セキュリティが最重要である、機密性の高い医療アプリケーションに適している。
論文 参考訳(メタデータ) (2024-11-01T21:34:43Z) - Submodular Maximization Approaches for Equitable Client Selection in Federated Learning [4.167345675621377]
従来の学習フレームワークでは、トレーニングのためのクライアント選択は、通常、各イテレーションでクライアントのサブセットをランダムにサンプリングする。
本稿では,ランダムクライアント選択の限界に対処するために,SUBTRUNCとUNIONFLという2つの新しい手法を提案する。
論文 参考訳(メタデータ) (2024-08-24T22:40:31Z) - Identifying and Mitigating Social Bias Knowledge in Language Models [52.52955281662332]
個々人の社会的偏見をきめ細かなキャリブレーションを可能にする新しいデバイアス・アプローチであるFairness Stamp(FAST)を提案する。
FASTは最先端のベースラインを超え、デバイアス性能が優れている。
これは、大きな言語モデルにおける公平性を達成するためのきめ細かいデバイアス戦略の可能性を強調している。
論文 参考訳(メタデータ) (2024-08-07T17:14:58Z) - Federated Class-Incremental Learning with Hierarchical Generative Prototypes [10.532838477096055]
Federated Learning (FL)は、複数のデバイス(クライアント)に分散した計算をすることで、ディープモデルのトレーニングを解き放つことを目的としている。
提案手法は,学習可能なプロンプトを用いてトレーニング済みのバックボーンを効率よく微調整することにより,最終層のバイアスを抑える。
提案手法は現状を著しく改善し, 平均精度は+7.8%向上した。
論文 参考訳(メタデータ) (2024-06-04T16:12:27Z) - Delving into Identify-Emphasize Paradigm for Combating Unknown Bias [52.76758938921129]
同定精度を高めるため,有効バイアス強調スコアリング法(ECS)を提案する。
また, マイニングされたバイアスアライメントとバイアスコンプリケート試料のコントリビューションのバランスをとるために, 勾配アライメント(GA)を提案する。
様々な環境で複数のデータセットで実験を行い、提案されたソリューションが未知のバイアスの影響を軽減することを実証した。
論文 参考訳(メタデータ) (2023-02-22T14:50:24Z) - FedABC: Targeting Fair Competition in Personalized Federated Learning [76.9646903596757]
フェデレートラーニングは、クライアントのローカルプライベートデータにアクセスすることなく、モデルを協調的にトレーニングすることを目的としている。
我々はFedABCと呼ばれるバイナリ分類によるFederated Averagingと呼ばれる新規で汎用的なPFLフレームワークを提案する。
特に、各クライアントに1対1のトレーニング戦略を採用して、クラス間の不公平な競争を軽減する。
論文 参考訳(メタデータ) (2023-02-15T03:42:59Z) - Fed-CBS: A Heterogeneity-Aware Client Sampling Mechanism for Federated
Learning via Class-Imbalance Reduction [76.26710990597498]
本研究では,ランダムに選択したクライアントからのグループデータのクラス不均衡が,性能の大幅な低下につながることを示す。
我々のキーとなる観測に基づいて、我々は効率的なクライアントサンプリング機構、すなわちフェデレートクラスバランスサンプリング(Fed-CBS)を設計する。
特に、クラス不均衡の尺度を提案し、その後、同型暗号化を用いてプライバシー保護方式でこの尺度を導出する。
論文 参考訳(メタデータ) (2022-09-30T05:42:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。