論文の概要: Federated Measurement of Demographic Disparities from Quantile Sketches
- arxiv url: http://arxiv.org/abs/2602.18870v1
- Date: Sat, 21 Feb 2026 15:34:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.369178
- Title: Federated Measurement of Demographic Disparities from Quantile Sketches
- Title(参考訳): 量子スケッチからのデモグラフィックの差異のフェデレーション計測
- Authors: Arthur Charpentier, Agathe Fernandes Machado, Olivier Côté, François Hu,
- Abstract要約: Horizontal Federated Learning (FL)は、生データを共有せずに、連携した機能を持つクライアント間の協調モデリングを可能にする。
本研究は, スコア分布による人口動態の相互監査, ワッサーシュタインとしての格差の測定, センシティブグループスコア法間の差異について検討する。
本稿では,各サイロがグループ数のみを共有し,その局所的なスコア分布を定量的に要約するワンショット通信効率のプロトコルを提案する。
- 参考スコア(独自算出の注目度): 4.991212094743681
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Many fairness goals are defined at a population level that misaligns with siloed data collection, which remains unsharable due to privacy regulations. Horizontal federated learning (FL) enables collaborative modeling across clients with aligned features without sharing raw data. We study federated auditing of demographic parity through score distributions, measuring disparity as a Wasserstein--Frechet variance between sensitive-group score laws, and expressing the population metric in federated form that makes explicit how silo-specific selection drives local-global mismatch. For the squared Wasserstein distance, we prove an ANOVA-style decomposition that separates (i) selection-induced mixture effects from (ii) cross-silo heterogeneity, yielding tight bounds linking local and global metrics. We then propose a one-shot, communication-efficient protocol in which each silo shares only group counts and a quantile summary of its local score distributions, enabling the server to estimate global disparity and its decomposition, with $O(1/k)$ discretization bias ($k$ quantiles) and finite-sample guarantees. Experiments on synthetic data and COMPAS show that a few dozen quantiles suffice to recover global disparity and diagnose its sources.
- Abstract(参考訳): 多くの公正な目標が、プライバシー規制のために相容れない、サイロ化されたデータ収集と不一致の人口レベルで定義されている。
Horizontal Federated Learning (FL)は、生データを共有せずに、連携した機能を持つクライアント間の協調モデリングを可能にする。
本研究は, スコア分布による人口比率のフェデレーション監査, ワッサーシュタインの格差の測定, センシティブグループスコア法間の差異, および, シロ種別選択が局所的ミスマッチをいかに促進させるかを明らかにするフェデレーション形式での人口指標の表現について検討する。
正方形ワッサーシュタイン距離に対して、分離するANOVA型分解を証明する。
一 選択による混合効果
(ii) 局所的および大域的メトリクスをリンクする厳密な境界をもたらすクロスサイロ不均一性。
次に、各サイロがグループ数と局所的なスコア分布の量子的サマリのみを共有できるワンショットの通信効率の高いプロトコルを提案し、サーバがグローバルな格差と分解を推定できるようにし、$O(1/k)$離散化バイアス(k$ Quantiles)と有限サンプル保証を付与する。
合成データとCompASの実験では、数ダースの量子が世界の格差を回復し、その情報源を診断するのに十分であることが示された。
関連論文リスト
- Collaborative Heterogeneous Causal Inference Beyond Meta-analysis [68.4474531911361]
異種データを用いた因果推論のための協調的逆確率スコア推定器を提案する。
異質性の増加に伴うメタアナリシスに基づく手法に対して,本手法は有意な改善を示した。
論文 参考訳(メタデータ) (2024-04-24T09:04:36Z) - Estimating Unknown Population Sizes Using the Hypergeometric Distribution [1.03590082373586]
総人口と構成カテゴリーの規模が不明な場合, 個別分布の推定に挑戦する。
本研究では,連続潜伏変数上での分布条件の混合となるデータ生成過程について考察する。
実験データシミュレーションにより,本手法は数値データをモデル化する他の可能性関数よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-02-22T01:53:56Z) - Federated Two Stage Decoupling With Adaptive Personalization Layers [5.69361786082969]
フェデレーション学習は、プライバシ制約を維持しながら分散学習を可能にする能力によって、大きな注目を集めている。
本質的には、学習の劣化と収束速度の低下を経験する。
等質なクライアントを同じ群にクラスタリングするという概念を採用することは自然であり、各群内のモデル重みのみを集約することができる。
論文 参考訳(メタデータ) (2023-08-30T07:46:32Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - Divide and Contrast: Source-free Domain Adaptation via Adaptive
Contrastive Learning [122.62311703151215]
Divide and Contrast (DaC) は、それぞれの制限を回避しつつ、両方の世界の善良な端を接続することを目的としている。
DaCは、ターゲットデータをソースライクなサンプルとターゲット固有なサンプルに分割する。
さらに、ソースライクなドメインと、メモリバンクベースの最大平均離散性(MMD)損失を用いて、ターゲット固有のサンプルとを整合させて、分散ミスマッチを低減する。
論文 参考訳(メタデータ) (2022-11-12T09:21:49Z) - A One-shot Framework for Distributed Clustered Learning in Heterogeneous
Environments [54.172993875654015]
異種環境における分散学習のためのコミュニケーション効率化手法のファミリーを提案する。
ユーザによるローカル計算に基づくワンショットアプローチと、サーバにおけるクラスタリングベースのアグリゲーションステップは、強力な学習保証を提供する。
厳密な凸問題に対しては,ユーザ毎のデータ点数がしきい値を超える限り,提案手法はサンプルサイズの観点から順序最適平均二乗誤差率を達成する。
論文 参考訳(メタデータ) (2022-09-22T09:04:10Z) - Heterogeneous Federated Learning via Grouped Sequential-to-Parallel
Training [60.892342868936865]
フェデレートラーニング(Federated Learning, FL)は、プライバシ保護のためのコラボレーション機械学習パラダイムである。
本稿では,この課題に対処するため,データヘテロジニアス・ロバストFLアプローチであるFedGSPを提案する。
その結果,FedGSPは7つの最先端アプローチと比較して平均3.7%の精度向上を実現していることがわかった。
論文 参考訳(メタデータ) (2022-01-31T03:15:28Z) - Global Distance-distributions Separation for Unsupervised Person
Re-identification [93.39253443415392]
既存の教師なしのReIDアプローチは、距離ベースのマッチング/ランク付けを通じて正のサンプルと負のサンプルを正しく識別するのに失敗することが多い。
本研究では,2つの分布に対する大域的距離分布分離の制約を導入し,大域的視点から正と負のサンプルを明確に分離することを奨励する。
本研究では,本手法がベースラインを大幅に改善し,最先端の性能を実現することを示す。
論文 参考訳(メタデータ) (2020-06-01T07:05:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。