Fugu-MT 論文翻訳(概要): Improving the Privacy Loss Under User-Level DP Composition for Fixed Estimation Error

論文の概要: Improving the Privacy Loss Under User-Level DP Composition for Fixed Estimation Error

arxiv url: http://arxiv.org/abs/2405.06261v2
Date: Wed, 7 Aug 2024 08:11:47 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-08 17:50:17.161716
Title: Improving the Privacy Loss Under User-Level DP Composition for Fixed Estimation Error
Title（参考訳）: 修正推定誤差に対するユーザレベルDP構成によるプライバシ損失の改善
Authors: V. Arvind Rameshwar, Anshoo Tandon,
Abstract要約: 我々は、サンプル平均の$epsilon$-userレベルの差分的リリースとデータセットの不整合部分集合におけるサンプル値のばらつきについて検討する。当社の主なコントリビューションは,ユーザのコントリビューションの抑制に基づく反復アルゴリズムです。
参考スコア（独自算出の注目度）: 4.809236881780709
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This paper considers the private release of statistics of several disjoint subsets of a datasets. In particular, we consider the $\epsilon$-user-level differentially private release of sample means and variances of sample values in disjoint subsets of a dataset, in a potentially sequential manner. Traditional analysis of the privacy loss under user-level privacy due to the composition of queries to the disjoint subsets necessitates a privacy loss degradation by the total number of disjoint subsets. Our main contribution is an iterative algorithm, based on suppressing user contributions, which seeks to reduce the overall privacy loss degradation under a canonical Laplace mechanism, while not increasing the worst estimation error among the subsets. Important components of this analysis are our exact, analytical characterizations of the sensitivities and the worst-case bias errors of estimators of the sample mean and variance, which are obtained by clipping or suppressing user contributions. We test the performance of our algorithm on real-world and synthetic datasets and demonstrate improvements in the privacy loss degradation factor, for fixed estimation error. We also show improvements in the worst-case error across subsets, via a natural optimization procedure, for fixed numbers of users contributing to each subset.
Abstract（参考訳）: 本稿では、データセットのいくつかの不整合部分集合の統計のプライベートリリースについて考察する。特に、サンプル平均の$\epsilon$-user-level差分的リリースとデータセットの非結合部分集合におけるサンプル値のばらつきを、潜在的に逐次的に検討する。ユーザレベルのプライバシの下でのプライバシ損失の従来の分析では、非結合サブセットへのクエリの構成は、非結合サブセットの総数によるプライバシー損失の減少を必要とする。我々の主な貢献は、ユーザのコントリビューションの抑制に基づく反復的アルゴリズムであり、これは、標準ラプラス機構の下での全体的なプライバシー損失の減少を減らし、サブセット間で最悪の推定誤差を増大させないことを目的としている。本分析の重要要素は, サンプル平均および分散量の推定器の感度の正確な, 分析的特性, 最悪の偏差誤差であり, ユーザの貢献をクリップしたり抑制したりすることで得られる。実世界および合成データセット上でのアルゴリズムの性能を検証し、固定推定誤差に対するプライバシー損失劣化係数の改善を実証する。また、各サブセットに寄与する固定数のユーザに対して、自然な最適化手順を通じて、サブセット間の最悪のエラーの改善を示す。

関連論文リスト

Benchmarking Fraud Detectors on Private Graph Data [70.4654745317714]
現在、多くの種類の不正は、グラフ上で動く自動検出アルゴリズムによって部分的に管理されている。データ保有者が不正検知器の開発を第三者にアウトソースしようとするシナリオを考察する。サードパーティは、不正検出をデータ保持者に送信し、これらのアルゴリズムをプライベートデータセットで評価し、その結果を公表する。本システムに対する現実的なプライバシ攻撃を提案し,評価結果のみに基づいて個人データの匿名化を可能にする。
論文参考訳（メタデータ） (2025-07-30T03:20:15Z)
Privacy for Free: Leveraging Local Differential Privacy Perturbed Data from Multiple Services [10.822843258077997]
ローカル微分プライバシー(LDP)は、現代のデータ分析において広く採用されているプライバシー保護技術である。本稿では,複数のサービスからの摂動情報に基づいてデータを収集・集約するフレームワークを提案する。
論文参考訳（メタデータ） (2025-03-11T11:10:03Z)
Improved subsample-and-aggregate via the private modified winsorized mean [0.0]
修正されたWinsorized平均は、いくつかの大きな分布のクラスに対して最小限最適であることを示す。我々は、修正されたウィンソル化平均をサブサンプル・アンド・アグリゲートのアグリゲータとみなす。
論文参考訳（メタデータ） (2025-01-23T21:03:40Z)
Error Feedback under $(L_0,L_1)$-Smoothness: Normalization and Momentum [56.37522020675243]
機械学習の幅広い問題にまたがる正規化誤差フィードバックアルゴリズムに対する収束の最初の証明を提供する。提案手法では,許容可能なステップサイズが大きくなったため,新しい正規化エラーフィードバックアルゴリズムは,各種タスクにおける非正規化エラーよりも優れていた。
論文参考訳（メタデータ） (2024-10-22T10:19:27Z)
Empirical Mean and Frequency Estimation Under Heterogeneous Privacy: A Worst-Case Analysis [5.755004576310333]
微分プライバシー(DP)は、現在プライバシーを測定するための金の標準である。異種プライバシー制約を考慮した一変量データに対する経験的平均推定とカテゴリーデータに対する周波数推定の問題点を考察する。提案アルゴリズムは,PAC誤差と平均二乗誤差の両面から最適性を証明し,他のベースライン手法よりも優れた性能を示す。
論文参考訳（メタデータ） (2024-07-15T22:46:02Z)
AAA: an Adaptive Mechanism for Locally Differential Private Mean Estimation [42.95927712062214]
ローカルディファレンシャルプライバシ(LDP)は、一般的なソフトウェアシステムで採用されている強力なプライバシ標準である。本稿では, 平均効用に対処する分布認識手法である, 適応型アダプティブ (AAA) 機構を提案する。我々は、厳密なプライバシー証明、ユーティリティ分析、そしてAAAと最先端のメカニズムを比較した広範な実験を提供する。
論文参考訳（メタデータ） (2024-04-02T04:22:07Z)
Bounded and Unbiased Composite Differential Privacy [25.427802467876248]
差分プライバシ(DP)の目的は、隣接する2つのデータベース間で区別できない出力分布を生成することにより、プライバシを保護することである。既存のソリューションでは、後処理やトランケーション技術を使ってこの問題に対処しようとしている。本稿では,合成確率密度関数を用いて有界および非偏りの出力を生成する新しい微分プライベート機構を提案する。
論文参考訳（メタデータ） (2023-11-04T04:43:47Z)
Improving the Variance of Differentially Private Randomized Experiments through Clustering [16.166525280886578]
差分的プライベートなメカニズムであるCluster-DPを提案する。より高品質なクラスタを選択することで,プライバシー保証を損なうことなく,分散ペナルティを低減できることを示す。
論文参考訳（メタデータ） (2023-08-02T05:51:57Z)
Mean Estimation with User-level Privacy under Data Heterogeneity [54.07947274508013]
異なるユーザーは、非常に多くの異なるデータポイントを持っているかもしれない。すべてのユーザが同じディストリビューションからサンプルを採取していると仮定することはできない。本研究では,データの分布と量の両方でユーザデータが異なる異質なユーザデータの単純なモデルを提案する。
論文参考訳（メタデータ） (2023-07-28T23:02:39Z)
Data Analytics with Differential Privacy [0.0]
我々は分散データとストリーミングデータを解析するための差分プライベートアルゴリズムを開発した。分散モデルでは、学習の特定の問題 -- 分散形式で -- がデータのグローバルモデルであると考えている。私たちは、ストリーミングモデル、ユーザーレベルのパンプライバシに対して、最も強力なプライバシー保証の1つを提供しています。
論文参考訳（メタデータ） (2023-07-20T17:43:29Z)
Correcting Underrepresentation and Intersectional Bias for Classification [49.1574468325115]
我々は、表現不足のバイアスによって破損したデータから学習する問題を考察する。偏りのないデータの少ない場合、グループワイドのドロップアウト率を効率的に推定できることが示される。本アルゴリズムは,有限VC次元のモデルクラスに対して,効率的な学習を可能にする。
論文参考訳（メタデータ） (2023-06-19T18:25:44Z)
On the Privacy-Robustness-Utility Trilemma in Distributed Learning [7.778461949427662]
本稿では,少数の対向マシンに対してロバスト性を保証するアルゴリズムによって得られた誤差を,まず厳密に解析する。私たちの分析は、プライバシ、堅牢性、ユーティリティの基本的なトレードオフを示しています。
論文参考訳（メタデータ） (2023-02-09T17:24:18Z)
Post-processing of Differentially Private Data: A Fairness Perspective [53.29035917495491]
本稿では,ポストプロセッシングが個人やグループに異なる影響を与えることを示す。差分的にプライベートなデータセットのリリースと、ダウンストリームの決定にそのようなプライベートなデータセットを使用するという、2つの重要な設定を分析している。それは、異なる公正度尺度の下で(ほぼ)最適である新しい後処理機構を提案する。
論文参考訳（メタデータ） (2022-01-24T02:45:03Z)
Calibrated Feature Decomposition for Generalizable Person Re-Identification [82.64133819313186]
Calibrated Feature Decomposition (CFD)モジュールは、人物の再識別の一般化能力の向上に焦点を当てている。キャリブレーション・アンド・スタンダード化されたバッチ正規化(CSBN)は、キャリブレーションされた人物表現を学習するために設計されている。
論文参考訳（メタデータ） (2021-11-27T17:12:43Z)
Private Alternating Least Squares: Practical Private Matrix Completion with Tighter Rates [34.023599653814415]
ユーザレベルのプライバシの下で、差分的プライベート(DP)行列補完の問題について検討する。本稿では,Alternating-Least-Squares (ALS) 方式の差分型を設計する。
論文参考訳（メタデータ） (2021-07-20T23:19:11Z)
Exploiting Sample Uncertainty for Domain Adaptive Person Re-Identification [137.9939571408506]
各サンプルに割り当てられた擬似ラベルの信頼性を推定・活用し,ノイズラベルの影響を緩和する。不確実性に基づく最適化は大幅な改善をもたらし、ベンチマークデータセットにおける最先端のパフォーマンスを達成します。
論文参考訳（メタデータ） (2020-12-16T04:09:04Z)
Graph-Homomorphic Perturbations for Private Decentralized Learning [64.26238893241322]
ローカルな見積もりの交換は、プライベートデータに基づくデータの推測を可能にする。すべてのエージェントで独立して選択された摂動により、パフォーマンスが著しく低下する。本稿では,特定のヌル空間条件に従って摂動を構成する代替スキームを提案する。
論文参考訳（メタデータ） (2020-10-23T10:35:35Z)
Accounting for Unobserved Confounding in Domain Generalization [107.0464488046289]
本稿では,データセットの組み合わせから頑健で一般化可能な予測モデルを学習する際の問題点について検討する。堅牢なモデルを学ぶことの課題の一部は、保存されていない共同設立者の影響にある。異なるモダリティの医療データに対するアプローチの実証的性能を実証する。
論文参考訳（メタデータ） (2020-07-21T08:18:06Z)
Asymptotic Analysis of an Ensemble of Randomly Projected Linear Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文参考訳（メタデータ） (2020-04-17T12:47:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。