Fugu-MT 論文翻訳(概要): Enhancing Trade-offs in Privacy, Utility, and Computational Efficiency through MUltistage Sampling Technique (MUST)

論文の概要: Enhancing Trade-offs in Privacy, Utility, and Computational Efficiency through MUltistage Sampling Technique (MUST)

arxiv url: http://arxiv.org/abs/2312.13389v1
Date: Wed, 20 Dec 2023 19:38:29 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-22 16:50:03.788106
Title: Enhancing Trade-offs in Privacy, Utility, and Computational Efficiency through MUltistage Sampling Technique (MUST)
Title（参考訳）: MUST(Multistage Smpling Technique)によるプライバシ、ユーティリティ、計算効率のトレードオフの強化
Authors: Xingyuan Zhao, Fang Liu
Abstract要約: プライバシ・アンプリフィケーション(PA)のためのMUST(MUST)と呼ばれるサブサンプリング手法のクラスを提案する。本稿では,2段階のMUST手順,すなわちMUST.WO,MUST.OW,MUST.WWに対して,PA効果と実用性を包括的に分析する。以上の結果から,MUST.OWとMUST.WWは1段サンプリング法よりも,エプシロン$が強いことが示唆された。
参考スコア（独自算出の注目度）: 4.107946593741216
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Applying a randomized algorithm to a subset of a dataset rather than the entire dataset is a common approach to amplify its privacy guarantees in the released information. We propose a class of subsampling methods named MUltistage Sampling Technique (MUST) for privacy amplification (PA) in the context of differential privacy (DP). We conduct comprehensive analyses of the PA effects and utility for several 2-stage MUST procedures, namely, MUST.WO, MUST.OW, and MUST.WW that respectively represent sampling with (W), without (O), with (W) replacement from the original dataset in stage I and then sampling without (O), with (W), with (W) replacement in stage II from the subset drawn in stage I. We also provide the privacy composition analysis over repeated applications of MUST via the Fourier accountant algorithm. Our theoretical and empirical results suggest that MUST.OW and MUST.WW have stronger PA in $\epsilon$ than the common one-stage sampling procedures including Poisson sampling, sampling without replacement, and sampling with replacement, while the results on $\delta$ vary case by case. We also prove that MUST.WO is equivalent to sampling with replacement in PA. Furthermore, the final subset generated by a MUST procedure is a multiset that may contain multiple copies of the same data points due to sampling with replacement involved, which enhances the computational efficiency of algorithms that require complex function calculations on distinct data points (e.g., gradient descent). Our utility experiments show that MUST delivers similar or improved utility and stability in the privacy-preserving outputs compared to one-stage subsampling methods at similar privacy loss. MUST can be seamlessly integrated into stochastic optimization algorithms or procedures that involve parallel or simultaneous subsampling (e.g., bagging and subsampling bootstrap) when DP guarantees are necessary.
Abstract（参考訳）: データセット全体ではなくデータセットのサブセットにランダム化アルゴリズムを適用することは、リリース情報におけるプライバシの保証を強化する一般的なアプローチである。差分プライバシー(DP)の文脈において,プライバシ増幅(PA)のためのMUST(MUltistage Smpling Technique)というサブサンプリング手法のクラスを提案する。 2段階の必須手続きである must.wo, must.ow, must.ww を,それぞれ (w), without (o), with (w) でサンプリングし, (o), without (w) でサンプリングし, stage i で描画された部分集合から stage ii で (w) を置換して,pa 効果と有用性を包括的に解析する。また、フーリエ会計アルゴリズムを用いてMUSTの繰り返し適用に関するプライバシー構成分析を行う。理論的および実証的な結果から,MUST.OWとMUST.WWのPA値が,ポアソンサンプリング,交換なしサンプリング,置換によるサンプリングを含む一般的な1段階サンプリング法よりも強いことが示唆された。また、MUST.WOはPAで置換したサンプリングと等価であることを示す。さらに、MUSTプロシージャによって生成される最後のサブセットはマルチセットであり、同一のデータポイントの複数のコピーを含むことができるため、異なるデータポイント(例えば勾配降下)で複雑な関数計算を必要とするアルゴリズムの計算効率が向上する。我々のユーティリティ実験は、MUSTが同様の、または改善されたユーティリティと安定性をプライバシー保護出力で提供することを示す。 MUSTは、DP保証が必要な場合、並列または同時サブサンプリング(例えば、バッグとサブサンプリングブートストラップ)を含む確率最適化アルゴリズムや手順にシームレスに統合することができる。

関連論文リスト

Differentially Private Two-Stage Gradient Descent for Instrumental Variable Regression [22.733602577854825]
差分プライバシー制約下でのインストゥルメンタル変数回帰(IVaR)について検討する。勾配更新に慎重に校正された雑音を注入することにより、差分プライバシーを確保するノイズの多い2状態勾配降下アルゴリズムを提案する。
論文参考訳（メタデータ） (2025-09-26T18:02:58Z)
Hybrid least squares for learning functions from highly noisy data [7.096701481970196]
大量の汚染データを用いた最小二乗関数近似問題を考える。大きなノイズが存在する場合、小さなノイズレシエーションにおいて強力な既存の手法は最適以下である。提案アルゴリズムは,サンプル点生成とノイズモリゼーションの両方に対して,適切な最適性を有することを示す。
論文参考訳（メタデータ） (2025-07-03T00:31:29Z)
Sample-Optimal Private Regression in Polynomial Time [3.3748750222488657]
アルゴリズムのサンプル複雑性の改善は,統計的クエリや情報理論的下位境界に反することを示した。アルゴリズムは任意の外れ値の小さな部分に対して頑健であり、外れ値の小さな部分の関数として最適誤差率を達成する。
論文参考訳（メタデータ） (2025-03-31T17:08:12Z)
Privacy amplification by random allocation [18.231854497751137]
我々は,ユーザのデータがランダムに選択された$k$ステップにおいて,$t$ステップのシーケンス(あるいはセット)から一様に選択されるサンプリングスキームのプライバシアンプリフィケーション特性について考察する。このスキームの既存の分析は、シャッフルによるプライバシーの増幅に頼り、過度に保守的な境界を導いたり、モンテカルロシミュレーションを必要とする。特に、ランダムな$k$-out-of-t$アロケーションのプライバシ保証は、よく研究されている独立性(あるいはPoisson)サブサンプリングのプライバシー保証によって上限づけられることを示す。
論文参考訳（メタデータ） (2025-02-12T08:32:10Z)
The Cost of Shuffling in Private Gradient Based Optimization [40.31928071333575]
その結果, DP-ShuffleGはDP-SGDと比較して, データのシャッフル処理により過大なリスクが生じることがわかった。我々は、プライベートな最適化に公開データサンプルを統合するハイブリッドアプローチである textitInterleaved-ShuffleG を提案する。
論文参考訳（メタデータ） (2025-02-05T22:30:00Z)
Noise Variance Optimization in Differential Privacy: A Game-Theoretic Approach Through Per-Instance Differential Privacy [7.264378254137811]
差分プライバシー(DP)は、個人をターゲットデータセットに含めることによる分布の変化を観察することにより、プライバシー損失を測定することができる。 DPは、AppleやGoogleのような業界巨人の機械学習におけるデータセットの保護において際立っている。本稿では,PDPを制約として提案し,各データインスタンスのプライバシ損失を測定し,個々のインスタンスに適したノイズを最適化する。
論文参考訳（メタデータ） (2024-04-24T06:51:16Z)
Provable Privacy with Non-Private Pre-Processing [56.770023668379615]
非プライベートなデータ依存前処理アルゴリズムによって生じる追加のプライバシーコストを評価するための一般的なフレームワークを提案する。当社のフレームワークは,2つの新しい技術的概念を活用することにより,全体的なプライバシー保証の上限を確立する。
論文参考訳（メタデータ） (2024-03-19T17:54:49Z)
TernaryVote: Differentially Private, Communication Efficient, and Byzantine Resilient Distributed Optimization on Heterogeneous Data [50.797729676285876]
本稿では, 3次圧縮機と多数決機構を組み合わせて, 差分プライバシー, 勾配圧縮, ビザンチンレジリエンスを同時に実現するternaryVoteを提案する。提案アルゴリズムのF差分プライバシー(DP)とビザンチンレジリエンスのレンズによるプライバシー保証を理論的に定量化する。
論文参考訳（メタデータ） (2024-02-16T16:41:14Z)
SHAP@k:Efficient and Probably Approximately Correct (PAC) Identification of Top-k Features [16.99004256148679]
本稿では,トップk識別問題(TkIP)を紹介し,最も高いSHAP値を持つk特徴を特定することを目的とする。我々の研究の目的は、TkIP解決の文脈において、既存の手法のサンプル効率を改善することである。
論文参考訳（メタデータ） (2023-07-10T18:42:45Z)
Practical Privacy-Preserving Gaussian Process Regression via Secret Sharing [23.80837224347696]
本稿では秘密共有(SS)に基づくプライバシー保護型GPR手法を提案する。コンフュージョン補正(confusion-correction)というアイデアを通じて,新たなSSベースの指数演算を導出し,Cholesky分解に基づくSSベースの行列逆変換アルゴリズムを構築する。実験結果から,データプライバシ保護の前提として,提案手法が妥当な精度と効率を達成できることが示唆された。
論文参考訳（メタデータ） (2023-06-26T08:17:51Z)
Theoretically Principled Federated Learning for Balancing Privacy and Utility [61.03993520243198]
モデルパラメータを歪ませることでプライバシを保護する保護機構の一般学習フレームワークを提案する。フェデレートされた学習における各コミュニケーションラウンドにおいて、各クライアント上の各モデルパラメータに対して、パーソナライズされたユーティリティプライバシトレードオフを実現することができる。
論文参考訳（メタデータ） (2023-05-24T13:44:02Z)
Private Alternating Least Squares: Practical Private Matrix Completion with Tighter Rates [34.023599653814415]
ユーザレベルのプライバシの下で、差分的プライベート(DP)行列補完の問題について検討する。本稿では,Alternating-Least-Squares (ALS) 方式の差分型を設計する。
論文参考訳（メタデータ） (2021-07-20T23:19:11Z)
Improved, Deterministic Smoothing for L1 Certified Robustness [119.86676998327864]
分割雑音を伴う非加法的決定論的平滑化法(dssn)を提案する。一様加法平滑化とは対照的に、ssn認証は無作為なノイズコンポーネントを独立に必要としない。これは、規範ベースの敵対的脅威モデルに対して決定論的「ランダム化平滑化」を提供する最初の仕事である。
論文参考訳（メタデータ） (2021-03-17T21:49:53Z)
Hiding Among the Clones: A Simple and Nearly Optimal Analysis of Privacy Amplification by Shuffling [49.43288037509783]
ランダムシャッフルは、局所的ランダム化データの差分プライバシー保証を増幅する。私たちの結果は、以前の作業よりも単純で、ほぼ同じ保証で差分プライバシーに拡張された新しいアプローチに基づいています。
論文参考訳（メタデータ） (2020-12-23T17:07:26Z)
Adaptive Sampling for Best Policy Identification in Markov Decision Processes [79.4957965474334]
本稿では,学習者が生成モデルにアクセスできる場合の,割引マルコフ決定(MDP)における最良の政治的識別の問題について検討する。最先端アルゴリズムの利点を論じ、解説する。
論文参考訳（メタデータ） (2020-09-28T15:22:24Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。