Fugu-MT 論文翻訳(概要): Online Differentially Private Synthetic Data Generation

論文の概要: Online Differentially Private Synthetic Data Generation

arxiv url: http://arxiv.org/abs/2402.08012v1
Date: Mon, 12 Feb 2024 19:21:14 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-14 17:40:15.748034
Title: Online Differentially Private Synthetic Data Generation
Title（参考訳）: オンライン微分プライベート合成データ生成
Authors: Yiyun He, Roman Vershynin, Yizhe Zhu
Abstract要約: 差分プライベートな合成データセットを毎回$t$で生成するオンラインアルゴリズムを開発した。このアルゴリズムは、$O(t-1/dlog(t))$ for $dgeq 2$と$O(t-1log4.5(t))$ for $d=1$の近似精度を1-ワッサーシュタイン距離で達成する。
参考スコア（独自算出の注目度）: 11.438537476739633
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We present a polynomial-time algorithm for online differentially private synthetic data generation. For a data stream within the hypercube $[0,1]^d$ and an infinite time horizon, we develop an online algorithm that generates a differentially private synthetic dataset at each time $t$. This algorithm achieves a near-optimal accuracy bound of $O(t^{-1/d}\log(t))$ for $d\geq 2$ and $O(t^{-1}\log^{4.5}(t))$ for $d=1$ in the 1-Wasserstein distance. This result generalizes the previous work on the continual release model for counting queries to include Lipschitz queries. Compared to the offline case, where the entire dataset is available at once, our approach requires only an extra polylog factor in the accuracy bound.
Abstract（参考訳）: オンライン微分プライベート合成データ生成のための多項式時間アルゴリズムを提案する。ハイパーキューブの$[0,1]^d$と無限の時間軸内のデータストリームに対して、各時刻に差動的にプライベートな合成データセットを生成するオンラインアルゴリズムを開発した。このアルゴリズムは、$O(t^{-1/d}\log(t))$ for $d\geq 2$ and $O(t^{-1}\log^{4.5}(t))$ for $d=1$ in the 1-Wasserstein distanceである。この結果は、Lipschitzクエリを含むクエリをカウントする継続リリースモデルに関する以前の作業を一般化する。データセット全体が一度に利用可能となるオフラインの場合と比較して、我々のアプローチは精度境界に追加のポリログ係数しか必要としない。

関連論文リスト

Minimax optimal differentially private synthetic data for smooth queries [6.093338631816647]
ハイパーキューブでサポートされたサイズ$n$のデータセットから、$(varepsilon,)$-differentially privateな合成データを生成する問題について検討する。我々は、$n-min 1, frackd$のミニマックス誤差率を$log(n)$ factorまで提案する。
論文参考訳（メタデータ） (2026-02-02T03:54:11Z)
Differentially Private Space-Efficient Algorithms for Counting Distinct Elements in the Turnstile Model [61.40326886123332]
ターンタイルストリーミングモデルにおいて、異なる要素を数えるという根本的な問題に対して、最初のサブ線形空間を微分プライベートなアルゴリズムを与える。本結果は, 線形問題である最先端アルゴリズムの空間要求を著しく改善する。ストリームにアイテムが現れる回数の制限付き$W$が分かっている場合、我々のアルゴリズムは$tildeO_eta(sqrtW)$ space.sqrtW)$ additive errorを提供する。
論文参考訳（メタデータ） (2025-05-29T17:21:20Z)
Statistical-Computational Trade-offs for Density Estimation [60.81548752871115]
幅広い種類のデータ構造に対して、それらの境界は著しく改善されないことを示す。これは密度推定のための新しい統計計算トレードオフである。
論文参考訳（メタデータ） (2024-10-30T15:03:33Z)
Improved Sample Complexity for Private Nonsmooth Nonconvex Optimization [28.497079108813924]
データセットのサイズが$widetildeOmega(sqrtd/alphabeta3+d/epsilonalphabeta2)$である限り、$(alpha,beta)$-stationaryポイントを返すシングルパス$(epsilon,delta)$-DPアルゴリズムを提供する。次に、サンプルの複雑さを$widetildeOmegaleft(d/beta2+d3/4/epsilonalphaに改善するマルチパス時間アルゴリズムを提案する。
論文参考訳（メタデータ） (2024-10-08T10:15:49Z)
Fast John Ellipsoid Computation with Differential Privacy Optimization [34.437362489150246]
高速なジョン楕円体計算のための微分プライベートアルゴリズムを提案する。提案手法は, ノイズ摂動とスケッチ処理を統合し, スコアサンプリングを活用し, 効率とプライバシの両立を図る。
論文参考訳（メタデータ） (2024-08-12T03:47:55Z)
Private Stochastic Convex Optimization with Heavy Tails: Near-Optimality from Simple Reductions [19.008521454738425]
重み付き勾配を持つ差分プライベート凸最適化(DP-SCO)の問題を考察し、一様境界ではなく、サンプル関数のリプシッツ定数上の$ktextth$-momentを仮定する。 Gcdot frac 1 sqrt n + G_k cdot (fracsqrt dnepsilon) 1 の誤差を達成し、重み付け設定における第1次最適率(対数係数まで)を得るための新しい還元ベースのアプローチを提案する。
論文参考訳（メタデータ） (2024-06-04T21:26:29Z)
Turnstile $\ell_p$ leverage score sampling with applications [56.403488578703865]
我々は,行列$AinmathbbRntimes d$の行をサンプリングする新しいアルゴリズムを開発した。我々のアルゴリズムはサンプル行インデックスのセットを返すだけでなく、わずかに乱れた行を $tildea_i approx a_i$ で返却し、サンプリング確率を $varepsilon$ の相対誤差に近似する。ロジスティック回帰のために、我々のフレームワークは$を達成した最初のアルゴリズムを得る。
論文参考訳（メタデータ） (2024-06-01T07:33:41Z)
Differentially Private Clustering in Data Streams [65.78882209673885]
オフラインのDPコアセットやクラスタリングアルゴリズムをブラックボックスとしてのみ必要とする,差分プライベートなストリーミングクラスタリングフレームワークを提案する。我々のフレームワークはまた、連続的なリリース設定の下で微分プライベートであり、すなわち、全てのタイムスタンプにおけるアルゴリズムの出力の和は常に微分プライベートである。
論文参考訳（メタデータ） (2023-07-14T16:11:22Z)
Private estimation algorithms for stochastic block models and mixture models [63.07482515700984]
効率的なプライベート推定アルゴリズムを設計するための一般的なツール。最初の効率的な$(epsilon, delta)$-differentially private algorithm for both weak recovery and exact recovery。
論文参考訳（メタデータ） (2023-01-11T09:12:28Z)
Efficient Mean Estimation with Pure Differential Privacy via a Sum-of-Squares Exponential Mechanism [16.996435043565594]
純微分プライバシーを受ける独立サンプルの共分散で$d$正確率分布の平均を推定するアルゴリズムを初めて与える。我々の主な手法は、強力なSum of Squares法(SoS)を用いて微分プライベートアルゴリズムを設計する新しいアプローチである。
論文参考訳（メタデータ） (2021-11-25T09:31:15Z)
Private Stochastic Convex Optimization: Optimal Rates in $\ell_1$ Geometry [69.24618367447101]
対数要因まで $(varepsilon,delta)$-differently private の最適過剰人口損失は $sqrtlog(d)/n + sqrtd/varepsilon n.$ です。損失関数がさらなる滑らかさの仮定を満たすとき、余剰損失は$sqrtlog(d)/n + (log(d)/varepsilon n)2/3で上界(対数因子まで)であることが示される。
論文参考訳（メタデータ） (2021-03-02T06:53:44Z)
Streaming Complexity of SVMs [110.63976030971106]
本稿では,ストリーミングモデルにおけるバイアス正規化SVM問題を解く際の空間複雑性について検討する。両方の問題に対して、$frac1lambdaepsilon$の次元に対して、$frac1lambdaepsilon$よりも空間的に小さいストリーミングアルゴリズムを得ることができることを示す。
論文参考訳（メタデータ） (2020-07-07T17:10:00Z)
A Deterministic Streaming Sketch for Ridge Regression [15.256452294422294]
リッジ回帰を推定するための決定論的空間効率アルゴリズムを提案する。これは、ソリューションエラーが保証された最初の$o(d2)$空間決定論的ストリーミングアルゴリズムである。合成データセットと実世界のデータセットのランダムなスケッチアルゴリズムと比較して、我々のアルゴリズムは空間と類似時間が少なくて経験的誤差が少ない。
論文参考訳（メタデータ） (2020-02-05T22:08:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。