論文の概要: PRIMO: Private Regression in Multiple Outcomes
- arxiv url: http://arxiv.org/abs/2303.04195v1
- Date: Tue, 7 Mar 2023 19:32:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-09 16:15:05.174699
- Title: PRIMO: Private Regression in Multiple Outcomes
- Title(参考訳): PRIMO: 複数のアウトカムでプライベート回帰
- Authors: Seth Neel
- Abstract要約: 複数アウトカムでプライベート回帰と呼ぶ新しい差分プライベート回帰設定を導入する。
第4条1$では、十分な統計摂動(SSP)に基づくテクニックを変更し、$l$への依存を大幅に改善する。
セクション5$では、1000 Genomesプロジェクトのデータを用いて、複数の表現型に対する個人のゲノムリスク予測のタスクにアルゴリズムを適用します。
- 参考スコア(独自算出の注目度): 4.111899441919164
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce a new differentially private regression setting we call Private
Regression in Multiple Outcomes (PRIMO), inspired the common situation where a
data analyst wants to perform a set of $l$ regressions while preserving
privacy, where the covariates $X$ are shared across all $l$ regressions, and
each regression $i \in [l]$ has a different vector of outcomes $y_i$. While
naively applying private linear regression techniques $l$ times leads to a
$\sqrt{l}$ multiplicative increase in error over the standard linear regression
setting, in Subsection $4.1$ we modify techniques based on sufficient
statistics perturbation (SSP) to yield greatly improved dependence on $l$. In
Subsection $4.2$ we prove an equivalence to the problem of privately releasing
the answers to a special class of low-sensitivity queries we call inner product
queries. Via this equivalence, we adapt the geometric projection-based methods
from prior work on private query release to the PRIMO setting. Under the
assumption the labels $Y$ are public, the projection gives improved results
over the Gaussian mechanism when $n < l\sqrt{d}$, with no asymptotic dependence
on $l$ in the error. In Subsection $4.3$ we study the complexity of our
projection algorithm, and analyze a faster sub-sampling based variant in
Subsection $4.4$. Finally in Section $5$ we apply our algorithms to the task of
private genomic risk prediction for multiple phenotypes using data from the
1000 Genomes project. We find that for moderately large values of $l$ our
techniques drastically improve the accuracy relative to both the naive baseline
that uses existing private regression methods and our modified SSP algorithm
that doesn't use the projection.
- Abstract(参考訳): プライバシを保ちながら、データアナリストが一連の$l$レグレッションを実行したいという共通の状況に触発され、covariates $x$がすべての$l$レグレッションで共有され、各レグレッション$i \in [l]$は異なる結果ベクトル$y_i$を持つ。
プライベートな線形回帰技術である l$ times を適用すると、標準線形回帰設定に対する誤差が$\sqrt{l}$ 増加するが、第4.1条では、十分な統計摂動(ssp)に基づいてテクニックを変更し、$l$ への依存度を大幅に改善する。
セクション4.2$では、内部製品クエリと呼ばれる特殊な低感度クエリに対して、回答をプライベートにリリースする問題と等価性を証明します。
この等価性を通じて,プライベートクエリリリースの事前作業からプリモ設定まで,幾何学的プロジェクションに基づく手法を適用する。
y$ というラベルがパブリックであると仮定すると、n < l\sqrt{d}$ のときガウスのメカニズムよりも改善され、エラー中の $l$ に対する漸近的な依存がなくなる。
4.3$で、プロジェクションアルゴリズムの複雑さを調べ、より高速なサブサンプリングベースの変種を4.4$で分析する。
最後に、1000 Genomesプロジェクトのデータを用いて、複数の表現型に対するプライベートなゲノムリスク予測のタスクにアルゴリズムを適用する。
提案手法を適度に大きめの$l$の場合,既存のプライベート回帰法とプロジェクションを使用しない修正SSPアルゴリズムの両方を用いて,本手法の精度を劇的に向上させることが判明した。
関連論文リスト
- Scaling Laws in Linear Regression: Compute, Parameters, and Data [86.48154162485712]
無限次元線形回帰セットアップにおけるスケーリング法則の理論について検討する。
テストエラーの再現可能な部分は$Theta(-(a-1) + N-(a-1)/a)$であることを示す。
我々の理論は経験的ニューラルスケーリング法則と一致し、数値シミュレーションによって検証される。
論文 参考訳(メタデータ) (2024-06-12T17:53:29Z) - Optimal Bias-Correction and Valid Inference in High-Dimensional Ridge Regression: A Closed-Form Solution [0.0]
寸法$p$がサンプルサイズ$n$より小さい場合、バイアスを効果的に補正するための反復戦略を導入する。
p>n$の場合、提案した非バイアス推定器の残余バイアスが到達不能であるようなバイアスを最適に緩和する。
本手法は,様々な分野にわたるリッジ回帰推論におけるバイアス問題に対する変換解を提供する。
論文 参考訳(メタデータ) (2024-05-01T10:05:19Z) - Streaming Sparse Linear Regression [1.8707139489039097]
本稿では,データポイントが逐次到着したときのストリーミングデータを解析する新しいオンライン疎線形回帰フレームワークを提案する。
提案手法はメモリ効率が高く,厳密な制約付き凸性仮定を必要とする。
論文 参考訳(メタデータ) (2022-11-11T07:31:55Z) - Dimension free ridge regression [10.434481202633458]
我々は、リッジ回帰のバイアスとばらつきの観点から、すなわちデータ上のリッジ回帰を再考し、等価なシーケンスモデルのバイアスとばらつきの観点から、リッジ回帰のバイアスとばらつきを考察する。
新しい応用として、定期的に変化するスペクトルを持つヒルベルト共変量に対して、完全に明示的で鋭い尾根回帰特性を得る。
論文 参考訳(メタデータ) (2022-10-16T16:01:05Z) - Easy Differentially Private Linear Regression [16.325734286930764]
本研究では,指数関数機構を用いて,非プライベート回帰モデルの集合からタキー深度の高いモデルを選択するアルゴリズムについて検討する。
このアルゴリズムは、データリッチな設定において、強い経験的性能を得る。
論文 参考訳(メタデータ) (2022-08-15T17:42:27Z) - $p$-Generalized Probit Regression and Scalable Maximum Likelihood
Estimation via Sketching and Coresets [74.37849422071206]
本稿では, 2次応答に対する一般化線形モデルである,$p$一般化プロビット回帰モデルについて検討する。
p$の一般化されたプロビット回帰に対する最大可能性推定器は、大容量データ上で$(1+varepsilon)$の係数まで効率的に近似できることを示す。
論文 参考訳(メタデータ) (2022-03-25T10:54:41Z) - SLOE: A Faster Method for Statistical Inference in High-Dimensional
Logistic Regression [68.66245730450915]
実用データセットに対する予測の偏見を回避し、頻繁な不確実性を推定する改善された手法を開発している。
私たちの主な貢献は、推定と推論の計算時間をマグニチュードの順序で短縮する収束保証付き信号強度の推定器SLOEです。
論文 参考訳(メタデータ) (2021-03-23T17:48:56Z) - Online nonparametric regression with Sobolev kernels [99.12817345416846]
我々は、ソボレフ空間のクラス上の後悔の上限を$W_pbeta(mathcalX)$, $pgeq 2, beta>fracdp$ とする。
上界は minimax regret analysis で支えられ、$beta> fracd2$ または $p=infty$ の場合、これらの値は(本質的に)最適である。
論文 参考訳(メタデータ) (2021-02-06T15:05:14Z) - Conditional Uncorrelation and Efficient Non-approximate Subset Selection
in Sparse Regression [72.84177488527398]
相関性の観点からスパース回帰を考察し,条件付き非相関式を提案する。
提案手法により、計算複雑性は、スパース回帰における各候補部分集合に対して$O(frac16k3+mk2+mkd)$から$O(frac16k3+frac12mk2)$に削減される。
論文 参考訳(メタデータ) (2020-09-08T20:32:26Z) - Truncated Linear Regression in High Dimensions [26.41623833920794]
truncated linear regression において、従属変数 $(A_i, y_i)_i$ は $y_i= A_irm T cdot x* + eta_i$ は固定された未知の興味ベクトルである。
目標は、$A_i$とノイズ分布に関するいくつかの好ましい条件の下で$x*$を回復することである。
我々は、$k$-sparse $n$-dimensional vectors $x*$ from $m$ truncated sample。
論文 参考訳(メタデータ) (2020-07-29T00:31:34Z) - Optimal Robust Linear Regression in Nearly Linear Time [97.11565882347772]
学習者が生成モデル$Y = langle X,w* rangle + epsilon$から$n$のサンプルにアクセスできるような高次元頑健な線形回帰問題について検討する。
i) $X$ is L4-L2 hypercontractive, $mathbbE [XXtop]$ has bounded condition number and $epsilon$ has bounded variance, (ii) $X$ is sub-Gaussian with identity second moment and $epsilon$ is
論文 参考訳(メタデータ) (2020-07-16T06:44:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。