論文の概要: PRIMO: Private Regression in Multiple Outcomes
- arxiv url: http://arxiv.org/abs/2303.04195v1
- Date: Tue, 7 Mar 2023 19:32:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-09 16:15:05.174699
- Title: PRIMO: Private Regression in Multiple Outcomes
- Title(参考訳): PRIMO: 複数のアウトカムでプライベート回帰
- Authors: Seth Neel
- Abstract要約: 複数アウトカムでプライベート回帰と呼ぶ新しい差分プライベート回帰設定を導入する。
第4条1$では、十分な統計摂動(SSP)に基づくテクニックを変更し、$l$への依存を大幅に改善する。
セクション5$では、1000 Genomesプロジェクトのデータを用いて、複数の表現型に対する個人のゲノムリスク予測のタスクにアルゴリズムを適用します。
- 参考スコア(独自算出の注目度): 4.111899441919164
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce a new differentially private regression setting we call Private
Regression in Multiple Outcomes (PRIMO), inspired the common situation where a
data analyst wants to perform a set of $l$ regressions while preserving
privacy, where the covariates $X$ are shared across all $l$ regressions, and
each regression $i \in [l]$ has a different vector of outcomes $y_i$. While
naively applying private linear regression techniques $l$ times leads to a
$\sqrt{l}$ multiplicative increase in error over the standard linear regression
setting, in Subsection $4.1$ we modify techniques based on sufficient
statistics perturbation (SSP) to yield greatly improved dependence on $l$. In
Subsection $4.2$ we prove an equivalence to the problem of privately releasing
the answers to a special class of low-sensitivity queries we call inner product
queries. Via this equivalence, we adapt the geometric projection-based methods
from prior work on private query release to the PRIMO setting. Under the
assumption the labels $Y$ are public, the projection gives improved results
over the Gaussian mechanism when $n < l\sqrt{d}$, with no asymptotic dependence
on $l$ in the error. In Subsection $4.3$ we study the complexity of our
projection algorithm, and analyze a faster sub-sampling based variant in
Subsection $4.4$. Finally in Section $5$ we apply our algorithms to the task of
private genomic risk prediction for multiple phenotypes using data from the
1000 Genomes project. We find that for moderately large values of $l$ our
techniques drastically improve the accuracy relative to both the naive baseline
that uses existing private regression methods and our modified SSP algorithm
that doesn't use the projection.
- Abstract(参考訳): プライバシを保ちながら、データアナリストが一連の$l$レグレッションを実行したいという共通の状況に触発され、covariates $x$がすべての$l$レグレッションで共有され、各レグレッション$i \in [l]$は異なる結果ベクトル$y_i$を持つ。
プライベートな線形回帰技術である l$ times を適用すると、標準線形回帰設定に対する誤差が$\sqrt{l}$ 増加するが、第4.1条では、十分な統計摂動(ssp)に基づいてテクニックを変更し、$l$ への依存度を大幅に改善する。
セクション4.2$では、内部製品クエリと呼ばれる特殊な低感度クエリに対して、回答をプライベートにリリースする問題と等価性を証明します。
この等価性を通じて,プライベートクエリリリースの事前作業からプリモ設定まで,幾何学的プロジェクションに基づく手法を適用する。
y$ というラベルがパブリックであると仮定すると、n < l\sqrt{d}$ のときガウスのメカニズムよりも改善され、エラー中の $l$ に対する漸近的な依存がなくなる。
4.3$で、プロジェクションアルゴリズムの複雑さを調べ、より高速なサブサンプリングベースの変種を4.4$で分析する。
最後に、1000 Genomesプロジェクトのデータを用いて、複数の表現型に対するプライベートなゲノムリスク予測のタスクにアルゴリズムを適用する。
提案手法を適度に大きめの$l$の場合,既存のプライベート回帰法とプロジェクションを使用しない修正SSPアルゴリズムの両方を用いて,本手法の精度を劇的に向上させることが判明した。
関連論文リスト
- Better Locally Private Sparse Estimation Given Multiple Samples Per User [2.9562742331218725]
ユーザレベルの局所微分プライベートスパース線形回帰について検討する。
我々は、$n$のユーザがそれぞれ$m$のサンプルを提供していれば、$d$の線形依存を排除できることを示した。
本稿では,まず候補変数を選択し,次に狭義の低次元空間で推定を行うフレームワークを提案する。
論文 参考訳(メタデータ) (2024-08-08T08:47:20Z) - Improved Algorithm for Adversarial Linear Mixture MDPs with Bandit
Feedback and Unknown Transition [71.33787410075577]
線形関数近似,未知遷移,および逆損失を用いた強化学習について検討した。
我々は高い確率で$widetildeO(dsqrtHS3K + sqrtHSAK)$ regretを実現する新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-03-07T15:03:50Z) - Scaling Up Differentially Private LASSO Regularized Logistic Regression
via Faster Frank-Wolfe Iterations [51.14495595270775]
我々は,Frank-Wolfeアルゴリズムを$L_1$のペナル化線形回帰に適応させ,スパース入力を認識し,有効利用する。
この方法では,プライバシパラメータ$epsilon$の値とデータセットの分散度に応じて,最大2,200times$の係数でランタイムを削減できることを示す。
論文 参考訳(メタデータ) (2023-10-30T19:52:43Z) - Efficient Conditionally Invariant Representation Learning [41.320360597120604]
Conditional Independence Regression CovariancE (CIRCE)
条件付き特徴依存の尺度は、特徴学習の各ステップに複数の回帰を必要とする。
実験では,従来のベンチマーク手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-12-16T18:39:32Z) - The Projected Covariance Measure for assumption-lean variable significance testing [3.8936058127056357]
単純だが一般的なアプローチは、線形モデルを指定し、次に$X$の回帰係数が 0 でないかどうかをテストすることである。
条件付き平均独立性のモデルフリーなnullをテストする問題、すなわち条件付き平均の$Y$$$X$と$Z$は$X$に依存しない。
本稿では,加法モデルやランダムフォレストなど,柔軟な非パラメトリックあるいは機械学習手法を活用可能な,シンプルで汎用的なフレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-03T17:55:50Z) - $p$-Generalized Probit Regression and Scalable Maximum Likelihood
Estimation via Sketching and Coresets [74.37849422071206]
本稿では, 2次応答に対する一般化線形モデルである,$p$一般化プロビット回帰モデルについて検討する。
p$の一般化されたプロビット回帰に対する最大可能性推定器は、大容量データ上で$(1+varepsilon)$の係数まで効率的に近似できることを示す。
論文 参考訳(メタデータ) (2022-03-25T10:54:41Z) - Statistical Query Lower Bounds for List-Decodable Linear Regression [55.06171096484622]
本稿では,リスト復号化可能な線形回帰問題について考察する。
我々の主な成果は、この問題に対して$dmathrmpoly (1/alpha)$の統計的クエリ(SQ)の低いバウンダリである。
論文 参考訳(メタデータ) (2021-06-17T17:45:21Z) - Outlier-robust sparse/low-rank least-squares regression and robust
matrix completion [1.0878040851637998]
ヘテロジニアス雑音を伴う統計的学習フレームワークにおける高次元最小二乗回帰について検討する。
また, 製品プロセスの新たな応用に基づいて, 行列分解を伴う新しいトレーサリグレス理論を提案する。
論文 参考訳(メタデータ) (2020-12-12T07:42:47Z) - Conditional Uncorrelation and Efficient Non-approximate Subset Selection
in Sparse Regression [72.84177488527398]
相関性の観点からスパース回帰を考察し,条件付き非相関式を提案する。
提案手法により、計算複雑性は、スパース回帰における各候補部分集合に対して$O(frac16k3+mk2+mkd)$から$O(frac16k3+frac12mk2)$に削減される。
論文 参考訳(メタデータ) (2020-09-08T20:32:26Z) - Truncated Linear Regression in High Dimensions [26.41623833920794]
truncated linear regression において、従属変数 $(A_i, y_i)_i$ は $y_i= A_irm T cdot x* + eta_i$ は固定された未知の興味ベクトルである。
目標は、$A_i$とノイズ分布に関するいくつかの好ましい条件の下で$x*$を回復することである。
我々は、$k$-sparse $n$-dimensional vectors $x*$ from $m$ truncated sample。
論文 参考訳(メタデータ) (2020-07-29T00:31:34Z) - Optimal Robust Linear Regression in Nearly Linear Time [97.11565882347772]
学習者が生成モデル$Y = langle X,w* rangle + epsilon$から$n$のサンプルにアクセスできるような高次元頑健な線形回帰問題について検討する。
i) $X$ is L4-L2 hypercontractive, $mathbbE [XXtop]$ has bounded condition number and $epsilon$ has bounded variance, (ii) $X$ is sub-Gaussian with identity second moment and $epsilon$ is
論文 参考訳(メタデータ) (2020-07-16T06:44:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。