Fugu-MT 論文翻訳(概要): PRIMO: Private Regression in Multiple Outcomes

論文の概要: PRIMO: Private Regression in Multiple Outcomes

arxiv url: http://arxiv.org/abs/2303.04195v1
Date: Tue, 7 Mar 2023 19:32:13 GMT
ステータス: 翻訳完了
システム内更新日: 2023-03-09 16:15:05.174699
Title: PRIMO: Private Regression in Multiple Outcomes
Title（参考訳）: PRIMO: 複数のアウトカムでプライベート回帰
Authors: Seth Neel
Abstract要約: 複数アウトカムでプライベート回帰と呼ぶ新しい差分プライベート回帰設定を導入する。第4条1$では、十分な統計摂動(SSP)に基づくテクニックを変更し、$l$への依存を大幅に改善する。セクション5$では、1000 Genomesプロジェクトのデータを用いて、複数の表現型に対する個人のゲノムリスク予測のタスクにアルゴリズムを適用します。
参考スコア（独自算出の注目度）: 4.111899441919164
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We introduce a new differentially private regression setting we call Private Regression in Multiple Outcomes (PRIMO), inspired the common situation where a data analyst wants to perform a set of $l$ regressions while preserving privacy, where the covariates $X$ are shared across all $l$ regressions, and each regression $i \in [l]$ has a different vector of outcomes $y_i$. While naively applying private linear regression techniques $l$ times leads to a $\sqrt{l}$ multiplicative increase in error over the standard linear regression setting, in Subsection $4.1$ we modify techniques based on sufficient statistics perturbation (SSP) to yield greatly improved dependence on $l$. In Subsection $4.2$ we prove an equivalence to the problem of privately releasing the answers to a special class of low-sensitivity queries we call inner product queries. Via this equivalence, we adapt the geometric projection-based methods from prior work on private query release to the PRIMO setting. Under the assumption the labels $Y$ are public, the projection gives improved results over the Gaussian mechanism when $n < l\sqrt{d}$, with no asymptotic dependence on $l$ in the error. In Subsection $4.3$ we study the complexity of our projection algorithm, and analyze a faster sub-sampling based variant in Subsection $4.4$. Finally in Section $5$ we apply our algorithms to the task of private genomic risk prediction for multiple phenotypes using data from the 1000 Genomes project. We find that for moderately large values of $l$ our techniques drastically improve the accuracy relative to both the naive baseline that uses existing private regression methods and our modified SSP algorithm that doesn't use the projection.
Abstract（参考訳）: プライバシを保ちながら、データアナリストが一連の$l$レグレッションを実行したいという共通の状況に触発され、covariates $x$がすべての$l$レグレッションで共有され、各レグレッション$i \in [l]$は異なる結果ベクトル$y_i$を持つ。プライベートな線形回帰技術である l$ times を適用すると、標準線形回帰設定に対する誤差が$\sqrt{l}$ 増加するが、第4.1条では、十分な統計摂動(ssp)に基づいてテクニックを変更し、$l$ への依存度を大幅に改善する。セクション4.2$では、内部製品クエリと呼ばれる特殊な低感度クエリに対して、回答をプライベートにリリースする問題と等価性を証明します。この等価性を通じて,プライベートクエリリリースの事前作業からプリモ設定まで,幾何学的プロジェクションに基づく手法を適用する。 y$ というラベルがパブリックであると仮定すると、n < l\sqrt{d}$ のときガウスのメカニズムよりも改善され、エラー中の $l$ に対する漸近的な依存がなくなる。 4.3$で、プロジェクションアルゴリズムの複雑さを調べ、より高速なサブサンプリングベースの変種を4.4$で分析する。最後に、1000 Genomesプロジェクトのデータを用いて、複数の表現型に対するプライベートなゲノムリスク予測のタスクにアルゴリズムを適用する。提案手法を適度に大きめの$l$の場合,既存のプライベート回帰法とプロジェクションを使用しない修正SSPアルゴリズムの両方を用いて,本手法の精度を劇的に向上させることが判明した。

関連論文リスト

Regression-Based Estimation of Causal Effects in the Presence of Selection Bias and Confounding [52.1068936424622]
治療が介入によって設定された場合、対象変数$Y$に対して、予測因果効果$E[Y|do(X)]$を推定する問題を考える。選択バイアスや欠点のない設定では、$E[Y|do(X)] = E[Y|X]$ となる。選択バイアスとコンバウンディングの両方を組み込んだフレームワークを提案する。
論文参考訳（メタデータ） (2025-03-26T13:43:37Z)
Better Locally Private Sparse Estimation Given Multiple Samples Per User [2.9562742331218725]
ユーザレベルの局所微分プライベートスパース線形回帰について検討する。我々は、$n$のユーザがそれぞれ$m$のサンプルを提供していれば、$d$の線形依存を排除できることを示した。本稿では,まず候補変数を選択し,次に狭義の低次元空間で推定を行うフレームワークを提案する。
論文参考訳（メタデータ） (2024-08-08T08:47:20Z)
Scaling Laws in Linear Regression: Compute, Parameters, and Data [86.48154162485712]
無限次元線形回帰セットアップにおけるスケーリング法則の理論について検討する。テストエラーの再現可能な部分は$Theta(-(a-1) + N-(a-1)/a)$であることを示す。我々の理論は経験的ニューラルスケーリング法則と一致し、数値シミュレーションによって検証される。
論文参考訳（メタデータ） (2024-06-12T17:53:29Z)
Optimal Bias-Correction and Valid Inference in High-Dimensional Ridge Regression: A Closed-Form Solution [0.0]
寸法$p$がサンプルサイズ$n$より小さい場合、バイアスを効果的に補正するための反復戦略を導入する。 p>n$の場合、提案した非バイアス推定器の残余バイアスが到達不能であるようなバイアスを最適に緩和する。本手法は,様々な分野にわたるリッジ回帰推論におけるバイアス問題に対する変換解を提供する。
論文参考訳（メタデータ） (2024-05-01T10:05:19Z)
Improved Algorithm for Adversarial Linear Mixture MDPs with Bandit Feedback and Unknown Transition [71.33787410075577]
線形関数近似,未知遷移,および逆損失を用いた強化学習について検討した。我々は高い確率で$widetildeO(dsqrtHS3K + sqrtHSAK)$ regretを実現する新しいアルゴリズムを提案する。
論文参考訳（メタデータ） (2024-03-07T15:03:50Z)
Scaling Up Differentially Private LASSO Regularized Logistic Regression via Faster Frank-Wolfe Iterations [51.14495595270775]
我々は,Frank-Wolfeアルゴリズムを$L_1$のペナル化線形回帰に適応させ,スパース入力を認識し,有効利用する。この方法では,プライバシパラメータ$epsilon$の値とデータセットの分散度に応じて,最大2,200times$の係数でランタイムを削減できることを示す。
論文参考訳（メタデータ） (2023-10-30T19:52:43Z)
Efficient Conditionally Invariant Representation Learning [41.320360597120604]
Conditional Independence Regression CovariancE (CIRCE) 条件付き特徴依存の尺度は、特徴学習の各ステップに複数の回帰を必要とする。実験では,従来のベンチマーク手法よりも優れた性能を示す。
論文参考訳（メタデータ） (2022-12-16T18:39:32Z)
Streaming Sparse Linear Regression [1.8707139489039097]
本稿では,データポイントが逐次到着したときのストリーミングデータを解析する新しいオンライン疎線形回帰フレームワークを提案する。提案手法はメモリ効率が高く,厳密な制約付き凸性仮定を必要とする。
論文参考訳（メタデータ） (2022-11-11T07:31:55Z)
The Projected Covariance Measure for assumption-lean variable significance testing [3.8936058127056357]
単純だが一般的なアプローチは、線形モデルを指定し、次に$X$の回帰係数が 0 でないかどうかをテストすることである。条件付き平均独立性のモデルフリーなnullをテストする問題、すなわち条件付き平均の$Y$$$X$と$Z$は$X$に依存しない。本稿では,加法モデルやランダムフォレストなど,柔軟な非パラメトリックあるいは機械学習手法を活用可能な,シンプルで汎用的なフレームワークを提案する。
論文参考訳（メタデータ） (2022-11-03T17:55:50Z)
Dimension free ridge regression [10.434481202633458]
我々は、リッジ回帰のバイアスとばらつきの観点から、すなわちデータ上のリッジ回帰を再考し、等価なシーケンスモデルのバイアスとばらつきの観点から、リッジ回帰のバイアスとばらつきを考察する。新しい応用として、定期的に変化するスペクトルを持つヒルベルト共変量に対して、完全に明示的で鋭い尾根回帰特性を得る。
論文参考訳（メタデータ） (2022-10-16T16:01:05Z)
Easy Differentially Private Linear Regression [16.325734286930764]
本研究では,指数関数機構を用いて,非プライベート回帰モデルの集合からタキー深度の高いモデルを選択するアルゴリズムについて検討する。このアルゴリズムは、データリッチな設定において、強い経験的性能を得る。
論文参考訳（メタデータ） (2022-08-15T17:42:27Z)
$p$-Generalized Probit Regression and Scalable Maximum Likelihood Estimation via Sketching and Coresets [74.37849422071206]
本稿では, 2次応答に対する一般化線形モデルである,$p$一般化プロビット回帰モデルについて検討する。 p$の一般化されたプロビット回帰に対する最大可能性推定器は、大容量データ上で$(1+varepsilon)$の係数まで効率的に近似できることを示す。
論文参考訳（メタデータ） (2022-03-25T10:54:41Z)
Statistical Query Lower Bounds for List-Decodable Linear Regression [55.06171096484622]
本稿では,リスト復号化可能な線形回帰問題について考察する。我々の主な成果は、この問題に対して$dmathrmpoly (1/alpha)$の統計的クエリ(SQ)の低いバウンダリである。
論文参考訳（メタデータ） (2021-06-17T17:45:21Z)
SLOE: A Faster Method for Statistical Inference in High-Dimensional Logistic Regression [68.66245730450915]
実用データセットに対する予測の偏見を回避し、頻繁な不確実性を推定する改善された手法を開発している。私たちの主な貢献は、推定と推論の計算時間をマグニチュードの順序で短縮する収束保証付き信号強度の推定器SLOEです。
論文参考訳（メタデータ） (2021-03-23T17:48:56Z)
Online nonparametric regression with Sobolev kernels [99.12817345416846]
我々は、ソボレフ空間のクラス上の後悔の上限を$W_pbeta(mathcalX)$, $pgeq 2, beta>fracdp$ とする。上界は minimax regret analysis で支えられ、$beta> fracd2$ または $p=infty$ の場合、これらの値は(本質的に)最適である。
論文参考訳（メタデータ） (2021-02-06T15:05:14Z)
Outlier-robust sparse/low-rank least-squares regression and robust matrix completion [1.0878040851637998]
ヘテロジニアス雑音を伴う統計的学習フレームワークにおける高次元最小二乗回帰について検討する。また, 製品プロセスの新たな応用に基づいて, 行列分解を伴う新しいトレーサリグレス理論を提案する。
論文参考訳（メタデータ） (2020-12-12T07:42:47Z)
Conditional Uncorrelation and Efficient Non-approximate Subset Selection in Sparse Regression [72.84177488527398]
相関性の観点からスパース回帰を考察し,条件付き非相関式を提案する。提案手法により、計算複雑性は、スパース回帰における各候補部分集合に対して$O(frac16k3+mk2+mkd)$から$O(frac16k3+frac12mk2)$に削減される。
論文参考訳（メタデータ） (2020-09-08T20:32:26Z)
Truncated Linear Regression in High Dimensions [26.41623833920794]
truncated linear regression において、従属変数 $(A_i, y_i)_i$ は $y_i= A_irm T cdot x* + eta_i$ は固定された未知の興味ベクトルである。目標は、$A_i$とノイズ分布に関するいくつかの好ましい条件の下で$x*$を回復することである。我々は、$k$-sparse $n$-dimensional vectors $x*$ from $m$ truncated sample。
論文参考訳（メタデータ） (2020-07-29T00:31:34Z)
Optimal Robust Linear Regression in Nearly Linear Time [97.11565882347772]
学習者が生成モデル$Y = langle X,w* rangle + epsilon$から$n$のサンプルにアクセスできるような高次元頑健な線形回帰問題について検討する。 i) $X$ is L4-L2 hypercontractive, $mathbbE [XXtop]$ has bounded condition number and $epsilon$ has bounded variance, (ii) $X$ is sub-Gaussian with identity second moment and $epsilon$ is
論文参考訳（メタデータ） (2020-07-16T06:44:44Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。