論文の概要: Private Regression via Data-Dependent Sufficient Statistic Perturbation
- arxiv url: http://arxiv.org/abs/2405.15002v1
- Date: Thu, 23 May 2024 19:09:50 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-27 19:17:31.801645
- Title: Private Regression via Data-Dependent Sufficient Statistic Perturbation
- Title(参考訳): データ依存型統計摂動による私的回帰
- Authors: Cecilia Ferrando, Daniel Sheldon,
- Abstract要約: 線形回帰に対するデータ依存型SSPを導入する。
この結果を、十分な統計量で表現できる近似的な目的を開発することにより、ロジスティック回帰に拡張する。
- 参考スコア(独自算出の注目度): 9.58219088613742
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sufficient statistic perturbation (SSP) is a widely used method for differentially private linear regression. SSP adopts a data-independent approach where privacy noise from a simple distribution is added to sufficient statistics. However, sufficient statistics can often be expressed as linear queries and better approximated by data-dependent mechanisms. In this paper we introduce data-dependent SSP for linear regression based on post-processing privately released marginals, and find that it outperforms state-of-the-art data-independent SSP. We extend this result to logistic regression by developing an approximate objective that can be expressed in terms of sufficient statistics, resulting in a novel and highly competitive SSP approach for logistic regression. We also make a connection to synthetic data for machine learning: for models with sufficient statistics, training on synthetic data corresponds to data-dependent SSP, with the overall utility determined by how well the mechanism answers these linear queries.
- Abstract(参考訳): SSP(Sufficient statistic perturbation)は、偏微分線形回帰法として広く用いられている手法である。
SSPは、単純な分布からのプライバシーノイズを十分な統計量に加える、データ非依存のアプローチを採用する。
しかし、十分な統計は、しばしば線形クエリとして表現され、データ依存メカニズムによってよりよく近似される。
本稿では, 線形回帰のためのデータ依存型SSPを導入し, 最新データ非依存型SSPよりも優れていることを示す。
この結果は、十分な統計量で表現できる近似的な目的を発達させることにより、ロジスティック回帰に拡張され、結果として、ロジスティック回帰に対する新しい高い競争力を持つSSPアプローチがもたらされる。
十分な統計を持つモデルでは、合成データのトレーニングはデータ依存のSSPに対応し、そのメカニズムがこれらの線形クエリにどの程度うまく答えるかによって、全体的なユーティリティが決定される。
関連論文リスト
- Stratified Prediction-Powered Inference for Hybrid Language Model Evaluation [62.2436697657307]
予測駆動推論(英: Prediction-powered Inference, PPI)は、人間ラベル付き限られたデータに基づいて統計的推定を改善する手法である。
我々はStratPPI(Stratified Prediction-Powered Inference)という手法を提案する。
単純なデータ階層化戦略を用いることで,基礎的なPPI推定精度を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2024-06-06T17:37:39Z) - Geometry-Aware Instrumental Variable Regression [56.16884466478886]
本稿では,データ導出情報によるデータ多様体の幾何を考慮した移動型IV推定器を提案する。
本手法のプラグイン・アンド・プレイ実装は,標準設定で関連する推定器と同等に動作する。
論文 参考訳(メタデータ) (2024-05-19T17:49:33Z) - Online Tensor Inference [0.0]
従来のオフライン学習は、各計算繰り返しにおける全てのデータの保存と利用を伴い、高次元テンソルデータには実用的ではない。
既存の低ランクテンソル法は、オンラインの方法での統計的推論能力に欠ける。
本手法では,広範囲なメモリ要求を伴わずに効率的なリアルタイムデータ処理を実現するため,グラディエント・Descent (SGD) を用いる。
論文 参考訳(メタデータ) (2023-12-28T16:37:48Z) - Soft Random Sampling: A Theoretical and Empirical Analysis [59.719035355483875]
ソフトランダムサンプリング(SRS)は、大量のデータを扱う際に、効率的なディープニューラルネットワークに対して単純だが効果的なアプローチである。
それは、各エポックに設定された各データセットから、ランダムに置換された均一な速度を選択する。
実世界の産業規模で重要な競争力を持つ、強力で競争力のある戦略であることが示されている。
論文 参考訳(メタデータ) (2023-11-21T17:03:21Z) - Differentially Private Linear Regression with Linked Data [3.9325957466009203]
コンピュータ科学の数学的概念である差分プライバシーは、堅牢なプライバシー保証を提供する上昇するツールである。
最近の研究は、個々の統計および機械学習タスクの微分プライベートバージョンの開発に焦点を当てている。
相関データを用いた線形回帰のための2つの微分プライベートアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-08-01T21:00:19Z) - Perturbation-Assisted Sample Synthesis: A Novel Approach for Uncertainty
Quantification [3.175239447683357]
本稿では、摂動支援サンプル合成(PASS)法により生成された合成データを利用した新しい摂動支援推論(PAI)フレームワークを提案する。
このフレームワークは、複雑なデータシナリオ、特に非構造化データの不確実性定量化に焦点を当てている。
我々は、画像合成、感情語分析、マルチモーダル推論、予測区間の構築など、様々な分野に適用することで、複雑なデータ駆動タスクにおける不確実性定量化を推し進める上で、PAIの有効性を実証する。
論文 参考訳(メタデータ) (2023-05-30T01:01:36Z) - Differentially Private Distributed Bayesian Linear Regression with MCMC [0.966840768820136]
我々は、複数のパーティがデータの一部を保持し、プライバシ保護ノイズにおけるその部分の要約統計を共有できる分散環境について検討する。
線形回帰統計学の要約統計学における有用な分布関係を生かした,個人共用統計学のための新しい生成統計学モデルを構築した。
本研究では,実データとシミュレーションデータの両方について数値計算を行い,提案アルゴリズムが十分に囲む推定と予測を行うことを示す。
論文 参考訳(メタデータ) (2023-01-31T17:27:05Z) - Data Sampling Affects the Complexity of Online SGD over Dependent Data [54.92366535993012]
本研究では,データサンプリング方式の違いが,高依存データに対するオンライン勾配勾配勾配の複雑さにどのように影響するかを示す。
データサンプルのサブサンプリングさえも、高度に依存したデータに対するオンラインSGDの収束を加速することができる。
論文 参考訳(メタデータ) (2022-03-31T07:48:30Z) - SLOE: A Faster Method for Statistical Inference in High-Dimensional
Logistic Regression [68.66245730450915]
実用データセットに対する予測の偏見を回避し、頻繁な不確実性を推定する改善された手法を開発している。
私たちの主な貢献は、推定と推論の計算時間をマグニチュードの順序で短縮する収束保証付き信号強度の推定器SLOEです。
論文 参考訳(メタデータ) (2021-03-23T17:48:56Z) - Learning summary features of time series for likelihood free inference [93.08098361687722]
時系列データから要約機能を自動的に学習するためのデータ駆動型戦略を提案する。
以上の結果から,データから要約的特徴を学習することで,手作りの値に基づいてLFI手法よりも優れる可能性が示唆された。
論文 参考訳(メタデータ) (2020-12-04T19:21:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。