論文の概要: Private Sequential Hypothesis Testing for Statisticians: Privacy, Error
Rates, and Sample Size
- arxiv url: http://arxiv.org/abs/2204.04597v1
- Date: Sun, 10 Apr 2022 04:15:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-12 15:59:37.696248
- Title: Private Sequential Hypothesis Testing for Statisticians: Privacy, Error
Rates, and Sample Size
- Title(参考訳): 統計学者のためのプライベートシークエンシャル仮説テスト:プライバシ、エラー率、サンプルサイズ
- Authors: Wanrong Zhang, Yajun Mei, Rachel Cummings
- Abstract要約: 我々は、Renyi差分プライバシーとして知られる、差分プライバシーのわずかな変種の下で、シーケンシャル仮説テスト問題を研究する。
我々は,Wald's Sequential Probability Ratio Test (SPRT)に基づく新たなプライベートアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 24.149533870085175
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The sequential hypothesis testing problem is a class of statistical analyses
where the sample size is not fixed in advance. Instead, the decision-process
takes in new observations sequentially to make real-time decisions for testing
an alternative hypothesis against a null hypothesis until some stopping
criterion is satisfied. In many common applications of sequential hypothesis
testing, the data can be highly sensitive and may require privacy protection;
for example, sequential hypothesis testing is used in clinical trials, where
doctors sequentially collect data from patients and must determine when to stop
recruiting patients and whether the treatment is effective. The field of
differential privacy has been developed to offer data analysis tools with
strong privacy guarantees, and has been commonly applied to machine learning
and statistical tasks.
In this work, we study the sequential hypothesis testing problem under a
slight variant of differential privacy, known as Renyi differential privacy. We
present a new private algorithm based on Wald's Sequential Probability Ratio
Test (SPRT) that also gives strong theoretical privacy guarantees. We provide
theoretical analysis on statistical performance measured by Type I and Type II
error as well as the expected sample size. We also empirically validate our
theoretical results on several synthetic databases, showing that our algorithms
also perform well in practice. Unlike previous work in private hypothesis
testing that focused only on the classical fixed sample setting, our results in
the sequential setting allow a conclusion to be reached much earlier, and thus
saving the cost of collecting additional samples.
- Abstract(参考訳): 逐次仮説テスト問題は、サンプルサイズが事前に固定されていない統計分析のクラスである。
代わりに、決定プロセスは、ある停止基準が満たされるまで、代替仮説をヌル仮説に対してテストするためのリアルタイムな決定を行うために、順次新しい観察を行う。
シーケンシャル仮説テストの多くの一般的な応用において、データは高度に敏感であり、プライバシー保護を必要とする可能性がある。例えば、シーケンシャル仮説テストは臨床試験で使用されており、医師は患者からのデータを順次収集し、いつ患者をリクルートし、治療が有効かどうかを決定する必要がある。
差分プライバシーの分野は、強力なプライバシー保証を備えたデータ分析ツールを提供するために開発され、マシンラーニングや統計処理に広く適用されてきた。
本研究では,Renyi差分プライバシ(差分プライバシ)と呼ばれる,わずかに異なる差分プライバシの下での逐次仮説テスト問題について検討する。
我々は,Wald's Sequential Probability Ratio Test (SPRT)に基づく新たなプライベートアルゴリズムを提案する。
我々は,I型とII型の誤差で測定された統計的性能と,期待される標本サイズに関する理論的解析を行った。
また、いくつかの合成データベース上で理論結果を実証的に検証し、我々のアルゴリズムが実際によく動作することを示す。
古典的な固定的なサンプル設定のみに焦点を当てたこれまでのプライベート仮説テストと異なり、シーケンシャルな設定の結果として結論がより早く到達し、追加のサンプルを収集するコストが削減される。
関連論文リスト
- Differentially private Bayesian tests [1.3127313002783776]
本稿では,原理的データ生成機構の下で自然に発生する,偏微分プライベートなベイズ仮説テストフレームワークを提案する。
広く使われているテスト統計に基づいて、偏ってプライベートなベイズ因子に着目し、完全なデータ生成機構をモデル化する必要性を回避する。
論文 参考訳(メタデータ) (2024-01-27T21:07:11Z) - Differentially Private Permutation Tests: Applications to Kernel Methods [7.596498528060537]
差分プライバシーは、プライバシー保護のための厳格な枠組みとして登場し、学術界と産業界の両方で広く認知されている。
本稿では,差分プライベートな置換テストを導入することにより,仮説テストの文脈における懸念を軽減することを目的とする。
提案フレームワークは、従来の非プライベートな置換試験をプライベートな設定に拡張し、有限サンプルの妥当性と差分プライバシーの両方を厳密な方法で維持する。
論文 参考訳(メタデータ) (2023-10-29T15:13:36Z) - Conditional Density Estimations from Privacy-Protected Data [0.0]
プライバシ保護されたデータセットからのシミュレーションに基づく推論手法を提案する。
本稿では,感染性疾患モデルと通常の線形回帰モデルに基づく個別時系列データについて述べる。
論文 参考訳(メタデータ) (2023-10-19T14:34:17Z) - Sequential Predictive Two-Sample and Independence Testing [114.4130718687858]
逐次的非パラメトリック2サンプルテストと独立テストの問題点について検討する。
私たちは賭けによる(非パラメトリックな)テストの原則に基づいています。
論文 参考訳(メタデータ) (2023-04-29T01:30:33Z) - Sequential Kernelized Independence Testing [101.22966794822084]
我々は、カーネル化依存度にインスパイアされたシーケンシャルなカーネル化独立試験を設計する。
シミュレーションデータと実データの両方にアプローチのパワーを実証する。
論文 参考訳(メタデータ) (2022-12-14T18:08:42Z) - Statistical and Computational Phase Transitions in Group Testing [73.55361918807883]
本研究の目的は、希少な疾患を患っているk人の集団を同定することである。
個々人のテストを割り当てるための2つの異なる単純なランダムな手順を考える。
論文 参考訳(メタデータ) (2022-06-15T16:38:50Z) - Conformal prediction for the design problem [72.14982816083297]
機械学習の現実的な展開では、次にテストすべきデータを選択するために予測アルゴリズムを使用します。
このような設定では、トレーニングデータとテストデータの間には、異なるタイプの分散シフトがある。
このような環境で予測の不確実性を定量化する手法を提案する。
論文 参考訳(メタデータ) (2022-02-08T02:59:12Z) - Tracking disease outbreaks from sparse data with Bayesian inference [55.82986443159948]
新型コロナウイルス(COVID-19)のパンデミックは、感染発生時の感染率を推定する新たな動機を与える。
標準的な手法は、より細かいスケールで共通する部分的な観測可能性とスパースなデータに対応するのに苦労する。
原理的に部分観測可能なベイズ的枠組みを提案する。
論文 参考訳(メタデータ) (2020-09-12T20:37:33Z) - Balance-Subsampled Stable Prediction [55.13512328954456]
本稿では, 分数分解設計理論に基づく新しいバランスサブサンプル安定予測法を提案する。
設計理論解析により,提案手法は分布シフトによって誘導される予測器間の共起効果を低減できることを示した。
合成および実世界の両方のデータセットに関する数値実験により、BSSPアルゴリズムは未知のテストデータ間で安定した予測を行うためのベースライン法を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2020-06-08T07:01:38Z) - PAPRIKA: Private Online False Discovery Rate Control [27.698099204682105]
サンプルの差分プライバシーの制約の下で, 仮説テストにおけるFalse Discovery Rate (FDR) の制御について検討した。
我々は、非プライベートなオンラインFDR制御における最先端の結果に基づく新しいプライベートアルゴリズムを提供する。
論文 参考訳(メタデータ) (2020-02-27T18:42:23Z) - Asymptotic Validity and Finite-Sample Properties of Approximate Randomization Tests [2.28438857884398]
我々の理論的な重要な貢献は、ノイズレスデータを用いた近似ランダム化テストのサイズと元のランダム化テストのサイズとの差に非漸近的境界を持つことである。
線形回帰における有意性のテストを含むいくつかの例を通して、我々の理論を解説する。
論文 参考訳(メタデータ) (2019-08-12T16:09:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。