論文の概要: Differential privacy and robust statistics in high dimensions
- arxiv url: http://arxiv.org/abs/2111.06578v1
- Date: Fri, 12 Nov 2021 06:36:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-15 13:46:54.791566
- Title: Differential privacy and robust statistics in high dimensions
- Title(参考訳): 高次元における微分プライバシーとロバスト統計
- Authors: Xiyang Liu, Weihao Kong, Sewoong Oh
- Abstract要約: 高次元Propose-Test-Release (HPTR) は指数的メカニズム、頑健な統計、Propose-Test-Release メカニズムという3つの重要なコンポーネントの上に構築されている。
本論文では,HPTRが複数のシナリオで最適サンプル複雑性をほぼ達成していることを示す。
- 参考スコア(独自算出の注目度): 49.50869296871643
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce a universal framework for characterizing the statistical
efficiency of a statistical estimation problem with differential privacy
guarantees. Our framework, which we call High-dimensional Propose-Test-Release
(HPTR), builds upon three crucial components: the exponential mechanism, robust
statistics, and the Propose-Test-Release mechanism. Gluing all these together
is the concept of resilience, which is central to robust statistical
estimation. Resilience guides the design of the algorithm, the sensitivity
analysis, and the success probability analysis of the test step in
Propose-Test-Release. The key insight is that if we design an exponential
mechanism that accesses the data only via one-dimensional robust statistics,
then the resulting local sensitivity can be dramatically reduced. Using
resilience, we can provide tight local sensitivity bounds. These tight bounds
readily translate into near-optimal utility guarantees in several cases. We
give a general recipe for applying HPTR to a given instance of a statistical
estimation problem and demonstrate it on canonical problems of mean estimation,
linear regression, covariance estimation, and principal component analysis. We
introduce a general utility analysis technique that proves that HPTR nearly
achieves the optimal sample complexity under several scenarios studied in the
literature.
- Abstract(参考訳): 本稿では,差分プライバシー保証を伴う統計的推定問題の統計的効率を特徴付ける普遍的な枠組みを提案する。
高次元Propose-Test-Release (HPTR) と呼ばれる我々のフレームワークは、指数的メカニズム、頑健な統計、Propose-Test-Releaseメカニズムという3つの重要なコンポーネントの上に構築されている。
これらすべてを結合することはレジリエンスの概念であり、ロバストな統計推定の中心である。
レジリエンスは、アルゴリズムの設計、感度分析、およびPropose-Test-Releaseにおけるテストステップの成功確率分析を導く。
鍵となる洞察は、もし1次元のロバスト統計のみを通してデータにアクセスする指数的なメカニズムを設計すれば、結果の局所感度を劇的に低減できるということである。
レジリエンスを利用することで、緊密な局所感度境界を提供できる。
これらの密接な境界は、しばしば最適に近い公益保証に容易に変換される。
我々は,HPTRを統計的推定問題の特定の事例に適用するための一般的なレシピを示し,平均推定,線形回帰,共分散推定,主成分分析の正準問題について示す。
そこで本研究では,HPTRが最適サンプル複雑性をほぼ達成可能であることを示す汎用ユーティリティ解析手法を提案する。
関連論文リスト
- Statistical Inference for Temporal Difference Learning with Linear Function Approximation [62.69448336714418]
時間差差(TD)学習は、おそらく政策評価に最も広く使用されるものであり、この目的の自然な枠組みとして機能する。
本稿では,Polyak-Ruppert平均化と線形関数近似によるTD学習の整合性について検討し,既存の結果よりも3つの重要な改善点を得た。
論文 参考訳(メタデータ) (2024-10-21T15:34:44Z) - Stratified Prediction-Powered Inference for Hybrid Language Model Evaluation [62.2436697657307]
予測駆動推論(英: Prediction-powered Inference, PPI)は、人間ラベル付き限られたデータに基づいて統計的推定を改善する手法である。
我々はStratPPI(Stratified Prediction-Powered Inference)という手法を提案する。
単純なデータ階層化戦略を用いることで,基礎的なPPI推定精度を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2024-06-06T17:37:39Z) - Uncertainty quantification in metric spaces [3.637162892228131]
本稿では、応答が分離可能な距離空間で値を取る回帰モデルのための新しい不確実性定量化フレームワークを提案する。
提案アルゴリズムは,大規模データセットを効率的に処理し,使用する予測ベースモデルに依存しない。
論文 参考訳(メタデータ) (2024-05-08T15:06:02Z) - Gaining Outlier Resistance with Progressive Quantiles: Fast Algorithms
and Theoretical Studies [1.6457778420360534]
任意の損失関数を強固化するために, 外部抵抗推定の枠組みを導入する。
通常のデータセットでは、データ再見積の回数を大幅に削減できるような、開始点の要件を緩和する新しい手法が提案されている。
得られた推定器は、必ずしも大域的でも大域的でもなくても、両方の低次元において最適性を楽しむことができる。
論文 参考訳(メタデータ) (2021-12-15T20:35:21Z) - Robust High-Dimensional Regression with Coefficient Thresholding and its
Application to Imaging Data Analysis [7.640041402805495]
実世界の画像データにおいて、複雑な依存と可能な外れ値の両方が存在する場合、高次元データを解析するための統計的手法を開発することが重要である。
論文 参考訳(メタデータ) (2021-09-30T05:29:54Z) - Heavy-tailed Streaming Statistical Estimation [58.70341336199497]
ストリーミング$p$のサンプルから重み付き統計推定の課題を考察する。
そこで我々は,傾きの雑音に対して,よりニュアンスな条件下での傾きの傾きの低下を設計し,より詳細な解析を行う。
論文 参考訳(メタデータ) (2021-08-25T21:30:27Z) - Distributionally Robust Learning [11.916893752969429]
本書は,データの摂動に頑健な包括的統計学習フレームワークを開発する。
各問題に対する引き込み可能なDRO緩和が導出され、境界と正規化の間の接続が確立される。
理論以外にも、数値実験や、合成データと実データを用いたケーススタディも含んでいる。
論文 参考訳(メタデータ) (2021-08-20T04:14:18Z) - SAMBA: Safe Model-Based & Active Reinforcement Learning [59.01424351231993]
SAMBAは、確率論的モデリング、情報理論、統計学といった側面を組み合わせた安全な強化学習のためのフレームワークである。
我々は,低次元および高次元の状態表現を含む安全な力学系ベンチマークを用いて,アルゴリズムの評価を行った。
アクティブなメトリクスと安全性の制約を詳細に分析することで,フレームワークの有効性を直感的に評価する。
論文 参考訳(メタデータ) (2020-06-12T10:40:46Z) - Instability, Computational Efficiency and Statistical Accuracy [101.32305022521024]
我々は,人口レベルでのアルゴリズムの決定論的収束率と,$n$サンプルに基づく経験的対象に適用した場合の(不安定性)の間の相互作用に基づいて,統計的精度を得るフレームワークを開発する。
本稿では,ガウス混合推定,非線形回帰モデル,情報的非応答モデルなど,いくつかの具体的なモデルに対する一般結果の応用について述べる。
論文 参考訳(メタデータ) (2020-05-22T22:30:52Z) - Convolutional Neural Networks as Summary Statistics for Approximate
Bayesian Computation [0.0]
本稿では,時間応答の情報的要約統計を自動学習する畳み込みニューラルネットワークアーキテクチャを提案する。
提案するネットワークは,ABC推論における前処理ステップの統計選択問題を効果的に回避できることを示す。
論文 参考訳(メタデータ) (2020-01-31T10:46:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。