論文の概要: New Oracle-Efficient Algorithms for Private Synthetic Data Release
- arxiv url: http://arxiv.org/abs/2007.05453v1
- Date: Fri, 10 Jul 2020 15:46:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-11 21:43:48.596080
- Title: New Oracle-Efficient Algorithms for Private Synthetic Data Release
- Title(参考訳): プライベートシンセティックデータリリースのための新しいOracle効率の良いアルゴリズム
- Authors: Giuseppe Vietri, Grace Tian, Mark Bun, Thomas Steinke, Zhiwei Steven
Wu
- Abstract要約: 微分プライベートな合成データを構築するための3つの新しいアルゴリズムを提案する。
アルゴリズムは最悪の場合でも差分プライバシーを満たす。
現状の手法である高次元行列機構 citeMcKennaMHM18 と比較すると,我々のアルゴリズムは大規模作業負荷の精度が向上する。
- 参考スコア(独自算出の注目度): 52.33506193761153
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present three new algorithms for constructing differentially private
synthetic data---a sanitized version of a sensitive dataset that approximately
preserves the answers to a large collection of statistical queries. All three
algorithms are \emph{oracle-efficient} in the sense that they are
computationally efficient when given access to an optimization oracle. Such an
oracle can be implemented using many existing (non-private) optimization tools
such as sophisticated integer program solvers. While the accuracy of the
synthetic data is contingent on the oracle's optimization performance, the
algorithms satisfy differential privacy even in the worst case. For all three
algorithms, we provide theoretical guarantees for both accuracy and privacy.
Through empirical evaluation, we demonstrate that our methods scale well with
both the dimensionality of the data and the number of queries. Compared to the
state-of-the-art method High-Dimensional Matrix Mechanism \cite{McKennaMHM18},
our algorithms provide better accuracy in the large workload and high privacy
regime (corresponding to low privacy loss $\varepsilon$).
- Abstract(参考訳): 本稿では,統計クエリの膨大なコレクションに対する回答をほぼ保存する,センシティブなデータセットのサニタイズ版である,差分プライベートな合成データを構築するための3つの新しいアルゴリズムを提案する。
3つのアルゴリズムはすべて、最適化オラクルへのアクセスが与えられたときに計算効率が良いという意味で、 \emph{oracle- efficient} である。
このようなoracleは、高度な整数プログラムソルバのような既存の(非プライベートな)最適化ツールを使って実装できる。
合成データの精度はオラクルの最適化性能に左右されるが、アルゴリズムは最悪の場合においても差分プライバシーを満たす。
3つのアルゴリズムすべてに対して、正確性とプライバシの両方に関する理論的保証を提供します。
経験的評価により,提案手法がデータ次元とクエリ数の両方において良好に拡張できることを実証した。
最先端の手法であるHigh-dimensional Matrix Mechanism \cite{McKennaMHM18}と比較して、我々のアルゴリズムは大きなワークロードと高いプライバシ体制(プライバシー損失の低い$\varepsilon$に対応する)においてより良い精度を提供する。
関連論文リスト
- A General Online Algorithm for Optimizing Complex Performance Metrics [5.726378955570775]
我々は,バイナリ,マルチクラス,マルチラベルの分類問題において,様々な複雑なパフォーマンス指標を用いて,直接的に使用可能な汎用オンラインアルゴリズムを導入,分析する。
アルゴリズムの更新と予測のルールは、過去のデータを保存することなく、非常にシンプルで計算的に効率的である。
論文 参考訳(メタデータ) (2024-06-20T21:24:47Z) - Decentralized Nonconvex Optimization with Guaranteed Privacy and
Accuracy [34.24521534464185]
プライバシ保護と中立性は、分散化された最適化学習の機密データにおいて難しい2つの問題である。
プライバシー保護と回避の両方を可能にするアルゴリズムを提案する。
このアルゴリズムは通信と計算の両方において効率的である。
論文 参考訳(メタデータ) (2022-12-14T22:36:13Z) - Learning to Hash Robustly, with Guarantees [79.68057056103014]
本稿では,理論的アルゴリズムと本質的に一致する最悪ケース保証を持つハミング空間のためのNSアルゴリズムを設計する。
理論的にも実用的にも、与えられたデータセットに対してアルゴリズムが最適化できる能力を評価する。
我々のアルゴリズムは、MNISTおよびImageNetデータセットに対する最悪のパフォーマンスのクエリを、1.8倍と2.1倍の精度でリコールする。
論文 参考訳(メタデータ) (2021-08-11T20:21:30Z) - Provably Faster Algorithms for Bilevel Optimization [54.83583213812667]
バイレベル最適化は多くの重要な機械学習アプリケーションに広く適用されている。
両レベル最適化のための2つの新しいアルゴリズムを提案する。
両アルゴリズムが$mathcalO(epsilon-1.5)$の複雑さを達成し,既存のアルゴリズムを桁違いに上回っていることを示す。
論文 参考訳(メタデータ) (2021-06-08T21:05:30Z) - Differentially Private Query Release Through Adaptive Projection [19.449593001368193]
我々は,$k$-way マージンのような膨大な統計クエリに対する回答を解放するための新しいアルゴリズムを提案し,実装し,評価する。
我々のアルゴリズムは、単純な摂動を用いて、プライベートデータセット上のクエリに応答するプロジェクションメカニズムの連続緩和を適応的に利用する。
特に,プライバシ予算が小さい場合や,クエリクラスが大きい場合など,既存のアルゴリズムよりも優れていることが判明した。
論文 参考訳(メタデータ) (2021-03-11T12:43:18Z) - Double Coverage with Machine-Learned Advice [100.23487145400833]
オンラインの基本的な$k$-serverの問題を学習強化環境で研究する。
我々のアルゴリズムは任意の k に対してほぼ最適の一貫性-破壊性トレードオフを達成することを示す。
論文 参考訳(メタデータ) (2021-03-02T11:04:33Z) - Towards Optimally Efficient Tree Search with Deep Learning [76.64632985696237]
本稿では,線形モデルから信号整数を推定する古典整数最小二乗問題について検討する。
問題はNPハードであり、信号処理、バイオインフォマティクス、通信、機械学習といった様々な応用でしばしば発生する。
本稿では, 深いニューラルネットワークを用いて, 単純化されたメモリバウンドA*アルゴリズムの最適推定を推定し, HATSアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-01-07T08:00:02Z) - Safeguarded Learned Convex Optimization [106.81731132086851]
解析最適化アルゴリズムは、反復的な方法で問題を確実に解くために手作業で設計することができる。
データ駆動アルゴリズムは、汎用最適化アルゴリズムと同様のイテレーション当たりのコストと、はるかに少ないイテレーションで"L2O"を最適化する。
我々はこれらのアプローチの利点を融合させるSafe-L2Oフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-04T04:01:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。