論文の概要: Differentially Private Sketches for Jaccard Similarity Estimation
- arxiv url: http://arxiv.org/abs/2008.08134v1
- Date: Tue, 18 Aug 2020 19:42:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 21:23:51.774334
- Title: Differentially Private Sketches for Jaccard Similarity Estimation
- Title(参考訳): jaccard類似度推定のための微分プライベートスケッチ
- Authors: Martin Aum\"uller and Anders Bourgeat and Jana Schmurr
- Abstract要約: 本稿では,これらのベクトル間のJaccard類似性を効率的に推定できるように,ユーザベクトルを解放する2つの局所微分プライベートアルゴリズムについて述べる。
理論解析は絶対誤差の限界を提供し、実験は、合成および実世界のデータに対するユーティリティとプライバシのトレードオフを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper describes two locally-differential private algorithms for
releasing user vectors such that the Jaccard similarity between these vectors
can be efficiently estimated. The basic building block is the well known
MinHash method. To achieve a privacy-utility trade-off, MinHash is extended in
two ways using variants of Generalized Randomized Response and the Laplace
Mechanism. A theoretical analysis provides bounds on the absolute error and
experiments show the utility-privacy trade-off on synthetic and real-world
data. The paper ends with a critical discussion of related work.
- Abstract(参考訳): 本稿では,これらのベクトル間のJaccard類似性を効率的に推定できるように,ユーザベクトルを解放する2つの局所微分プライベートアルゴリズムについて述べる。
基本的なビルディングブロックは、よく知られたMinHashメソッドである。
プライバシユーティリティのトレードオフを実現するため、MinHashはGeneralized Randomized ResponseとLaplace Mechanismの2つのバリエーションを使用して2つの方法で拡張される。
理論解析は絶対誤差の境界を提供し、実験は合成データと実世界のデータに対するユーティリティ・プライバシーのトレードオフを示す。
論文は関連する仕事に関する批判的な議論で終わる。
関連論文リスト
- Diffsurv: Differentiable sorting for censored time-to-event data [0.3303008003874494]
現在、生存分析における最も一般的なアプローチは、コックスの部分的可能性に基づいている。
我々は、検閲されたタスクを処理するためのDiffsurvと呼ばれる新しい手法を提案する。
実験の結果,Diffsurvは様々なシミュレーションおよび実世界のリスク予測シナリオにおいて,ベースラインの確立に優れていた。
論文 参考訳(メタデータ) (2023-04-26T14:42:31Z) - Scalable Differentially Private Clustering via Hierarchically Separated
Trees [82.69664595378869]
我々は,最大$O(d3/2log n)cdot OPT + O(k d2 log2 n / epsilon2)$,$epsilon$はプライバシ保証であることを示す。
最悪の場合の保証は、最先端のプライベートクラスタリング手法よりも悪いが、提案するアルゴリズムは実用的である。
論文 参考訳(メタデータ) (2022-06-17T09:24:41Z) - C-MinHash: Rigorously Reducing $K$ Permutations to Two [25.356048456005023]
MinHash (Minwise hashing) は、大量のバイナリ (0/1) データにおける Jaccard (resemblance) の類似性を近似するために、ランダムハッシュを生成するための重要かつ実用的なアルゴリズムである。
我々は、bf Circulant MinHash (C-MinHash)を提案する。
論文 参考訳(メタデータ) (2021-09-07T21:06:33Z) - Estimating leverage scores via rank revealing methods and randomization [50.591267188664666]
任意のランクの正方形密度あるいはスパース行列の統計レバレッジスコアを推定するアルゴリズムについて検討した。
提案手法は,高密度およびスパースなランダム化次元性還元変換の合成と階調明細化法を組み合わせることに基づく。
論文 参考訳(メタデータ) (2021-05-23T19:21:55Z) - Oneshot Differentially Private Top-k Selection [23.88111547236874]
我々は、トップ$k$問題の高速、低歪み、および微分プライベートプリミティブを紹介します。
文献の既存手法と比較して、我々のアルゴリズムはカウントにLaplaceノイズを加え、上位の$k$ノイズ数とその推定値を一括してリリースする。
論文 参考訳(メタデータ) (2021-05-18T02:18:01Z) - On InstaHide, Phase Retrieval, and Sparse Matrix Factorization [32.93116534310763]
InstaHideは、分散学習の文脈でプライベートデータセットのセキュリティを保存するためのスキームである。
健全な疑問は、このスキームが証明可能な意味で安全かどうかである。
本研究は, 位相探索の古典的問題に対する, マルチタスク, 欠落データバージョンの平均ケース複雑性と, 非常に微妙な関係があることを示唆する。
論文 参考訳(メタデータ) (2020-11-23T02:47:08Z) - CIMON: Towards High-quality Hash Codes [63.37321228830102]
我々はtextbfComprehensive stextbfImilarity textbfMining と ctextbfOnsistency leartextbfNing (CIMON) という新しい手法を提案する。
まず、グローバルな洗練と類似度統計分布を用いて、信頼性とスムーズなガイダンスを得る。第二に、意味的整合性学習とコントラスト的整合性学習の両方を導入して、乱不変と差別的ハッシュコードの両方を導出する。
論文 参考訳(メタデータ) (2020-10-15T14:47:14Z) - A One-Pass Private Sketch for Most Machine Learning Tasks [48.17461258268463]
差別化プライバシ(DP)は、正式な証明可能な保証を通じて、プライバシとユーティリティのトレードオフを説明する魅力的なプライバシ定義である。
本稿では,回帰,分類,密度推定など,多数の機械学習タスクをサポートするプライベートスケッチを提案する。
このスケッチは,局所性に敏感なハッシュをインデックス化して,効率的なワンパスアルゴリズムで構築したランダムな一致テーブルで構成されている。
論文 参考訳(メタデータ) (2020-06-16T17:47:48Z) - Generative Semantic Hashing Enhanced via Boltzmann Machines [61.688380278649056]
既存の生成ハッシュ法は、主に後部分布の分解形式を仮定する。
本稿では,ボルツマンマシンの分布を検索後部として利用することを提案する。
ハッシュコード内の異なるビット間の相関関係を効果的にモデル化することにより、我々のモデルは大幅な性能向上を達成できることを示す。
論文 参考訳(メタデータ) (2020-06-16T01:23:39Z) - Pairwise Supervised Hashing with Bernoulli Variational Auto-Encoder and
Self-Control Gradient Estimator [62.26981903551382]
バイナリ潜在変数を持つ変分自動エンコーダ(VAE)は、文書検索の精度の観点から最先端のパフォーマンスを提供する。
本稿では、クラス内類似度とクラス間類似度に報いるために、個別潜伏型VAEを用いたペアワイズ損失関数を提案する。
この新しいセマンティックハッシュフレームワークは、最先端技術よりも優れたパフォーマンスを実現する。
論文 参考訳(メタデータ) (2020-05-21T06:11:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。