論文の概要: Augmented Shuffle Differential Privacy Protocols for Large-Domain Categorical and Key-Value Data
- arxiv url: http://arxiv.org/abs/2509.02004v1
- Date: Tue, 02 Sep 2025 06:40:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.927923
- Title: Augmented Shuffle Differential Privacy Protocols for Large-Domain Categorical and Key-Value Data
- Title(参考訳): 大規模ドメインカテゴリおよびキーバリューデータのための拡張シャッフル微分プライバシープロトコル
- Authors: Takao Murakami, Yuichi Sei, Reo Eriguchi,
- Abstract要約: Shuffle DPプロトコルは、分散システムのデータをランダムにシャッフルするシャッフルを導入することによって、高精度でプライバシを提供する。
ほとんどのシャッフルDPプロトコルは、データコレクタとユーザによる共謀攻撃とデータ中毒攻撃の2つの攻撃に対して脆弱である。
FME(Filtering-with-Multiple-Encryption)プロトコルと呼ばれる新しい拡張シャッフルDPプロトコルを導入する。
- 参考スコア(独自算出の注目度): 6.69087470775851
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Shuffle DP (Differential Privacy) protocols provide high accuracy and privacy by introducing a shuffler who randomly shuffles data in a distributed system. However, most shuffle DP protocols are vulnerable to two attacks: collusion attacks by the data collector and users and data poisoning attacks. A recent study addresses this issue by introducing an augmented shuffle DP protocol, where users do not add noise and the shuffler performs random sampling and dummy data addition. However, it focuses on frequency estimation over categorical data with a small domain and cannot be applied to a large domain due to prohibitively high communication and computational costs. In this paper, we fill this gap by introducing a novel augmented shuffle DP protocol called the FME (Filtering-with-Multiple-Encryption) protocol. Our FME protocol uses a hash function to filter out unpopular items and then accurately calculates frequencies for popular items. To perform this within one round of interaction between users and the shuffler, our protocol carefully communicates within a system using multiple encryption. We also apply our FME protocol to more advanced KV (Key-Value) statistics estimation with an additional technique to reduce bias. For both categorical and KV data, we prove that our protocol provides computational DP, high robustness to the above two attacks, accuracy, and efficiency. We show the effectiveness of our proposals through comparisons with twelve existing protocols.
- Abstract(参考訳): Shuffle DP(Differential Privacy)プロトコルは、分散システムでランダムにシャッフルするシャッフルを導入することによって、高精度でプライバシを提供する。
しかし、ほとんどのシャッフルDPプロトコルは、データコレクタとユーザによる共謀攻撃とデータ中毒攻撃の2つの攻撃に対して脆弱である。
最近の研究では、ユーザがノイズを加えず、シャッフルがランダムサンプリングやダミーデータの追加を行う拡張シャッフルDPプロトコルを導入することでこの問題に対処している。
しかし、これは小領域のカテゴリデータよりも周波数推定に重点を置いており、通信コストや計算コストが極端に高いため、大領域には適用できない。
本稿では,FME(Filtering-with-Multiple-Encryption)プロトコルと呼ばれる拡張シャッフルDPプロトコルを導入することで,このギャップを埋める。
我々のFMEプロトコルはハッシュ関数を用いて不人気アイテムをフィルタリングし、人気アイテムの周波数を正確に計算する。
ユーザとシャフラー間の1ラウンドのインタラクションでこれを実行するため,本プロトコルは複数の暗号を用いてシステム内で慎重に通信する。
また,より高度なKV(Key-Value)統計推定にFMEプロトコルを適用し,バイアス低減のための追加手法を提案する。
カテゴリデータとKVデータの両方に対して、このプロトコルが計算DPを提供し、上記の2つの攻撃に対して高いロバスト性、精度、効率を提供することを示す。
提案手法を既存の12のプロトコルと比較し,提案手法の有効性を示す。
関連論文リスト
- Benchmarking Fraud Detectors on Private Graph Data [70.4654745317714]
現在、多くの種類の不正は、グラフ上で動く自動検出アルゴリズムによって部分的に管理されている。
データ保有者が不正検知器の開発を第三者にアウトソースしようとするシナリオを考察する。
サードパーティは、不正検出をデータ保持者に送信し、これらのアルゴリズムをプライベートデータセットで評価し、その結果を公表する。
本システムに対する現実的なプライバシ攻撃を提案し,評価結果のみに基づいて個人データの匿名化を可能にする。
論文 参考訳(メタデータ) (2025-07-30T03:20:15Z) - Augmented Shuffle Protocols for Accurate and Robust Frequency Estimation under Differential Privacy [4.527947047128005]
本稿では,DPとロバスト性を提供する3つの具体的なプロトコルを提案する。
我々の最初のプロトコルは、二項分布から各項目のダミー値の数を生成する。
第2のプロトコルは,新しいダミー数分布を導入することにより,第1のプロトコルの有用性を大幅に向上させる。
論文 参考訳(メタデータ) (2025-04-10T01:06:05Z) - DMM: Distributed Matrix Mechanism for Differentially-Private Federated Learning Based on Constant-Overhead Linear Secret Resharing [51.336015600778396]
本稿では,ベスト・オブ・ボス・ワールドを実現するための分散行列機構,分散DPのプライバシ向上,行列機構の実用性向上について紹介する。
我々は、異なるトレーニングイテレーションのクライアント委員会間で、一定の通信オーバーヘッドで機密値をセキュアに転送する、新しい暗号プロトコルを用いてこれを実現する。
論文 参考訳(メタデータ) (2024-10-21T16:25:14Z) - Benchmarking Secure Sampling Protocols for Differential Privacy [3.0325535716232404]
微分プライバシ(DP)の2つのよく知られたモデルは、中心モデルと局所モデルである。
近年,分散環境でのセキュアマルチパーティ計算(MPC)によるDPの実現が提案されている。
論文 参考訳(メタデータ) (2024-09-16T19:04:47Z) - Noise Variance Optimization in Differential Privacy: A Game-Theoretic Approach Through Per-Instance Differential Privacy [7.264378254137811]
差分プライバシー(DP)は、個人をターゲットデータセットに含めることによる分布の変化を観察することにより、プライバシー損失を測定することができる。
DPは、AppleやGoogleのような業界巨人の機械学習におけるデータセットの保護において際立っている。
本稿では,PDPを制約として提案し,各データインスタンスのプライバシ損失を測定し,個々のインスタンスに適したノイズを最適化する。
論文 参考訳(メタデータ) (2024-04-24T06:51:16Z) - Data post-processing for the one-way heterodyne protocol under
composable finite-size security [62.997667081978825]
本研究では,実用的連続可変(CV)量子鍵分布プロトコルの性能について検討する。
ヘテロダイン検出を用いたガウス変調コヒーレント状態プロトコルを高信号対雑音比で検討する。
これにより、プロトコルの実践的な実装の性能を調べ、上記のステップに関連付けられたパラメータを最適化することができる。
論文 参考訳(メタデータ) (2022-05-20T12:37:09Z) - Composably secure data processing for Gaussian-modulated continuous
variable quantum key distribution [58.720142291102135]
連続可変量子鍵分布(QKD)は、ボソニックモードの二次構造を用いて、2つのリモートパーティ間の秘密鍵を確立する。
構成可能な有限サイズセキュリティの一般的な設定におけるホモダイン検出プロトコルについて検討する。
特に、ハイレート(非バイナリ)の低密度パリティチェックコードを使用する必要のあるハイシグネチャ・ツー・ノイズ・システマを解析する。
論文 参考訳(メタデータ) (2021-03-30T18:02:55Z) - On the Practicality of Differential Privacy in Federated Learning by
Tuning Iteration Times [51.61278695776151]
フェデレートラーニング(FL)は、分散クライアント間で機械学習モデルを協調的にトレーニングする際のプライバシ保護でよく知られている。
最近の研究では、naive flは勾配リーク攻撃の影響を受けやすいことが指摘されている。
ディファレンシャルプライバシ(dp)は、勾配漏洩攻撃を防御するための有望な対策として現れる。
論文 参考訳(メタデータ) (2021-01-11T19:43:12Z) - A One-Pass Private Sketch for Most Machine Learning Tasks [48.17461258268463]
差別化プライバシ(DP)は、正式な証明可能な保証を通じて、プライバシとユーティリティのトレードオフを説明する魅力的なプライバシ定義である。
本稿では,回帰,分類,密度推定など,多数の機械学習タスクをサポートするプライベートスケッチを提案する。
このスケッチは,局所性に敏感なハッシュをインデックス化して,効率的なワンパスアルゴリズムで構築したランダムな一致テーブルで構成されている。
論文 参考訳(メタデータ) (2020-06-16T17:47:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。