論文の概要: Mayfly: Private Aggregate Insights from Ephemeral Streams of On-Device User Data
- arxiv url: http://arxiv.org/abs/2412.07962v1
- Date: Tue, 10 Dec 2024 22:58:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-12 14:00:34.829876
- Title: Mayfly: Private Aggregate Insights from Ephemeral Streams of On-Device User Data
- Title(参考訳): Mayfly: デバイス上のユーザデータの一時的なストリームからのプライベートアグリゲートインサイト
- Authors: Christopher Bian, Albert Cheu, Stanislav Chiknavaryan, Zoe Gong, Marco Gruteser, Oliver Guinan, Yannis Guzman, Peter Kairouz, Artem Lagzdin, Ryan McKenna, Grace Ni, Edo Roth, Maya Spivak, Timon Van Overveldt, Ren Yi,
- Abstract要約: Mayflyは、センシティブなユーザデータの集中的な永続化なしに、デバイス上の一時的なデータストリーム上の集約クエリを可能にする、フェデレーション付き分析アプローチである。
厳格なデータユーティリティ要件を満たしながら、デバイス毎の1週間のDP$varepsilon = 2$で、5億以上のデバイスで400万以上の統計を計算した。
- 参考スコア(独自算出の注目度): 14.347589497851265
- License:
- Abstract: This paper introduces Mayfly, a federated analytics approach enabling aggregate queries over ephemeral on-device data streams without central persistence of sensitive user data. Mayfly minimizes data via on-device windowing and contribution bounding through SQL-programmability, anonymizes user data via streaming differential privacy (DP), and mandates immediate in-memory cross-device aggregation on the server -- ensuring only privatized aggregates are revealed to data analysts. Deployed for a sustainability use case estimating transportation carbon emissions from private location data, Mayfly computed over 4 million statistics across more than 500 million devices with a per-device, per-week DP $\varepsilon = 2$ while meeting strict data utility requirements. To achieve this, we designed a new DP mechanism for Group-By-Sum workloads leveraging statistical properties of location data, with potential applicability to other domains.
- Abstract(参考訳): 本稿では,デバイス上の一時的データストリーム上のクエリを,センシティブなユーザデータの集中的な永続化なしに集約可能な,フェデレーション付き分析手法であるMayflyを紹介する。
Mayflyは、SQLプログラム可能性を通じてバウンディングされるデバイス上のウィンドウとコントリビューションによるデータの最小化、ストリーミングディファレンシャルプライバシ(DP)によるユーザデータの匿名化、サーバ上の即時インメモリクロスデバイスアグリゲーションの委任 -- データアナリストへのプライベートアグリゲーションのみの開示を保証する。
プライベートロケーションデータから輸送炭素排出量を推定するサステナビリティユースケースのために、Mayflyは5億以上のデバイスに対して、厳密なデータユーティリティ要件を満たしながらデバイス毎のDP$\varepsilon = 2$で400万以上の統計を計算した。
そこで我々は,他の領域に適用可能な位置データの統計特性を活用するグループバイサムワークロードのための新しいDP機構を設計した。
関連論文リスト
- PeFAD: A Parameter-Efficient Federated Framework for Time Series Anomaly Detection [51.20479454379662]
私たちはaを提案します。
フェデレートされた異常検出フレームワークであるPeFADは、プライバシーの懸念が高まっている。
我々は、4つの実際のデータセットに対して広範な評価を行い、PeFADは既存の最先端ベースラインを最大28.74%上回っている。
論文 参考訳(メタデータ) (2024-06-04T13:51:08Z) - Geometry-Aware Instrumental Variable Regression [56.16884466478886]
本稿では,データ導出情報によるデータ多様体の幾何を考慮した移動型IV推定器を提案する。
本手法のプラグイン・アンド・プレイ実装は,標準設定で関連する推定器と同等に動作する。
論文 参考訳(メタデータ) (2024-05-19T17:49:33Z) - Privacy Amplification for the Gaussian Mechanism via Bounded Support [64.86780616066575]
インスタンスごとの差分プライバシー(pDP)やフィッシャー情報損失(FIL)といったデータ依存のプライバシ会計フレームワークは、固定されたトレーニングデータセット内の個人に対してきめ細かいプライバシー保証を提供する。
本稿では,データ依存会計下でのプライバシ保証を向上することを示すとともに,バウンドサポートによるガウス機構の簡単な修正を提案する。
論文 参考訳(メタデータ) (2024-03-07T21:22:07Z) - PrivAgE: A Toolchain for Privacy-Preserving Distributed Aggregation on Edge-Devices [0.5216865930622505]
ローカルデータの分散したプライバシ保護アグリゲーションのためのPrivAgEというツールチェーンを提案する。
分散アグリゲーションはセキュアな和に基づいており、同時に差分プライバシーの概念を満たす。
ヒストグラムの総和を分散クラスタリングに拡張することにより,ツールチェーンの柔軟性を実証する。
論文 参考訳(メタデータ) (2023-09-21T20:55:29Z) - Probing the Transition to Dataset-Level Privacy in ML Models Using an
Output-Specific and Data-Resolved Privacy Profile [23.05994842923702]
差分プライバシーメカニズムを用いてデータセットでトレーニングされたモデルが、近隣のデータセットでトレーニングされた結果の分布によってカバーされる範囲を定量化するプライバシー指標について検討する。
プライバシプロファイルは、近隣のディストリビューションで発生する不明瞭性への観察された遷移を、$epsilon$の減少として調査するために使用できることを示す。
論文 参考訳(メタデータ) (2023-06-27T20:39:07Z) - PS-FedGAN: An Efficient Federated Learning Framework Based on Partially
Shared Generative Adversarial Networks For Data Privacy [56.347786940414935]
分散計算のための効果的な学習パラダイムとして、フェデレートラーニング(FL)が登場した。
本研究は,部分的なGANモデル共有のみを必要とする新しいFLフレームワークを提案する。
PS-FedGANと名付けられたこの新しいフレームワークは、異種データ分散に対処するためのGANリリースおよびトレーニングメカニズムを強化する。
論文 参考訳(メタデータ) (2023-05-19T05:39:40Z) - Membership Inference Attacks against Synthetic Data through Overfitting
Detection [84.02632160692995]
我々は、攻撃者が基礎となるデータ分布についてある程度の知識を持っていると仮定する現実的なMIA設定について論じる。
生成モデルの局所的なオーバーフィッティングをターゲットとして,メンバシップを推論することを目的とした密度ベースMIAモデルであるDOMIASを提案する。
論文 参考訳(メタデータ) (2023-02-24T11:27:39Z) - DP2-Pub: Differentially Private High-Dimensional Data Publication with
Invariant Post Randomization [58.155151571362914]
本稿では,2つのフェーズで動作する差分プライベートな高次元データパブリッシング機構(DP2-Pub)を提案する。
属性をクラスタ内凝集度の高い低次元クラスタに分割し、クラスタ間の結合度を低くすることで、適切なプライバシ予算を得ることができる。
また、DP2-Pubメカニズムを、ローカルの差分プライバシーを満たす半正直なサーバでシナリオに拡張します。
論文 参考訳(メタデータ) (2022-08-24T17:52:43Z) - Towards Sparse Federated Analytics: Location Heatmaps under Distributed
Differential Privacy with Secure Aggregation [15.569382274788234]
我々は、数百万のユーザデバイスから分散化されたデータにまたがって、位置情報のヒートマップをプライベートに生成するスケーラブルなアルゴリズムを設計する。
データの正確性を維持しつつ、ユーザのデバイス上でのリソース消費を最小限に抑えながら、データがサービスプロバイダに表示される前に、差分プライバシを確保することを目的としている。
論文 参考訳(メタデータ) (2021-11-03T17:19:05Z) - Generating private data with user customization [9.415164800448853]
モバイルデバイスは大量のデータを生成、保存し、機械学習モデルを強化することができる。
しかし、このデータには、データのリリースを防止するデータ所有者特有のプライベート情報が含まれている可能性がある。
有用な情報を保持しつつ、ユーザ固有のプライベート情報とデータとの相関を小さくしたい。
論文 参考訳(メタデータ) (2020-12-02T19:13:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。