論文の概要: Differentially Private Synthetic Data Release for Topics API Outputs
- arxiv url: http://arxiv.org/abs/2506.23855v1
- Date: Mon, 30 Jun 2025 13:46:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:54.085445
- Title: Differentially Private Synthetic Data Release for Topics API Outputs
- Title(参考訳): トピックAPI出力のための異なるプライベートな合成データリリース
- Authors: Travis Dick, Alessandro Epasto, Adel Javanmard, Josh Karlin, Andres Munoz Medina, Vahab Mirrokni, Sergei Vassilvitskii, Peilin Zhong,
- Abstract要約: 当社では,Google ChromeのPrivacy Sandboxの一部として,1つのPrivacy-Preserving Ads API – Topics APIに注目しています。
実トピックAPIデータの再識別リスク特性と密に一致した、微分プライベートなデータセットを生成する。
これにより、外部の研究者がAPIを詳細に分析し、現実的な大規模データセットの事前および将来の作業の再現が可能になります。
- 参考スコア(独自算出の注目度): 63.79476766779742
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The analysis of the privacy properties of Privacy-Preserving Ads APIs is an area of research that has received strong interest from academics, industry, and regulators. Despite this interest, the empirical study of these methods is hindered by the lack of publicly available data. Reliable empirical analysis of the privacy properties of an API, in fact, requires access to a dataset consisting of realistic API outputs; however, privacy concerns prevent the general release of such data to the public. In this work, we develop a novel methodology to construct synthetic API outputs that are simultaneously realistic enough to enable accurate study and provide strong privacy protections. We focus on one Privacy-Preserving Ads APIs: the Topics API, part of Google Chrome's Privacy Sandbox. We developed a methodology to generate a differentially-private dataset that closely matches the re-identification risk properties of the real Topics API data. The use of differential privacy provides strong theoretical bounds on the leakage of private user information from this release. Our methodology is based on first computing a large number of differentially-private statistics describing how output API traces evolve over time. Then, we design a parameterized distribution over sequences of API traces and optimize its parameters so that they closely match the statistics obtained. Finally, we create the synthetic data by drawing from this distribution. Our work is complemented by an open-source release of the anonymized dataset obtained by this methodology. We hope this will enable external researchers to analyze the API in-depth and replicate prior and future work on a realistic large-scale dataset. We believe that this work will contribute to fostering transparency regarding the privacy properties of Privacy-Preserving Ads APIs.
- Abstract(参考訳): プライバシー保護広告APIのプライバシー特性の分析は、学者、業界、規制当局から強い関心を集めてきた研究分野である。
このような関心にもかかわらず、これらの手法の実証的研究は、公開データの欠如によって妨げられている。
実際、APIのプライバシ特性に関する信頼性のある実証分析では、現実的なAPI出力からなるデータセットへのアクセスが必要であるが、プライバシに関する懸念は、そのようなデータを一般に公開することを妨げている。
本研究では,正確な研究と強力なプライバシ保護を実現するために,同時に現実的な合成API出力を構築するための新しい手法を開発する。
当社では,Google ChromeのPrivacy Sandboxの一部として,1つのPrivacy-Preserving Ads API – Topics APIに注目しています。
そこで我々は,実際のトピックスAPIデータの再識別リスク特性と密に一致した,微分プライベートなデータセットを生成する手法を開発した。
差分プライバシーの使用は、このリリースからのプライベートユーザー情報の漏洩に強い理論的拘束力を与える。
提案手法は,出力APIトレースが時間とともにどのように進化するかを記述する,多数の微分プライベートな統計データを最初に計算することに基づいている。
次に,APIトレースのシーケンス上のパラメータ分布を設計し,そのパラメータを最適化することにより,得られた統計値と密に一致させる。
最後に,この分布から合成データを作成する。
本手法により得られた匿名化データセットのオープンソースリリースによって,本研究を補完する。
これにより、外部の研究者がAPIを詳細に分析し、現実的な大規模データセットの事前および将来の作業の再現が可能になります。
この作業は、プライバシ保護広告APIのプライバシー特性に関する透明性向上に寄与すると考えています。
関連論文リスト
- PCEvolve: Private Contrastive Evolution for Synthetic Dataset Generation via Few-Shot Private Data and Generative APIs [39.108700932535754]
プライベート進化(PE)アルゴリズムは拡散モデルAPIを用いて差分プライバシー(DP)合成画像を生成する。
実際には、医療や業界といった専門分野では、ごくわずかのプライベートデータの問題が特に多い。
提案手法は,複数ショットのプライベートデータにおいて,クラス間のコントラスト関係を反復的にマイニングする,新しいAPI支援アルゴリズムであるPrivate Contrastive Evolution (PCEvolve)を提案する。
論文 参考訳(メタデータ) (2025-06-04T13:33:06Z) - On the Differential Privacy and Interactivity of Privacy Sandbox Reports [78.85958224681858]
GoogleのPrivacy Sandboxイニシアチブには、プライバシ保護広告機能を実現するAPIが含まれている。
これらのAPIのプライバシを分析するための抽象モデルを提供し、それらが正式なDP保証を満たすことを示す。
論文 参考訳(メタデータ) (2024-12-22T08:22:57Z) - The Privacy-Utility Trade-off in the Topics API [0.34952465649465553]
我々は、各インターネットユーザに対する再識別リスクと広告会社に提供するユーティリティについて、トピックスAPIを用いて分析する。
将来的なAPI更新のプライバシと実用性を評価するために、容易に適用可能なAPIパラメータのみに依存する理論的結果を提供する。
論文 参考訳(メタデータ) (2024-06-21T17:01:23Z) - A Public and Reproducible Assessment of the Topics API on Real Data [1.1510009152620668]
Topics API for the Webは、サードパーティのクッキーに代わる、Googleのプライバシ向上のためのAPIだ。
以前の作業の結果、ユーティリティとプライバシの両方をトレードオフするトピクスの能力に関する議論が続いている。
本稿では,Topicsがすべてのユーザに対して同じプライバシー保証を提供していない,情報漏洩が時間とともに悪化する,という実データについて述べる。
論文 参考訳(メタデータ) (2024-03-28T17:03:44Z) - Summary Reports Optimization in the Privacy Sandbox Attribution Reporting API [51.00674811394867]
Attribution Reporting APIは、Google Chromeがアトリビューションレポートの基本的な広告機能をサポートするためにデプロイしたものだ。
本稿では,API からの要約報告に対して,コントリビューション予算の配分を最適化する手法を提案する。
論文 参考訳(メタデータ) (2023-11-22T18:45:20Z) - A Unified View of Differentially Private Deep Generative Modeling [60.72161965018005]
プライバシー上の懸念のあるデータには、データアクセスとデータ共有を頻繁に禁止する厳格な規制が伴う。
これらの障害を克服することは、プライバシーに敏感なデータを含む多くの現実世界のアプリケーションシナリオにおいて、技術的進歩の鍵となる。
差分的プライベート(DP)データパブリッシングは、データの衛生化された形式のみを公開する、魅力的なソリューションを提供する。
論文 参考訳(メタデータ) (2023-09-27T14:38:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。