論文の概要: Blind Targeting: Personalization under Third-Party Privacy Constraints
- arxiv url: http://arxiv.org/abs/2507.05175v1
- Date: Mon, 07 Jul 2025 16:30:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:35.516777
- Title: Blind Targeting: Personalization under Third-Party Privacy Constraints
- Title(参考訳): Blind Targeting: サードパーティのプライバシー制約下でのパーソナライズ
- Authors: Anya Shchetkina,
- Abstract要約: 主要な広告プラットフォームは、広告主の個人レベルのデータへのアクセスを制限することで、最近プライバシー保護を強化した。
本稿では,これらの制限されたプライバシ保護データ環境において,広告主が効果的なターゲティングポリシーを設計できるかどうかについて検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Major advertising platforms recently increased privacy protections by limiting advertisers' access to individual-level data. Instead of providing access to granular raw data, the platforms only allow a limited number of aggregate queries to a dataset, which is further protected by adding differentially private noise. This paper studies whether and how advertisers can design effective targeting policies within these restrictive privacy preserving data environments. To achieve this, I develop a probabilistic machine learning method based on Bayesian optimization, which facilitates dynamic data exploration. Since Bayesian optimization was designed to sample points from a function to find its maximum, it is not applicable to aggregate queries and to targeting. Therefore, I introduce two innovations: (i) integral updating of posteriors which allows to select the best regions of the data to query rather than individual points and (ii) a targeting-aware acquisition function that dynamically selects the most informative regions for the targeting task. I identify the conditions of the dataset and privacy environment that necessitate the use of such a "smart" querying strategy. I apply the strategic querying method to the Criteo AI Labs dataset for uplift modeling (Diemert et al., 2018) that contains visit and conversion data from 14M users. I show that an intuitive benchmark strategy only achieves 33% of the non-privacy-preserving targeting potential in some cases, while my strategic querying method achieves 97-101% of that potential, and is statistically indistinguishable from Causal Forest (Athey et al., 2019): a state-of-the-art non-privacy-preserving machine learning targeting method.
- Abstract(参考訳): 主要な広告プラットフォームは、広告主の個人レベルのデータへのアクセスを制限することで、最近プライバシー保護を強化した。
詳細な生データへのアクセスを提供する代わりに、プラットフォームはデータセットに限られた数の集約クエリしか許可しない。
本稿では,これらの制限されたプライバシ保護データ環境において,広告主が効果的なターゲティングポリシーを設計できるかどうかについて検討する。
そこで本稿では,動的データ探索を容易にするベイズ最適化に基づく確率論的機械学習手法を提案する。
ベイズ最適化は関数から最大点を求めるために設計されており、クエリの集約やターゲティングには適用できない。
ですから、私は2つのイノベーションを紹介します。
i) 個々の点ではなく、クエリするデータの最適な領域を選択することができる後方の積分更新。
(i)ターゲットタスクの最も情報性の高い領域を動的に選択するターゲティング・アウェアの獲得機能。
このような“スマート”なクエリ戦略を使用する必要のある,データセットとプライバシ環境の条件を特定します。
戦略的クエリ手法をCriteo AI Labsデータセットに適用して,1400万人のユーザからの訪問および変換データを含むアップリフトモデリング(Diemert et al , 2018)を行う。
直感的なベンチマーク戦略は、一部のケースでは、非プライバシー保存対象の33%しか達成できないが、私の戦略的なクエリ手法は、そのポテンシャルの97-101%を達成しており、現在最先端の非プライバシー保存機械学習ターゲティング手法であるCausal Forest(Athey et al , 2019)とは統計的に区別できない。
関連論文リスト
- DataMIL: Selecting Data for Robot Imitation Learning with Datamodels [77.48472034791213]
データモデルパラダイムに基づいて構築されたポリシー駆動型データ選択フレームワークであるDataMILを紹介する。
品質の概念を使ってデータをフィルタリングする標準的なプラクティスとは異なり、DataMILはタスクの成功のためにデータ選択を直接最適化する。
我々は60以上のシミュレーションと実世界の操作タスクのスイートに対して,我々のアプローチを検証する。
論文 参考訳(メタデータ) (2025-05-14T17:55:10Z) - Feature Selection from Differentially Private Correlations [35.187113265093615]
高次元回帰はデータセット内の個々のデータポイントに関する情報をリークすることができる。
相関に基づく順序統計を用いて、データセットから重要な特徴を選択し、それらを民営化する。
提案手法は,多くのデータセット上でのプライベートな特徴選択において,確立されたベースラインを著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2024-08-20T13:54:07Z) - Synergizing Privacy and Utility in Data Analytics Through Advanced Information Theorization [2.28438857884398]
本稿では,高次元画像データに適したノイズ注入技術,ロバストな特徴抽出のための変分オートエンコーダ(VAE),構造化データプライバシに最適化された期待最大化(EM)アプローチの3つの高度なアルゴリズムを紹介する。
本手法は,機密属性と変換データ間の相互情報を著しく低減し,プライバシーを向上する。
この研究は、さまざまなデータタイプにまたがってプライバシ保護アルゴリズムをデプロイするための柔軟で効果的な戦略を提供することによって、この分野に貢献する。
論文 参考訳(メタデータ) (2024-04-24T22:58:42Z) - Beyond Random Noise: Insights on Anonymization Strategies from a Latent
Bandit Study [44.94720642208655]
本稿では,レコメンデーションタスクの知識を共有する学習シナリオにおけるプライバシの問題について検討する。
我々は、プライバシーとレコメンデーションパフォーマンスのトレードオフを評価するために、潜伏したバンディット設定を使用します。
論文 参考訳(メタデータ) (2023-09-30T01:56:04Z) - SEAM: Searching Transferable Mixed-Precision Quantization Policy through
Large Margin Regularization [50.04951511146338]
混合精度量子化(MPQ)は各層に対して最適なビット幅割り当てを求めるのに時間を要する。
本稿では,小規模なプロキシデータセットを用いて効率的なMPQポリシーを効率的に検索する手法を提案する。
論文 参考訳(メタデータ) (2023-02-14T05:47:45Z) - Data Selection for Language Models via Importance Resampling [90.9263039747723]
我々は、望まれるターゲット分布に合わせるために、大規模な未ラベルデータセットのサブセットを選択するという問題を形式化する。
我々は、LMデータ選択のために低次元で使用される古典的な重要度再サンプリング手法を拡張した。
DSIRフレームワークをhash n-gram機能でインスタンス化し、4.5時間で1億のドキュメントを選択できる。
論文 参考訳(メタデータ) (2023-02-06T23:57:56Z) - Retrieval Enhanced Data Augmentation for Question Answering on Privacy
Policies [74.01792675564218]
本研究では,ラベルのないポリシー文書から関連するテキストセグメントを抽出する検索モデルに基づくデータ拡張フレームワークを開発する。
拡張データの多様性と品質を改善するために,複数の事前学習言語モデル(LM)を活用し,ノイズ低減フィルタモデルでそれらをカスケードする。
PrivacyQAベンチマークの強化データを使用して、既存のベースラインを大きなマージン(10% F1)に高め、新しい最先端のF1スコアを50%達成します。
論文 参考訳(メタデータ) (2022-04-19T15:45:23Z) - S$^3$VAADA: Submodular Subset Selection for Virtual Adversarial Active
Domain Adaptation [49.01925978752677]
現実のシナリオでは、少数のターゲットデータに対してラベルを取得することは可能かもしれません。
我々は,S$3$VAADAを提案する。これは,ラベルに対する最大情報サブセットを選択するための,新しいサブモジュール基準を導入し,また,クラスタベースのDA手順を強化する。
我々のアプローチは、ドメインシフトの度合いの異なるデータセットにおいて、競合する最先端のアプローチよりも一貫して優れています。
論文 参考訳(メタデータ) (2021-09-18T10:53:57Z) - Privacy-preserving feature selection: A survey and proposing a new set
of protocols [2.055949720959582]
プライバシ保護機能の選択方法を3つ検討し、その性能を改善するための提案を行う。
また,大まかな設定特徴選択に基づくプライバシ保護機能選択手法を提案する。
提案手法は,水平および垂直に分割されたデータセットを,二部・多部シナリオで処理できる。
論文 参考訳(メタデータ) (2020-08-17T23:14:45Z) - PGLP: Customizable and Rigorous Location Privacy through Policy Graph [68.3736286350014]
我々はPGLPと呼ばれる新しい位置プライバシーの概念を提案し、カスタマイズ可能で厳格なプライバシー保証を備えたプライベートロケーションをリリースするためのリッチなインターフェースを提供する。
具体的には,ユーザの位置プライバシー要件を,表現的かつカスタマイズ可能なテキスト配置ポリシーグラフを用いて形式化する。
第3に、位置露光の検出、ポリシーグラフの修復、およびカスタマイズ可能な厳格な位置プライバシーを備えたプライベートな軌跡リリースをパイプライン化する、プライベートな位置トレースリリースフレームワークを設計する。
論文 参考訳(メタデータ) (2020-05-04T04:25:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。