論文の概要: AdaPrivate-TS: Private Thompson Sampling for Contextual Bandits with Privacy Amplification
- arxiv url: http://arxiv.org/abs/2606.21757v1
- Date: Fri, 19 Jun 2026 21:18:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-26 03:32:16.766296
- Title: AdaPrivate-TS: Private Thompson Sampling for Contextual Bandits with Privacy Amplification
- Title(参考訳): AdaPrivate-TS:プライバシを増幅したコンテキスト帯域のためのプライベートトンプソンサンプリング
- Authors: Mohammadreza Riyazat, Eranga Ukwatta,
- Abstract要約: AdaPrivate-TSは、トンプソン・サンプリングとバッチ化されたzCDP合成を組み合わせた、微分的にプライベートな文脈的包帯である。
AdaPrivate-TS は $varepsilon [0.5, 5]$ で 93-99% を達成し, UCB を0.5-3.7% で上回り,適応探索で 18% まで向上した。
- 参考スコア(独自算出の注目度): 0.3560429497877326
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present AdaPrivate-TS, a differentially private contextual bandit algorithm that combines Thompson Sampling with batched zCDP composition. Our key insight is that differential privacy noise inflates the posterior covariance in a structured way: adding Gaussian noise $N(0,σ^2 I)$ to $b$ yields sampling covariance $v^2 A^{-1} + σ^2 A^{-2}$, which Thompson Sampling interprets as increased uncertainty rather than pure corruption. Under event-level privacy (protecting individual interactions) with stochastic contexts, we prove that the privacy cost is only $O(\sqrt{d}\,\log T/\sqrtρ)$, logarithmic in $T$, because parallel composition amortizes noise across batches. Additionally, we explore privacy amplification via Poisson subsampling, which can reduce effective noise at stringent privacy budgets. Experiments on synthetic and real-world datasets demonstrate: (1) AdaPrivate-TS achieves 93-99% of non-private performance at $\varepsilon \in [0.5, 5]$, outperforming UCB by 0.5-3.7% and up to 18% with tuned adaptive exploration at extreme $\varepsilon$; (2) privacy amplification provides additional 2-5% gains at low $\varepsilon$; (3) on MovieLens and Jester, AdaPrivate-TS achieves the best overall performance among event-level baselines, dominating at $\varepsilon \geq 2$; (4) under DP-SVD private features, TS's advantage over UCB grows to +11%, confirming noise-as-uncertainty is not limited to reward privacy. We provide rigorous proofs for privacy guarantees under interactive zCDP composition and comprehensive evaluation including convergence curves, 12-seed CIs, and DP-SVD feature ablation.
- Abstract(参考訳): 本稿では、Thompson SamplingとzCDP合成を組み合わせた、微分プライベートなコンテキスト帯域幅アルゴリズムであるAdaPrivate-TSを提案する。
ガウスノイズ$N(0,σ^2 I)$ to $b$ yields sample covariance $v^2 A^{-1} + σ^2 A^{-2}$。
確率的コンテキストによるイベントレベルのプライバシ(個々のインタラクションを保護する)の下では、並列合成がバッチ間でノイズを和らげるため、プライバシコストが$O(\sqrt{d}\,\log T/\sqrtρ)$, logarithmic in $T$であることを示す。
さらに、Poissonサブサンプリングによるプライバシーの増幅についても検討する。
1) AdaPrivate-TSは、$\varepsilon \in [0.5, 5]$で93-99%、$\varepsilon$で0.5-3.7%、最大18%でUPBを上回り、極端な$\varepsilon$で調整された適応探索を行う。
対話型zCDP構成下でのプライバシー保証の厳密な証明と、収束曲線、12シードCI、DP-SVD特徴アブレーションを含む包括的評価を提供する。
関連論文リスト
- Fundamental Limitations of Favorable Privacy-Utility Guarantees for DP-SGD [7.787109481104569]
本稿では,DP-SGDを$f$差分プライバシーフレームワークで解析する。
小さい分離を強制することはノイズ乗算器$$に厳格な下限を課し、達成可能な効用を直接制限することを証明する。
実験により, この境界による雑音レベルは, 現実的な訓練環境において, 高い精度で劣化することが確認された。
論文 参考訳(メタデータ) (2026-01-15T09:50:36Z) - Connecting Thompson Sampling and UCB: Towards More Efficient Trade-offs Between Privacy and Regret [5.050520326139362]
DP-TS-UCBは,プライバシと後悔の交換を可能にする,新しいパラメタライズドプライベートバンディットアルゴリズムである。
DP-TS-UCBは、トンプソンサンプリングに基づくアルゴリズムにおいて、ガウス分布の反集中境界とリンク探索機構に依存している。
論文 参考訳(メタデータ) (2025-05-05T05:48:52Z) - Beyond Covariance Matrix: The Statistical Complexity of Private Linear Regression [66.93988594607842]
プライバシー制約の下では、プライベート線形回帰の複雑さは通常の共分散行列によって捉えられる。
最適率を達成するための情報重み付け回帰手法を提案する。
特に、我々の結果は、共同プライバシーは追加費用がほとんどないことを示している。
論文 参考訳(メタデータ) (2025-02-18T18:35:24Z) - Optimized Tradeoffs for Private Prediction with Majority Ensembling [59.99331405291337]
本稿では,データ依存型ランダム化応答行列(DaRRM)アルゴリズムを提案する。
DaRRMはデータ依存ノイズ関数$gamma$でパラメータ化され、全てのプライベートアルゴリズムのクラスに対して効率的なユーティリティ最適化を可能にする。
本稿では,DARRMが共通ベースラインよりも2倍のプライバシゲインを,固定ユーティリティで確実に享受していることを示す。
論文 参考訳(メタデータ) (2024-11-27T00:48:48Z) - Differentially Private Best-Arm Identification [14.916947598339988]
ベストアーム識別(BAI)問題は、データセンシティブなアプリケーションに徐々に使われている。
これらのアプリケーションによって引き起こされるデータプライバシの懸念に触発され、ローカルモデルと中央モデルの両方に一定の信頼を保ちながら、BAIの問題を研究する。
論文 参考訳(メタデータ) (2024-06-10T16:02:48Z) - On the Complexity of Differentially Private Best-Arm Identification with
Fixed Confidence [16.295693624977563]
我々は、$epsilon$-global Differential Privacyの下で、信頼度を固定したベストアーム識別の問題について検討する。
われわれの限界は、プライバシー予算によって2つのプライバシー体制が存在することを示唆している。
我々はトップ2アルゴリズムの$epsilon$-global DP変種であるAdaP-TTを提案する。
論文 参考訳(メタデータ) (2023-09-05T13:07:25Z) - Individual Privacy Accounting for Differentially Private Stochastic Gradient Descent [69.14164921515949]
DP-SGDで訓練されたモデルをリリースする際の個々の事例に対するプライバシー保証を特徴付ける。
ほとんどの例では、最悪のケースよりも強力なプライバシー保証を享受しています。
これは、モデルユーティリティの観点からは守られないグループが同時に、より弱いプライバシー保証を経験することを意味する。
論文 参考訳(メタデータ) (2022-06-06T13:49:37Z) - Learning with User-Level Privacy [61.62978104304273]
ユーザレベルの差分プライバシー制約下での学習課題を,アルゴリズムを用いて解析する。
個々のサンプルのプライバシーのみを保証するのではなく、ユーザレベルのdpはユーザの貢献全体を保護します。
プライバシコストが$tau$に比例した$K$適応的に選択されたクエリのシーケンスにプライベートに答えるアルゴリズムを導き出し、私たちが検討する学習タスクを解決するためにそれを適用します。
論文 参考訳(メタデータ) (2021-02-23T18:25:13Z) - Hiding Among the Clones: A Simple and Nearly Optimal Analysis of Privacy
Amplification by Shuffling [49.43288037509783]
ランダムシャッフルは、局所的ランダム化データの差分プライバシー保証を増幅する。
私たちの結果は、以前の作業よりも単純で、ほぼ同じ保証で差分プライバシーに拡張された新しいアプローチに基づいています。
論文 参考訳(メタデータ) (2020-12-23T17:07:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。