論文の概要: Robust and differentially private stochastic linear bandits
- arxiv url: http://arxiv.org/abs/2304.11741v1
- Date: Sun, 23 Apr 2023 20:17:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-25 16:35:42.251457
- Title: Robust and differentially private stochastic linear bandits
- Title(参考訳): ロバストで差動的にプライベートな線形バンディット
- Authors: Vasileios Charisopoulos, Hossein Esfandiari, Vahab Mirrokni
- Abstract要約: 差分プライバシー,ロバスト性,バッチ化観測などの追加要件の下で線形帯域問題について検討する。
対数バッチクエリを用いたアーム除去アルゴリズムの差分プライベートおよびロバストな変形について述べる。
- 参考スコア(独自算出の注目度): 23.96322363134793
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we study the stochastic linear bandit problem under the
additional requirements of differential privacy, robustness and batched
observations. In particular, we assume an adversary randomly chooses a constant
fraction of the observed rewards in each batch, replacing them with arbitrary
numbers. We present differentially private and robust variants of the arm
elimination algorithm using logarithmic batch queries under two privacy models
and provide regret bounds in both settings. In the first model, every reward in
each round is reported by a potentially different client, which reduces to
standard local differential privacy (LDP). In the second model, every action is
"owned" by a different client, who may aggregate the rewards over multiple
queries and privatize the aggregate response instead. To the best of our
knowledge, our algorithms are the first simultaneously providing differential
privacy and adversarial robustness in the stochastic linear bandits problem.
- Abstract(参考訳): 本稿では,差分プライバシー,ロバスト性,バッチ観測などの追加要件の下で,確率線形帯域問題について検討する。
特に、敵は各バッチで観察された報酬の一定割合をランダムに選択し、それらを任意の数に置き換える。
本稿では,2つのプライバシモデルに基づく対数的バッチクエリを用いたアーム除去アルゴリズムの差分的・頑健な変種について述べる。
最初のモデルでは、各ラウンドの報酬は潜在的に異なるクライアントによって報告され、標準のローカルディファレンシャルプライバシ(ldp)に還元される。
第2のモデルでは、すべてのアクションは別のクライアントによって"所有"され、複数のクエリに対して報酬を集約し、代わりに集約応答を民営化する。
我々の知る限りでは、我々のアルゴリズムは確率線形バンディット問題において微分プライバシーと敵対的ロバスト性を同時に提供する最初のアルゴリズムである。
関連論文リスト
- From Robustness to Privacy and Back [15.727276506140878]
統計的推論と機械学習における2つのデシラタの関係について検討する。
私たちの研究は、敵対的ロバストなアルゴリズムを純粋な差分プライバシーを満たすものに変換する最初のブラックボックス変換を提供します。
論文 参考訳(メタデータ) (2023-02-03T16:57:57Z) - Private Domain Adaptation from a Public Source [48.83724068578305]
我々は、公開ラベル付きデータを持つソースドメインから、未ラベル付きプライベートデータを持つターゲットドメインへの適応のための差分プライベート離散性に基づくアルゴリズムを設計する。
我々の解は、Frank-WolfeとMirror-Descentアルゴリズムのプライベートな変種に基づいている。
論文 参考訳(メタデータ) (2022-08-12T06:52:55Z) - Smooth Anonymity for Sparse Graphs [69.1048938123063]
しかし、スパースデータセットを共有するという点では、差分プライバシーがプライバシのゴールドスタンダードとして浮上している。
本研究では、スムーズな$k$匿名性(スムーズな$k$匿名性)と、スムーズな$k$匿名性(スムーズな$k$匿名性)を提供する単純な大規模アルゴリズムを設計する。
論文 参考訳(メタデータ) (2022-07-13T17:09:25Z) - Individual Privacy Accounting for Differentially Private Stochastic Gradient Descent [69.14164921515949]
DP-SGDで訓練されたモデルをリリースする際の個々の事例に対するプライバシー保証を特徴付ける。
ほとんどの例では、最悪のケースよりも強力なプライバシー保証を享受しています。
これは、モデルユーティリティの観点からは守られないグループが同時に、より弱いプライバシー保証を経験することを意味する。
論文 参考訳(メタデータ) (2022-06-06T13:49:37Z) - Optimal Algorithms for Mean Estimation under Local Differential Privacy [55.32262879188817]
そこで本研究では,PrivUnitが局所的プライベートな乱数化器群間の最適分散を実現することを示す。
また,ガウス分布に基づくPrivUnitの新たな変種も開発しており,数学的解析に適しており,同じ最適性保証を享受できる。
論文 参考訳(メタデータ) (2022-05-05T06:43:46Z) - Renyi Differential Privacy of the Subsampled Shuffle Model in
Distributed Learning [7.197592390105457]
クライアントは、プライバシを必要とするサーバとのインタラクションを通じて、学習モデルを反復的に構築する分散学習フレームワークで、プライバシを研究する。
最適化とフェデレートラーニング(FL)パラダイムによって動機付けられ、各ラウンドで少数のデータサンプルがランダムにサブサンプリングされた場合に焦点を当てる。
より強力なローカルプライバシ保証を得るために,各クライアントがローカルディファレンシャル・プライベート(LDP)機構を用いて応答をランダム化するシャッフルプライバシ・モデルを用いてこれを検証した。
論文 参考訳(メタデータ) (2021-07-19T11:43:24Z) - Optimal Rates of (Locally) Differentially Private Heavy-tailed
Multi-Armed Bandits [11.419534203345187]
本稿では,DP/LDPモデルにおけるマルチアームバンディット(MAB)の問題について検討する。
本稿では,SEアルゴリズムの局所的プライベートかつロバストなバージョンとみなすアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-06-04T16:17:21Z) - Bias-Robust Bayesian Optimization via Dueling Bandit [57.82422045437126]
ベイジアン最適化は、観測が逆偏りとなるような環境において考慮する。
情報指向サンプリング(IDS)に基づくダリングバンディットの新しい手法を提案する。
これにより、累積的後悔保証を伴う帯域幅の並列化のための、最初の効率的なカーネル化アルゴリズムが得られる。
論文 参考訳(メタデータ) (2021-05-25T10:08:41Z) - On the Renyi Differential Privacy of the Shuffle Model [25.052851351062845]
シャッフルモデルでは、各$n$クライアントはローカル差分プライベート(LDP)メカニズムを使用してレスポンスをランダム化し、信頼できないサーバは各クライアントに関連付けることなくクライアントレスポンスのランダムな置換(シャッフル)のみを受け取ります。
本稿では,シャッフルドプライバシモデルにおける一般離散局所ランダム化機構に対する最初の非自明な保証について述べる。
論文 参考訳(メタデータ) (2021-05-11T16:34:09Z) - Quantile Multi-Armed Bandits: Optimal Best-Arm Identification and a
Differentially Private Scheme [16.1694012177079]
我々は,多腕バンディットにおける最高の武器識別問題,潜在的に私的な報酬について検討する。
ゴールは、固定された所定のレベルで、最も高い定量値を持つ腕を特定することである。
このアルゴリズムは$delta$-PACであり,サンプルの複雑さを特徴付ける。
論文 参考訳(メタデータ) (2020-06-11T20:23:43Z) - Robustness Guarantees for Mode Estimation with an Application to Bandits [131.21717367564963]
平均ではなく報酬分布のモードを値とするマルチアームバンディットの理論を導入する。
我々は,我々のアルゴリズムが逆雑音列による腕の摂動に頑健であることを示すシミュレーションで示す。
論文 参考訳(メタデータ) (2020-03-05T21:29:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。