Fugu-MT 論文翻訳(概要): Differentially Private Linear Bandits with Partial Distributed Feedback

論文の概要: Differentially Private Linear Bandits with Partial Distributed Feedback

arxiv url: http://arxiv.org/abs/2207.05827v2
Date: Thu, 21 Mar 2024 08:53:03 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-22 20:49:10.302605
Title: Differentially Private Linear Bandits with Partial Distributed Feedback
Title（参考訳）: 部分分散フィードバックを持つ差分プライベート線形帯域
Authors: Fengjiao Li, Xingyu Zhou, Bo Ji,
Abstract要約: 部分的な分散フィードバックのみを用いて,グローバル報酬の問題について検討する。我々は、差分的プライベート分散除去と呼ばれる統合学習フレームワークを提案する。我々は,DP-DPEがサブリニア後悔とサブリニアコミュニケーションの両コストを実現することを証明した。
参考スコア（独自算出の注目度）: 10.00900236895304
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In this paper, we study the problem of global reward maximization with only partial distributed feedback. This problem is motivated by several real-world applications (e.g., cellular network configuration, dynamic pricing, and policy selection) where an action taken by a central entity influences a large population that contributes to the global reward. However, collecting such reward feedback from the entire population not only incurs a prohibitively high cost but often leads to privacy concerns. To tackle this problem, we consider differentially private distributed linear bandits, where only a subset of users from the population are selected (called clients) to participate in the learning process and the central server learns the global model from such partial feedback by iteratively aggregating these clients' local feedback in a differentially private fashion. We then propose a unified algorithmic learning framework, called differentially private distributed phased elimination (DP-DPE), which can be naturally integrated with popular differential privacy (DP) models (including central DP, local DP, and shuffle DP). Furthermore, we prove that DP-DPE achieves both sublinear regret and sublinear communication cost. Interestingly, DP-DPE also achieves privacy protection ``for free'' in the sense that the additional cost due to privacy guarantees is a lower-order additive term. In addition, as a by-product of our techniques, the same results of ``free" privacy can also be achieved for the standard differentially private linear bandits. Finally, we conduct simulations to corroborate our theoretical results and demonstrate the effectiveness of DP-DPE.
Abstract（参考訳）: 本稿では,部分分散フィードバックのみを用いた大域的報酬最大化の問題について検討する。この問題は、複数の実世界のアプリケーション(例えば、セルラーネットワークの構成、動的価格設定、ポリシー選択)によって動機付けられ、中央のエンティティによって取られたアクションが、グローバルな報酬に寄与する大集団に影響を与える。しかし、このような報奨のフィードバックを全人口から収集することは、違法に高いコストを発生させるだけでなく、しばしばプライバシーの懸念につながる。この問題に対処するために,本研究では,学習プロセスに参加するために,人口のごく一部(クライアントと呼ぶ)のみが選択され,中央サーバは,これらのクライアントの局所的なフィードバックを段階的に個別に収集することで,このような部分的なフィードバックからグローバルモデルを学習する,差分プライベートな分散線形バンドレットについて検討する。そこで我々は,分散分散位相除去(DP-DPE)と呼ばれる一元的アルゴリズム学習フレームワークを提案し,このフレームワークを一般の差分プライバシー(DP)モデル(中央DP,局所DP,シャッフルDPを含む)と自然に統合することができる。さらに,DP-DPEがサブリニア・後悔とサブリニア・コミュニケーションの両コストを実現することを証明する。興味深いことに、DP-DPEはプライバシー保証による追加コストが低次の追加用語であるという意味で、プライバシ保護の ``for free'' も達成している。また,本手法の副産物として,標準的にプライベートな線形包帯に対して,'free'プライバシーの同じ結果が得られる。最後に,理論結果の相関をシミュレーションし,DP-DPEの有効性を実証する。

関連論文リスト

Your Privacy Depends on Others: Collusion Vulnerabilities in Individual Differential Privacy [50.66105844449181]
個々の差別的プライバシ(iDP)は、ユーザが自身のプライバシをコントロールすることを約束するが、この約束は実際には破られる可能性がある。我々は、サンプリングベースのiDPメカニズムにおいて、これまで見過ごされていた脆弱性を明らかにした。我々は、$(varepsilon_i,_i,overline)$-iDPというプライバシー契約を提案します。
論文参考訳（メタデータ） (2026-01-19T10:26:12Z)
Decentralized Differentially Private Power Method [4.58112062523768]
ネットワーク化されたマルチエージェント設定において主成分分析(PCA)を行うための分散分散微分プライベート・パワー・メソッド(D-DP-PM)を提案する。本手法は,ネットワーク全体の固有ベクトルを協調的に推定しながら,$(epsilon,delta)$-Differential Privacy (DP)を保証する。実世界のデータセット実験により、D-DP-PMは、単純で局所的なDPアプローチに比べて、優れたプライバシーとユーティリティのトレードオフを実現することが示された。
論文参考訳（メタデータ） (2025-07-30T17:15:50Z)
Embedding-Based Federated Data Sharing via Differentially Private Conditional VAEs [0.13108652488669734]
フェデレートラーニング(FL)は、分散トレーニングを可能にするが、高いコミュニケーションコストに悩まされる。差分的プライベート(DP)生成モデルを用いたデータ共有手法を提案する。クライアントは、グローバルでプライバシを意識したデータ配布をモデル化するために、差分的にプライベートな条件変分自動エンコーダ(DP-CVAE)を共同でトレーニングする。
論文参考訳（メタデータ） (2025-07-03T14:36:15Z)
Machine Learning with Privacy for Protected Attributes [56.44253915927481]
差分プライバシー(DP)の定義を洗練し、機能差分プライバシー(FDP)と呼ばれるより汎用的で柔軟なフレームワークを作成する。私たちの定義はシミュレーションに基づいており、プライバシの追加/削除と置き換えの両方が可能で、保護された機能と非保護された機能の任意の分離を処理できます。各種機械学習タスクにフレームワークを適用し,パブリック機能が利用可能であればDP学習モデルの実用性を大幅に向上させることができることを示す。
論文参考訳（メタデータ） (2025-06-24T17:53:28Z)
KL-regularization Itself is Differentially Private in Bandits and RLHF [19.463863037999054]
差分プライバシー(DP)は、プライバシーのための厳格なフレームワークを提供し、単一のエントリで異なるデータセット間で統計的に区別できないデータ駆動アルゴリズムの出力を保証する。「一般に、DPを保証するためには、アルゴリズム自体または出力に明示的にノイズを注入する必要があるが、既存のアルゴリズムの固有のランダム性は、DPを無償で達成する機会を与える。」
論文参考訳（メタデータ） (2025-05-23T22:22:02Z)
Differentially Private 2D Human Pose Estimation [6.982542225631412]
微分プライベートな2次元ポーズ推定(2D-HPE)のための最初の包括的枠組みを提案する。プライバシ性能を効果的にバランスするために,低次元部分空間へのノイズ勾配を投影するProjected DP-SGDを採用した。次に、FDP(Feature Differential Privacy)を導入し、公共の視覚的手がかりを維持しながら、機密機能のみを選択的に民営化する。
論文参考訳（メタデータ） (2025-04-14T12:50:37Z)
Noise Variance Optimization in Differential Privacy: A Game-Theoretic Approach Through Per-Instance Differential Privacy [7.264378254137811]
差分プライバシー(DP)は、個人をターゲットデータセットに含めることによる分布の変化を観察することにより、プライバシー損失を測定することができる。 DPは、AppleやGoogleのような業界巨人の機械学習におけるデータセットの保護において際立っている。本稿では,PDPを制約として提案し,各データインスタンスのプライバシ損失を測定し,個々のインスタンスに適したノイズを最適化する。
論文参考訳（メタデータ） (2024-04-24T06:51:16Z)
Incentives in Private Collaborative Machine Learning [56.84263918489519]
コラボレーション型機械学習は、複数のパーティのデータに基づいてモデルをトレーニングする。インセンティブとして差分プライバシー(DP)を導入する。合成および実世界のデータセットに対するアプローチの有効性と実用性を実証的に実証した。
論文参考訳（メタデータ） (2024-04-02T06:28:22Z)
FedLAP-DP: Federated Learning by Sharing Differentially Private Loss Approximations [53.268801169075836]
我々は,フェデレーション学習のための新しいプライバシ保護手法であるFedLAP-DPを提案する。公式なプライバシー分析は、FedLAP-DPが典型的な勾配共有方式と同じプライバシーコストを発生させることを示している。提案手法は, 通常の勾配共有法に比べて高速な収束速度を示す。
論文参考訳（メタデータ） (2023-02-02T12:56:46Z)
Large Scale Transfer Learning for Differentially Private Image Classification [51.10365553035979]
Differential Privacy(DP)は、個別のサンプルレベルのプライバシで機械学習モデルをトレーニングするための正式なフレームワークを提供する。 DP-SGDを用いたプライベートトレーニングは、個々のサンプル勾配にノイズを注入することで漏れを防ぐ。この結果は非常に魅力的であるが,DP-SGDを用いた大規模モデルのトレーニングの計算コストは,非プライベートトレーニングよりもかなり高い。
論文参考訳（メタデータ） (2022-05-06T01:22:20Z)
Differentially Private Regret Minimization in Episodic Markov Decision Processes [6.396288020763144]
差分プライバシー(DP)制約下における有限地平線表型マルコフ決定過程(MDP)の後悔について検討する。これは、実世界の逐次意思決定問題における強化学習(RL)の広範な応用が動機となっている。
論文参考訳（メタデータ） (2021-12-20T15:12:23Z)
Smoothed Differential Privacy [55.415581832037084]
微分プライバシー(DP)は、最悪のケース分析に基づいて広く受け入れられ、広く適用されているプライバシーの概念である。本稿では, 祝賀されたスムーズな解析の背景にある最悪の平均ケースのアイデアに倣って, DPの自然な拡張を提案する。サンプリング手順による離散的なメカニズムはDPが予測するよりもプライベートであるのに対して,サンプリング手順による連続的なメカニズムはスムーズなDP下では依然としてプライベートではないことが証明された。
論文参考訳（メタデータ） (2021-07-04T06:55:45Z)
Private Reinforcement Learning with PAC and Regret Guarantees [69.4202374491817]
エピソード強化学習(RL)のためのプライバシー保護探索ポリシーを設計する。まず、共同微分プライバシー(JDP)の概念を用いた有意義なプライバシー定式化を提供する。そこで我々は,強いPACと後悔境界を同時に達成し,JDP保証を享受する,プライベートな楽観主義に基づく学習アルゴリズムを開発した。
論文参考訳（メタデータ） (2020-09-18T20:18:35Z)
Federated Learning with Sparsification-Amplified Privacy and Adaptive Optimization [27.243322019117144]
フェデレートラーニング(FL)により、分散エージェントは、生データを互いに共有することなく、集中型モデルを共同で学習することができる。スパーシフィケーションを増幅した新しいFLフレームワークを提案する。提案手法では,ランダムなスペーシフィケーションと各エージェントの勾配摂動を統合し,プライバシー保証を増幅する。
論文参考訳（メタデータ） (2020-08-01T20:22:57Z)
Privacy Amplification via Random Check-Ins [38.72327434015975]
Differentially Private Gradient Descent (DP-SGD) は、多くのアプリケーションにおいて、機密データを学習するための基本的な構成要素となっている。本稿では,DP-SGD のような反復的手法を,多くのデバイス(クライアント)に分散したフェデレーションラーニング(FL)の設定において実施することに焦点を当てる。当社の主なコントリビューションは,各クライアントがローカルかつ独立に行うランダムな参加決定にのみ依存する,Emphrandom Check-in分散プロトコルです。
論文参考訳（メタデータ） (2020-07-13T18:14:09Z)
RDP-GAN: A R\'enyi-Differential Privacy based Generative Adversarial Network [75.81653258081435]
GAN(Generative Adversarial Network)は,プライバシ保護の高い現実的なサンプルを生成する能力によって,近年注目を集めている。しかし、医療記録や財務記録などの機密・私的な訓練例にGANを適用すると、個人の機密・私的な情報を漏らしかねない。本稿では、学習中の損失関数の値にランダムノイズを慎重に付加することにより、GAN内の差分プライバシー(DP)を実現するR'enyi-differentially private-GAN(RDP-GAN)を提案する。
論文参考訳（メタデータ） (2020-07-04T09:51:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。