論文の概要: Adaptive Control of Differentially Private Linear Quadratic Systems
- arxiv url: http://arxiv.org/abs/2108.11563v1
- Date: Thu, 26 Aug 2021 03:06:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-27 23:58:34.326925
- Title: Adaptive Control of Differentially Private Linear Quadratic Systems
- Title(参考訳): 微分プライベート線形二次系の適応制御
- Authors: Sayak Ray Chowdhury, Xingyu Zhou and Ness Shroff
- Abstract要約: 差分プライバシー制約下での強化学習(RL)における後悔の問題について検討する。
プライバシ保護を保証しながらサブ線形後悔を達成できる,最初のプライベートRLアルゴリズムであるPRLを開発した。
- 参考スコア(独自算出の注目度): 5.414308305392762
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we study the problem of regret minimization in reinforcement
learning (RL) under differential privacy constraints. This work is motivated by
the wide range of RL applications for providing personalized service, where
privacy concerns are becoming paramount. In contrast to previous works, we take
the first step towards non-tabular RL settings, while providing a rigorous
privacy guarantee. In particular, we consider the adaptive control of
differentially private linear quadratic (LQ) systems. We develop the first
private RL algorithm, PRL, which is able to attain a sub-linear regret while
guaranteeing privacy protection. More importantly, the additional cost due to
privacy is only on the order of $\frac{\ln(1/\delta)^{1/4}}{\epsilon^{1/2}}$
given privacy parameters $\epsilon, \delta > 0$. Through this process, we also
provide a general procedure for adaptive control of LQ systems under changing
regularizers, which not only generalizes previous non-private controls, but
also serves as the basis for general private controls.
- Abstract(参考訳): 本稿では,差分プライバシー制約下での強化学習(RL)における後悔最小化の問題について検討する。
この作業は、プライバシに関する懸念が最重要になっているパーソナライズされたサービスを提供するための、幅広いRLアプリケーションによって動機付けられています。
これまでの作業とは対照的に、我々は厳格なプライバシー保証を提供しながら、非タブラルなRL設定に向けた第一歩を踏み出します。
特に、微分プライベート線形二次系(LQ)の適応制御について考察する。
プライバシ保護を保証しながらサブ線形後悔を達成できる,最初のプライベートRLアルゴリズムであるPRLを開発した。
さらに重要なのは、プライバシによる追加コストが$\frac{\ln(1/\delta)^{1/4}}{\epsilon^{1/2}}$与えられたプライバシーパラメータ$\epsilon, \delta > 0$であることだ。
このプロセスを通じて,従来の非私的制御を一般化するだけでなく,一般私的制御の基盤として機能する正規化子の変更によるLQシステムの適応制御の一般的な手順も提供する。
関連論文リスト
- Enhancing Feature-Specific Data Protection via Bayesian Coordinate Differential Privacy [55.357715095623554]
ローカル微分プライバシー(LDP)は、ユーザーが外部の関係者を信頼することなく、強力なプライバシー保証を提供する。
本稿では,ベイジアン・フレームワークであるベイジアン・コーディネート・ディファレンシャル・プライバシ(BCDP)を提案する。
論文 参考訳(メタデータ) (2024-10-24T03:39:55Z) - Masked Differential Privacy [64.32494202656801]
本稿では,差分プライバシーを適用した機密領域を制御できる「マスク型差分プライバシー(DP)」という効果的なアプローチを提案する。
提案手法はデータに基づいて選択的に動作し,DPアプリケーションや差分プライバシーをデータサンプル内の他のプライバシー技術と組み合わせることなく,非感性時間領域を定義できる。
論文 参考訳(メタデータ) (2024-10-22T15:22:53Z) - Differentially Private Deep Model-Based Reinforcement Learning [47.651861502104715]
形式的な差分プライバシー保証を備えたモデルベースRLアルゴリズムであるPriMORLを紹介する。
PriMORLはオフラインデータから環境の軌道レベルのDPモデルのアンサンブルを学習する。
論文 参考訳(メタデータ) (2024-02-08T10:05:11Z) - Differentially Private High Dimensional Bandits [1.3597551064547502]
差分プライベートなLASSO帯域幅アルゴリズムであるPrivateLASSOを提案する。
PrivateLASSOは2つのサブルーチンに基づいている。 (i) 疎いハードスレッディングベースのプライバシメカニズムと (ii) パラメータの$theta$のサポートを識別するためのエピソードのしきい値設定ルールである。
論文 参考訳(メタデータ) (2024-02-06T06:10:46Z) - adaPARL: Adaptive Privacy-Aware Reinforcement Learning for
Sequential-Decision Making Human-in-the-Loop Systems [0.5414308305392761]
強化学習(Reinforcement Learning, RL)は, 各種アプリケーションにおけるルールベースアプローチと比較して, 数多くの利点を示す。
本稿では,プライバシを意識したRLの適応的アプローチであるadaPARLを提案する。
AdaPARLは、人間の振る舞いや好みに応じて、パーソナライズされたプライバシユーティリティトレードオフを提供する。
論文 参考訳(メタデータ) (2023-03-07T21:55:22Z) - Algorithms with More Granular Differential Privacy Guarantees [65.3684804101664]
我々は、属性ごとのプライバシー保証を定量化できる部分微分プライバシー(DP)について検討する。
本研究では,複数の基本データ分析および学習タスクについて検討し,属性ごとのプライバシパラメータが個人全体のプライバシーパラメータよりも小さい設計アルゴリズムについて検討する。
論文 参考訳(メタデータ) (2022-09-08T22:43:50Z) - On Differential Privacy for Federated Learning in Wireless Systems with
Multiple Base Stations [90.53293906751747]
複数の基地局とセル間干渉を持つ無線システムにおける連合学習モデルを考える。
本稿では,学習過程の収束挙動を,その最適性ギャップの上限を導出することによって示す。
提案するスケジューラは,ランダムなスケジューラと比較して予測平均精度を向上する。
論文 参考訳(メタデータ) (2022-08-25T03:37:11Z) - Improved Regret for Differentially Private Exploration in Linear MDP [31.567811502343552]
医療記録などのセンシティブなデータに依存する環境におけるシーケンシャルな意思決定におけるプライバシ保護探索について検討する。
我々は、エピソード数に対して$O(sqrtK)$を最適に依存した、改善された後悔率を持つプライベートアルゴリズムを提供する。
論文 参考訳(メタデータ) (2022-02-02T21:32:09Z) - Differentially Private Reinforcement Learning with Linear Function
Approximation [3.42658286826597]
差分プライバシー(DP)制約下における有限水平マルコフ決定過程(MDP)における後悔の最小化について検討する。
本研究の結果は, 線形混合MDPにおける正則化条件の変更による学習の一般的な手順によって得られた。
論文 参考訳(メタデータ) (2022-01-18T15:25:24Z) - Private Reinforcement Learning with PAC and Regret Guarantees [69.4202374491817]
エピソード強化学習(RL)のためのプライバシー保護探索ポリシーを設計する。
まず、共同微分プライバシー(JDP)の概念を用いた有意義なプライバシー定式化を提供する。
そこで我々は,強いPACと後悔境界を同時に達成し,JDP保証を享受する,プライベートな楽観主義に基づく学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-09-18T20:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。