論文の概要: Homomorphically Encrypted Linear Contextual Bandit
- arxiv url: http://arxiv.org/abs/2103.09927v1
- Date: Wed, 17 Mar 2021 21:49:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-19 13:57:26.910129
- Title: Homomorphically Encrypted Linear Contextual Bandit
- Title(参考訳): 同型暗号化線形コンテキスト帯域
- Authors: Evrard Garcelon and Vianney Perchet and Matteo Pirotta
- Abstract要約: コンテキストバンディットは、連続的な意思決定問題におけるオンライン学習のためのフレームワークです。
非対称暗号に基づくプライバシー保護バンディットフレームワークを提案する。
設定の複雑さにもかかわらず、暗号化されたデータを通して学習できることが示される。
- 参考スコア(独自算出の注目度): 39.5858373448478
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Contextual bandit is a general framework for online learning in sequential
decision-making problems that has found application in a large range of
domains, including recommendation system, online advertising, clinical trials
and many more. A critical aspect of bandit methods is that they require to
observe the contexts -- i.e., individual or group-level data -- and the rewards
in order to solve the sequential problem. The large deployment in industrial
applications has increased interest in methods that preserve the privacy of the
users. In this paper, we introduce a privacy-preserving bandit framework based
on asymmetric encryption. The bandit algorithm only observes encrypted
information (contexts and rewards) and has no ability to decrypt it. Leveraging
homomorphic encryption, we show that despite the complexity of the setting, it
is possible to learn over encrypted data. We introduce an algorithm that
achieves a $\widetilde{O}(d\sqrt{T})$ regret bound in any linear contextual
bandit problem, while keeping data encrypted.
- Abstract(参考訳): context banditは、レコメンデーションシステム、オンライン広告、臨床試験など、さまざまなドメインで応用されているシーケンシャルな意思決定問題における、オンライン学習の一般的なフレームワークである。
banditメソッドの重要な側面は、シーケンシャルな問題を解決するために、個々のデータやグループレベルのデータといったコンテキストと報酬を観察する必要があることです。
産業アプリケーションにおける大規模なデプロイメントは、ユーザのプライバシを保護する方法への関心を高めている。
本稿では,非対称暗号に基づくプライバシー保護バンディットフレームワークを提案する。
banditアルゴリズムは暗号化された情報(コンテキストと報酬)のみを観察し、それを解読する能力を持たない。
準同型暗号を活用することで,設定の複雑さにもかかわらず,暗号化データから学習することができることを示す。
我々は,データを暗号化したまま,任意の線形コンテキストの盗聴問題に対して,$\widetilde{O}(d\sqrt{T})$ regretboundを実現するアルゴリズムを導入する。
関連論文リスト
- Encrypted system identification as-a-service via reliable encrypted matrix inversion [0.0]
暗号化された計算は、多数のアプリケーションドメインにわたる有望な道を開く。
特に、算術的同型暗号化はクラウドベースの計算サービスに自然に適合する。
本稿では,少なくとも2乗問題に対する信頼性の高い暗号化ソリューションにより,暗号化されたシステム識別サービスを提案する。
論文 参考訳(メタデータ) (2024-10-27T20:00:04Z) - Feel-Good Thompson Sampling for Contextual Dueling Bandits [49.450050682705026]
FGTS.CDBという名前のトンプソンサンプリングアルゴリズムを提案する。
われわれのアルゴリズムの核心は、デュエルバンディットに適した新しいFeel-Good探索用語である。
我々のアルゴリズムは最小限の誤差、すなわち $tildemathcalO(dsqrt T)$, $d$ はモデル次元、$T$ は時間水平線である。
論文 参考訳(メタデータ) (2024-04-09T04:45:18Z) - A Survey on Property-Preserving Database Encryption Techniques in the Cloud [0.0]
アウトソースされたデータのセキュリティと機密性には懸念がある。
報告では、クラウドデータベースサービスとの関係でデータを保存するのに使用される一般的な暗号化技術について調査している。
論文 参考訳(メタデータ) (2023-12-19T11:50:31Z) - Lightweight Public Key Encryption in Post-Quantum Computing Era [0.0]
デジタル世界での信頼度は、暗号アルゴリズムのセキュリティに基づいています。
量子コンピュータの技術進歩の過程で、共通暗号化アルゴリズムの保護機能が脅かされている。
我々の概念は、古典的非対称暗号法の現代複雑性クラスへの変換を記述している。
論文 参考訳(メタデータ) (2023-11-24T21:06:42Z) - Contexts can be Cheap: Solving Stochastic Contextual Bandits with Linear
Bandit Algorithms [39.70492757288025]
我々は,意思決定者がコンテキストを提供するコンテキスト線形帯域問題に対処する。
文脈問題を線形バンディット問題として解くことができることを示す。
この結果から,文脈的線形包帯に対して$O(dsqrtTlog T)$高確率残差が生じることが示唆された。
論文 参考訳(メタデータ) (2022-11-08T22:18:53Z) - Syndicated Bandits: A Framework for Auto Tuning Hyper-parameters in
Contextual Bandit Algorithms [74.55200180156906]
文脈的盗賊問題は、探索と搾取の間のトレードオフをモデル化する。
我々のSyndicated Banditsフレームワークは最適な後悔の上限を達成できることを示す。
論文 参考訳(メタデータ) (2021-06-05T22:30:21Z) - Robust Stochastic Linear Contextual Bandits Under Adversarial Attacks [81.13338949407205]
近年の研究では、最適なバンディットアルゴリズムは敵攻撃に対して脆弱であり、攻撃の有無で完全に失敗する可能性があることが示されている。
既存の堅牢なバンディットアルゴリズムは、報酬の攻撃下では、非コンテキスト設定でのみ機能する。
完全適応的かつ全能的な攻撃下での線形文脈帯域設定のための最初の頑健な帯域幅アルゴリズムを提供する。
論文 参考訳(メタデータ) (2021-06-05T22:20:34Z) - A brief history on Homomorphic learning: A privacy-focused approach to
machine learning [2.055949720959582]
同型暗号化により、暗号化されたデータ上で任意の操作を実行できる。
これにより、基盤となる生データにアクセスすることなく、洗練された機械学習アルゴリズムを実行できます。
最終的に"はい"という答えを見つけるのに30年以上を要した。
論文 参考訳(メタデータ) (2020-09-09T21:57:47Z) - Stochastic Bandits with Linear Constraints [69.757694218456]
制約付き文脈線形帯域設定について検討し、エージェントの目標は一連のポリシーを作成することである。
楽観的悲観的線形帯域(OPLB)と呼ばれる,この問題に対する高信頼束縛アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-17T22:32:19Z) - Bandits with Partially Observable Confounded Data [74.04376842070624]
この問題は,サイド情報を用いたバンドイット問題の変種と密接に関連していることを示す。
本稿では,予測情報を活用する線形帯域幅アルゴリズムを構築し,残差を証明した。
この結果から,オンライン学習アルゴリズムにおいて,オフラインデータの集約が著しく向上することが示唆された。
論文 参考訳(メタデータ) (2020-06-11T18:48:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。