論文の概要: Distributed Reinforcement Learning for Privacy-Preserving Dynamic Edge
Caching
- arxiv url: http://arxiv.org/abs/2110.10349v1
- Date: Wed, 20 Oct 2021 02:48:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-24 02:39:15.854934
- Title: Distributed Reinforcement Learning for Privacy-Preserving Dynamic Edge
Caching
- Title(参考訳): プライバシー保護動的エッジキャッシングのための分散強化学習
- Authors: Shengheng Liu, Chong Zheng, Yongming Huang, Tony Q. S. Quek
- Abstract要約: MECネットワークにおけるデバイスのキャッシュヒット率を最大化するために,プライバシ保護型分散ディープポリシー勾配(P2D3PG)を提案する。
分散最適化をモデルフリーなマルコフ決定プロセス問題に変換し、人気予測のためのプライバシー保護フェデレーション学習手法を導入する。
- 参考スコア(独自算出の注目度): 91.50631418179331
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Mobile edge computing (MEC) is a prominent computing paradigm which expands
the application fields of wireless communication. Due to the limitation of the
capacities of user equipments and MEC servers, edge caching (EC) optimization
is crucial to the effective utilization of the caching resources in MEC-enabled
wireless networks. However, the dynamics and complexities of content
popularities over space and time as well as the privacy preservation of users
pose significant challenges to EC optimization. In this paper, a
privacy-preserving distributed deep deterministic policy gradient (P2D3PG)
algorithm is proposed to maximize the cache hit rates of devices in the MEC
networks. Specifically, we consider the fact that content popularities are
dynamic, complicated and unobservable, and formulate the maximization of cache
hit rates on devices as distributed problems under the constraints of privacy
preservation. In particular, we convert the distributed optimizations into
distributed model-free Markov decision process problems and then introduce a
privacy-preserving federated learning method for popularity prediction.
Subsequently, a P2D3PG algorithm is developed based on distributed
reinforcement learning to solve the distributed problems. Simulation results
demonstrate the superiority of the proposed approach in improving EC hit rate
over the baseline methods while preserving user privacy.
- Abstract(参考訳): モバイルエッジコンピューティング (MEC) は、無線通信の応用分野を拡大する卓越したコンピューティングパラダイムである。
ユーザ機器やMECサーバの容量が制限されているため、エッジキャッシュ(EC)最適化はMEC対応無線ネットワークにおけるキャッシュリソースの有効活用に不可欠である。
しかし、空間や時間のコンテンツ人気度とユーザのプライバシー保護のダイナミクスと複雑さは、EC最適化に重大な課題をもたらしている。
本稿では,MECネットワークにおけるデバイスにおけるキャッシュヒット率を最大化するために,プライバシ保護型分散Deep Deterministic Policy gradient (P2D3PG)アルゴリズムを提案する。
具体的には、コンテンツの人気度が動的で複雑で観測不能であり、プライバシー保護の制約下での分散問題としてデバイスへのキャッシュヒット率の最大化を定式化するという事実を考察する。
特に,分散最適化を分散モデルフリーマルコフ決定プロセス問題に変換し,人気予測のためのプライバシ保存型フェデレーション学習法を導入する。
その後,分散強化学習に基づいてp2d3pgアルゴリズムを開発し,分散問題を解決する。
シミュレーションの結果,ユーザプライバシを保ちながら,ベースライン方式よりもECヒット率を向上させる手法が優れていることが示された。
関連論文リスト
- Digital Twin-Assisted Data-Driven Optimization for Reliable Edge Caching in Wireless Networks [60.54852710216738]
我々はD-RECと呼ばれる新しいデジタルツインアシスト最適化フレームワークを導入し、次世代無線ネットワークにおける信頼性の高いキャッシュを実現する。
信頼性モジュールを制約付き決定プロセスに組み込むことで、D-RECは、有利な制約に従うために、アクション、報酬、状態を適応的に調整することができる。
論文 参考訳(メタデータ) (2024-06-29T02:40:28Z) - Differentially Private Deep Q-Learning for Pattern Privacy Preservation
in MEC Offloading [76.0572817182483]
攻撃者は、エッジサーバ(ES)のキュー情報とユーザの使用パターンを推測するために、オフロードの決定を盗み取ることができる。
パターンプライバシ(PP)を維持しつつ,レイテンシ,ESのエネルギー消費,タスク削減率を両立させるオフロード戦略を提案する。
そこで我々はDP-DQOアルゴリズムを開発し,PP問題にノイズを注入することでこの問題に対処する。
論文 参考訳(メタデータ) (2023-02-09T12:50:18Z) - Unsupervised Recurrent Federated Learning for Edge Popularity Prediction
in Privacy-Preserving Mobile Edge Computing Networks [31.871608633577047]
本稿では,MEC対応IIoTのための教師なし,プライバシ保護による人気予測フレームワークを提案する。
提案したフレームワークは、ルート平均二乗誤差を最大60.5%-68.7%まで削減することで予測精度を向上させることができる。
論文 参考訳(メタデータ) (2022-07-02T06:50:54Z) - Decentralized Stochastic Optimization with Inherent Privacy Protection [103.62463469366557]
分散最適化は、現代の協調機械学習、分散推定と制御、大規模センシングの基本的な構成要素である。
データが関与して以降、分散最適化アルゴリズムの実装において、プライバシ保護がますます重要になっている。
論文 参考訳(メタデータ) (2022-05-08T14:38:23Z) - Learning from Images: Proactive Caching with Parallel Convolutional
Neural Networks [94.85780721466816]
本稿では,プロアクティブキャッシングのための新しいフレームワークを提案する。
モデルベースの最適化とデータ駆動技術を組み合わせて、最適化問題をグレースケールのイメージに変換する。
数値計算の結果,提案手法は71.6%の計算時間を0.8%のコストで削減できることがわかった。
論文 参考訳(メタデータ) (2021-08-15T21:32:47Z) - Local Differential Privacy for Bayesian Optimization [12.05395706770007]
局所微分プライバシー(LDP)を保証した非パラメトリックガウス過程におけるブラックボックス最適化について検討する。
具体的には、各ユーザの報酬は、プライバシーを保護するためにさらに悪化し、学習者は、後悔を最小限に抑えるために、破損した報酬にのみアクセスすることができる。
GP-UCBフレームワークとLaplace DP機構に基づく3つのほぼ最適なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-10-13T21:50:09Z) - Differentially Private Federated Learning for Resource-Constrained
Internet of Things [24.58409432248375]
フェデレーション学習は、中央にデータをアップロードすることなく、分散されたスマートデバイスから大量のデータを分析できる。
本稿では、IoTのリソース制約されたスマートデバイスにまたがるデータから機械学習モデルを効率的にトレーニングするためのDP-PASGDと呼ばれる新しいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-28T04:32:54Z) - A Privacy-Preserving-Oriented DNN Pruning and Mobile Acceleration
Framework [56.57225686288006]
モバイルエッジデバイスの限られたストレージとコンピューティング能力を満たすために、ディープニューラルネットワーク(DNN)の軽量プルーニングが提案されている。
従来のプルーニング手法は主に、ユーザデータのプライバシを考慮せずに、モデルのサイズを減らしたり、パフォーマンスを向上させることに重点を置いていた。
プライベートトレーニングデータセットを必要としないプライバシ保護指向のプルーニングおよびモバイルアクセラレーションフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-13T23:52:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。