論文の概要: Differentially Private Deep Q-Learning for Pattern Privacy Preservation
in MEC Offloading
- arxiv url: http://arxiv.org/abs/2302.04608v1
- Date: Thu, 9 Feb 2023 12:50:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-10 15:53:30.469481
- Title: Differentially Private Deep Q-Learning for Pattern Privacy Preservation
in MEC Offloading
- Title(参考訳): MECオフロードにおけるパターンプライバシ保護のための微分プライベートQ-Learning
- Authors: Shuying Gan, Marie Siew, Chao Xu, Tony Q.S. Quek
- Abstract要約: 攻撃者は、エッジサーバ(ES)のキュー情報とユーザの使用パターンを推測するために、オフロードの決定を盗み取ることができる。
パターンプライバシ(PP)を維持しつつ,レイテンシ,ESのエネルギー消費,タスク削減率を両立させるオフロード戦略を提案する。
そこで我々はDP-DQOアルゴリズムを開発し,PP問題にノイズを注入することでこの問題に対処する。
- 参考スコア(独自算出の注目度): 76.0572817182483
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mobile edge computing (MEC) is a promising paradigm to meet the quality of
service (QoS) requirements of latency-sensitive IoT applications. However,
attackers may eavesdrop on the offloading decisions to infer the edge server's
(ES's) queue information and users' usage patterns, thereby incurring the
pattern privacy (PP) issue. Therefore, we propose an offloading strategy which
jointly minimizes the latency, ES's energy consumption, and task dropping rate,
while preserving PP. Firstly, we formulate the dynamic computation offloading
procedure as a Markov decision process (MDP). Next, we develop a Differential
Privacy Deep Q-learning based Offloading (DP-DQO) algorithm to solve this
problem while addressing the PP issue by injecting noise into the generated
offloading decisions. This is achieved by modifying the deep Q-network (DQN)
with a Function-output Gaussian process mechanism. We provide a theoretical
privacy guarantee and a utility guarantee (learning error bound) for the DP-DQO
algorithm and finally, conduct simulations to evaluate the performance of our
proposed algorithm by comparing it with greedy and DQN-based algorithms.
- Abstract(参考訳): モバイルエッジコンピューティング(MEC)は、レイテンシに敏感なIoTアプリケーションの品質(QoS)要件を満たすための、有望なパラダイムである。
しかしながら、攻撃者は、エッジサーバ(es)のキュー情報とユーザの使用パターンを推測するオフロード決定を盗聴して、パターンプライバシ(pp)の問題を引き起こす可能性がある。
そこで本研究では, PP を保ちながら, 遅延, ES のエネルギー消費, タスク削減率を両立させるオフロード戦略を提案する。
まず, 動的計算オフロード手順をマルコフ決定過程(MDP)として定式化する。
次に、差分プライバシー深層Q-ラーニングに基づくオフローディング(DP-DQO)アルゴリズムを開発し、この問題を解決するとともに、生成されたオフローディング決定にノイズを注入することでPP問題に対処する。
これはDQN(Deep Q-network)をFunction-output Gaussianプロセス機構で修正することで実現される。
DP-DQOアルゴリズムの理論的プライバシ保証と実用性保証(学習エラー境界)を提供し、最後に、提案アルゴリズムの性能をgreedyおよびDQNベースのアルゴリズムと比較して評価するシミュレーションを行う。
関連論文リスト
- Pointer Networks with Q-Learning for Combinatorial Optimization [55.2480439325792]
我々は、モデルフリーQ値ポリシー近似をPointer Networks(Ptr-Nets)と統合したハイブリッドニューラルネットワークであるPointer Q-Network(PQN)を紹介する。
実験により,本手法の有効性を実証し,不安定な環境でモデルをテストする。
論文 参考訳(メタデータ) (2023-11-05T12:03:58Z) - Dynamic Partial Computation Offloading for the Metaverse in In-Network
Computing [1.1124588036301817]
我々はCOIN環境における複数のサブタスクに対するメタバースにおける部分計算のオフロード問題を考察する。
我々はこれを,ユーザ側のタスク分割問題(TSP)と,COIN側のタスクオフロード問題(TOP)の2つのサブプロブレムに変換する。
知的エージェントが特定の確率でランダムにオフロード決定をサンプリングする従来のDDQNアルゴリズムとは異なり、COINエージェントはTSPとディープニューラルネットワークのNEを探索する。
論文 参考訳(メタデータ) (2023-06-09T16:41:34Z) - Optimal Privacy Preserving for Federated Learning in Mobile Edge
Computing [35.57643489979182]
ユーザ差分プライバシ(DP)を維持するための有望なアプローチとして,無線ネットワーク上での定量化と意図的なノイズ付加によるフェデレーション学習(FL)がある。
本稿では,無線ネットワークとDP要件の制約下での収束率を最大化するために,量子化と二項機構パラメータと通信資源を協調的に最適化することを目的とする。
論文 参考訳(メタデータ) (2022-11-14T07:54:14Z) - Reinforcement Learning with a Terminator [80.34572413850186]
我々は, TerMDP のパラメータを学習し, 推定問題の構造を活用し, 状態ワイドな信頼境界を提供する。
我々はこれらを用いて証明可能な効率のよいアルゴリズムを構築し、終端を考慮し、その後悔を抑える。
論文 参考訳(メタデータ) (2022-05-30T18:40:28Z) - Collaborative Intelligent Reflecting Surface Networks with Multi-Agent
Reinforcement Learning [63.83425382922157]
インテリジェント・リフレクション・サーフェス(IRS)は将来の無線ネットワークに広く応用されることが想定されている。
本稿では,エネルギー収穫能力を備えた協調型IRSデバイスを用いたマルチユーザ通信システムについて検討する。
論文 参考訳(メタデータ) (2022-03-26T20:37:14Z) - Distributed Reinforcement Learning for Privacy-Preserving Dynamic Edge
Caching [91.50631418179331]
MECネットワークにおけるデバイスのキャッシュヒット率を最大化するために,プライバシ保護型分散ディープポリシー勾配(P2D3PG)を提案する。
分散最適化をモデルフリーなマルコフ決定プロセス問題に変換し、人気予測のためのプライバシー保護フェデレーション学習手法を導入する。
論文 参考訳(メタデータ) (2021-10-20T02:48:27Z) - Learning Augmented Index Policy for Optimal Service Placement at the
Network Edge [8.136957953239254]
私たちは、意思決定者がエッジでホストする$ N$サービスのいずれかを選択する必要があるネットワークエッジでサービス配置の問題を検討します。
私たちの目標は、顧客の平均サービス配信遅延を最小限に抑える適応アルゴリズムを設計することです。
論文 参考訳(メタデータ) (2021-01-10T23:54:59Z) - RIS Enhanced Massive Non-orthogonal Multiple Access Networks: Deployment
and Passive Beamforming Design [116.88396201197533]
再構成可能なインテリジェントサーフェス(RIS)の配置と受動ビームフォーミング設計のための新しいフレームワークを提案する。
エネルギー効率を最大化するために、共同配置、位相シフト設計、および電力配分の問題を定式化する。
リアルタイムデータセットを活用することで,ユーザの遠隔交通需要を予測するために,LSTM(Long Short-term memory)ベースのエコー状態ネットワーク(ESN)アルゴリズムを提案する。
RISの展開と設計の連立問題を解くために,D3QNに基づく位置取得と位相制御アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-01-28T14:37:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。