論文の概要: Exploiting Deep Reinforcement Learning for Edge Caching in Cell-Free
Massive MIMO Systems
- arxiv url: http://arxiv.org/abs/2208.12453v1
- Date: Fri, 26 Aug 2022 06:28:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-29 13:30:30.065729
- Title: Exploiting Deep Reinforcement Learning for Edge Caching in Cell-Free
Massive MIMO Systems
- Title(参考訳): セルレス大量MIMOシステムにおけるエッジキャッシングの深部強化学習
- Authors: Yu Zhang, Shuaifei Chen, and Jiayi Zhang
- Abstract要約: セルフリーの大規模マルチインプット・マルチプル出力は、鉄道無線通信の厳しい品質保証(QoE)要件を満たすことを約束している。
主な課題は、列車の速度の増大による急激な伝搬環境の変化により、所望のコンテンツをタイムリーに提供する方法である。
本稿では,コヒーレント・トランスミッションを行ない,エンドツーエンドの遅延を低減するために,今後のAPで積極的に要求されるコンテンツをキャッシュすることを提案する。
- 参考スコア(独自算出の注目度): 14.19884999844356
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cell-free massive multiple-input-multiple-output is promising to meet the
stringent quality-of-experience (QoE) requirements of railway wireless
communications by coordinating many successional access points (APs) to serve
the onboard users coherently. A key challenge is how to deliver the desired
contents timely due to the radical changing propagation environment caused by
the growing train speed. In this paper, we propose to proactively cache the
likely-requesting contents at the upcoming APs which perform the coherent
transmission to reduce end-to-end delay. A long-term QoE-maximization problem
is formulated and two cache placement algorithms are proposed. One is based on
heuristic convex optimization (HCO) and the other exploits deep reinforcement
learning (DRL) with soft actor-critic (SAC). Compared to the conventional
benchmark, numerical results show the advantage of our proposed algorithms on
QoE and hit probability. With the advanced DRL model, SAC outperforms HCO on
QoE by predicting the user requests accurately.
- Abstract(参考訳): セルフリーな大規模マルチインプット・マルチプル出力は、多くの連続アクセスポイント(AP)を協調してオンボードユーザーに提供することで、鉄道無線通信の厳しい品質要件(QoE)を満たすことを約束している。
重要な課題は,列車速度の増大に伴う過激な伝搬環境の変化により,所望のコンテンツをタイムリーに配信する方法である。
本稿では,このコヒーレント伝送を行ない,エンドツーエンドの遅延を低減するために,潜在的に要求されるコンテンツを今後のAPにキャッシュすることを提案する。
長期QoE最大化問題を定式化し、2つのキャッシュ配置アルゴリズムを提案する。
ひとつはヒューリスティック凸最適化(hco)、もうひとつはsoft actor-critic(sac)を用いた深層強化学習(drl)の活用である。
従来のベンチマークと比較すると,提案したQoEアルゴリズムとヒット確率の利点が示される。
アドバンストDRLモデルでは、SACはユーザの要求を正確に予測することで、QoE上のHCOよりも優れている。
関連論文リスト
- DEER: A Delay-Resilient Framework for Reinforcement Learning with Variable Delays [26.032139258562708]
本稿では,解釈性を効果的に向上し,ランダム遅延問題に対処するためのフレームワークである$textbfDEER (Delay-Resilient-Enhanced RL)$を提案する。
様々な遅延シナリオでは、トレーニングされたエンコーダは、追加の修正を必要とせずに、標準のRLアルゴリズムとシームレスに統合することができる。
その結果, DEER は定常およびランダムな遅延設定において最先端の RL アルゴリズムよりも優れていることを確認した。
論文 参考訳(メタデータ) (2024-06-05T09:45:26Z) - Adaptive User-Centric Entanglement Routing in Quantum Data Networks [5.421492821020181]
分散量子コンピューティング(DQC)は、量子データネットワーク(QDN)を介して複数の小さな量子コンピュータ(QC)を相互接続することで、量子コンピューティングの可能性を活用するという大きな可能性を秘めている。
QDN内の量子テレポーテーションのための2つのQC間の長距離量子絡み合わせを確立することは重要な側面であり、絡み合わせルーティングを伴う。
既存のアプローチは主に、現在の絡み合い接続(EC)要求に対する絡み合い性能の最適化に重点を置いている。
本稿では,ユーザの予算制約に固執しながら,絡み合いの成功率を最大化するために,長期にわたるユーザ中心の絡み合いルーティング問題を提案する。
論文 参考訳(メタデータ) (2024-04-13T17:20:00Z) - Learning RL-Policies for Joint Beamforming Without Exploration: A Batch
Constrained Off-Policy Approach [1.0080317855851213]
本稿では,ネットワークにおけるパラメータキャンセル最適化の問題点について考察する。
探索と学習のために実世界でアルゴリズムをデプロイすることは、探索せずにデータによって達成できることを示す。
論文 参考訳(メタデータ) (2023-10-12T18:36:36Z) - Differentially Private Deep Q-Learning for Pattern Privacy Preservation
in MEC Offloading [76.0572817182483]
攻撃者は、エッジサーバ(ES)のキュー情報とユーザの使用パターンを推測するために、オフロードの決定を盗み取ることができる。
パターンプライバシ(PP)を維持しつつ,レイテンシ,ESのエネルギー消費,タスク削減率を両立させるオフロード戦略を提案する。
そこで我々はDP-DQOアルゴリズムを開発し,PP問題にノイズを注入することでこの問題に対処する。
論文 参考訳(メタデータ) (2023-02-09T12:50:18Z) - Collaborative Intelligent Reflecting Surface Networks with Multi-Agent
Reinforcement Learning [63.83425382922157]
インテリジェント・リフレクション・サーフェス(IRS)は将来の無線ネットワークに広く応用されることが想定されている。
本稿では,エネルギー収穫能力を備えた協調型IRSデバイスを用いたマルチユーザ通信システムについて検討する。
論文 参考訳(メタデータ) (2022-03-26T20:37:14Z) - Real-Time GPU-Accelerated Machine Learning Based Multiuser Detection for
5G and Beyond [70.81551587109833]
非線形ビームフォーミングフィルタは、大規模な接続を伴う定常シナリオにおいて、線形アプローチを著しく上回る。
主な課題の1つは、これらのアルゴリズムのリアルタイム実装である。
本稿では,大規模並列化によるAPSMに基づくアルゴリズムの高速化について検討する。
論文 参考訳(メタデータ) (2022-01-13T15:20:45Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - APQ: Joint Search for Network Architecture, Pruning and Quantization
Policy [49.3037538647714]
本稿では,リソース制約のあるハードウェア上での効率的なディープラーニング推論のためのAPQを提案する。
ニューラルアーキテクチャ、プルーニングポリシー、量子化ポリシーを別々に検索する従来の方法とは異なり、我々はそれらを共同で最適化する。
同じ精度で、APQはMobileNetV2+HAQよりもレイテンシ/エネルギーを2倍/1.3倍削減する。
論文 参考訳(メタデータ) (2020-06-15T16:09:17Z) - Reinforcement Learning Based Cooperative Coded Caching under Dynamic
Popularities in Ultra-Dense Networks [38.44125997148742]
小規模基地局(SBS)のキャッシュ戦略は、膨大なデータレート要求を満たすために重要である。
我々は、強化学習(RL)を利用して、最大距離分離可能(MDS)符号化による協調的なキャッシュ戦略を設計する。
論文 参考訳(メタデータ) (2020-03-08T10:45:45Z) - Non-Cooperative Game Theory Based Rate Adaptation for Dynamic Video
Streaming over HTTP [89.30855958779425]
Dynamic Adaptive Streaming over HTTP (DASH)は、新興かつ有望なマルチメディアストリーミング技術であることを示した。
本稿では,サーバの限られた輸出帯域幅をマルチユーザに対して最適に割り当てるアルゴリズムを提案し,その品質・オブ・エクスペリエンス(QoE)を公平性で最大化する。
論文 参考訳(メタデータ) (2019-12-27T01:19:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。