論文の概要: Dynamic Spectrum Access for Ambient Backscatter Communication-assisted D2D Systems with Quantum Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2410.17971v1
- Date: Wed, 23 Oct 2024 15:36:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-24 13:55:09.454923
- Title: Dynamic Spectrum Access for Ambient Backscatter Communication-assisted D2D Systems with Quantum Reinforcement Learning
- Title(参考訳): 量子強化学習を用いたアンビエント後方散乱通信支援D2Dシステムのための動的スペクトルアクセス
- Authors: Nguyen Van Huynh, Bolun Zhang, Dinh-Hieu Tran, Dinh Thai Hoang, Diep N. Nguyen, Gan Zheng, Dusit Niyato, Quoc-Viet Pham,
- Abstract要約: 無線スペクトルは乏しくなり、D2D通信のスペクトル効率は低い。
本稿では, 周囲RF信号の後方散乱を可能にするために, 環境後方散乱通信技術をD2Dデバイスに統合することを目的とする。
我々は、より少ないトレーニングパラメータでより高速な収束率を達成することができる新しい量子強化学習(RL)アルゴリズムを開発した。
- 参考スコア(独自算出の注目度): 68.63990729719369
- License:
- Abstract: Spectrum access is an essential problem in device-to-device (D2D) communications. However, with the recent growth in the number of mobile devices, the wireless spectrum is becoming scarce, resulting in low spectral efficiency for D2D communications. To address this problem, this paper aims to integrate the ambient backscatter communication technology into D2D devices to allow them to backscatter ambient RF signals to transmit their data when the shared spectrum is occupied by mobile users. To obtain the optimal spectrum access policy, i.e., stay idle or access the shared spectrum and perform active transmissions or backscattering ambient RF signals for transmissions, to maximize the average throughput for D2D users, deep reinforcement learning (DRL) can be adopted. However, DRL-based solutions may require long training time due to the curse of dimensionality issue as well as complex deep neural network architectures. For that, we develop a novel quantum reinforcement learning (RL) algorithm that can achieve a faster convergence rate with fewer training parameters compared to DRL thanks to the quantum superposition and quantum entanglement principles. Specifically, instead of using conventional deep neural networks, the proposed quantum RL algorithm uses a parametrized quantum circuit to approximate an optimal policy. Extensive simulations then demonstrate that the proposed solution not only can significantly improve the average throughput of D2D devices when the shared spectrum is busy but also can achieve much better performance in terms of convergence rate and learning complexity compared to existing DRL-based methods.
- Abstract(参考訳): スペクトルアクセスはデバイス間通信(D2D)において重要な問題である。
しかし,近年のモバイル端末数の増加に伴い,無線帯域は少なくなり,D2D通信のスペクトル効率は低くなった。
そこで本論文では,D2Dデバイスに周辺無線通信技術を統合することで,モバイル利用者が共有帯域を占有する場合に,周囲RF信号を後方散乱してデータを送信できるようにすることを目的とする。
D2Dユーザの平均スループットを最大化するために、アイドル状態に留まったり、共有スペクトルにアクセスしたり、送信のためのアクティブな送信や周囲RF信号の後方散乱といった最適なスペクトルアクセスポリシーを実現するため、深層強化学習(DRL)を採用することができる。
しかし、DRLベースのソリューションは、次元問題や複雑なディープニューラルネットワークアーキテクチャの呪いのため、長いトレーニング時間を必要とする可能性がある。
そこで我々は,量子重ね合わせと量子絡み合いの原理により,DRLに比べてトレーニングパラメータが少なく,より高速な収束率が得られる量子強化学習(RL)アルゴリズムを開発した。
具体的には、従来のディープニューラルネットワークの代わりに、提案した量子RLアルゴリズムは、パラメータ化された量子回路を用いて最適なポリシーを近似する。
広範シミュレーションにより,提案手法は,共有スペクトルが多用された場合のD2Dデバイスの平均スループットを著しく向上するだけでなく,既存のDRL法に比べて収束率や学習の複雑さの点で優れた性能が得られることを示した。
関連論文リスト
- Neuromorphic Wireless Split Computing with Multi-Level Spikes [69.73249913506042]
ニューロモルフィックコンピューティングでは、スパイクニューラルネットワーク(SNN)が推論タスクを実行し、シーケンシャルデータを含むワークロードの大幅な効率向上を提供する。
ハードウェアとソフトウェアの最近の進歩は、スパイクニューロン間で交換された各スパイクに数ビットのペイロードを埋め込むことにより、推論精度をさらに高めることを示した。
本稿では,マルチレベルSNNを用いた無線ニューロモルフィック分割計算アーキテクチャについて検討する。
論文 参考訳(メタデータ) (2024-11-07T14:08:35Z) - Deep Learning for Low-Latency, Quantum-Ready RF Sensing [2.5393702482222813]
近年の研究では、無線周波数(RF)信号のソフトウェア処理を強化するためにディープラーニングを適用することが期待されている。
本稿では,RF信号分類のための量子可読機械学習手法の実装について述べる。
論文 参考訳(メタデータ) (2024-04-27T17:22:12Z) - Multi-task Learning Approach for Modulation and Wireless Signal
Classification for 5G and Beyond: Edge Deployment via Model Compression [1.218340575383456]
将来的な通信網は、異種無線デバイスの成長に対応するために、少ないスペクトルに対処する必要がある。
我々は、深層ニューラルネットワークに基づくマルチタスク学習フレームワークの可能性を利用して、変調と信号分類タスクを同時に学習する。
公共利用のための包括的ヘテロジニアス無線信号データセットを提供する。
論文 参考訳(メタデータ) (2022-02-26T14:51:02Z) - Real-Time GPU-Accelerated Machine Learning Based Multiuser Detection for
5G and Beyond [70.81551587109833]
非線形ビームフォーミングフィルタは、大規模な接続を伴う定常シナリオにおいて、線形アプローチを著しく上回る。
主な課題の1つは、これらのアルゴリズムのリアルタイム実装である。
本稿では,大規模並列化によるAPSMに基づくアルゴリズムの高速化について検討する。
論文 参考訳(メタデータ) (2022-01-13T15:20:45Z) - Dynamic Network-Assisted D2D-Aided Coded Distributed Learning [59.29409589861241]
本稿では,デバイス間のロードバランシングのための新しいデバイス・ツー・デバイス(D2D)支援型符号化学習手法(D2D-CFL)を提案する。
最小処理時間を達成するための最適圧縮率を導出し、収束時間との接続を確立する。
提案手法は,ユーザが継続的にトレーニングデータを生成するリアルタイム協調アプリケーションに有用である。
論文 参考訳(メタデータ) (2021-11-26T18:44:59Z) - Deep Reinforcement Learning for Intelligent Reflecting Surface-assisted
D2D Communications [33.9975494305404]
知的反射面(IRS)をサポートしたデバイス間通信(D2D)におけるネットワークの総和レートの最適化問題を解決するための深層強化学習(DRL)手法を提案する。
IRSは干渉を緩和し、D2D送信機と関連するD2D受信機の間の信号を強化する。
マルコフ決定過程を定式化し、最大化ゲームを解決するための近似ポリシー最適化を提案する。
論文 参考訳(メタデータ) (2021-08-06T00:02:37Z) - Multi-hop RIS-Empowered Terahertz Communications: A DRL-based Hybrid
Beamforming Design [39.21220050099642]
テラヘルツ帯における無線通信 (0.1-10thz) は、将来の第6世代 (6g) 無線通信システムの鍵となる技術の一つとして考えられている。
マルチホップRIS対応通信ネットワークのための新しいハイブリッドビームフォーミング方式を提案し,THz帯域でのカバレッジ範囲を改善する。
論文 参考訳(メタデータ) (2021-01-22T14:56:28Z) - Deep Learning-based Resource Allocation For Device-to-Device
Communication [66.74874646973593]
デバイス間通信(D2D)を用いたマルチチャネルセルシステムにおいて,リソース割り当ての最適化のためのフレームワークを提案する。
任意のチャネル条件に対する最適な資源配分戦略をディープニューラルネットワーク(DNN)モデルにより近似する深層学習(DL)フレームワークを提案する。
シミュレーションの結果,提案手法のリアルタイム性能を低速で実現できることが確認された。
論文 参考訳(メタデータ) (2020-11-25T14:19:23Z) - Optimization-driven Deep Reinforcement Learning for Robust Beamforming
in IRS-assisted Wireless Communications [54.610318402371185]
Intelligent Reflecting Surface (IRS)は、マルチアンテナアクセスポイント(AP)から受信機へのダウンリンク情報伝達を支援する有望な技術である。
我々は、APのアクティブビームフォーミングとIRSのパッシブビームフォーミングを共同最適化することで、APの送信電力を最小化する。
過去の経験からビームフォーミング戦略に適応できる深層強化学習(DRL)手法を提案する。
論文 参考訳(メタデータ) (2020-05-25T01:42:55Z) - Reconfigurable Intelligent Surface Assisted Multiuser MISO Systems
Exploiting Deep Reinforcement Learning [21.770491711632832]
再構成可能なインテリジェントサーフェス(RIS)は、将来の6世代(6G)無線通信システムにおいて重要な技術の一つとして推測されている。
本稿では, 基地局におけるビームフォーミング行列とRISにおける位相シフト行列の接合設計について, 深部強化学習(DRL)の最近の進歩を活用して検討する。
提案アルゴリズムは環境から学習し、その振る舞いを徐々に改善するだけでなく、2つの最先端ベンチマークと比較して同等の性能が得られる。
論文 参考訳(メタデータ) (2020-02-24T04:28:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。