論文の概要: Fast Reinforcement Learning for Anti-jamming Communications
- arxiv url: http://arxiv.org/abs/2002.05364v1
- Date: Thu, 13 Feb 2020 06:37:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-01 13:38:36.607744
- Title: Fast Reinforcement Learning for Anti-jamming Communications
- Title(参考訳): アンチジャミング通信のための高速強化学習
- Authors: Pei-Gen Ye, Yuan-Gen Wang, Jin Li, Liang Xiao
- Abstract要約: Letterは、アンチジャミング通信のための高速強化学習アルゴリズムを提供する。
提案アルゴリズムは無線通信システムにおいて複数のジャマーに対して実装される。
- 参考スコア(独自算出の注目度): 12.5424542850836
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This letter presents a fast reinforcement learning algorithm for anti-jamming
communications which chooses previous action with probability $\tau$ and
applies $\epsilon$-greedy with probability $(1-\tau)$. A dynamic threshold
based on the average value of previous several actions is designed and
probability $\tau$ is formulated as a Gaussian-like function to guide the
wireless devices. As a concrete example, the proposed algorithm is implemented
in a wireless communication system against multiple jammers. Experimental
results demonstrate that the proposed algorithm exceeds Q-learing, deep
Q-networks (DQN), double DQN (DDQN), and prioritized experience reply based
DDQN (PDDQN), in terms of signal-to-interference-plus-noise ratio and
convergence rate.
- Abstract(参考訳): このレターは、反ジャミングコミュニケーションのための高速な強化学習アルゴリズムを示し、確率$\tau$で以前のアクションを選択し、確率$(1-\tau)$で$\epsilon$-greedyを適用する。
従来の複数の動作の平均値に基づく動的閾値を設計し、確率$\tau$を無線装置を誘導するガウス関数として定式化する。
具体的な例として,提案手法は複数のジャマーに対する無線通信システムにおいて実装されている。
実験の結果,提案アルゴリズムはQ-learing, Deep Q-networks (DQN), double DQN (DDQN), priorityd experience response based DDQN (PDDQN) を信号対干渉+雑音比と収束率で上回った。
関連論文リスト
- DASA: Delay-Adaptive Multi-Agent Stochastic Approximation [64.32538247395627]
我々は,N$エージェントが並列に動作し,中央サーバと通信することで,一般的な近似問題を高速化することを目的とした設定を考える。
遅延とストラグラーの効果を軽減するために,マルチエージェント近似のための遅延適応アルゴリズムである textttDASA を提案する。
論文 参考訳(メタデータ) (2024-03-25T22:49:56Z) - Robust Training and Verification of Implicit Neural Networks: A
Non-Euclidean Contractive Approach [64.23331120621118]
本稿では,暗黙的ニューラルネットワークのトレーニングとロバスト性検証のための理論的および計算的枠組みを提案する。
組込みネットワークを導入し、組込みネットワークを用いて、元のネットワークの到達可能な集合の超近似として$ell_infty$-normボックスを提供することを示す。
MNISTデータセット上で暗黙的なニューラルネットワークをトレーニングするためにアルゴリズムを適用し、我々のモデルの堅牢性と、文献における既存のアプローチを通じてトレーニングされたモデルを比較する。
論文 参考訳(メタデータ) (2022-08-08T03:13:24Z) - Interference-Limited Ultra-Reliable and Low-Latency Communications:
Graph Neural Networks or Stochastic Geometry? [45.776476161876204]
我々は、繰り返しスキームを表現し、それを訓練するために、ランダムエッジグラフニューラルネットワーク(REGNN)をケースケードで構築する。
対称シナリオにおける幾何学的手法による違反確率を解析し、モデルに基づくExhaustive Search (ES) 法を適用して最適解を求める。
論文 参考訳(メタデータ) (2022-07-11T05:49:41Z) - Matching Pursuit Based Scheduling for Over-the-Air Federated Learning [67.59503935237676]
本稿では,フェデレートラーニング手法を用いて,オーバー・ザ・エアラーニングのための低複雑さデバイススケジューリングアルゴリズムのクラスを開発する。
最先端の提案方式と比較すると,提案方式は極めて低効率なシステムである。
提案手法の有効性は,CIFARデータセットを用いた実験により確認した。
論文 参考訳(メタデータ) (2022-06-14T08:14:14Z) - Quantum Digital Signatures with Random Pairing [5.188295416244742]
本稿では,QDSの効率を大幅に向上させる,乱数ペアリングQDS(RP-QDS)の一般化手法を提案する。
この方法では、各ペアのパリティ値が結果ビット値に使用される。
数値シミュレーションの結果,ノイズチャネル下ではシグネチャレートを100%以上向上できることがわかった。
論文 参考訳(メタデータ) (2022-01-25T18:36:38Z) - Blind Coherent Preamble Detection via Neural Networks [2.2063018784238984]
ニューラルネットワーク(NN)シークエンス検出器とタイミング先進推定器を提案する。
NNによるプリアンブル検出のプロセス全体を置き換えるものではない。
本稿では,通信路効果を補うために,検出器内の信号を組み合わせたテキストブロードコヒーレントにのみNNを用いることを提案する。
論文 参考訳(メタデータ) (2021-09-30T09:53:49Z) - NOMA in UAV-aided cellular offloading: A machine learning approach [59.32570888309133]
複数の無人航空機(UAV)によるセルローディングのための新しい枠組みの提案
非直交多重アクセス(NOMA)技術は、無線ネットワークのスペクトル効率をさらに向上するために、各UAVに採用されている。
相互深いQ-network (MDQN) アルゴリズムは,UAVの最適3次元軌道と電力配分を共同で決定するために提案される。
論文 参考訳(メタデータ) (2020-10-18T17:38:48Z) - Finite-Time Analysis for Double Q-learning [50.50058000948908]
二重Q-ラーニングのための非漸近的有限時間解析を初めて提供する。
同期と非同期の二重Q-ラーニングの両方が,グローバル最適化の$epsilon$-accurate近辺に収束することが保証されていることを示す。
論文 参考訳(メタデータ) (2020-09-29T18:48:21Z) - Preparation of excited states for nuclear dynamics on a quantum computer [117.44028458220427]
量子コンピュータ上で励起状態を作成するための2つの異なる方法を研究する。
シミュレーションおよび実量子デバイス上でこれらの手法をベンチマークする。
これらの結果から,フォールトトレラントデバイスに優れたスケーリングを実現するために設計された量子技術が,接続性やゲート忠実性に制限されたデバイスに実用的なメリットをもたらす可能性が示唆された。
論文 参考訳(メタデータ) (2020-09-28T17:21:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。