論文の概要: Generalization of Deep Reinforcement Learning for Jammer-Resilient
Frequency and Power Allocation
- arxiv url: http://arxiv.org/abs/2302.02250v2
- Date: Sat, 6 May 2023 19:03:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-09 23:09:07.025924
- Title: Generalization of Deep Reinforcement Learning for Jammer-Resilient
Frequency and Power Allocation
- Title(参考訳): ジャマー耐性周波数とパワーアロケーションのための深層強化学習の一般化
- Authors: Swatantra Kafle, Jithin Jagannath, Zackary Kane, Noor Biswas, Prem
Sagar Vasanth Kumar, Anu Jagannath
- Abstract要約: 我々は,深層強化学習モデルの一般化能力を強調しつつ,結合周波数と電力配分の問題に取り組む。
従来は見つからなかった無線ネットワーク上で,提案手法のトレーニングと推論性能の向上について検討した。
エンド・ツー・エンドのソリューションは組込みソフトウェア定義無線で実装され、オーバー・ザ・エア評価を用いて検証された。
- 参考スコア(独自算出の注目度): 4.436632973105495
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We tackle the problem of joint frequency and power allocation while
emphasizing the generalization capability of a deep reinforcement learning
model. Most of the existing methods solve reinforcement learning-based wireless
problems for a specific pre-determined wireless network scenario. The
performance of a trained agent tends to be very specific to the network and
deteriorates when used in a different network operating scenario (e.g.,
different in size, neighborhood, and mobility, among others). We demonstrate
our approach to enhance training to enable a higher generalization capability
during inference of the deployed model in a distributed multi-agent setting in
a hostile jamming environment. With all these, we show the improved training
and inference performance of the proposed methods when tested on previously
unseen simulated wireless networks of different sizes and architectures. More
importantly, to prove practical impact, the end-to-end solution was implemented
on the embedded software-defined radio and validated using over-the-air
evaluation.
- Abstract(参考訳): 我々は,深層強化学習モデルの一般化能力を強調しつつ,結合周波数と電力配分の問題に取り組む。
既存の手法の多くは、事前決定された無線ネットワークシナリオの強化学習ベースのワイヤレス問題を解決する。
訓練されたエージェントのパフォーマンスはネットワークに非常に特有であり、異なるネットワーク運用シナリオ(例えば、サイズ、周辺、移動性など)で使用されると劣化する傾向がある。
本稿では,分散マルチエージェント環境におけるデプロイモデルの推論において,より高度な一般化機能を実現するためのトレーニング強化手法を提案する。
これらの結果から,従来は見つからなかった異なるサイズとアーキテクチャの無線ネットワーク上で,提案手法のトレーニングと推論性能が向上したことを示す。
さらに重要なことは、実用的な影響を証明するために、組込みソフトウェア定義無線にエンドツーエンドのソリューションを実装し、オーバー・ザ・エア評価を用いて検証したことである。
関連論文リスト
- Multi-Agent Reinforcement Learning for Power Control in Wireless
Networks via Adaptive Graphs [1.1861167902268832]
多エージェント深部強化学習(MADRL)は、電力制御のような幅広い複雑な最適化問題に対処するための有望な手法として登場した。
本稿では,これらの課題を緩和する有効な手段として,分散エージェント間の通信誘導構造としてグラフを用いることを提案する。
論文 参考訳(メタデータ) (2023-11-27T14:25:40Z) - Deep Reinforcement Learning for mmWave Initial Beam Alignment [6.240268911509346]
我々は,mmWave通信における適応初期アクセスビームアライメント問題に対する深部強化学習アルゴリズムの適用性を検討した。
深層強化学習は、新しい広範囲のアプリケーションに対処する可能性がある。
提案手法は, 実測的な問題の大きさを訓練しても性能が良くないにもかかわらず, ビームフォーミングモジュールの形で動作空間の整形を導入することにより, 性能が大幅に向上することを示した。
論文 参考訳(メタデータ) (2023-02-17T16:10:42Z) - Multi-agent Reinforcement Learning with Graph Q-Networks for Antenna
Tuning [60.94661435297309]
モバイルネットワークの規模は、手作業による介入や手作業による戦略を使ってアンテナパラメータの最適化を困難にしている。
本研究では,モバイルネットワーク構成をグローバルに最適化するマルチエージェント強化学習アルゴリズムを提案する。
シミュレーション環境におけるアンテナ傾き調整問題とジョイント傾き・電力制御問題に対するアルゴリズムの性能を実証的に示す。
論文 参考訳(メタデータ) (2023-01-20T17:06:34Z) - Learning Dynamics and Generalization in Reinforcement Learning [59.530058000689884]
時間差学習は, エージェントが訓練の初期段階において, 値関数の非平滑成分を適合させるのに役立つことを理論的に示す。
本研究では,高密度報酬タスクの時間差アルゴリズムを用いて学習したニューラルネットワークが,ランダムなネットワークや政策手法で学習した勾配ネットワークよりも,状態間の一般化が弱いことを示す。
論文 参考訳(メタデータ) (2022-06-05T08:49:16Z) - Offline Contextual Bandits for Wireless Network Optimization [107.24086150482843]
本稿では,ユーザ要求の変化に応じて,ネットワーク内の各セルの構成パラメータを自動的に調整するポリシの学習方法について検討する。
私たちのソリューションは、オフライン学習のための既存の方法を組み合わせて、この文脈で生じる重要な課題を克服する原則的な方法でそれらを適応します。
論文 参考訳(メタデータ) (2021-11-11T11:31:20Z) - In-Network Learning: Distributed Training and Inference in Networks [10.635097939284753]
我々は,複数のデータストリームと処理ユニットを利用する学習アルゴリズムとアーキテクチャを開発する。
特に、この分析は、推論がネットワークをまたいでどのように伝播し、融合するかを明らかにする。
論文 参考訳(メタデータ) (2021-07-07T18:35:08Z) - All at Once Network Quantization via Collaborative Knowledge Transfer [56.95849086170461]
オールオンス量子化ネットワークを効率的にトレーニングするための新しい共同知識伝達アプローチを開発しています。
具体的には、低精度の学生に知識を伝達するための高精度のエンクォータを選択するための適応的選択戦略を提案する。
知識を効果的に伝達するために,低精度の学生ネットワークのブロックを高精度の教師ネットワークのブロックにランダムに置き換える動的ブロックスワッピング法を開発した。
論文 参考訳(メタデータ) (2021-03-02T03:09:03Z) - Reinforcement Learning for Datacenter Congestion Control [50.225885814524304]
渋滞制御アルゴリズムの成功は、レイテンシとネットワーク全体のスループットを劇的に改善する。
今日まで、このような学習ベースのアルゴリズムはこの領域で実用的な可能性を示さなかった。
実世界のデータセンターネットワークの様々な構成に一般化することを目的としたRLに基づくアルゴリズムを考案する。
本稿では,この手法が他のRL手法よりも優れており,トレーニング中に見られなかったシナリオに一般化可能であることを示す。
論文 参考訳(メタデータ) (2021-02-18T13:49:28Z) - Deep Actor-Critic Learning for Distributed Power Control in Wireless
Mobile Networks [5.930707872313038]
深層強化学習は、教師付きディープラーニングと古典的な最適化に代わるモデルなしの代替手段を提供する。
本稿では,深いアクター・クリティカル・ラーニングの助けを借りて,分散的に実行された連続電力制御アルゴリズムを提案する。
提案した電力制御アルゴリズムを,携帯端末とチャネル条件が急速に変化するタイムスロットシステムに統合する。
論文 参考訳(メタデータ) (2020-09-14T18:29:12Z) - Dynamics Generalization via Information Bottleneck in Deep Reinforcement
Learning [90.93035276307239]
本稿では,RLエージェントのより優れた一般化を実現するために,情報理論正則化目標とアニーリングに基づく最適化手法を提案する。
迷路ナビゲーションからロボットタスクまで、さまざまな領域において、我々のアプローチの極端な一般化の利点を実証する。
この研究は、タスク解決のために冗長な情報を徐々に取り除き、RLの一般化を改善するための原則化された方法を提供する。
論文 参考訳(メタデータ) (2020-08-03T02:24:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。