論文の概要: Reinforcement Learning for Efficient and Tuning-Free Link Adaptation
- arxiv url: http://arxiv.org/abs/2010.08651v2
- Date: Wed, 5 May 2021 00:44:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-06 22:24:09.434919
- Title: Reinforcement Learning for Efficient and Tuning-Free Link Adaptation
- Title(参考訳): 効率的・チューニングフリーリンク適応のための強化学習
- Authors: Vidit Saxena, Hugo Tullberg, and Joakim Jald\'en
- Abstract要約: 無線リンクは、データ転送パラメータを動的チャネルの状態に適応させる。
本稿では,データ伝達パラメータ間の相関を利用したリンク適応のための潜在学習モデルを提案する。
我々は、通信路のダイナミクスを自動的に追跡するチューニング不要のメカニズムにより、LTSを無線チャネルに拡張する。
- 参考スコア(独自算出の注目度): 0.9176056742068812
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Wireless links adapt the data transmission parameters to the dynamic channel
state -- this is called link adaptation. Classical link adaptation relies on
tuning parameters that are challenging to configure for optimal link
performance. Recently, reinforcement learning has been proposed to automate
link adaptation, where the transmission parameters are modeled as discrete arms
of a multi-armed bandit. In this context, we propose a latent learning model
for link adaptation that exploits the correlation between data transmission
parameters. Further, motivated by the recent success of Thompson sampling for
multi-armed bandit problems, we propose a latent Thompson sampling (LTS)
algorithm that quickly learns the optimal parameters for a given channel state.
We extend LTS to fading wireless channels through a tuning-free mechanism that
automatically tracks the channel dynamics. In numerical evaluations with fading
wireless channels, LTS improves the link throughout by up to 100% compared to
the state-of-the-art link adaptation algorithms.
- Abstract(参考訳): 無線リンクは、データ送信パラメータを動的チャネルの状態に適応させる -- これはリンク適応と呼ばれる。
古典的なリンク適応は、最適なリンク性能の設定が難しいチューニングパラメータに依存している。
近年,多腕バンディットの離散アームとして伝達パラメータがモデル化されるリンク適応の自動化のために強化学習が提案されている。
本稿では,データ伝達パラメータ間の相関を利用したリンク適応のための潜在学習モデルを提案する。
さらに,近年のマルチアームバンディット問題に対するトンプソンサンプリングの成功により,与えられたチャネル状態に対する最適パラメータを迅速に学習する潜時トンプソンサンプリング(LTS)アルゴリズムを提案する。
チャネルダイナミクスを自動的に追跡するチューニングフリー機構によって、ltsをフェーディング無線チャネルに拡張します。
減少する無線チャネルを用いた数値評価では、LTSは最先端のリンク適応アルゴリズムと比較して、全リンクを最大100%改善する。
関連論文リスト
- RAP: Efficient Text-Video Retrieval with Sparse-and-Correlated Adapter [77.0205013713008]
Text-Video Retrieval (TVR)は、関連するビデオコンテンツと自然言語クエリを連携させることを目的としている。
現在までに、ほとんどの最先端のTVR手法は、大規模な事前学習された視覚モデルに基づいて、画像からビデオへの変換学習を学習している。
パラメータ化層数で事前学習モデルの微調整を行うためのスパース・アンド・コラージュAdaPter (RAP) を提案する。
論文 参考訳(メタデータ) (2024-05-29T19:23:53Z) - UAV-assisted Semantic Communication with Hybrid Action Reinforcement
Learning [19.48293218551122]
本稿では, セマンティックモデルスケール, チャネル割り当て, 送信電力, UAV軌道に関する決定を行うためのハイブリッドアクション強化学習フレームワークを提案する。
シミュレーションの結果,提案したハイブリッドアクション強化学習フレームワークは,アップリンクセマンティックデータ収集の効率を効果的に向上できることが示された。
論文 参考訳(メタデータ) (2023-08-18T06:30:18Z) - Hybrid Knowledge-Data Driven Channel Semantic Acquisition and
Beamforming for Cell-Free Massive MIMO [6.010360758759109]
本稿では、ユビキタス・拡張現実(XR)アプリケーションのサポートを改善するために、屋外無線システムの進歩に焦点を当てる。
セルレス大規模マルチインプットマルチアウトプット(MIMO)システムにおいて,チャネル意味獲得とマルチユーザビームフォーミングのためのハイブリッド知識データ駆動方式を提案する。
論文 参考訳(メタデータ) (2023-07-06T15:35:55Z) - Learning OFDM Waveforms with PAPR and ACLR Constraints [15.423422040627331]
達成可能な情報レートを最大化しつつ,選択した制約を満たすOFDMベースの波形を設計するための学習ベース手法を提案する。
エンドツーエンドシステムは,PAPRとACLRの制約を満たすことができ,スループットを著しく向上させることができることを示す。
論文 参考訳(メタデータ) (2021-10-21T08:58:59Z) - Distributional Reinforcement Learning for mmWave Communications with
Intelligent Reflectors on a UAV [119.97450366894718]
無人航空機(UAV)搭載のインテリジェントリフレクタ(IR)を用いた新しい通信フレームワークを提案する。
ダウンリンク和率を最大化するために、最適プリコーディング行列(基地局)と反射係数(IR)を共同で導出する。
論文 参考訳(メタデータ) (2020-11-03T16:50:37Z) - Efficient Online Learning for Cognitive Radar-Cellular Coexistence via
Contextual Thompson Sampling [9.805913930878]
本稿では,適応型レーダ伝送における逐次的,あるいはオンライン学習方式について述べる。
レーダの振舞いを駆動するために、線形コンテキスト帯域学習(CB)フレームワークが適用される。
提案したThompson Smpling (TS)アルゴリズムはより複雑なディープQ-Network (DQN) と競合する性能を維持していることを示す。
論文 参考訳(メタデータ) (2020-08-24T01:20:58Z) - Harnessing Wireless Channels for Scalable and Privacy-Preserving
Federated Learning [56.94644428312295]
無線接続は、フェデレートラーニング(FL)の実現に有効である
Channel randomnessperturbs 各ワーカはモデル更新をインバージョンし、複数のワーカはバンド幅に大きな干渉を発生させる。
A-FADMMでは、すべてのワーカーがモデル更新をアナログ送信を介して単一のチャンネルを使用してパラメータサーバにアップロードする。
これは通信帯域幅を節約するだけでなく、各ワーカーの正確なモデル更新軌跡を任意の盗聴者から隠蔽する。
論文 参考訳(メタデータ) (2020-07-03T16:31:15Z) - Optimization-driven Deep Reinforcement Learning for Robust Beamforming
in IRS-assisted Wireless Communications [54.610318402371185]
Intelligent Reflecting Surface (IRS)は、マルチアンテナアクセスポイント(AP)から受信機へのダウンリンク情報伝達を支援する有望な技術である。
我々は、APのアクティブビームフォーミングとIRSのパッシブビームフォーミングを共同最適化することで、APの送信電力を最小化する。
過去の経験からビームフォーミング戦略に適応できる深層強化学習(DRL)手法を提案する。
論文 参考訳(メタデータ) (2020-05-25T01:42:55Z) - VaPar Synth -- A Variational Parametric Model for Audio Synthesis [78.3405844354125]
本稿では,条件付き変分オートエンコーダ(CVAE)を用いた変分パラメトリックシンセサイザVaPar Synthを提案する。
提案するモデルの性能は,ピッチを柔軟に制御した楽器音の再構成と生成によって実証する。
論文 参考訳(メタデータ) (2020-03-30T16:05:47Z) - Millimeter Wave Communications with an Intelligent Reflector:
Performance Optimization and Distributional Reinforcement Learning [119.97450366894718]
ミリ波基地局のダウンリンクマルチユーザ通信を最適化するための新しいフレームワークを提案する。
チャネル状態情報(CSI)をリアルタイムで計測するために,チャネル推定手法を開発した。
最適赤外反射を学習し、ダウンリンク能力の期待を最大化するために、分布強化学習(DRL)手法を提案する。
論文 参考訳(メタデータ) (2020-02-24T22:18:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。