論文の概要: Learning and Adaptation in Millimeter-Wave: a Dual Timescale Variational
Framework
- arxiv url: http://arxiv.org/abs/2107.05466v1
- Date: Sun, 27 Jun 2021 19:04:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-18 12:20:50.988669
- Title: Learning and Adaptation in Millimeter-Wave: a Dual Timescale Variational
Framework
- Title(参考訳): ミリ波の学習と適応:2次元時間スケール変動フレームワーク
- Authors: Muddassar Hussain, Nicolo Michelusi
- Abstract要約: ミリ波車両ネットワークはビームトレーニングのオーバーヘッドが大きいため、狭ビーム通信が可能である。
本稿では,通信ビームのダイナミクスを学習し,低オーバーヘッドで適応ビームトレーニングを設計するための学習適応フレームワークを提案する。
- 参考スコア(独自算出の注目度): 4.162663632560141
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Millimeter-wave vehicular networks incur enormous beam-training overhead to
enable narrow-beam communications. This paper proposes a learning and
adaptation framework in which the dynamics of the communication beams are
learned and then exploited to design adaptive beam-training with low overhead:
on a long-timescale, a deep recurrent variational autoencoder (DR-VAE) uses
noisy beam-training observations to learn a probabilistic model of beam
dynamics; on a short-timescale, an adaptive beam-training procedure is
formulated as a partially observable (PO-) Markov decision process (MDP) and
optimized via point-based value iteration (PBVI) by leveraging beam-training
feedback and a probabilistic prediction of the strongest beam pair provided by
the DR-VAE. In turn, beam-training observations are used to refine the DR-VAE
via stochastic gradient ascent in a continuous process of learning and
adaptation. The proposed DR-VAE mobility learning framework learns accurate
beam dynamics: it reduces the Kullback-Leibler divergence between the ground
truth and the learned beam dynamics model by 86% over the Baum-Welch algorithm
and by 92\% over a naive mobility learning approach that neglects feedback
errors. The proposed dual-timescale approach yields a negligible loss of
spectral efficiency compared to a genie-aided scheme operating under error-free
feedback and foreknown mobility model. Finally, a low-complexity policy is
proposed by reducing the POMDP to an error-robust MDP. It is shown that the
PBVI- and error-robust MDP-based policies improve the spectral efficiency by
85% and 67%, respectively, over a policy that scans exhaustively over the
dominant beam pairs, and by 16% and 7%, respectively, over a state-of-the-art
POMDP policy.
- Abstract(参考訳): ミリ波車両ネットワークはビームトレーニングのオーバーヘッドが大きいため、狭ビーム通信が可能である。
This paper proposes a learning and adaptation framework in which the dynamics of the communication beams are learned and then exploited to design adaptive beam-training with low overhead: on a long-timescale, a deep recurrent variational autoencoder (DR-VAE) uses noisy beam-training observations to learn a probabilistic model of beam dynamics; on a short-timescale, an adaptive beam-training procedure is formulated as a partially observable (PO-) Markov decision process (MDP) and optimized via point-based value iteration (PBVI) by leveraging beam-training feedback and a probabilistic prediction of the strongest beam pair provided by the DR-VAE.
ビームトレーニング観測は、学習と適応の継続的なプロセスにおいて、確率的勾配によるDR-VAEの洗練に使用される。
提案するdr-vaeモビリティ学習フレームワークは、正確なビームダイナミクスを学習する: 基底真理と学習ビームダイナミクスモデルの間のkullback-leiblerの発散を、baum-welchアルゴリズムを86%、フィードバックエラーを無視するナイーブモビリティ学習アプローチを92%削減する。
提案するデュアルタイムスケールアプローチは,誤差のないフィードバックと未知のモビリティモデルの下で動作するジェニー支援方式と比較して,スペクトル効率の無視できない損失をもたらす。
最後に,POMDP を誤差破壊 MDP に還元することで,低複雑さ政策を提案する。
その結果, pbviおよびエラーロバストmdpに基づく政策は, 主ビーム対で徹底的に走査する政策に対して, スペクトル効率を85%, 67%, 最先端pomdp政策で16%, 7%向上させた。
関連論文リスト
- Efficient Remote Photoplethysmography with Temporal Derivative Modules
and Time-Shift Invariant Loss [6.381149074212898]
遠隔心拍推定のための軽量ニューラルネットワークを提案する。
我々は,顔面光胸腺撮影の時間的学習に焦点をあてる。
既存モデルと比較して,本手法では,パラメータ数が大幅に少なく,計算コストが低く,競合精度が向上している。
論文 参考訳(メタデータ) (2022-03-21T11:08:06Z) - Unit-Modulus Wireless Federated Learning Via Penalty Alternating
Minimization [64.76619508293966]
Wireless Federated Learning(FL)は、分散データセットから無線通信を介してグローバルパラメトリックモデルをトレーニングする、新興機械学習パラダイムである。
本稿では、ローカルモデルパラメータをアップロードし、無線通信を介してグローバルモデルパラメータを算出する無線FLフレームワークを提案する。
論文 参考訳(メタデータ) (2021-08-31T08:19:54Z) - Discriminator Augmented Model-Based Reinforcement Learning [47.094522301093775]
学習したモデルが不正確であり、計画が損なわれ、パフォーマンスが悪くなるのは実際には一般的です。
本稿では,真の力学と学習力学の相違を考慮に入れた重要サンプリングフレームワークによる計画の改善を目的とする。
論文 参考訳(メタデータ) (2021-03-24T06:01:55Z) - Adaptive Gradient Method with Resilience and Momentum [120.83046824742455]
レジリエンスとモメンタム(AdaRem)を用いた適応勾配法を提案する。
AdaRemは、過去の1つのパラメータの変化方向が現在の勾配の方向と一致しているかどうかに応じてパラメータワイズ学習率を調整する。
本手法は,学習速度とテスト誤差の観点から,従来の適応学習率に基づくアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2020-10-21T14:49:00Z) - Extrapolation for Large-batch Training in Deep Learning [72.61259487233214]
我々は、バリエーションのホストが、我々が提案する統一されたフレームワークでカバー可能であることを示す。
本稿では,この手法の収束性を証明し,ResNet,LSTM,Transformer上での経験的性能を厳格に評価する。
論文 参考訳(メタデータ) (2020-06-10T08:22:41Z) - Optimization-driven Deep Reinforcement Learning for Robust Beamforming
in IRS-assisted Wireless Communications [54.610318402371185]
Intelligent Reflecting Surface (IRS)は、マルチアンテナアクセスポイント(AP)から受信機へのダウンリンク情報伝達を支援する有望な技術である。
我々は、APのアクティブビームフォーミングとIRSのパッシブビームフォーミングを共同最適化することで、APの送信電力を最小化する。
過去の経験からビームフォーミング戦略に適応できる深層強化学習(DRL)手法を提案する。
論文 参考訳(メタデータ) (2020-05-25T01:42:55Z) - Mixed Reinforcement Learning with Additive Stochastic Uncertainty [19.229447330293546]
強化学習 (Reinforcement Learning, RL) 法は、しばしば最適なポリシーを探索するための大規模な探索データに依存し、サンプリング効率の低下に悩まされる。
本稿では, 環境力学の2つの表現を同時に利用して, 最適ポリシーを探索する混合RLアルゴリズムを提案する。
混合RLの有効性は、非アフィン非線形系の典型的な最適制御問題によって実証される。
論文 参考訳(メタデータ) (2020-02-28T08:02:34Z) - Millimeter Wave Communications with an Intelligent Reflector:
Performance Optimization and Distributional Reinforcement Learning [119.97450366894718]
ミリ波基地局のダウンリンクマルチユーザ通信を最適化するための新しいフレームワークを提案する。
チャネル状態情報(CSI)をリアルタイムで計測するために,チャネル推定手法を開発した。
最適赤外反射を学習し、ダウンリンク能力の期待を最大化するために、分布強化学習(DRL)手法を提案する。
論文 参考訳(メタデータ) (2020-02-24T22:18:54Z) - Learnable Bernoulli Dropout for Bayesian Deep Learning [53.79615543862426]
Learnable Bernoulli Dropout (LBD) は、他のモデルパラメータと共に最適化されたパラメータとしてドロップアウト率を考慮する新しいモデルに依存しないドロップアウトスキームである。
LBDは画像分類とセマンティックセグメンテーションにおける精度と不確実性の推定を改善する。
論文 参考訳(メタデータ) (2020-02-12T18:57:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。