論文の概要: Real-Time GPU-Accelerated Machine Learning Based Multiuser Detection for
5G and Beyond
- arxiv url: http://arxiv.org/abs/2201.05024v2
- Date: Fri, 14 Jan 2022 09:17:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-17 12:20:20.599554
- Title: Real-Time GPU-Accelerated Machine Learning Based Multiuser Detection for
5G and Beyond
- Title(参考訳): リアルタイムGPU高速化機械学習による5G以上のマルチユーザ検出
- Authors: Matthias Mehlhose, Guillermo Marcus, Daniel Sch\"aufele, Daniyal Amir
Awan, Nikolaus Binder, Martin Kasparick, Renato L. G. Cavalcante, S{\l}awomir
Sta\'nczak and Alexander Keller
- Abstract要約: 非線形ビームフォーミングフィルタは、大規模な接続を伴う定常シナリオにおいて、線形アプローチを著しく上回る。
主な課題の1つは、これらのアルゴリズムのリアルタイム実装である。
本稿では,大規模並列化によるAPSMに基づくアルゴリズムの高速化について検討する。
- 参考スコア(独自算出の注目度): 70.81551587109833
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Adaptive partial linear beamforming meets the need of 5G and future 6G
applications for high flexibility and adaptability. Choosing an appropriate
tradeoff between conflicting goals opens the recently proposed multiuser (MU)
detection method. Due to their high spatial resolution, nonlinear beamforming
filters can significantly outperform linear approaches in stationary scenarios
with massive connectivity. However, a dramatic decrease in performance can be
expected in high mobility scenarios because they are very susceptible to
changes in the wireless channel. The robustness of linear filters is required,
considering these changes. One way to respond appropriately is to use online
machine learning algorithms. The theory of algorithms based on the adaptive
projected subgradient method (APSM) is rich, and they promise accurate tracking
capabilities in dynamic wireless environments. However, one of the main
challenges comes from the real-time implementation of these algorithms, which
involve projections on time-varying closed convex sets. While the projection
operations are relatively simple, their vast number poses a challenge in
ultralow latency (ULL) applications where latency constraints must be satisfied
in every radio frame. Taking non-orthogonal multiple access (NOMA) systems as
an example, this paper explores the acceleration of APSM-based algorithms
through massive parallelization. The result is a GPU-accelerated real-time
implementation of an orthogonal frequency-division multiplexing (OFDM)-based
transceiver that enables detection latency of less than one millisecond and
therefore complies with the requirements of 5G and beyond. To meet the
stringent physical layer latency requirements, careful co-design of hardware
and software is essential, especially in virtualized wireless systems with
hardware accelerators.
- Abstract(参考訳): 適応型部分線形ビームフォーミングは、高い柔軟性と適応性のために5gおよび将来の6g応用の必要性を満たす。
競合する目標間の適切なトレードオフを選択することで、最近提案されたmultiuser(MU)検出方法が開かれる。
空間分解能が高いため、非線形ビームフォーミングフィルタは、大規模接続を伴う定常シナリオにおいて、線形アプローチを著しく上回ることができる。
しかし、無線チャネルの変化に非常に影響を受けやすいため、高機動性シナリオではパフォーマンスが劇的に低下することが期待できる。
これらの変化を考慮すると、線形フィルタの堅牢性が必要である。
適切な対応方法のひとつは、オンライン機械学習アルゴリズムを使用することだ。
adaptive projected subgradient method (apsm)に基づくアルゴリズムの理論は豊富であり、動的無線環境における正確な追跡能力を約束している。
しかし、主な課題の1つは、時間変化した閉凸集合の射影を含むこれらのアルゴリズムのリアルタイム実装である。
プロジェクション操作は比較的単純であるが、その膨大な数は、すべての無線フレームでレイテンシ制約を満たさなければならない超低レイテンシ(ULL)アプリケーションにおいて課題となる。
本稿では,非直交多重アクセス(NOMA)システムを例として,大規模並列化によるAPSMアルゴリズムの高速化について検討する。
その結果、GPUによる直交周波数分割多重化(OFDM)ベースのトランシーバの実装が加速され、1ミリ秒未満のレイテンシの検出が可能となり、5G以上の要件に準拠する。
厳密な物理層レイテンシ要件を満たすためには、特にハードウェアアクセラレータを備えた仮想化無線システムにおいて、ハードウェアとソフトウェアの注意深い共同設計が不可欠である。
関連論文リスト
- VARADE: a Variational-based AutoRegressive model for Anomaly Detection on the Edge [7.4646496981460855]
本研究は,エッジ上でのリアルタイム実行に最適な変分推論に基づく軽量自己回帰フレームワークを実装した新しいソリューションを提案する。
提案手法は、パイロット生産ラインの一部であるロボットアームで検証され、最先端のアルゴリズムと比較された。
論文 参考訳(メタデータ) (2024-09-23T08:46:15Z) - Online-Score-Aided Federated Learning: Taming the Resource Constraints in Wireless Networks [26.74283774805648]
我々は,無線アプリケーションに関連するタスクを学習するために,OSAFLと呼ばれる新しいFLアルゴリズムを提案する。
当社の大規模なシミュレーションでは,3つの異なるデータセットを持つ2つのタスクについて,OSAFLの有効性を4つの一般的なMLモデルで検証しています。
論文 参考訳(メタデータ) (2024-08-12T01:27:06Z) - Coverage-aware and Reinforcement Learning Using Multi-agent Approach for HD Map QoS in a Realistic Environment [8.853779271331508]
オフロードプロセスを最適化する効果的な方法の1つは、送信時間を最小化することである。
これはVehicular Adhoc Network(VANET)において特に当てはまり、車両はHD(High-Definition)マップデータを頻繁にダウンロードしてアップロードする。
論文 参考訳(メタデータ) (2024-07-19T12:40:07Z) - Latency-aware Unified Dynamic Networks for Efficient Image Recognition [72.8951331472913]
LAUDNetは動的ネットワークの理論的および実用的な効率ギャップを橋渡しするフレームワークである。
3つの主要な動的パラダイム - 適応型計算、動的層スキップ、動的チャネルスキップ - を統合している。
これにより、V100,3090やTX2 GPUのようなプラットフォーム上で、ResNetのようなモデルの遅延を50%以上削減できる。
論文 参考訳(メタデータ) (2023-08-30T10:57:41Z) - Latency-aware Spatial-wise Dynamic Networks [33.88843632160247]
深層ネットワークのための遅延認識型空間的動的ネットワーク(LASNet)を提案する。
LASNetは、新しい遅延予測モデルのガイダンスに基づき、粗粒度空間適応推論を行う。
画像分類,オブジェクト検出,インスタンスセグメンテーションの実験により,提案手法はディープネットワークの実用的な推論効率を大幅に向上させることを示した。
論文 参考訳(メタデータ) (2022-10-12T14:09:27Z) - GPU-Accelerated Machine Learning in Non-Orthogonal Multiple Access [71.58925117604039]
非直交多重アクセス(Noma)は、将来の5Gおよび6Gネットワークに必要な大規模な接続を可能にする興味深い技術である。
線形処理と非線形処理の両方の利点を組み合わせたニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-06-13T09:38:23Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - Dynamic Network-Assisted D2D-Aided Coded Distributed Learning [59.29409589861241]
本稿では,デバイス間のロードバランシングのための新しいデバイス・ツー・デバイス(D2D)支援型符号化学習手法(D2D-CFL)を提案する。
最小処理時間を達成するための最適圧縮率を導出し、収束時間との接続を確立する。
提案手法は,ユーザが継続的にトレーニングデータを生成するリアルタイム協調アプリケーションに有用である。
論文 参考訳(メタデータ) (2021-11-26T18:44:59Z) - Architecture Aware Latency Constrained Sparse Neural Networks [35.50683537052815]
本稿では,CNNモデルの作成と高速化を目的として,遅延制約付きスパースフレームワークを設計する。
また,効率的な計算のための新しいスパース畳み込みアルゴリズムを提案する。
我々のシステム・アルゴリズムの共同設計フレームワークは、リソース制約のあるモバイルデバイス上でのネットワークの精度とレイテンシのフロンティアをはるかに向上させることができる。
論文 参考訳(メタデータ) (2021-09-01T03:41:31Z) - Phase Retrieval using Expectation Consistent Signal Recovery Algorithm
based on Hypernetwork [73.94896986868146]
位相検索は現代の計算イメージングシステムにおいて重要な要素である。
近年のディープラーニングの進歩は、堅牢で高速なPRの新たな可能性を開いた。
我々は、既存の制限を克服するために、深層展開のための新しいフレームワークを開発する。
論文 参考訳(メタデータ) (2021-01-12T08:36:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。