論文の概要: Learning to Schedule in Non-Stationary Wireless Networks With Unknown
Statistics
- arxiv url: http://arxiv.org/abs/2308.02734v1
- Date: Fri, 4 Aug 2023 22:51:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-08 18:56:49.478210
- Title: Learning to Schedule in Non-Stationary Wireless Networks With Unknown
Statistics
- Title(参考訳): 未知統計を用いた非定常無線ネットワークにおけるスケジュール学習
- Authors: Quang Minh Nguyen, Eytan Modiano
- Abstract要約: 一般化された干渉制約を受ける無線ネットワークの効率的なスケジューリングアルゴリズムについて検討する。
一般化無線ネットワークスケジューリングのためのMW-UCBという新しいアルゴリズムを提案する。
MW-UCB は,政策階層の安定領域に近い安定領域を任意に達成できることを示す。
- 参考スコア(独自算出の注目度): 0.8528384027684192
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The emergence of large-scale wireless networks with partially-observable and
time-varying dynamics has imposed new challenges on the design of optimal
control policies. This paper studies efficient scheduling algorithms for
wireless networks subject to generalized interference constraint, where mean
arrival and mean service rates are unknown and non-stationary. This model
exemplifies realistic edge devices' characteristics of wireless communication
in modern networks. We propose a novel algorithm termed MW-UCB for generalized
wireless network scheduling, which is based on the Max-Weight policy and
leverages the Sliding-Window Upper-Confidence Bound to learn the channels'
statistics under non-stationarity. MW-UCB is provably throughput-optimal under
mild assumptions on the variability of mean service rates. Specifically, as
long as the total variation in mean service rates over any time period grows
sub-linearly in time, we show that MW-UCB can achieve the stability region
arbitrarily close to the stability region of the class of policies with full
knowledge of the channel statistics. Extensive simulations validate our
theoretical results and demonstrate the favorable performance of MW-UCB.
- Abstract(参考訳): 部分観測可能で時間変動のダイナミクスを持つ大規模無線ネットワークの出現は、最適制御ポリシーの設計に新たな課題を課してきた。
本稿では,平均到着率と平均サービスレートが不明で非定常な一般干渉制約を考慮した無線ネットワークの効率的なスケジューリングアルゴリズムについて検討する。
このモデルは、現代のネットワークにおける現実のエッジデバイスの無線通信特性を例示する。
我々は、最大ウェイトポリシに基づいて、スライディング・ウィンドウアッパー信頼境界を利用して、非定常性の下でチャネルの統計を学習する一般化無線ネットワークスケジューリングのための新しいアルゴリズムMW-UCBを提案する。
mw-ucbは平均サービスレートの変動性に関する軽度仮定下ではスループット最適である。
具体的には、任意の期間における平均サービスレートの総変動がサブリニアに増加する限り、MW-UCBは、チャネル統計の完全な知識を持つ政策クラスの安定領域に任意に近い安定性領域を達成できることを示す。
広範なシミュレーションにより理論結果が検証され,mw-ucbの性能が実証された。
関連論文リスト
- Decentralized Learning Strategies for Estimation Error Minimization with Graph Neural Networks [94.2860766709971]
統計的に同一性を持つ無線ネットワークにおける自己回帰的マルコフ過程のサンプリングとリモート推定の課題に対処する。
我々のゴールは、分散化されたスケーラブルサンプリングおよび送信ポリシーを用いて、時間平均推定誤差と/または情報の年齢を最小化することである。
論文 参考訳(メタデータ) (2024-04-04T06:24:11Z) - Linear Combination of Exponential Moving Averages for Wireless Channel
Prediction [2.34863357088666]
本研究では,指数移動平均(EMA)に基づく予測モデルについて検討した。
EMA線形結合(ELC)と呼ばれる新しいモデルを導入し、説明し、実験的に評価した。
論文 参考訳(メタデータ) (2023-12-13T07:44:05Z) - BOF-UCB: A Bayesian-Optimistic Frequentist Algorithm for Non-Stationary
Contextual Bandits [16.59103967569845]
本研究では,非定常環境におけるコンテキスト線形帯域に対するベイズ・最適周波数帯域上信頼境界(BOF-UCB)アルゴリズムを提案する。
このベイジアンと頻繁な原理の独特な組み合わせは、動的設定における適応性と性能を高める。
論文 参考訳(メタデータ) (2023-07-07T13:29:07Z) - Learning to Transmit with Provable Guarantees in Wireless Federated
Learning [40.11488246920875]
干渉制限無線ネットワーク上でのフェデレーション学習(FL)に送信電力を割り当てる新しいデータ駆動方式を提案する。
提案手法は、FLトレーニングプロセス中に無線チャネルが変化している場合の課題に有用である。
最終的な目標は、訓練中のグローバルFLモデルの精度と効率を改善することです。
論文 参考訳(メタデータ) (2023-04-18T22:28:03Z) - Age of Semantics in Cooperative Communications: To Expedite Simulation
Towards Real via Offline Reinforcement Learning [53.18060442931179]
協調リレー通信システムにおける状態更新のセマンティックス更新度を測定するための意味学年代(AoS)を提案する。
オンライン・ディープ・アクター・クリティック(DAC)学習手法を,政治時間差学習の枠組みに基づいて提案する。
そこで我々は,以前に収集したデータセットから最適制御ポリシーを推定する,新しいオフラインDAC方式を提案する。
論文 参考訳(メタデータ) (2022-09-19T11:55:28Z) - Reinforcement Learning for Datacenter Congestion Control [50.225885814524304]
渋滞制御アルゴリズムの成功は、レイテンシとネットワーク全体のスループットを劇的に改善する。
今日まで、このような学習ベースのアルゴリズムはこの領域で実用的な可能性を示さなかった。
実世界のデータセンターネットワークの様々な構成に一般化することを目的としたRLに基づくアルゴリズムを考案する。
本稿では,この手法が他のRL手法よりも優れており,トレーニング中に見られなかったシナリオに一般化可能であることを示す。
論文 参考訳(メタデータ) (2021-02-18T13:49:28Z) - Cognitive Radio Network Throughput Maximization with Deep Reinforcement
Learning [58.44609538048923]
RF-CRN(Radio Frequency powered Cognitive Radio Networks)は、IoT(Internet of Things)などの最新のネットワークの目と耳である可能性が高い。
自律的と考えるには、RF駆動のネットワークエンティティは、ネットワーク環境の不確実性の下でネットワークスループットを最大化するために、ローカルで決定する必要がある。
本稿では,この欠点を克服し,無線ゲートウェイがネットワークスループットを最大化するための最適なポリシーを導出できるように,深層強化学習を提案する。
論文 参考訳(メタデータ) (2020-07-07T01:49:07Z) - Multi-Armed Bandit Based Client Scheduling for Federated Learning [91.91224642616882]
統合学習(FL)は、通信オーバーヘッドの低減やデータのプライバシの保護など、ユビキタスな特性を特徴とする。
FLの各通信ラウンドでは、クライアントは自身のデータに基づいてローカルモデルを更新し、無線チャネル経由でローカル更新をアップロードする。
本研究は、無線チャネルの状態情報やクライアントの統計的特性を知ることなく、FLにおけるオンラインクライアントスケジューリング(CS)のためのマルチアームバンディットベースのフレームワークを提供する。
論文 参考訳(メタデータ) (2020-07-05T12:32:32Z) - Deep Learning for Radio Resource Allocation with Diverse
Quality-of-Service Requirements in 5G [53.23237216769839]
本研究では,基地局の最適資源配分ポリシーを近似するディープラーニングフレームワークを開発する。
完全接続ニューラルネットワーク(NN)は,近似誤差とサブキャリア数の量子化誤差により,要求を完全に保証できないことがわかった。
無線チャネルの分布と無線ネットワークにおけるサービスのタイプが定常的でないことを考慮し,非定常的無線ネットワークにおけるNNの更新にディープトランスファー学習を適用した。
論文 参考訳(メタデータ) (2020-03-29T04:48:22Z) - Network-Density-Controlled Decentralized Parallel Stochastic Gradient
Descent in Wireless Systems [6.574517227976925]
分散並列勾配勾配(D-PSGD)は、分散学習のための最先端アルゴリズムの1つである。
ネットワークトポロジの密度がD-PSGDの実行性能に大きく影響する可能性がある。
本稿では,各ノードが最適な伝送速度を推定する通信戦略を提案する。
論文 参考訳(メタデータ) (2020-02-25T09:20:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。