論文の概要: Fairness-Oriented Scheduling for Bursty Traffic in OFDMA Downlink
Systems Using Multi-Agent Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2012.15081v8
- Date: Sun, 7 Mar 2021 12:20:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-18 15:50:37.357548
- Title: Fairness-Oriented Scheduling for Bursty Traffic in OFDMA Downlink
Systems Using Multi-Agent Reinforcement Learning
- Title(参考訳): マルチエージェント強化学習を用いたOFDMAダウンリンクシステムにおけるバースティトラフィックの公正指向スケジューリング
- Authors: Mingqi Yuan, Qi Cao, Man-on Pun, Yi Chen
- Abstract要約: マルチエージェント強化学習(MARL)を用いたユーザスケジューラを構築し、分散最適化を行い、通信システムの公平性を最大化します。
5%タイルのユーザーデータレート(5TUDR)を公平性の重要なパフォーマンス指標(KPI)として捉え、MARLスケジューリングのパフォーマンスとPFスケジューリングとRFスケジューリングを比較します。
- 参考スコア(独自算出の注目度): 8.19547771752507
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: User scheduling is a classical problem and key technology in wireless
communication, which will still plays an important role in the prospective 6G.
There are many sophisticated schedulers that are widely deployed in the base
stations, such as Proportional Fairness (PF) and Round-Robin Fashion (RRF). It
is known that the Opportunistic (OP) scheduling is the optimal scheduler for
maximizing the average user data rate (AUDR) considering the full buffer
traffic. But the optimal strategy achieving the highest fairness still remains
largely unknown both in the full buffer traffic and the bursty traffic. In this
work, we investigate the problem of fairness-oriented user scheduling,
especially for the RBG allocation. We build a user scheduler using Multi-Agent
Reinforcement Learning (MARL), which conducts distributional optimization to
maximize the fairness of the communication system. The agents take the
cross-layer information (e.g. RSRP, Buffer size) as state and the RBG
allocation result as action, then explore the optimal solution following a
well-defined reward function designed for maximizing fairness. Furthermore, we
take the 5%-tile user data rate (5TUDR) as the key performance indicator (KPI)
of fairness, and compare the performance of MARL scheduling with PF scheduling
and RRF scheduling by conducting extensive simulations. And the simulation
results show that the proposed MARL scheduling outperforms the traditional
schedulers.
- Abstract(参考訳): ユーザスケジューリングは、無線通信における古典的な問題であり、鍵となる技術である。
基地局には、PF(Proportional Fairness)やRRF(Robin Fashion)など、多くの高度なスケジューラが展開されている。
オポチュニティ(OP)スケジューリングは、完全なバッファトラフィックを考慮した平均ユーザデータレート(AUDR)を最大化する最適なスケジューラであることが知られている。
しかし、最高公平性を達成するための最適な戦略は、フルバッファトラフィックとバーストトラフィックの両方において、いまだに不明である。
本研究では,特にRBG割り当てにおける公平性を考慮したユーザスケジューリングの問題について検討する。
本稿では,マルチエージェント強化学習(marl)を用いて,通信システムの公平性を最大化する分散最適化を行うユーザスケジューラを構築する。
エージェントは層間情報(例)を取る。
状態として RSRP, Buffer サイズ) と状態として RBG を割り当て、フェアネスを最大化するように設計された報酬関数に従って最適解を探索する。
さらに、5%タイルのユーザデータレート(5TUDR)をキーパフォーマンス指標(KPI)として、PFスケジューリングとRFスケジューリングとMARLスケジューリングの性能を比較する。
シミュレーションの結果,提案したMARLスケジューリングは従来のスケジューラよりも優れていた。
関連論文リスト
- Load Balancing in Federated Learning [3.2999744336237384]
Federated Learning(FL)は、複数のリモートデバイスに分散したデータからの学習を可能にする、分散機械学習フレームワークである。
本稿では,情報時代に基づくスケジューリングポリシーの負荷指標を提案する。
マルコフ連鎖モデルの最適パラメータを確立し、シミュレーションによりアプローチを検証する。
論文 参考訳(メタデータ) (2024-08-01T00:56:36Z) - A Graph-based Adversarial Imitation Learning Framework for Reliable & Realtime Fleet Scheduling in Urban Air Mobility [5.19664437943693]
本稿では,艦隊スケジューリング問題の包括的最適化について述べる。
また、代替ソリューションのアプローチの必要性も認識している。
新しい模倣アプローチは、目に見えない最悪のシナリオにおいて、パフォーマンスと顕著な改善を実現する。
論文 参考訳(メタデータ) (2024-07-16T18:51:24Z) - Client Orchestration and Cost-Efficient Joint Optimization for
NOMA-Enabled Hierarchical Federated Learning [55.49099125128281]
半同期クラウドモデルアグリゲーションの下で非直交多重アクセス(NOMA)を実現するHFLシステムを提案する。
提案手法は,HFLの性能改善と総コスト削減に関するベンチマークよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-11-03T13:34:44Z) - Federated Learning of Large Language Models with Parameter-Efficient
Prompt Tuning and Adaptive Optimization [71.87335804334616]
フェデレートラーニング(FL)は、分散データとの協調モデルトレーニングを可能にする、有望なパラダイムである。
LLM(Large Language Models)のトレーニングプロセスは一般的に重要なパラメータの更新を引き起こす。
本稿では,性能と効率を同時に向上する効率的な部分的プロンプトチューニング手法を提案する。
論文 参考訳(メタデータ) (2023-10-23T16:37:59Z) - Analysis and Optimization of Wireless Federated Learning with Data
Heterogeneity [72.85248553787538]
本稿では、データの不均一性を考慮した無線FLの性能解析と最適化と、無線リソース割り当てについて述べる。
ロス関数の最小化問題を、長期エネルギー消費と遅延の制約の下で定式化し、クライアントスケジューリング、リソース割り当て、ローカルトレーニングエポック数(CRE)を共同で最適化する。
実世界のデータセットの実験により、提案アルゴリズムは学習精度とエネルギー消費の点で他のベンチマークよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-08-04T04:18:01Z) - Dynamic Scheduling for Federated Edge Learning with Streaming Data [56.91063444859008]
我々は,長期的エネルギー制約のある分散エッジデバイスにおいて,トレーニングデータを時間とともにランダムに生成するフェデレーションエッジ学習(FEEL)システムを検討する。
限られた通信リソースとレイテンシ要件のため、各イテレーションでローカルトレーニングプロセスに参加するのはデバイスのサブセットのみである。
論文 参考訳(メタデータ) (2023-05-02T07:41:16Z) - Uplink Scheduling in Federated Learning: an Importance-Aware Approach
via Graph Representation Learning [5.903263170730936]
フェデレートラーニング(FL)は、AIベースのサービス、アプリケーション、ネットワークプロシージャを6Gで分散トレーニングするための有望なフレームワークとして登場した。
6G無線FLシステムの性能と効率に影響を及ぼす大きな課題の1つは、リソース制約されたチャネル上でのユーザデバイスの大規模なスケジューリングである。
非教師付きグラフ表現学習(Unsupervised Graph Representation Learning, UGRL)を活用し, FLアプリケーションにおけるクライアントスケジューリングのための新しい, エネルギー効率, 重要度を考慮したメトリクスを提案する。
論文 参考訳(メタデータ) (2023-01-27T18:30:39Z) - Sequential Information Design: Markov Persuasion Process and Its
Efficient Reinforcement Learning [156.5667417159582]
本稿では,逐次情報設計の新たなモデル,すなわちマルコフ説得過程(MPP)を提案する。
MPPのプランニングは、ミオピックレシーバーに同時に説得されるシグナルポリシーを見つけ、送信者の最適な長期累積ユーティリティを誘導する、というユニークな課題に直面している。
我々は,楽観主義と悲観主義の両原理の新たな組み合わせを特徴とする,実証可能な効率のよい非回帰学習アルゴリズム,Optimism-Pessimism Principle for Persuasion Process (OP4) を設計する。
論文 参考訳(メタデータ) (2022-02-22T05:41:43Z) - Low-Latency Federated Learning over Wireless Channels with Differential
Privacy [142.5983499872664]
フェデレートラーニング(FL)では、モデルトレーニングはクライアントに分散し、ローカルモデルは中央サーバによって集約される。
本稿では,各クライアントの差分プライバシ(DP)要件だけでなく,全体としてのトレーニング性能に制約された無線チャネル上でのFLトレーニング遅延を最小限に抑えることを目的とする。
論文 参考訳(メタデータ) (2021-06-20T13:51:18Z) - Deep-Reinforcement-Learning-Based Scheduling with Contiguous Resource
Allocation for Next-Generation Cellular Systems [4.227387975627387]
深部強化学習(DRL)に基づく連続周波数領域リソース割り当て(FDRA)を用いた新しいスケジューリングアルゴリズムを提案する。
DRLに基づくスケジューリングアルゴリズムは、オンライン計算の複雑さを低くしながら、他の代表的ベースライン方式よりも優れている。
論文 参考訳(メタデータ) (2020-10-11T05:41:40Z) - Reinforcement Learning Based Cooperative Coded Caching under Dynamic
Popularities in Ultra-Dense Networks [38.44125997148742]
小規模基地局(SBS)のキャッシュ戦略は、膨大なデータレート要求を満たすために重要である。
我々は、強化学習(RL)を利用して、最大距離分離可能(MDS)符号化による協調的なキャッシュ戦略を設計する。
論文 参考訳(メタデータ) (2020-03-08T10:45:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。