論文の概要: A Reinforcement Learning Approach to Age of Information in Multi-User
Networks with HARQ
- arxiv url: http://arxiv.org/abs/2102.09774v1
- Date: Fri, 19 Feb 2021 07:30:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-22 15:15:24.822864
- Title: A Reinforcement Learning Approach to Age of Information in Multi-User
Networks with HARQ
- Title(参考訳): HARQを用いたマルチユーザネットワークにおける情報年齢の強化学習手法
- Authors: Elif Tugce Ceran, Deniz Gunduz and Andras Gyorgy
- Abstract要約: ソースノードから複数のユーザへのタイムセンシティブな情報の送信を,エラーが発生しやすい通信チャネル上でスケジューリングする。
リソースの長期平均制約はソースに課され、送信の平均数を制限します。
- 参考スコア(独自算出の注目度): 1.5469452301122177
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scheduling the transmission of time-sensitive information from a source node
to multiple users over error-prone communication channels is studied with the
goal of minimizing the long-term average age of information (AoI) at the users.
A long-term average resource constraint is imposed on the source, which limits
the average number of transmissions. The source can transmit only to a single
user at each time slot, and after each transmission, it receives an
instantaneous ACK/NACK feedback from the intended receiver, and decides when
and to which user to transmit the next update. Assuming the channel statistics
are known, the optimal scheduling policy is studied for both the standard
automatic repeat request (ARQ) and hybrid ARQ (HARQ) protocols. Then, a
reinforcement learning(RL) approach is introduced to find a near-optimal
policy, which does not assume any a priori information on the random processes
governing the channel states. Different RL methods including average-cost
SARSAwith linear function approximation (LFA), upper confidence reinforcement
learning (UCRL2), and deep Q-network (DQN) are applied and compared through
numerical simulations
- Abstract(参考訳): エラー発生の少ない通信チャネルを通じて, ソースノードから複数のユーザへの時間的情報伝達をスケジューリングし, ユーザにおける情報平均年齢(AoI)を最小化することを目的とする。
ソースには、平均送信数を制限する長期的な平均リソース制約が課される。
ソースは、各タイムスロットで1つのユーザーのみに送信することができ、各送信後、目的の受信機から即時のACK/NACKフィードバックを受け取り、次の更新を送信する日時を決定します。
チャネル統計が知られていると仮定すると、標準自動繰り返し要求(ARQ)とハイブリッドARQ(HARQ)プロトコルの両方に対して最適なスケジューリングポリシーが検討される。
次に、チャネル状態を管理するランダムプロセスに関する事前情報を仮定しない、ほぼ最適に近いポリシーを見つけるために強化学習(rl)アプローチを導入する。
線形関数近似(LFA)を用いた平均コストSARSA、高信頼強化学習(UCRL2)、深層Qネットワーク(DQN)を含む異なるRL法を適用し、数値シミュレーションにより比較する。
関連論文リスト
- Age-of-Gradient Updates for Federated Learning over Random Access Channels [13.337006106442738]
ランダムアクセスチャネル(RACH)上でのディープニューラルネットワーク(DNN)のフェデレーショントレーニングの問題点について検討する。
RACH-FL設定は、(i)クライアント選択と(ii)勾配圧縮戦略を共同で設計する問題に決定的に対処する。
我々は、(i)Top-Kスペーシフィケーションを用いて勾配スペーシフィケーションを行い、(ii)メモリ蓄積を用いて誤り訂正を行い、(iii)現在のローカルメモリを比較してスロット送信確率を求める政策を提案する。
論文 参考訳(メタデータ) (2024-10-15T18:49:58Z) - Actor-Critic Scheduling for Path-Aware Air-to-Ground Multipath
Multimedia Delivery [5.01187288554981]
Actor-Critic (AC) RLアルゴリズムに基づくマルチパスシステムにおけるリアルタイムマルチメディア配信のための新しいスケジューラを提案する。
RLエージェントとして機能するスケジューラは、経路選択、経路レート割り当て、フロー保護のための冗長性推定のための最適ポリシーをリアルタイムで学習する。
論文 参考訳(メタデータ) (2022-04-28T08:28:25Z) - Learning Resilient Radio Resource Management Policies with Graph Neural
Networks [124.89036526192268]
我々は、ユーザ当たりの最小容量制約でレジリエントな無線リソース管理問題を定式化する。
有限個のパラメータ集合を用いてユーザ選択と電力制御ポリシーをパラメータ化できることを示す。
このような適応により,提案手法は平均レートと5番目のパーセンタイルレートとの良好なトレードオフを実現する。
論文 参考訳(メタデータ) (2022-03-07T19:40:39Z) - Text Generation with Efficient (Soft) Q-Learning [91.47743595382758]
強化学習(RL)は、任意のタスクメトリクスを報酬としてプラグインすることで、より柔軟なソリューションを提供する。
ソフトQ-ラーニングの観点からテキスト生成のための新しいRL式を導入する。
雑音/負の例から学習し、敵攻撃、即時生成など、幅広いタスクにアプローチを適用する。
論文 参考訳(メタデータ) (2021-06-14T18:48:40Z) - Dynamic Multichannel Access via Multi-agent Reinforcement Learning:
Throughput and Fairness Guarantees [9.615742794292943]
マルチエージェント強化学習(RL)に基づく分散マルチチャネルアクセスプロトコルを提案する。
チャネルアクセス確率を各時間スロットで調整する従来の手法とは異なり、提案したRLアルゴリズムは、連続する時間スロットに対する一連のチャネルアクセスポリシーを決定論的に選択する。
我々は,現実的な交通環境において広範なシミュレーションを行い,提案したオンライン学習がスループットと公平性の両方を改善することを示す。
論文 参考訳(メタデータ) (2021-05-10T02:32:57Z) - Better than the Best: Gradient-based Improper Reinforcement Learning for
Network Scheduling [60.48359567964899]
パケット遅延を最小限に抑えるため,制約付き待ち行列ネットワークにおけるスケジューリングの問題を考える。
我々は、利用可能な原子ポリシーよりも優れたスケジューラを生成するポリシー勾配に基づく強化学習アルゴリズムを使用する。
論文 参考訳(メタデータ) (2021-05-01T10:18:34Z) - Deep Reinforcement Learning for Resource Constrained Multiclass
Scheduling in Wireless Networks [0.0]
セットアップでは、ランダムに到着するサービス要求に対応するために、利用可能な限られた帯域幅のリソースを割り当てます。
本稿では,Deep Setsと組み合わせた分布型Deep Deterministic Policy Gradient (DDPG)アルゴリズムを提案する。
提案アルゴリズムは, 合成データと実データの両方で検証し, 従来手法に対する一貫した利得を示す。
論文 参考訳(メタデータ) (2020-11-27T09:49:38Z) - FedRec: Federated Learning of Universal Receivers over Fading Channels [92.15358738530037]
本稿では,ダウンリンクフェージングチャネルに対するニューラルネットワークを用いたシンボル検出手法を提案する。
複数のユーザが協力して、普遍的なデータ駆動型検出器を学習する。
得られた受信機の性能は、フェーディング統計の知識を必要とせずに、様々なチャネル条件下でMAP性能に近づくことを示す。
論文 参考訳(メタデータ) (2020-11-14T11:29:55Z) - Distributional Reinforcement Learning for mmWave Communications with
Intelligent Reflectors on a UAV [119.97450366894718]
無人航空機(UAV)搭載のインテリジェントリフレクタ(IR)を用いた新しい通信フレームワークを提案する。
ダウンリンク和率を最大化するために、最適プリコーディング行列(基地局)と反射係数(IR)を共同で導出する。
論文 参考訳(メタデータ) (2020-11-03T16:50:37Z) - Scheduling Policy and Power Allocation for Federated Learning in NOMA
Based MEC [21.267954799102874]
Federated Learning(FL)は、データ分散を維持しながらモデルを集中的にトレーニングできる、高度に追求された機械学習技術である。
重み付き和データレートを最大化するために、非直交多重アクセス(NOMA)設定を用いた新しいスケジューリングポリシーと電力割当方式を提案する。
シミュレーションの結果,提案手法は,NOMAベースの無線ネットワークにおいて高いFLテスト精度を実現するのに有効であることがわかった。
論文 参考訳(メタデータ) (2020-06-21T23:07:41Z) - Millimeter Wave Communications with an Intelligent Reflector:
Performance Optimization and Distributional Reinforcement Learning [119.97450366894718]
ミリ波基地局のダウンリンクマルチユーザ通信を最適化するための新しいフレームワークを提案する。
チャネル状態情報(CSI)をリアルタイムで計測するために,チャネル推定手法を開発した。
最適赤外反射を学習し、ダウンリンク能力の期待を最大化するために、分布強化学習(DRL)手法を提案する。
論文 参考訳(メタデータ) (2020-02-24T22:18:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。