論文の概要: Scalable Joint Learning of Wireless Multiple-Access Policies and their
Signaling
- arxiv url: http://arxiv.org/abs/2206.03844v1
- Date: Wed, 8 Jun 2022 12:38:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-09 14:01:57.709453
- Title: Scalable Joint Learning of Wireless Multiple-Access Policies and their
Signaling
- Title(参考訳): 無線マルチアクセスポリシのスケーラブルな共同学習とそのシグナル伝達
- Authors: Mateus P. Mota, Alvaro Valcarce, Jean-Marie Gorce
- Abstract要約: 本稿では,基地局(BS)とユーザ機器(UE)が無線マルチアクセスシナリオでチャネルアクセスポリシーとそのシグナリングを共同で学習できるようにするマルチエージェント強化学習(MARL)フレームワークを適用する。
本フレームワークは,低衝突率を維持しながら,高交通状況においても優れた性能を発揮する。
- 参考スコア(独自算出の注目度): 2.268853004164585
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we apply an multi-agent reinforcement learning (MARL)
framework allowing the base station (BS) and the user equipments (UEs) to
jointly learn a channel access policy and its signaling in a wireless multiple
access scenario. In this framework, the BS and UEs are reinforcement learning
(RL) agents that need to cooperate in order to deliver data. The comparison
with a contention-free and a contention-based baselines shows that our
framework achieves a superior performance in terms of goodput even in high
traffic situations while maintaining a low collision rate. The scalability of
the proposed method is studied, since it is a major problem in MARL and this
paper provides the first results in order to address it.
- Abstract(参考訳): 本稿では,マルチエージェント強化学習(marl)フレームワークを適用し,基地局(bs)とユーザ機器(ues)が無線マルチアクセスシナリオにおいてチャネルアクセスポリシーとそのシグナルを共同で学習できるようにする。
このフレームワークでは、BSとUEはデータを配信するために協力する必要がある強化学習(RL)エージェントである。
競合のないベースラインと競合のないベースラインとの比較から,衝突速度を低く保ちながら,交通量の多い状況でも優れた性能を発揮することを示す。
提案手法のスケーラビリティについて検討し,本手法はMARLの主要な問題であり,本論文はそれに対応するための最初の結果を提供する。
関連論文リスト
- POGEMA: A Benchmark Platform for Cooperative Multi-Agent Navigation [76.67608003501479]
主評価指標の基礎に基づいて計算された領域関連メトリクスの範囲を定義する評価プロトコルを導入・指定する。
このような比較の結果は、様々な最先端のMARL、検索ベース、ハイブリッド手法を含むものである。
論文 参考訳(メタデータ) (2024-07-20T16:37:21Z) - Emergent Communication Protocol Learning for Task Offloading in
Industrial Internet of Things [30.146175299047325]
計算のオフロード決定とマルチチャネルアクセスポリシーを対応するシグナリングで学習する。
具体的には、基地局と産業用IoTモバイルデバイスは強化学習エージェントである。
この問題を解決するために,創発的な通信プロトコル学習フレームワークを採用する。
論文 参考訳(メタデータ) (2024-01-23T17:06:13Z) - Learning to Sail Dynamic Networks: The MARLIN Reinforcement Learning
Framework for Congestion Control in Tactical Environments [53.08686495706487]
本稿では, 正確な並列化可能なエミュレーション環境を利用して, 戦術ネットワークの環境を再現するRLフレームワークを提案する。
衛星通信(SATCOM)とUHFワイドバンド(UHF)の無線リンク間のボトルネックリンク遷移を再現した条件下で、MARLINエージェントを訓練することにより、我々のRL学習フレームワークを評価する。
論文 参考訳(メタデータ) (2023-06-27T16:15:15Z) - Multi-Agent Reinforcement Learning for Network Routing in Integrated
Access Backhaul Networks [0.0]
IABネットワークの遅延を最小化しながらパケット到着率を最大化することを目的としている。
この問題を解決するため、我々はマルチエージェントで部分的に観察されたマルコフ決定プロセス(POMD)を開発した。
A2Cは他の強化学習アルゴリズムよりも優れており、ネットワーク効率が向上し、利己的エージェントの挙動が低下することを示した。
論文 参考訳(メタデータ) (2023-05-12T13:03:26Z) - Sparsity-Aware Intelligent Massive Random Access Control in Open RAN: A
Reinforcement Learning Based Approach [61.74489383629319]
新たなOpen Radio Access Network(O-RAN)におけるデバイスの大量ランダムアクセスは、アクセス制御と管理に大きな課題をもたらします。
閉ループアクセス制御の強化学習(RL)支援方式を提案する。
深部RL支援SAUDは、連続的かつ高次元の状態と行動空間を持つ複雑な環境を解決するために提案されている。
論文 参考訳(メタデータ) (2023-03-05T12:25:49Z) - FedDBL: Communication and Data Efficient Federated Deep-Broad Learning
for Histopathological Tissue Classification [65.7405397206767]
本稿では,FedDBL(Federated Deep-Broad Learning)を提案する。
FedDBLは1ラウンドの通信と限られたトレーニングサンプルで競合相手をはるかに上回り、マルチラウンドの通信で同等のパフォーマンスを達成している。
異なるクライアント間でのデータやディープモデルを共有しないため、プライバシ問題は十分に解決されており、モデルのセキュリティはモデル反転攻撃のリスクなしに保証される。
論文 参考訳(メタデータ) (2023-02-24T14:27:41Z) - AI-aided Traffic Control Scheme for M2M Communications in the Internet
of Vehicles [61.21359293642559]
交通のダイナミクスと異なるIoVアプリケーションの異種要求は、既存のほとんどの研究では考慮されていない。
本稿では,ハイブリッド交通制御方式とPPO法を併用して検討する。
論文 参考訳(メタデータ) (2022-03-05T10:54:05Z) - The Emergence of Wireless MAC Protocols with Multi-Agent Reinforcement
Learning [15.790464310310083]
本稿では,基地局 (BS) とユーザ機器 (UE) がマルチアクセスシナリオでメディアアクセス制御 (MAC) プロトコルを実現するための新しいフレームワークを提案する。
このフレームワークでは、BSとUEは強化学習(RL)エージェントであり、データを提供するために協力することを学ぶ必要がある。
論文 参考訳(メタデータ) (2021-08-16T15:18:03Z) - Low-Latency Federated Learning over Wireless Channels with Differential
Privacy [142.5983499872664]
フェデレートラーニング(FL)では、モデルトレーニングはクライアントに分散し、ローカルモデルは中央サーバによって集約される。
本稿では,各クライアントの差分プライバシ(DP)要件だけでなく,全体としてのトレーニング性能に制約された無線チャネル上でのFLトレーニング遅延を最小限に抑えることを目的とする。
論文 参考訳(メタデータ) (2021-06-20T13:51:18Z) - Batch-Augmented Multi-Agent Reinforcement Learning for Efficient Traffic
Signal Optimization [9.456254189014127]
提案手法は,現在使用されている固定時間信号機に比べて,待ち時間において交通渋滞を36%削減する。
提案手法は,現在使用されている固定時間信号計画と比較して,待ち時間において渋滞を36%低減することを示す。
論文 参考訳(メタデータ) (2020-05-19T17:53:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。