論文の概要: Applications of Multi-Agent Reinforcement Learning in Future Internet: A
Comprehensive Survey
- arxiv url: http://arxiv.org/abs/2110.13484v1
- Date: Tue, 26 Oct 2021 08:26:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-27 14:18:22.547603
- Title: Applications of Multi-Agent Reinforcement Learning in Future Internet: A
Comprehensive Survey
- Title(参考訳): 次世代インターネットにおけるマルチエージェント強化学習の応用:包括的調査
- Authors: Tianxu Li, Kun Zhu, Nguyen Cong Luong, Dusit Niyato, Qihui Wu, Yang
Zhang, Bing Chen
- Abstract要約: マルチエージェント強化学習(MARL)により、各ネットワークエンティティは環境だけでなく、他のエンティティのポリシーも観察することで、最適なポリシーを学ぶことができる。
MARLはネットワークエンティティの学習効率を大幅に向上させることができ、近年、新興ネットワークにおける様々な問題を解決するために使用されている。
- 参考スコア(独自算出の注目度): 45.805062677919
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Future Internet involves several emerging technologies such as 5G and beyond
5G networks, vehicular networks, unmanned aerial vehicle (UAV) networks, and
Internet of Things (IoTs). Moreover, future Internet becomes heterogeneous and
decentralized with a large number of involved network entities. Each entity may
need to make its local decision to improve the network performance under
dynamic and uncertain network environments. Standard learning algorithms such
as single-agent Reinforcement Learning (RL) or Deep Reinforcement Learning
(DRL) have been recently used to enable each network entity as an agent to
learn an optimal decision-making policy adaptively through interacting with the
unknown environments. However, such an algorithm fails to model the
cooperations or competitions among network entities, and simply treats other
entities as a part of the environment that may result in the non-stationarity
issue. Multi-agent Reinforcement Learning (MARL) allows each network entity to
learn its optimal policy by observing not only the environments, but also other
entities' policies. As a result, MARL can significantly improve the learning
efficiency of the network entities, and it has been recently used to solve
various issues in the emerging networks. In this paper, we thus review the
applications of MARL in the emerging networks. In particular, we provide a
tutorial of MARL and a comprehensive survey of applications of MARL in next
generation Internet. In particular, we first introduce single-agent RL and
MARL. Then, we review a number of applications of MARL to solve emerging issues
in future Internet. The issues consist of network access, transmit power
control, computation offloading, content caching, packet routing, trajectory
design for UAV-aided networks, and network security issues.
- Abstract(参考訳): 将来のインターネットには、5G以降の5Gネットワーク、車両ネットワーク、無人航空機(UAV)ネットワーク、IoT(Internet of Things)など、いくつかの新興技術が含まれている。
さらに、将来のインターネットは、多数のネットワークエンティティを持つ異質で分散化される。
各エンティティは、動的かつ不確定なネットワーク環境下でのネットワークパフォーマンスを改善するために、ローカルな決定を行う必要がある。
シングルエージェント強化学習(RL)やディープ強化学習(DRL)のような標準学習アルゴリズムは、エージェントとして各ネットワークエンティティが未知の環境と対話することで最適な意思決定ポリシーを適応的に学習できるようにするために最近使用されている。
しかし、そのようなアルゴリズムはネットワークエンティティ間の協調や競合のモデル化に失敗し、他のエンティティを非定常問題の原因となる可能性のある環境の一部として扱う。
マルチエージェント強化学習(MARL)により、各ネットワークエンティティは環境だけでなく、他のエンティティのポリシーも観察することで、最適なポリシーを学ぶことができる。
その結果、marlはネットワークエンティティの学習効率を大幅に向上させ、近年、新興ネットワークにおける様々な問題を解決するために使用されている。
本稿では,新興ネットワークにおけるMARLの適用について概説する。
特に、MARLのチュートリアルと次世代インターネットにおけるMARLの応用に関する総合的な調査を提供する。
特に,まず単一エージェントRLとMARLを紹介する。
そこで我々は,今後のインターネットの課題を解決するために,MARLの多くの応用をレビューする。
問題は、ネットワークアクセス、送信電力制御、計算オフロード、コンテンツキャッシュ、パケットルーティング、UAV支援ネットワークの軌道設計、ネットワークセキュリティの問題である。
関連論文リスト
- Towards Intelligent Network Management: Leveraging AI for Network
Service Detection [0.0]
本研究では,高度なネットワークトラフィック分類システムを構築するために機械学習手法を活用することに焦点を当てた。
我々は,様々なネットワークサービスタイプをリアルタイムに識別する,新しいデータ駆動型アプローチを提案する。
本システムは,ネットワークサービスを識別する際,顕著な精度を示す。
論文 参考訳(メタデータ) (2023-10-14T16:06:11Z) - Emergent Communication in Multi-Agent Reinforcement Learning for Future
Wireless Networks [30.678152524314225]
創発的コミュニケーションを用いたマルチエージェント強化学習(EC-MARL)は,高次元連続制御問題に対処するための有望な解である。
本稿では,将来の6G無線ネットワークにおけるEC-MARLの重要性を述べる。
論文 参考訳(メタデータ) (2023-09-12T07:40:53Z) - MARLIN: Soft Actor-Critic based Reinforcement Learning for Congestion
Control in Real Networks [63.24965775030673]
そこで本研究では,汎用的な渋滞制御(CC)アルゴリズムを設計するための新しい強化学習(RL)手法を提案する。
我々の解であるMARLINは、Soft Actor-Criticアルゴリズムを用いてエントロピーとリターンの両方を最大化する。
我々は,MARLINを実ネットワーク上で訓練し,実ミスマッチを克服した。
論文 参考訳(メタデータ) (2023-02-02T18:27:20Z) - Distributed Learning in Wireless Networks: Recent Progress and Future
Challenges [170.35951727508225]
次世代のワイヤレスネットワークは、エッジデバイスが収集するさまざまな種類のデータを分析する多くの機械学習ツールやアプリケーションを可能にする。
エッジデバイスが生データ交換なしでMLモデルを協調的にトレーニングできるようにする手段として,分散学習と推論技術が提案されている。
本稿では,ワイヤレスエッジネットワーク上で分散学習を効率的に効果的に展開する方法を包括的に研究する。
論文 参考訳(メタデータ) (2021-04-05T20:57:56Z) - Single and Multi-Agent Deep Reinforcement Learning for AI-Enabled
Wireless Networks: A Tutorial [29.76086936463468]
このチュートリアルは、AI対応の6Gネットワークのための深層マルチエージェント強化学習(MARL)に焦点を当て、DRL(Deep Reinforcement Learning)の役割に焦点を当てている。
本稿では, 単エージェント RL と MARL の数学的枠組みについて概説する。
モデルベースRL(MBRL)や協調MARLなどのRLアルゴリズムを選択的に記述する。
論文 参考訳(メタデータ) (2020-11-06T22:12:40Z) - A Tutorial on Ultra-Reliable and Low-Latency Communications in 6G:
Integrating Domain Knowledge into Deep Learning [115.75967665222635]
超信頼性・低レイテンシ通信(URLLC)は、様々な新しいミッションクリティカルなアプリケーションの開発の中心となる。
ディープラーニングアルゴリズムは、将来の6GネットワークでURLLCを実現する技術を開発するための有望な方法と考えられている。
このチュートリアルでは、URLLCのさまざまなディープラーニングアルゴリズムにドメイン知識を組み込む方法について説明する。
論文 参考訳(メタデータ) (2020-09-13T14:53:01Z) - From Federated to Fog Learning: Distributed Machine Learning over
Heterogeneous Wireless Networks [71.23327876898816]
フェデレートラーニング(Federated Learning)は、データを収集するノード間で処理能力を活用することによって、ネットワークエッジでMLモデルをトレーニングするテクニックとして登場した。
我々は、エッジデバイスからクラウドサーバへのノード連続体にMLモデルのトレーニングをインテリジェントに分散する、フォグラーニングと呼ばれる新しい学習パラダイムを提唱する。
論文 参考訳(メタデータ) (2020-06-07T05:11:18Z) - NetML: A Challenge for Network Traffic Analytics [16.8001000840057]
約1.3Mラベル付きフローを含む3つのオープンデータセットをリリースする。
我々は、マルウェア検出とアプリケーション分類の両方を含む、ネットワークトラフィック分析の幅広い側面に焦点を当てる。
NetMLの成長を続けるにつれて、データセットはAI駆動で再現可能なネットワークフロー分析の研究のための共通プラットフォームとして機能することを期待しています。
論文 参考訳(メタデータ) (2020-04-25T01:12:17Z) - Distributed Learning in Ad-Hoc Networks: A Multi-player Multi-armed
Bandit Framework [0.0]
次世代ネットワークは超高密度で、ピークレートは非常に高いが、ユーザ当たりのトラフィックは比較的低いと期待されている。
この問題を解決するために、他のネットワークとスペクトルを共有する認知アドホックネットワーク(CAHN)が構想されている。
本稿では,最先端のマルチアーム・マルチプレイヤー・バンディットに基づく分散学習アルゴリズムについて論じる。
論文 参考訳(メタデータ) (2020-03-06T18:11:47Z) - Deep Learning for Ultra-Reliable and Low-Latency Communications in 6G
Networks [84.2155885234293]
まず,データ駆動型教師付き深層学習と深部強化学習をURLLCに適用する方法を概説する。
このようなオープンな問題に対処するために、デバイスインテリジェンス、エッジインテリジェンス、およびURLLCのためのクラウドインテリジェンスを可能にするマルチレベルアーキテクチャを開発した。
論文 参考訳(メタデータ) (2020-02-22T14:38:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。