論文の概要: Medium Access using Distributed Reinforcement Learning for IoTs with
Low-Complexity Wireless Transceivers
- arxiv url: http://arxiv.org/abs/2104.14549v1
- Date: Thu, 29 Apr 2021 17:57:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-30 12:40:04.918056
- Title: Medium Access using Distributed Reinforcement Learning for IoTs with
Low-Complexity Wireless Transceivers
- Title(参考訳): 低複雑ワイヤレストランシーバを用いたIoTのための分散強化学習を用いた媒体アクセス
- Authors: Hrishikesh Dutta and Subir Biswas
- Abstract要約: 本論文では,低複雑性無線トランシーバを用いたIoTネットワークにおけるMAC層無線プロトコルに使用できる分散強化学習(RL)ベースのフレームワークを提案する。
このフレームワークでは、アクセスプロトコルをまずMarkov Decision Processs (MDP) として定式化し、次にRLを用いて解決する。
本論文は,学習パラダイムの性能と,ノードが様々なネットワークダイナミクスに応答して,その最適伝達戦略をオンザフライで適応させる能力を示す。
- 参考スコア(独自算出の注目度): 2.6397379133308214
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes a distributed Reinforcement Learning (RL) based framework
that can be used for synthesizing MAC layer wireless protocols in IoT networks
with low-complexity wireless transceivers. The proposed framework does not rely
on complex hardware capabilities such as carrier sensing and its associated
algorithmic complexities that are often not supported in wireless transceivers
of low-cost and low-energy IoT devices. In this framework, the access protocols
are first formulated as Markov Decision Processes (MDP) and then solved using
RL. A distributed and multi-Agent RL framework is used as the basis for
protocol synthesis. Distributed behavior makes the nodes independently learn
optimal transmission strategies without having to rely on full network level
information and direct knowledge of behavior of other nodes. The nodes learn to
minimize packet collisions such that optimal throughput can be attained and
maintained for loading conditions that are higher than what the known benchmark
protocols (such as ALOHA) for IoT devices without complex transceivers. In
addition, the nodes are observed to be able to learn to act optimally in the
presence of heterogeneous loading and network topological conditions. Finally,
the proposed learning approach allows the wireless bandwidth to be fairly
distributed among network nodes in a way that is not dependent on such
heterogeneities. Via simulation experiments, the paper demonstrates the
performance of the learning paradigm and its abilities to make nodes adapt
their optimal transmission strategies on the fly in response to various network
dynamics.
- Abstract(参考訳): 本稿では,低複雑性無線トランシーバを用いたIoTネットワークにおいて,MAC層無線プロトコルの合成に使用できる分散強化学習(RL)ベースのフレームワークを提案する。
提案するフレームワークは,低コストで低エネルギーのIoTデバイスの無線トランシーバではサポートされない,キャリアセンシングなどの複雑なハードウェア機能や,関連するアルゴリズムの複雑さに依存しない。
このフレームワークでは、アクセスプロトコルをまずMarkov Decision Processs (MDP) として定式化し、次にRLを用いて解決する。
プロトコル合成の基礎として分散マルチエージェントRLフレームワークが使用される。
分散動作は、ノードがネットワークレベルの情報と他のノードの振る舞いに関する直接的な知識に頼ることなく、最適な送信戦略を独立に学習させる。
ノードはパケット衝突を最小限に抑え、複雑なトランシーバを使わずにIoTデバイス用の既知のベンチマークプロトコル(ALOHAなど)よりも高いロード条件で最適なスループットを達成および維持できるように学習する。
さらに、ノードは、異種負荷とネットワークトポロジー条件の存在下で最適に動作することを学ぶことができることが観察される。
最後に、提案した学習手法により、無線帯域幅は、そのような不均一性に依存しない方法で、ネットワークノード間でかなり分散することができる。
シミュレーション実験を通じて,学習パラダイムの性能と,ノードが様々なネットワークダイナミクスに応答して,その最適な伝達戦略をオンザフライで適応させる能力を示す。
関連論文リスト
- Adaptive Genetic Selection based Pinning Control with Asymmetric Coupling for Multi-Network Heterogeneous Vehicular Systems [8.454856509502733]
本稿では,異種マルチネットワーク車載アドホックネットワーク(VANET)のためのピンニング制御手法を提案する。
まず、単一および複数ネットワーク条件下でのピンニング制御戦略の安定性を証明し、厳密な理論基盤を確立する。
本理論に基づいて,最適ピンニングノードの選択に適した適応型遺伝的アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-11-05T11:49:26Z) - A Centralized Reinforcement Learning Framework for Adaptive Clustering
with Low Control Overhead in IoT Networks [0.0]
本稿では,Reinforcement Adaptive Learning-based Controller (LEACH-RLC)を用いた低エネルギークラスタリング階層を提案する。
LEACH-RLCは、クラスタヘッド(CH)とノード間割り当ての戦略的選択にMILP(Mixed Linear Programming)を使用している。
Reinforcement Learning (RL)エージェントを統合して、新しいクラスタを生成するための最適なタイミングを学習することで、制御オーバーヘッドを最小限にする。
その結果,LEACH-RLCは従来のLEACHとLEACH-Cよりも優れた性能を示し,ネットワーク寿命の向上,平均エネルギー消費の削減,制御オーバーヘッドの最小化を示した。
論文 参考訳(メタデータ) (2024-01-28T21:08:45Z) - Reinforcement Learning for Protocol Synthesis in Resource-Constrained
Wireless Sensor and IoT Networks [1.462434043267217]
本稿では、メディアアクセス制御(MAC)におけるRLとMulti Armed Bandit(MAB)の使用について紹介する。
次に、ランダムアクセスとタイムスロットネットワークの両方において、メディアアクセスの特定の困難と制限に対処する、新しい学習ベースのプロトコル合成フレームワークを導入する。
ノードによる独立したプロトコル学習の能力により、システムはネットワークや交通条件の変化に対して堅牢で適応できる。
論文 参考訳(メタデータ) (2023-01-14T03:28:26Z) - Artificial Intelligence Empowered Multiple Access for Ultra Reliable and
Low Latency THz Wireless Networks [76.89730672544216]
テラヘルツ(THz)無線ネットワークは、第5世代(B5G)以上の時代を触媒すると予想されている。
いくつかのB5Gアプリケーションの超信頼性と低レイテンシ要求を満たすためには、新しいモビリティ管理アプローチが必要である。
本稿では、インテリジェントなユーザアソシエーションとリソースアロケーションを実現するとともに、フレキシブルで適応的なモビリティ管理を可能にする、全体論的MAC層アプローチを提案する。
論文 参考訳(メタデータ) (2022-08-17T03:00:24Z) - Semantic-Aware Collaborative Deep Reinforcement Learning Over Wireless
Cellular Networks [82.02891936174221]
複数のエージェントが無線ネットワーク上で協調できるコラボレーティブディープ強化学習(CDRL)アルゴリズムは有望なアプローチである。
本稿では,リソース制約のある無線セルネットワーク上で,意味的にリンクされたDRLタスクを持つ未学習エージェントのグループを効率的に協調させる,新しい意味認識型CDRL手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T18:24:47Z) - Learning Autonomy in Management of Wireless Random Networks [102.02142856863563]
本稿では,任意の数のランダム接続ノードを持つ無線ネットワークにおいて,分散最適化タスクに取り組む機械学習戦略を提案する。
我々は,ネットワークトポロジとは無関係に,前方および後方に計算を行う分散メッセージパスニューラルネットワーク(DMPNN)と呼ばれる,柔軟な深層ニューラルネットワーク形式を開発した。
論文 参考訳(メタデータ) (2021-06-15T09:03:28Z) - Joint Coding and Scheduling Optimization for Distributed Learning over
Wireless Edge Networks [21.422040036286536]
この記事では、符号化コンピューティングとディープデュエルニューラルネットワークアーキテクチャの最近の進歩を活用することで、問題を解決する。
コード化された構造/冗長性を導入することで、ノードをつまずくのを待つことなく、分散学習タスクを完了することができる。
シミュレーションでは、提案されたフレームワークは、他のDLアプローチと比較して、無線エッジコンピューティングの平均学習遅延を最大66%削減する。
論文 参考訳(メタデータ) (2021-03-07T08:57:09Z) - Towards Multi-agent Reinforcement Learning for Wireless Network Protocol
Synthesis [2.6397379133308214]
本稿では,無線ネットワークのためのマルチエージェント強化学習に基づくメディアアクセスフレームワークを提案する。
アクセス問題はMarkov Decision Process (MDP) として定式化され、分散学習エージェントとして機能するネットワークノード毎に強化学習を用いて解決される。
論文 参考訳(メタデータ) (2021-02-02T17:13:37Z) - Data-Driven Random Access Optimization in Multi-Cell IoT Networks with
NOMA [78.60275748518589]
非直交多重アクセス(NOMA)は、5Gネットワーク以降で大規模なマシンタイプ通信(mMTC)を可能にする重要な技術です。
本稿では,高密度空間分散マルチセル無線IoTネットワークにおけるランダムアクセス効率向上のために,NOMAを適用した。
ユーザ期待容量の幾何学的平均を最大化するために,各IoTデバイスの伝送確率を調整したランダムチャネルアクセス管理の新たな定式化を提案する。
論文 参考訳(メタデータ) (2021-01-02T15:21:08Z) - Unsupervised Learning for Asynchronous Resource Allocation in Ad-hoc
Wireless Networks [122.42812336946756]
集約グラフニューラルネットワーク(Agg-GNN)に基づく教師なし学習手法を設計する。
アクティベーションパターンを各ノードの特徴としてモデル化し,ポリシーに基づくリソース割り当て手法を訓練することにより,非同期性を捉える。
論文 参考訳(メタデータ) (2020-11-05T03:38:36Z) - A Compressive Sensing Approach for Federated Learning over Massive MIMO
Communication Systems [82.2513703281725]
フェデレートラーニング(Federated Learning)は、無線デバイスとのコラボレーションによって、中央サーバでグローバルモデルをトレーニングするための、プライバシ保護のアプローチである。
本稿では,大規模マルチインプット多出力通信システム上でのフェデレーション学習のための圧縮センシング手法を提案する。
論文 参考訳(メタデータ) (2020-03-18T05:56:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。