論文の概要: TinyQMIX: Distributed Access Control for mMTC via Multi-agent
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2211.11692v1
- Date: Mon, 21 Nov 2022 18:09:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 23:47:05.364028
- Title: TinyQMIX: Distributed Access Control for mMTC via Multi-agent
Reinforcement Learning
- Title(参考訳): TinyQMIX:マルチエージェント強化学習によるmMTCの分散アクセス制御
- Authors: Tien Thanh Le, Yusheng Ji, John C.S Lui
- Abstract要約: 集中制御に頼ることなく,資源選択のための分散強化学習について検討する。
既存の分散アクセス制御の研究は、トラフィックの負荷が静的であるか、動的トラフィックに徐々に適応できると仮定している。
軽量なマルチエージェント深部強化学習モデルであるTinyQmixをトレーニングすることで適応期間を最小化する。
- 参考スコア(独自算出の注目度): 32.99612690478941
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Distributed access control is a crucial component for massive machine type
communication (mMTC). In this communication scenario, centralized resource
allocation is not scalable because resource configurations have to be sent
frequently from the base station to a massive number of devices. We investigate
distributed reinforcement learning for resource selection without relying on
centralized control. Another important feature of mMTC is the sporadic and
dynamic change of traffic. Existing studies on distributed access control
assume that traffic load is static or they are able to gradually adapt to the
dynamic traffic. We minimize the adaptation period by training TinyQMIX, which
is a lightweight multi-agent deep reinforcement learning model, to learn a
distributed wireless resource selection policy under various traffic patterns
before deployment. Therefore, the trained agents are able to quickly adapt to
dynamic traffic and provide low access delay. Numerical results are presented
to support our claims.
- Abstract(参考訳): 分散アクセス制御は、大規模機械型通信(mMTC)にとって重要なコンポーネントである。
この通信シナリオでは、リソース構成をベースステーションから大量のデバイスに頻繁に送信する必要があるため、集中型リソース割り当てはスケーラブルではない。
資源選択のための分散強化学習を集中制御に頼らずに検討する。
mMTCのもう1つの重要な特徴は、トラフィックの散発的および動的変化である。
既存の分散アクセス制御の研究は、トラフィックの負荷が静的であるか、動的トラフィックに徐々に適応できると仮定している。
我々は,軽量なマルチエージェント深層強化学習モデルであるTinyQMIXをトレーニングし,展開前の様々なトラフィックパターンの下で分散無線リソース選択ポリシーを学習することにより,適応期間を最小化する。
したがって、訓練されたエージェントは、動的トラフィックに迅速に適応でき、アクセス遅延を低減できる。
我々の主張を支持するために数値的な結果が提示される。
関連論文リスト
- Learning Decentralized Traffic Signal Controllers with Multi-Agent Graph
Reinforcement Learning [42.175067773481416]
我々は,空間的時間的相関を捉えるために,環境観測性を改善した新しい分散制御アーキテクチャを設計する。
具体的には,道路ネットワークに収集された非構造データから相関関連情報を抽出するトポロジ対応情報集約戦略を開発する。
拡散畳み込みモジュールが開発され、新しいMARLアルゴリズムが作成され、エージェントにグラフ学習の能力を与える。
論文 参考訳(メタデータ) (2023-11-07T06:43:15Z) - A Novel Multi-Agent Deep RL Approach for Traffic Signal Control [13.927155702352131]
都市ネットワークにおける複数の交通信号制御のための Friend-Deep Q-network (Friend-DQN) アプローチを提案する。
特に、複数のエージェント間の協調は状態-作用空間を減少させ、収束を加速させる。
論文 参考訳(メタデータ) (2023-06-05T08:20:37Z) - Distributed Resource Allocation for URLLC in IIoT Scenarios: A
Multi-Armed Bandit Approach [17.24490186427519]
本稿では,将来の6G産業用IoT(Industrial Internet of Things, IIoT)ネットワークにおいて,機械間ウルトラ信頼性低レイテンシ通信(URLLC)を実現するという課題に対処する。
本研究では,ユーザ機器がアリンク無線リソースを自律的に選択する機械学習に基づく,分散型ユーザ中心方式について検討する。
シミュレーションを用いて,URLLCを念頭に置いてリソースを割り当てる上で,MAB(Multi-Armed Bandit)アプローチが望ましい手法であることを実証した。
論文 参考訳(メタデータ) (2022-11-22T11:50:05Z) - Artificial Intelligence Empowered Multiple Access for Ultra Reliable and
Low Latency THz Wireless Networks [76.89730672544216]
テラヘルツ(THz)無線ネットワークは、第5世代(B5G)以上の時代を触媒すると予想されている。
いくつかのB5Gアプリケーションの超信頼性と低レイテンシ要求を満たすためには、新しいモビリティ管理アプローチが必要である。
本稿では、インテリジェントなユーザアソシエーションとリソースアロケーションを実現するとともに、フレキシブルで適応的なモビリティ管理を可能にする、全体論的MAC層アプローチを提案する。
論文 参考訳(メタデータ) (2022-08-17T03:00:24Z) - AI-aided Traffic Control Scheme for M2M Communications in the Internet
of Vehicles [61.21359293642559]
交通のダイナミクスと異なるIoVアプリケーションの異種要求は、既存のほとんどの研究では考慮されていない。
本稿では,ハイブリッド交通制御方式とPPO法を併用して検討する。
論文 参考訳(メタデータ) (2022-03-05T10:54:05Z) - Asynchronous Parallel Incremental Block-Coordinate Descent for
Decentralized Machine Learning [55.198301429316125]
機械学習(ML)は、巨大なIoT(Internet of Things)ベースのインテリジェントでユビキタスなコンピューティングのビッグデータ駆動モデリングと分析のための重要なテクニックである。
急成長するアプリケーションやデータ量にとって、分散学習は有望な新興パラダイムである。
本稿では,多くのユーザデバイスに分散した分散システム上でMLモデルをトレーニングする問題について検討する。
論文 参考訳(メタデータ) (2022-02-07T15:04:15Z) - Federated Learning over Wireless IoT Networks with Optimized
Communication and Resources [98.18365881575805]
協調学習技術のパラダイムとしてのフェデレートラーニング(FL)は研究の注目を集めている。
無線システム上での高速応答および高精度FLスキームの検証が重要である。
提案する通信効率のよいフェデレーション学習フレームワークは,強い線形速度で収束することを示す。
論文 参考訳(メタデータ) (2021-10-22T13:25:57Z) - Scalable Multiagent Driving Policies For Reducing Traffic Congestion [32.08636346620938]
過去の研究では、AVと人間駆動車両の両方で小規模の混合交通シナリオでは、制御されたマルチエージェント運転ポリシーを実行する少数のAVが混雑を緩和できることを示しています。
本稿では,既存のアプローチをスケールアップし,より複雑なシナリオにおいてavのための新しいマルチエージェント駆動ポリシを開発する。
論文 参考訳(メタデータ) (2021-02-26T21:29:55Z) - Coded Stochastic ADMM for Decentralized Consensus Optimization with Edge
Computing [113.52575069030192]
セキュリティ要件の高いアプリケーションを含むビッグデータは、モバイルデバイスやドローン、車両など、複数の異種デバイスに収集され、格納されることが多い。
通信コストとセキュリティ要件の制限のため、核融合センターにデータを集約するのではなく、分散的に情報を抽出することが最重要となる。
分散エッジノードを介してデータを局所的に処理するマルチエージェントシステムにおいて,モデルパラメータを学習する問題を考える。
分散学習モデルを開発するために,乗算器アルゴリズムの最小バッチ交互方向法(ADMM)のクラスについて検討した。
論文 参考訳(メタデータ) (2020-10-02T10:41:59Z) - IG-RL: Inductive Graph Reinforcement Learning for Massive-Scale Traffic
Signal Control [4.273991039651846]
適応的な交通信号制御のスケーリングには、状態と行動空間を扱う必要がある。
本稿では,グラフ畳み込みネットワークに基づくインダクティブグラフ強化学習(IG-RL)を紹介する。
我々のモデルは、新しい道路網、交通分布、交通体制に一般化することができる。
論文 参考訳(メタデータ) (2020-03-06T17:17:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。