論文の概要: Emergent Communication Protocol Learning for Task Offloading in
Industrial Internet of Things
- arxiv url: http://arxiv.org/abs/2401.12914v1
- Date: Tue, 23 Jan 2024 17:06:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-24 14:53:50.859240
- Title: Emergent Communication Protocol Learning for Task Offloading in
Industrial Internet of Things
- Title(参考訳): 産業用iotにおけるタスクオフロードのための創発的通信プロトコル学習
- Authors: Salwa Mostafa, Mateus P. Mota, Alvaro Valcarce, and Mehdi Bennis
- Abstract要約: 計算のオフロード決定とマルチチャネルアクセスポリシーを対応するシグナリングで学習する。
具体的には、基地局と産業用IoTモバイルデバイスは強化学習エージェントである。
この問題を解決するために,創発的な通信プロトコル学習フレームワークを採用する。
- 参考スコア(独自算出の注目度): 30.146175299047325
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we leverage a multi-agent reinforcement learning (MARL)
framework to jointly learn a computation offloading decision and multichannel
access policy with corresponding signaling. Specifically, the base station and
industrial Internet of Things mobile devices are reinforcement learning agents
that need to cooperate to execute their computation tasks within a deadline
constraint. We adopt an emergent communication protocol learning framework to
solve this problem. The numerical results illustrate the effectiveness of
emergent communication in improving the channel access success rate and the
number of successfully computed tasks compared to contention-based,
contention-free, and no-communication approaches. Moreover, the proposed task
offloading policy outperforms remote and local computation baselines.
- Abstract(参考訳): 本稿では、マルチエージェント強化学習(MARL)フレームワークを活用し、計算オフロード決定とマルチチャネルアクセスポリシーを対応信号とともに共同で学習する。
具体的には、ベースステーションと産業用iotモバイルデバイスは、期限の制約内で計算タスクを実行するために協力する必要がある強化学習エージェントである。
この問題を解決するために,創発的な通信プロトコル学習フレームワークを採用する。
計算結果から,チャネルアクセス成功率の向上における創発的コミュニケーションの有効性と,コンティションベース,コンティションフリー,非コミュニケーションアプローチと比較して計算されたタスク数について検討した。
さらに,提案するタスクオフロードポリシは,リモートおよびローカルの計算ベースラインを上回っている。
関連論文リスト
- Emergency Computing: An Adaptive Collaborative Inference Method Based on
Hierarchical Reinforcement Learning [14.929735103723573]
センシング,通信,計算,キャッシュ,インテリジェンスを備えた緊急ネットワーク(E-SC3I)を提案する。
このフレームワークには、緊急コンピューティング、キャッシュ、統合通信とセンシング、インテリジェンス強化のためのメカニズムが含まれている。
本稿では,特に緊急コンピューティングに焦点をあて,階層的強化学習に基づく適応型協調推論手法(ACIM)を提案する。
論文 参考訳(メタデータ) (2024-02-03T13:28:35Z) - Will 6G be Semantic Communications? Opportunities and Challenges from
Task Oriented and Secure Communications to Integrated Sensing [49.83882366499547]
本稿では,マルチタスク学習を統合した次世代(NextG)ネットワークにおけるタスク指向およびセマンティックコミュニケーションの機会と課題について検討する。
我々は、送信側の専用エンコーダと受信側の複数のタスク固有のデコーダを表すディープニューラルネットワークを用いる。
トレーニングとテストの段階において、敵対的攻撃に起因する潜在的な脆弱性を精査する。
論文 参考訳(メタデータ) (2024-01-03T04:01:20Z) - MARLIN: Soft Actor-Critic based Reinforcement Learning for Congestion
Control in Real Networks [63.24965775030673]
そこで本研究では,汎用的な渋滞制御(CC)アルゴリズムを設計するための新しい強化学習(RL)手法を提案する。
我々の解であるMARLINは、Soft Actor-Criticアルゴリズムを用いてエントロピーとリターンの両方を最大化する。
我々は,MARLINを実ネットワーク上で訓練し,実ミスマッチを克服した。
論文 参考訳(メタデータ) (2023-02-02T18:27:20Z) - Federated Reinforcement Learning at the Edge [1.4271989597349055]
現代のサイバー物理アーキテクチャでは、異なる物理的位置にあるシステムから収集されたデータを使用して適切な振る舞いを学び、不確実な環境に適応する。
本稿では,複数のエージェントが分散的に収集された時系列データに対して,強化学習問題を共同で解決するために,効率的にコミュニケーションを行う必要がある設定について考察する。
通信効率向上のためのアルゴリズムが提案され、理論的保証、実践的実装、数値評価がサポートされている。
論文 参考訳(メタデータ) (2021-12-11T03:28:59Z) - Event-Based Communication in Multi-Agent Distributed Q-Learning [0.0]
本稿では,イベントトリガ制御(ETC)技術に触発されたマルチエージェント学習システムにおける情報通信の低減手法を提案する。
マルコフ決定過程(MDP)における分散Q-ラーニング問題のベースラインシナリオについて考察する。
イベントベースのアプローチの後、NエージェントはMDPを探索し、必要に応じて中央学習者と経験を伝達し、アクターQ機能の更新を行う。
論文 参考訳(メタデータ) (2021-09-03T10:06:53Z) - Accelerating Federated Edge Learning via Optimized Probabilistic Device
Scheduling [57.271494741212166]
本稿では,通信時間最小化問題を定式化し,解決する。
最適化されたポリシーは、トレーニングプロセスが進むにつれて、残りの通信ラウンドの抑制から、ラウンドごとのレイテンシの低減へと、徐々に優先順位を転換している。
提案手法の有効性は,自律運転における協調的3次元目標検出のユースケースを通じて実証される。
論文 参考訳(メタデータ) (2021-07-24T11:39:17Z) - Communication-Efficient Split Learning Based on Analog Communication and
Over the Air Aggregation [48.150466900765316]
スプリットラーニング(SL)は、その固有のプライバシー保護機能と、限られた計算能力を持つデバイスに対する協調推論を可能にする能力により、最近人気を集めている。
標準SLアルゴリズムは、理想的なデジタル通信システムを想定し、通信帯域不足の問題を無視している。
本稿では,エージェント側で追加層を導入し,重みとバイアスの選択を制約し,空気の凝集を確実にするための新しいSLフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-02T07:49:41Z) - Deep reinforcement learning of event-triggered communication and control
for multi-agent cooperative transport [9.891241465396098]
協調輸送のためのコミュニケーション・制御戦略の設計問題に対処する多エージェント強化学習手法を検討する。
我々のフレームワークはイベントトリガーアーキテクチャ、すなわち通信入力を演算するフィードバックコントローラと、入力を再更新する必要があるタイミングを決定するトリガー機構を利用する。
論文 参考訳(メタデータ) (2021-03-29T01:16:12Z) - Toward Multiple Federated Learning Services Resource Sharing in Mobile
Edge Networks [88.15736037284408]
本稿では,マルチアクセスエッジコンピューティングサーバにおいて,複数のフェデレーション付き学習サービスの新たなモデルについて検討する。
共同資源最適化とハイパーラーニング率制御の問題,すなわちMS-FEDLを提案する。
シミュレーションの結果,提案アルゴリズムの収束性能を実証した。
論文 参考訳(メタデータ) (2020-11-25T01:29:41Z) - Communication-Efficient and Distributed Learning Over Wireless Networks:
Principles and Applications [55.65768284748698]
機械学習(ML)は、第5世代(5G)通信システムなどのための有望なイネーブルである。
本稿では、関連するコミュニケーションとMLの原則を概観し、選択したユースケースでコミュニケーション効率と分散学習フレームワークを提示することを目的とする。
論文 参考訳(メタデータ) (2020-08-06T12:37:14Z) - Learning to Communicate Using Counterfactual Reasoning [2.8110705488739676]
本稿では,Multi-agent counterfactual communication learning (MACC)法を提案する。
MACCは、通信エージェントの信用割当問題を克服するために、対実的推論に適応する。
実験の結果,MACCは粒子環境における4つのシナリオにおいて,最先端のベースラインよりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-06-12T14:02:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。