論文の概要: Model-aided Federated Reinforcement Learning for Multi-UAV Trajectory
Planning in IoT Networks
- arxiv url: http://arxiv.org/abs/2306.02029v1
- Date: Sat, 3 Jun 2023 07:16:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-06 20:33:19.630198
- Title: Model-aided Federated Reinforcement Learning for Multi-UAV Trajectory
Planning in IoT Networks
- Title(参考訳): IoTネットワークにおける多UAV軌道計画のためのモデル支援フェデレーション強化学習
- Authors: Jichao Chen, Omid Esrafilian, Harald Bayerlein, David Gesbert, and
Marco Caccamo
- Abstract要約: 本稿では,データ収集ミッションにおいて,環境に関する限られた知識で複数のUAVを協調するモデル支援フェデレーションMARLアルゴリズムを提案する。
提案アルゴリズムは,MARLアルゴリズムと類似したデータ収集性能を確保しつつ,実世界のトレーニング経験の必要性を大幅に低減することを示す。
- 参考スコア(独自算出の注目度): 16.922818785282907
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deploying teams of cooperative unmanned aerial vehicles (UAVs) to harvest
data from distributed Internet of Things (IoT) devices requires efficient
trajectory planning and coordination algorithms. Multi-agent reinforcement
learning (MARL) has emerged as an effective solution, but often requires
extensive and costly real-world training data. In this paper, we propose a
novel model-aided federated MARL algorithm to coordinate multiple UAVs on a
data harvesting mission with limited knowledge about the environment,
significantly reducing the real-world training data demand. The proposed
algorithm alternates between learning an environment model from real-world
measurements and federated QMIX training in the simulated environment.
Specifically, collected measurements from the real-world environment are used
to learn the radio channel and estimate unknown IoT device locations to create
a simulated environment. Each UAV agent trains a local QMIX model in its
simulated environment and continuously consolidates it through federated
learning with other agents, accelerating the learning process and further
improving training sample efficiency. Simulation results demonstrate that our
proposed model-aided FedQMIX algorithm substantially reduces the need for
real-world training experiences while attaining similar data collection
performance as standard MARL algorithms.
- Abstract(参考訳): 分散IoT(Internet of Things)デバイスからデータを収集するために、協調無人航空機(UAV)のチームが配置するには、効率的な軌道計画と調整アルゴリズムが必要である。
マルチエージェント強化学習(MARL)が有効なソリューションとして登場したが、多くの場合、広範囲でコストのかかる実世界のトレーニングデータを必要とする。
本稿では,環境に関する知識が限られたデータ収集ミッションにおいて,複数のuavを協調させ,実世界のトレーニングデータ要求を大幅に削減するモデル支援型フェデレーションmarlアルゴリズムを提案する。
提案アルゴリズムは,実環境計測から環境モデルを学ぶことと,シミュレーション環境におけるQMIX訓練とを交互に行う。
具体的には、実環境から収集した測定値を用いて、無線チャンネルを学習し、未知のIoTデバイス位置を推定し、シミュレーション環境を作成する。
各uavエージェントは、シミュレーション環境でローカルqmixモデルをトレーニングし、他のエージェントとの連合学習を通じて継続的に統合し、学習プロセスを加速し、さらにトレーニングサンプル効率を向上させる。
シミュレーションの結果,提案するモデル支援fedqmixアルゴリズムは,標準marlアルゴリズムと同様のデータ収集性能を実現しつつ,実世界のトレーニングエクスペリエンスを実質的に削減できることが示されている。
関連論文リスト
- Federated Learning for Misbehaviour Detection with Variational Autoencoders and Gaussian Mixture Models [0.2999888908665658]
Federated Learning (FL)は、機械学習(ML)モデルを協調的にトレーニングするための魅力的なアプローチになっている。
本研究は、車載環境における潜在的な不適切な行動を特定するための、新しい教師なしFLアプローチを提案する。
当社は、モデルアグリゲーションの目的のために、パブリッククラウドサービスのコンピューティング能力を活用しています。
論文 参考訳(メタデータ) (2024-05-16T08:49:50Z) - Asynchronous Multi-Model Dynamic Federated Learning over Wireless
Networks: Theory, Modeling, and Optimization [20.741776617129208]
分散機械学習(ML)の鍵となる技術として、フェデレートラーニング(FL)が登場した。
まず、システムパラメータが学習性能に与える影響を捉えるために、長方形のスケジューリングステップと関数を定式化する。
我々の分析は、デバイストレーニング変数と非同期スケジューリング決定の協調的影響に光を当てている。
論文 参考訳(メタデータ) (2023-05-22T21:39:38Z) - Vertical Federated Learning over Cloud-RAN: Convergence Analysis and
System Optimization [82.12796238714589]
高速かつ正確なモデルアグリゲーションを実現するために,クラウド無線アクセスネットワーク(Cloud-RAN)ベースの垂直FLシステムを提案する。
アップリンクとダウンリンクの両方の伝送を考慮した垂直FLアルゴリズムの収束挙動を特徴付ける。
我々は,連続凸近似と代替凸探索に基づくシステム最適化アルゴリズムを開発した,連系トランシーバとフロントホール量子化設計によるシステム最適化フレームワークを構築した。
論文 参考訳(メタデータ) (2023-05-04T09:26:03Z) - Scheduling and Aggregation Design for Asynchronous Federated Learning
over Wireless Networks [56.91063444859008]
Federated Learning(FL)は、デバイス上でのトレーニングとサーバベースのアグリゲーションを組み合わせた、協調的な機械学習フレームワークである。
FLシステムにおけるストラグラー問題に対処するために,周期的アグリゲーションを用いた非同期FL設計を提案する。
年齢認識の集約重み付け設計は,非同期FL設定における学習性能を著しく向上させることができることを示す。
論文 参考訳(メタデータ) (2022-12-14T17:33:01Z) - Parallel Successive Learning for Dynamic Distributed Model Training over
Heterogeneous Wireless Networks [50.68446003616802]
フェデレートラーニング(Federated Learning, FedL)は、一連の無線デバイスにモデルトレーニングを配布する一般的なテクニックとして登場した。
我々は,FedLアーキテクチャを3次元に拡張した並列逐次学習(PSL)を開発した。
我々の分析は、分散機械学習におけるコールド対ウォームアップモデルの概念とモデル慣性について光を当てている。
論文 参考訳(メタデータ) (2022-02-07T05:11:01Z) - Robust Semi-supervised Federated Learning for Images Automatic
Recognition in Internet of Drones [57.468730437381076]
プライバシー保護型UAV画像認識のための半教師付きフェデレートラーニング(SSFL)フレームワークを提案する。
異なるカメラモジュールを使用したUAVによって収集されたローカルデータの数、特徴、分布には大きな違いがある。
本稿では,クライアントがトレーニングに参加する頻度,すなわちFedFreqアグリゲーションルールに基づくアグリゲーションルールを提案する。
論文 参考訳(メタデータ) (2022-01-03T16:49:33Z) - UAV-assisted Online Machine Learning over Multi-Tiered Networks: A
Hierarchical Nested Personalized Federated Learning Approach [25.936914508952086]
地理的分散デバイスクラスタのための無人航空機(UAV)による分散機械学習(ML)を検討する。
i)リーダー,ワーカー,コーディネータによるUAVスワーミング,(ii)階層型ネスト型パーソナライズド・フェデレーション・ラーニング(HN-PFL),(iii)UAVのローカル計算機能を用いた分散MLのための協調的UAVリソースプール,の5つの新しい技術/技術を提案する。
論文 参考訳(メタデータ) (2021-06-29T21:40:28Z) - Edge Federated Learning Via Unit-Modulus Over-The-Air Computation
(Extended Version) [64.76619508293966]
本稿では,効率の良いエッジフェデレーション学習を実現するために,UM-AirCompフレームワークを提案する。
ローカルモデルパラメータを同時にアップロードし、アナログビームフォーミングを通じてグローバルモデルパラメータを更新する。
車両間自動運転シミュレーションプラットフォームにおけるUM-AirCompの実装を実演する。
論文 参考訳(メタデータ) (2021-01-28T15:10:22Z) - Fast-Convergent Federated Learning [82.32029953209542]
フェデレーション学習は、モバイルデバイスの現代的なネットワークを介して機械学習タスクを分散するための、有望なソリューションである。
本稿では,FOLBと呼ばれる高速収束型フェデレーション学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-26T14:37:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。