論文の概要: Model-aided Federated Reinforcement Learning for Multi-UAV Trajectory
Planning in IoT Networks
- arxiv url: http://arxiv.org/abs/2306.02029v2
- Date: Sat, 7 Oct 2023 07:50:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-13 09:08:27.185010
- Title: Model-aided Federated Reinforcement Learning for Multi-UAV Trajectory
Planning in IoT Networks
- Title(参考訳): IoTネットワークにおける多UAV軌道計画のためのモデル支援フェデレーション強化学習
- Authors: Jichao Chen, Omid Esrafilian, Harald Bayerlein, David Gesbert, and
Marco Caccamo
- Abstract要約: 本稿では,データ収集ミッションにおいて,環境に関する限られた知識しか持たない複数のUAVを協調するモデル支援フェデレーションMARLアルゴリズムを提案する。
標準的なMARLアルゴリズムとの比較により,提案したモデル支援型FedQMIXアルゴリズムは実世界のトレーニング経験を約3倍削減することを示した。
- 参考スコア(独自算出の注目度): 17.770665737751372
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deploying teams of unmanned aerial vehicles (UAVs) to harvest data from
distributed Internet of Things (IoT) devices requires efficient trajectory
planning and coordination algorithms. Multi-agent reinforcement learning (MARL)
has emerged as a solution, but requires extensive and costly real-world
training data. To tackle this challenge, we propose a novel model-aided
federated MARL algorithm to coordinate multiple UAVs on a data harvesting
mission with only limited knowledge about the environment. The proposed
algorithm alternates between building an environment simulation model from
real-world measurements, specifically learning the radio channel
characteristics and estimating unknown IoT device positions, and federated QMIX
training in the simulated environment. Each UAV agent trains a local QMIX model
in its simulated environment and continuously consolidates it through federated
learning with other agents, accelerating the learning process. A performance
comparison with standard MARL algorithms demonstrates that our proposed
model-aided FedQMIX algorithm reduces the need for real-world training
experiences by around three magnitudes while attaining similar data collection
performance.
- Abstract(参考訳): 無人航空機(UAV)のチームが分散IoT(Internet of Things)デバイスからデータを収集するには、効率的な軌道計画と調整アルゴリズムが必要である。
マルチエージェント強化学習(MARL)がソリューションとして登場したが、大規模な実世界のトレーニングデータが必要である。
この課題に対処するために,データ収集ミッションにおいて,環境に関する限られた知識のみで複数のUAVを協調するモデル支援連合型MARLアルゴリズムを提案する。
提案手法は,実世界の計測から環境シミュレーションモデルの構築,特に無線チャネル特性の学習,未知のiotデバイス位置の推定,シミュレーション環境での連合qmixトレーニングを交互に行う。
各UAVエージェントは、模擬環境でローカルQMIXモデルを訓練し、他のエージェントとの連携学習を通じて継続的に統合し、学習プロセスを加速する。
標準marlアルゴリズムとの比較により,提案するモデル支援feedqmixアルゴリズムは,実世界のトレーニングエクスペリエンスを約3桁削減するとともに,同様のデータ収集性能を実現する。
関連論文リスト
- Federated Learning for Misbehaviour Detection with Variational Autoencoders and Gaussian Mixture Models [0.2999888908665658]
Federated Learning (FL)は、機械学習(ML)モデルを協調的にトレーニングするための魅力的なアプローチになっている。
本研究は、車載環境における潜在的な不適切な行動を特定するための、新しい教師なしFLアプローチを提案する。
当社は、モデルアグリゲーションの目的のために、パブリッククラウドサービスのコンピューティング能力を活用しています。
論文 参考訳(メタデータ) (2024-05-16T08:49:50Z) - Asynchronous Multi-Model Dynamic Federated Learning over Wireless
Networks: Theory, Modeling, and Optimization [20.741776617129208]
分散機械学習(ML)の鍵となる技術として、フェデレートラーニング(FL)が登場した。
まず、システムパラメータが学習性能に与える影響を捉えるために、長方形のスケジューリングステップと関数を定式化する。
我々の分析は、デバイストレーニング変数と非同期スケジューリング決定の協調的影響に光を当てている。
論文 参考訳(メタデータ) (2023-05-22T21:39:38Z) - Vertical Federated Learning over Cloud-RAN: Convergence Analysis and
System Optimization [82.12796238714589]
高速かつ正確なモデルアグリゲーションを実現するために,クラウド無線アクセスネットワーク(Cloud-RAN)ベースの垂直FLシステムを提案する。
アップリンクとダウンリンクの両方の伝送を考慮した垂直FLアルゴリズムの収束挙動を特徴付ける。
我々は,連続凸近似と代替凸探索に基づくシステム最適化アルゴリズムを開発した,連系トランシーバとフロントホール量子化設計によるシステム最適化フレームワークを構築した。
論文 参考訳(メタデータ) (2023-05-04T09:26:03Z) - Scheduling and Aggregation Design for Asynchronous Federated Learning
over Wireless Networks [56.91063444859008]
Federated Learning(FL)は、デバイス上でのトレーニングとサーバベースのアグリゲーションを組み合わせた、協調的な機械学習フレームワークである。
FLシステムにおけるストラグラー問題に対処するために,周期的アグリゲーションを用いた非同期FL設計を提案する。
年齢認識の集約重み付け設計は,非同期FL設定における学習性能を著しく向上させることができることを示す。
論文 参考訳(メタデータ) (2022-12-14T17:33:01Z) - Parallel Successive Learning for Dynamic Distributed Model Training over
Heterogeneous Wireless Networks [50.68446003616802]
フェデレートラーニング(Federated Learning, FedL)は、一連の無線デバイスにモデルトレーニングを配布する一般的なテクニックとして登場した。
我々は,FedLアーキテクチャを3次元に拡張した並列逐次学習(PSL)を開発した。
我々の分析は、分散機械学習におけるコールド対ウォームアップモデルの概念とモデル慣性について光を当てている。
論文 参考訳(メタデータ) (2022-02-07T05:11:01Z) - Robust Semi-supervised Federated Learning for Images Automatic
Recognition in Internet of Drones [57.468730437381076]
プライバシー保護型UAV画像認識のための半教師付きフェデレートラーニング(SSFL)フレームワークを提案する。
異なるカメラモジュールを使用したUAVによって収集されたローカルデータの数、特徴、分布には大きな違いがある。
本稿では,クライアントがトレーニングに参加する頻度,すなわちFedFreqアグリゲーションルールに基づくアグリゲーションルールを提案する。
論文 参考訳(メタデータ) (2022-01-03T16:49:33Z) - UAV-assisted Online Machine Learning over Multi-Tiered Networks: A
Hierarchical Nested Personalized Federated Learning Approach [25.936914508952086]
地理的分散デバイスクラスタのための無人航空機(UAV)による分散機械学習(ML)を検討する。
i)リーダー,ワーカー,コーディネータによるUAVスワーミング,(ii)階層型ネスト型パーソナライズド・フェデレーション・ラーニング(HN-PFL),(iii)UAVのローカル計算機能を用いた分散MLのための協調的UAVリソースプール,の5つの新しい技術/技術を提案する。
論文 参考訳(メタデータ) (2021-06-29T21:40:28Z) - Edge Federated Learning Via Unit-Modulus Over-The-Air Computation
(Extended Version) [64.76619508293966]
本稿では,効率の良いエッジフェデレーション学習を実現するために,UM-AirCompフレームワークを提案する。
ローカルモデルパラメータを同時にアップロードし、アナログビームフォーミングを通じてグローバルモデルパラメータを更新する。
車両間自動運転シミュレーションプラットフォームにおけるUM-AirCompの実装を実演する。
論文 参考訳(メタデータ) (2021-01-28T15:10:22Z) - Fast-Convergent Federated Learning [82.32029953209542]
フェデレーション学習は、モバイルデバイスの現代的なネットワークを介して機械学習タスクを分散するための、有望なソリューションである。
本稿では,FOLBと呼ばれる高速収束型フェデレーション学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-26T14:37:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。