論文の概要: On Decentralizing Federated Reinforcement Learning in Multi-Robot
Scenarios
- arxiv url: http://arxiv.org/abs/2207.09372v1
- Date: Tue, 19 Jul 2022 16:17:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-20 14:19:37.077431
- Title: On Decentralizing Federated Reinforcement Learning in Multi-Robot
Scenarios
- Title(参考訳): マルチロボットシナリオにおけるフェデレーション強化学習の分散化について
- Authors: Jayprakash S. Nair, Divya D. Kulkarni, Ajitem Joshi, Sruthy Suresh
- Abstract要約: フェデレートラーニング(FL)は、複数のコンピューティングデバイス間で学習情報を協調的に集約することを可能にする。
移動エージェントは分散連邦強化学習(dFRL)のタスクを遂行できる
Q-learning と SARSA を用いた実験の結果, 対応するQ-table を集約して得られた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Federated Learning (FL) allows for collaboratively aggregating learned
information across several computing devices and sharing the same amongst them,
thereby tackling issues of privacy and the need of huge bandwidth. FL
techniques generally use a central server or cloud for aggregating the models
received from the devices. Such centralized FL techniques suffer from inherent
problems such as failure of the central node and bottlenecks in channel
bandwidth. When FL is used in conjunction with connected robots serving as
devices, a failure of the central controlling entity can lead to a chaotic
situation. This paper describes a mobile agent based paradigm to decentralize
FL in multi-robot scenarios. Using Webots, a popular free open-source robot
simulator, and Tartarus, a mobile agent platform, we present a methodology to
decentralize federated learning in a set of connected robots. With Webots
running on different connected computing systems, we show how mobile agents can
perform the task of Decentralized Federated Reinforcement Learning (dFRL).
Results obtained from experiments carried out using Q-learning and SARSA by
aggregating their corresponding Q-tables, show the viability of using
decentralized FL in the domain of robotics. Since the proposed work can be used
in conjunction with other learning algorithms and also real robots, it can act
as a vital tool for the study of decentralized FL using heterogeneous learning
algorithms concurrently in multi-robot scenarios.
- Abstract(参考訳): Federated Learning(FL)は、複数のコンピューティングデバイス間で学習情報を協調的に集約し、それら間で共有することで、プライバシの問題と巨大な帯域幅の必要性に対処する。
FL技術は一般的に、デバイスから受け取ったモデルを集約するために中央サーバーまたはクラウドを使用する。
このような集中型FL技術は、中央ノードの故障やチャネル帯域のボトルネックといった固有の問題に悩まされる。
flがデバイスとして機能するコネクテッドロボットと併用される場合、中央制御エンティティの故障はカオス状態につながる可能性がある。
本稿では,マルチロボットシナリオにおいてFLを分散化するモバイルエージェントベースのパラダイムについて述べる。
オープンソースロボットシミュレータとして人気のwebotsと,モバイルエージェントプラットフォームであるtartarusを用いて,連帯学習を一組のコネクテッドロボットで分散化する手法を提案する。
webotsは異なるコンピュータシステム上で動作し,モバイルエージェントが分散連合強化学習(dfrl)のタスクをどのように実行するかを示す。
Q-learning と SARSA を用いた実験の結果,ロボット分野における分散FL の実現可能性を示した。
提案手法は他の学習アルゴリズムや実ロボットと併用できるため,マルチロボットシナリオにおいて異種学習アルゴリズムを同時に用いた分散FLの研究において重要なツールとして機能する。
関連論文リスト
- Fed-EC: Bandwidth-Efficient Clustering-Based Federated Learning For Autonomous Visual Robot Navigation [7.8839937556789375]
Federated-EmbedCluster (Fed-EC) は、さまざまな屋外環境で視覚ベースの自律ロボットナビゲーションを備えたクラスタリングベースのフェデレーション学習フレームワークである。
Fed-ECは、目標指向ナビゲーションの集中学習性能に適合しながら、各ロボットの通信サイズを23倍に削減し、局所学習より優れる。
論文 参考訳(メタデータ) (2024-11-06T18:44:09Z) - Communication Efficient ConFederated Learning: An Event-Triggered SAGA
Approach [67.27031215756121]
Federated Learning(FL)は、さまざまなデータソース上のローカルデータを収集することなく、モデルトレーニングをターゲットとする機械学習パラダイムである。
単一のサーバを使用するStandard FLは、限られた数のユーザしかサポートできないため、学習能力の低下につながる。
本研究では,多数のユーザに対応するために,emphConfederated Learning(CFL)と呼ばれるマルチサーバFLフレームワークを検討する。
論文 参考訳(メタデータ) (2024-02-28T03:27:10Z) - LPAC: Learnable Perception-Action-Communication Loops with Applications
to Coverage Control [80.86089324742024]
本稿では,その問題に対する学習可能なパーセプション・アクション・コミュニケーション(LPAC)アーキテクチャを提案する。
CNNは局所認識を処理する。グラフニューラルネットワーク(GNN)はロボットのコミュニケーションを促進する。
評価の結果,LPACモデルは標準分散型および集中型カバレッジ制御アルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2024-01-10T00:08:00Z) - Coordination-free Decentralised Federated Learning on Complex Networks:
Overcoming Heterogeneity [2.6849848612544]
Federated Learning(FL)は、エッジコンピューティングシナリオで学習タスクを実行するためのフレームワークである。
本稿では,コミュニケーション効率のよい分散フェデレート学習(DFL)アルゴリズムを提案する。
我々のソリューションは、デバイスが直接隣人とのみ通信し、正確なモデルを訓練することを可能にする。
論文 参考訳(メタデータ) (2023-12-07T18:24:19Z) - Robot Fleet Learning via Policy Merging [58.5086287737653]
我々はFLEET-MERGEを提案し、艦隊設定における政策を効率的にマージする。
本稿では,FLEET-MERGEがメタワールド環境における50のタスクで訓練されたポリシーの行動を統合することを示す。
合成・接触に富んだロボット操作タスクにおけるフリートポリシー学習のための新しいロボットツール用ベンチマークであるFLEET-TOOLSを導入する。
論文 参考訳(メタデータ) (2023-10-02T17:23:51Z) - Fedstellar: A Platform for Decentralized Federated Learning [10.014744081331672]
2016年、Googleはフェデレーション(FL)を、フェデレーションの参加者間で機械学習(ML)モデルをトレーニングするための新しいパラダイムとして提案した。
本稿では,Fedstellarについて述べる。Fedstellarは,多種多様なフェデレーションにまたがる分散化・半分散化・集中化方式でFLモデルを学習するためのプラットフォームである。
論文 参考訳(メタデータ) (2023-06-16T10:34:49Z) - Confederated Learning: Federated Learning with Decentralized Edge
Servers [42.766372620288585]
Federated Learning(FL)は、中央サーバでデータを集約することなく、モデルトレーニングを達成可能な、新興の機械学習パラダイムである。
本稿では,各サーバが個々のデバイスに接続されたConFederated Learning(CFL)フレームワークを提案する。
提案アルゴリズムはランダムなスケジューリングポリシを用いて,各イテレーションで各サーバにアクセスするデバイスサブセットをランダムに選択する。
論文 参考訳(メタデータ) (2022-05-30T07:56:58Z) - Learning Connectivity for Data Distribution in Robot Teams [96.39864514115136]
グラフニューラルネットワーク(GNN)を用いたアドホックネットワークにおけるデータ分散のためのタスク非依存,分散化,低レイテンシ手法を提案する。
当社のアプローチは、グローバル状態情報に基づいたマルチエージェントアルゴリズムを各ロボットで利用可能にすることで機能させます。
我々は,情報の平均年齢を報酬関数として強化学習を通じて分散gnn通信政策を訓練し,タスク固有の報酬関数と比較してトレーニング安定性が向上することを示す。
論文 参考訳(メタデータ) (2021-03-08T21:48:55Z) - Opportunities of Federated Learning in Connected, Cooperative and
Automated Industrial Systems [44.627847349764664]
次世代産業システムは、超信頼性、低遅延通信の進歩を牽引しています。
分散機械学習(FL)は、センシング、コミュニケーション、学習におけるキノコの多分野にわたる研究領域を表しています。
本稿では,次世代ネットワーク産業システムにおけるFLの新たな可能性について考察する。
論文 参考訳(メタデータ) (2021-01-09T14:27:52Z) - From Federated to Fog Learning: Distributed Machine Learning over
Heterogeneous Wireless Networks [71.23327876898816]
フェデレートラーニング(Federated Learning)は、データを収集するノード間で処理能力を活用することによって、ネットワークエッジでMLモデルをトレーニングするテクニックとして登場した。
我々は、エッジデバイスからクラウドサーバへのノード連続体にMLモデルのトレーニングをインテリジェントに分散する、フォグラーニングと呼ばれる新しい学習パラダイムを提唱する。
論文 参考訳(メタデータ) (2020-06-07T05:11:18Z) - Wireless Communications for Collaborative Federated Learning [160.82696473996566]
IoT(Internet of Things)デバイスは、収集したデータを中央のコントローラに送信することができず、機械学習モデルをトレーニングすることができる。
GoogleのセミナルFLアルゴリズムでは、すべてのデバイスを中央コントローラに直接接続する必要がある。
本稿では,コラボレーティブFL(CFL)と呼ばれる新しいFLフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-03T20:00:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。