論文の概要: Federated Reinforcement Learning at the Edge
- arxiv url: http://arxiv.org/abs/2112.05908v1
- Date: Sat, 11 Dec 2021 03:28:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-18 15:49:25.562017
- Title: Federated Reinforcement Learning at the Edge
- Title(参考訳): エッジにおけるフェデレーション強化学習
- Authors: Konstantinos Gatsis
- Abstract要約: 現代のサイバー物理アーキテクチャでは、異なる物理的位置にあるシステムから収集されたデータを使用して適切な振る舞いを学び、不確実な環境に適応する。
本稿では,複数のエージェントが分散的に収集された時系列データに対して,強化学習問題を共同で解決するために,効率的にコミュニケーションを行う必要がある設定について考察する。
通信効率向上のためのアルゴリズムが提案され、理論的保証、実践的実装、数値評価がサポートされている。
- 参考スコア(独自算出の注目度): 1.4271989597349055
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern cyber-physical architectures use data collected from systems at
different physical locations to learn appropriate behaviors and adapt to
uncertain environments. However, an important challenge arises as communication
exchanges at the edge of networked systems are costly due to limited resources.
This paper considers a setup where multiple agents need to communicate
efficiently in order to jointly solve a reinforcement learning problem over
time-series data collected in a distributed manner. This is posed as learning
an approximate value function over a communication network. An algorithm for
achieving communication efficiency is proposed, supported with theoretical
guarantees, practical implementations, and numerical evaluations. The approach
is based on the idea of communicating only when sufficiently informative data
is collected.
- Abstract(参考訳): 現代のサイバーフィジカルアーキテクチャは、異なる物理的場所にあるシステムから収集されたデータを使用して適切な行動を学び、不確定な環境に適応する。
しかし、ネットワークシステムの端にある通信交換はリソースが限られているためコストがかかるため、重要な課題が発生する。
本稿では,分散的に収集した時系列データを用いて強化学習問題を解くために,複数のエージェントが効率的にコミュニケーションする必要がある環境について考察する。
これは、通信ネットワーク上で近似値関数を学習するものとして設定される。
通信効率を達成するためのアルゴリズムとして, 理論的な保証, 実践的実装, 数値評価が提案されている。
このアプローチは、十分な情報を収集した場合にのみ通信するという考え方に基づいている。
関連論文リスト
- Decentralized Learning Strategies for Estimation Error Minimization with Graph Neural Networks [94.2860766709971]
統計的に同一性を持つ無線ネットワークにおける自己回帰的マルコフ過程のサンプリングとリモート推定の課題に対処する。
我々のゴールは、分散化されたスケーラブルサンプリングおよび送信ポリシーを用いて、時間平均推定誤差と/または情報の年齢を最小化することである。
論文 参考訳(メタデータ) (2024-04-04T06:24:11Z) - Emergency Computing: An Adaptive Collaborative Inference Method Based on
Hierarchical Reinforcement Learning [14.929735103723573]
センシング,通信,計算,キャッシュ,インテリジェンスを備えた緊急ネットワーク(E-SC3I)を提案する。
このフレームワークには、緊急コンピューティング、キャッシュ、統合通信とセンシング、インテリジェンス強化のためのメカニズムが含まれている。
本稿では,特に緊急コンピューティングに焦点をあて,階層的強化学習に基づく適応型協調推論手法(ACIM)を提案する。
論文 参考訳(メタデータ) (2024-02-03T13:28:35Z) - An Efficient Federated Learning Framework for Training Semantic
Communication System [29.593406320684448]
ほとんどの意味コミュニケーションシステムは高度なディープラーニングモデルに基づいて構築されている。
プライバシーとセキュリティ上の懸念から、データの送信は制限されている。
我々は、FedLolと呼ばれるクライアントからグローバルモデルを集約するメカニズムを導入します。
論文 参考訳(メタデータ) (2023-10-20T02:45:20Z) - Cognitive Semantic Communication Systems Driven by Knowledge Graph:
Principle, Implementation, and Performance Evaluation [74.38561925376996]
単一ユーザと複数ユーザのコミュニケーションシナリオに対して,認知意味コミュニケーションフレームワークが2つ提案されている。
知識グラフから推論規則をマイニングすることにより,効果的な意味補正アルゴリズムを提案する。
マルチユーザ認知型セマンティックコミュニケーションシステムにおいて,異なるユーザのメッセージを識別するために,メッセージ復元アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-03-15T12:01:43Z) - Linear Regression over Networks with Communication Guarantees [1.4271989597349055]
接続された自律システムでは、しばしば限られたリソースを持つ通信ネットワーク上でデータ転送が行われる。
本稿では,線形回帰タスクのためのコミュニケーション効率の高い学習のためのアルゴリズムについて検討する。
論文 参考訳(メタデータ) (2021-03-06T15:28:21Z) - Adaptive Scheduling for Machine Learning Tasks over Networks [1.4271989597349055]
本論文では, 線形回帰タスクに資源を効率的に割り当てるアルゴリズムを, データのインフォマティビティ性を利用して検討する。
アルゴリズムは、信頼性の高い性能保証による学習タスクの適応スケジューリングを可能にする。
論文 参考訳(メタデータ) (2021-01-25T10:59:00Z) - CosSGD: Nonlinear Quantization for Communication-efficient Federated
Learning [62.65937719264881]
フェデレーション学習は、これらのクライアントのローカルデータを中央サーバに転送することなく、クライアント間での学習を促進する。
圧縮勾配降下のための非線形量子化を提案し、フェデレーションラーニングで容易に利用することができる。
本システムは,訓練過程の収束と精度を維持しつつ,通信コストを最大3桁まで削減する。
論文 参考訳(メタデータ) (2020-12-15T12:20:28Z) - Communication-Efficient and Distributed Learning Over Wireless Networks:
Principles and Applications [55.65768284748698]
機械学習(ML)は、第5世代(5G)通信システムなどのための有望なイネーブルである。
本稿では、関連するコミュニケーションとMLの原則を概観し、選択したユースケースでコミュニケーション効率と分散学習フレームワークを提示することを目的とする。
論文 参考訳(メタデータ) (2020-08-06T12:37:14Z) - Deep Learning for Ultra-Reliable and Low-Latency Communications in 6G
Networks [84.2155885234293]
まず,データ駆動型教師付き深層学習と深部強化学習をURLLCに適用する方法を概説する。
このようなオープンな問題に対処するために、デバイスインテリジェンス、エッジインテリジェンス、およびURLLCのためのクラウドインテリジェンスを可能にするマルチレベルアーキテクチャを開発した。
論文 参考訳(メタデータ) (2020-02-22T14:38:11Z) - Distributed Learning in the Non-Convex World: From Batch to Streaming
Data, and Beyond [73.03743482037378]
分散学習は、多くの人々が想定する、大規模に接続された世界の重要な方向となっている。
本稿では、スケーラブルな分散処理とリアルタイムデータ計算の4つの重要な要素について論じる。
実践的な問題や今後の研究についても論じる。
論文 参考訳(メタデータ) (2020-01-14T14:11:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。