論文の概要: Lightweight Distributed Gaussian Process Regression for Online Machine
Learning
- arxiv url: http://arxiv.org/abs/2105.04738v5
- Date: Mon, 10 Jul 2023 03:26:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-11 23:05:03.223781
- Title: Lightweight Distributed Gaussian Process Regression for Online Machine
Learning
- Title(参考訳): オンライン機械学習のための軽量分散ガウスプロセス回帰
- Authors: Zhenyuan Yuan, Minghui Zhu
- Abstract要約: エージェントのグループは、ストリーミングデータを通じて共通の静的潜伏関数を協調的に学習することを目指している。
本稿では,通信,計算,メモリにおけるエージェントの限られた能力を認識する軽量分散ガウスプロセス回帰(GPR)アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 2.0305676256390934
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we study the problem where a group of agents aim to
collaboratively learn a common static latent function through streaming data.
We propose a lightweight distributed Gaussian process regression (GPR)
algorithm that is cognizant of agents' limited capabilities in communication,
computation and memory. Each agent independently runs agent-based GPR using
local streaming data to predict test points of interest; then the agents
collaboratively execute distributed GPR to obtain global predictions over a
common sparse set of test points; finally, each agent fuses results from
distributed GPR with agent-based GPR to refine its predictions. By quantifying
the transient and steady-state performances in predictive variance and error,
we show that limited inter-agent communication improves learning performances
in the sense of Pareto. Monte Carlo simulation is conducted to evaluate the
developed algorithm.
- Abstract(参考訳): 本稿では,あるエージェント群が,ストリーミングデータを通じて共通の静的潜在関数を協調的に学習する問題について検討する。
本稿では,通信,計算,メモリにおけるエージェントの限られた能力を認識する軽量分散ガウスプロセス回帰(GPR)アルゴリズムを提案する。
各エージェントは、ローカルストリーミングデータを用いてエージェントベースのGPRを独立に実行し、その後、エージェントが協調して分散GPRを実行し、共通のスパースなテストポイントのセットでグローバルな予測を得る。
予測的分散と誤りにおける過渡的および定常的な性能を定量化することにより、エージェント間通信の制限がParetoの学習性能を向上させることを示す。
モンテカルロシミュレーションにより,開発アルゴリズムの評価を行った。
関連論文リスト
- Distributed Event-Based Learning via ADMM [11.461617927469316]
エージェントがネットワーク上で情報を交換することで,グローバルな目的関数を最小限に抑える分散学習問題を考える。
提案手法には2つの特徴がある: (i) 必要なときにのみ通信をトリガーすることで通信を大幅に削減し, (ii) 異なるエージェント間のデータ分散に非依存である。
論文 参考訳(メタデータ) (2024-05-17T08:30:28Z) - Distribution Shift Inversion for Out-of-Distribution Prediction [57.22301285120695]
本稿では,OoD(Out-of-Distribution)予測のためのポータブル分布シフト変換アルゴリズムを提案する。
提案手法は,OoDアルゴリズムを広範囲に接続した場合に,一般的な性能向上をもたらすことを示す。
論文 参考訳(メタデータ) (2023-06-14T08:00:49Z) - Distributed Learning over Networks with Graph-Attention-Based
Personalization [49.90052709285814]
分散ディープラーニングのためのグラフベースパーソナライズアルゴリズム(GATTA)を提案する。
特に、各エージェントのパーソナライズされたモデルは、グローバルな部分とノード固有の部分で構成される。
グラフ内の各エージェントを1つのノードとして扱うことにより、ノード固有のパラメータを特徴として扱うことにより、グラフアテンション機構の利点を継承することができる。
論文 参考訳(メタデータ) (2023-05-22T13:48:30Z) - Compressed Regression over Adaptive Networks [58.79251288443156]
分散エージェントのネットワークによって達成可能な性能を導出し,通信制約や回帰問題を解消し,適応的に解決する。
エージェントによって最適化に必要なパラメータをオンラインで学習できる最適化アロケーション戦略を考案する。
論文 参考訳(メタデータ) (2023-04-07T13:41:08Z) - Federated Learning for Heterogeneous Bandits with Unobserved Contexts [0.0]
我々は、未知のコンテキストを持つ多腕コンテキスト包帯のフェデレーション問題について検討する。
線形パラメタライズされた報酬関数に対して,除去に基づくアルゴリズムを提案し,後悔の束縛を証明した。
論文 参考訳(メタデータ) (2023-03-29T22:06:24Z) - IPCC-TP: Utilizing Incremental Pearson Correlation Coefficient for Joint
Multi-Agent Trajectory Prediction [73.25645602768158]
IPCC-TPはインクリメンタルピアソン相関係数に基づく新しい関連認識モジュールであり,マルチエージェントインタラクションモデリングを改善する。
我々のモジュールは、既存のマルチエージェント予測手法に便利に組み込んで、元の動き分布デコーダを拡張することができる。
論文 参考訳(メタデータ) (2023-03-01T15:16:56Z) - Asynchronous Bayesian Learning over a Network [18.448653247778143]
本稿では,ネットワーク化されたエージェントが生データを共有せずに分散ベイズ学習を行うための非同期データ融合モデルを提案する。
アルゴリズムは、ランダムに選択されたエージェントのペアがパラメータサンプリングのために調整されていないランゲヴィンダイナミクスを使用するゴシップベースのアプローチを用いる。
本稿では,ゴシップエージェント間の通信をさらに削減するイベントトリガー機構を提案する。
論文 参考訳(メタデータ) (2022-11-16T01:21:36Z) - Distributed Cooperative Multi-Agent Reinforcement Learning with Directed
Coordination Graph [18.04270684579841]
既存の分散協調型マルチエージェント強化学習(MARL)フレームワークは、非指向的な協調グラフと通信グラフを前提としている。
本稿では,局所的ポリシー評価を局所値関数に基づく分散RLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-01-10T04:14:46Z) - Learning-based Measurement Scheduling for Loosely-Coupled Cooperative
Localization [3.616948583169635]
協調的ローカライゼーションにおいて、コミュニケーションモバイルエージェントは、デッドレコニングに基づくグローバルローカライゼーションを改善するために、エージェント間相対測定を使用する。
測定スケジューリングにより、エージェントは、利用可能なエージェント間相対的な測定のサブセットを、その計算リソースが制限されたときに処理すべきかどうかを決定することができる。
本稿では,SGの効用関数の代用としてニューラルネットワークに基づく代理モデルを用いて,逐次計算手法に従うCLの測定スケジューリングを提案する。
論文 参考訳(メタデータ) (2021-12-06T08:06:29Z) - Implicit Distributional Reinforcement Learning [61.166030238490634]
2つのディープジェネレータネットワーク(DGN)上に構築された暗黙の分布型アクター批判(IDAC)
半単純アクター (SIA) は、フレキシブルなポリシー分布を利用する。
我々は,代表的OpenAI Gym環境において,IDACが最先端のアルゴリズムより優れていることを観察する。
論文 参考訳(メタデータ) (2020-07-13T02:52:18Z) - Model-based Reinforcement Learning for Decentralized Multiagent
Rendezvous [66.6895109554163]
目標を他のエージェントと整合させる人間の能力の下にあるのは、他人の意図を予測し、自分たちの計画を積極的に更新する能力である。
分散型マルチエージェントレンデブーのためのモデルに基づく強化学習手法である階層型予測計画(HPP)を提案する。
論文 参考訳(メタデータ) (2020-03-15T19:49:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。