論文の概要: Fusing Multiple Algorithms for Heterogeneous Online Learning
- arxiv url: http://arxiv.org/abs/2312.05432v1
- Date: Sat, 9 Dec 2023 01:52:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-12 21:00:46.604808
- Title: Fusing Multiple Algorithms for Heterogeneous Online Learning
- Title(参考訳): ヘテロジニアスオンライン学習における複数アルゴリズムの活用
- Authors: Darshan Gadginmath, Shivanshu Tripathi, Fabio Pasqualetti
- Abstract要約: Switched Online Learning Algorithm (SOLA)は、異種オンライン学習問題を解決するために設計されたアルゴリズムである。
理論的には、SOLAの後悔が束縛されていることを確実にするために、選択機構の設計を解析する。
- 参考スコア(独自算出の注目度): 2.992602379681373
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This study addresses the challenge of online learning in contexts where
agents accumulate disparate data, face resource constraints, and use different
local algorithms. This paper introduces the Switched Online Learning Algorithm
(SOLA), designed to solve the heterogeneous online learning problem by
amalgamating updates from diverse agents through a dynamic switching mechanism
contingent upon their respective performance and available resources. We
theoretically analyze the design of the selecting mechanism to ensure that the
regret of SOLA is bounded. Our findings show that the number of changes in
selection needs to be bounded by a parameter dependent on the performance of
the different local algorithms. Additionally, two test cases are presented to
emphasize the effectiveness of SOLA, first on an online linear regression
problem and then on an online classification problem with the MNIST dataset.
- Abstract(参考訳): 本研究では,エージェントが異質なデータを蓄積し,リソース制約に直面し,異なる局所アルゴリズムを使用するコンテキストにおける,オンライン学習の課題に対処する。
本稿では,多種多様なエージェントからの更新を,それぞれのパフォーマンスと利用可能なリソースに基づいて動的に切り替える機構を通じて集約することで,異種オンライン学習問題を解決するために設計されたスイッチドオンライン学習アルゴリズム(SOLA)を紹介する。
理論的には、SOLAの後悔が束縛されることを保証するため、選択機構の設計を解析する。
この結果から,各局所アルゴリズムの性能に依存するパラメータによって,選択の回数を限定する必要があることがわかった。
さらに、オンライン線形回帰問題とMNISTデータセットを用いたオンライン分類問題でSOLAの有効性を強調するために、2つのテストケースが提示される。
関連論文リスト
- Equivariant Offline Reinforcement Learning [7.822389399560674]
実演数が少ないオフラインRLに対して,$SO(2)$-equivariantなニューラルネットワークを使用することを検討した。
実験の結果,保守的Q-Learning(CQL)とImplicit Q-Learning(IQL)の同変バージョンは,同変でないQ-Learningよりも優れていることがわかった。
論文 参考訳(メタデータ) (2024-06-20T03:02:49Z) - Discovering Multiple Solutions from a Single Task in Offline Reinforcement Learning [51.00472376469131]
オフライン強化学習において,一つのタスクから複数の解を学習するアルゴリズムを提案する。
実験の結果,提案アルゴリズムはオフラインRLにおいて,定性的,定量的に複数の解を学習することがわかった。
論文 参考訳(メタデータ) (2024-06-10T03:25:49Z) - Distributionally Robust Off-Dynamics Reinforcement Learning: Provable
Efficiency with Linear Function Approximation [8.234072589087095]
我々は、オフダイナミックス強化学習(RL)を研究し、そこでポリシーはソースドメイン上でトレーニングされ、異なるターゲットドメインにデプロイされる。
オフダイナミックス RL の関数近似を用いたオンライン DRMDP に関する最初の研究を行った。
DR-LSVI-UCBは,関数近似を用いたオフダイナミックスのための高速オンラインDRMDPアルゴリズムである。
論文 参考訳(メタデータ) (2024-02-23T16:01:44Z) - Online Network Source Optimization with Graph-Kernel MAB [62.6067511147939]
大規模ネットワークにおける最適なソース配置をオンラインで学習するためのグラフカーネルマルチアームバンディットアルゴリズムであるGrab-UCBを提案する。
適応グラフ辞書モデルを用いて,ネットワークプロセスを記述する。
我々は、ネットワークパラメータに依存する性能保証を導出し、シーケンシャルな意思決定戦略の学習曲線にさらに影響を及ぼす。
論文 参考訳(メタデータ) (2023-07-07T15:03:42Z) - Smoothed Online Learning for Prediction in Piecewise Affine Systems [43.64498536409903]
本稿では,最近開発されたスムーズなオンライン学習フレームワークに基づく。
これは、断片的なアフィン系における予測とシミュレーションのための最初のアルゴリズムを提供する。
論文 参考訳(メタデータ) (2023-01-26T15:54:14Z) - Nonuniqueness and Convergence to Equivalent Solutions in Observer-based Inverse Reinforcement Learning [0.8943924354248618]
オンラインおよびリアルタイムに決定論的逆強化学習(IRL)問題を解決する上で重要な課題は、複数のソリューションの存在である。
非特異性は等価解の概念の研究を必要とする。
IRL問題のほぼ等価解に収束する正規化履歴スタックオブザーバを開発した。
論文 参考訳(メタデータ) (2022-10-28T17:52:18Z) - Federated Offline Reinforcement Learning [55.326673977320574]
マルチサイトマルコフ決定プロセスモデルを提案する。
我々は,オフラインRLを対象とした最初のフェデレーション最適化アルゴリズムを設計する。
提案アルゴリズムでは,学習ポリシーの準最適性は,データが分散していないような速度に匹敵する,理論的保証を与える。
論文 参考訳(メタデータ) (2022-06-11T18:03:26Z) - Resource Allocation via Model-Free Deep Learning in Free Space Optical
Communications [119.81868223344173]
本稿では,自由空間光学(FSO)通信におけるチャネルフェージング効果の緩和のための資源配分の一般的な問題について検討する。
本フレームワークでは,FSO資源割り当て問題を解決する2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-27T17:38:51Z) - An Online Method for A Class of Distributionally Robust Optimization
with Non-Convex Objectives [54.29001037565384]
本稿では,オンライン分散ロバスト最適化(DRO)のクラスを解決するための実用的なオンライン手法を提案する。
本研究は,ネットワークの堅牢性向上のための機械学習における重要な応用を実証する。
論文 参考訳(メタデータ) (2020-06-17T20:19:25Z) - Dynamic Federated Learning [57.14673504239551]
フェデレートラーニング(Federated Learning)は、マルチエージェント環境における集中的なコーディネーション戦略の包括的用語として登場した。
我々は、各イテレーションにおいて、利用可能なエージェントのランダムなサブセットがそのデータに基づいてローカル更新を実行する、フェデレートされた学習モデルを考える。
集約最適化問題に対する真の最小化器上の非定常ランダムウォークモデルの下で、アーキテクチャの性能は、各エージェントにおけるデータ変動率、各エージェントにおけるモデル変動率、アルゴリズムの学習率に逆比例する追跡項の3つの要因によって決定されることを示す。
論文 参考訳(メタデータ) (2020-02-20T15:00:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。