論文の概要: Distributed Online Learning with Multiple Kernels
- arxiv url: http://arxiv.org/abs/2011.08930v1
- Date: Tue, 17 Nov 2020 20:29:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-24 16:13:08.555840
- Title: Distributed Online Learning with Multiple Kernels
- Title(参考訳): 複数のカーネルによる分散オンライン学習
- Authors: Jeongmin Chae, Songnam Hong
- Abstract要約: マルチカーネル(DOMKL)を用いたプライバシ保護型分散オンライン学習フレームワークを提案する。
理論的には、T時間スロット上でのDOMKLは最適なサブ線形後悔を実現することができる。
提案するDOMKLの回帰および時系列予測タスクにおける有効性を検証する。
- 参考スコア(独自算出の注目度): 10.203602318836444
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the Internet-of-Things (IoT) systems, there are plenty of informative data
provided by a massive number of IoT devices (e.g., sensors). Learning a
function from such data is of great interest in machine learning tasks for IoT
systems. Focusing on streaming (or sequential) data, we present a
privacy-preserving distributed online learning framework with multiplekernels
(named DOMKL). The proposed DOMKL is devised by leveraging the principles of an
online alternating direction of multipliers (OADMM) and a distributed Hedge
algorithm. We theoretically prove that DOMKL over T time slots can achieve an
optimal sublinear regret, implying that every learned function achieves the
performance of the best function in hindsight as in the state-of-the-art
centralized online learning method. Moreover, it is ensured that the learned
functions of any two neighboring learners have a negligible difference as T
grows, i.e., the so-called consensus constraints hold. Via experimental tests
with various real datasets, we verify the effectiveness of the proposed DOMKL
on regression and time-series prediction tasks.
- Abstract(参考訳): IoT(Internet-of-Things)システムでは、大量のIoTデバイス(センサなど)によって提供される情報的なデータが多数存在する。
このようなデータから関数を学ぶことは、IoTシステムの機械学習タスクに非常に関心がある。
ストリーミング(あるいはシーケンシャル)データに着目し,複数カーネル(DOMKL)を備えたプライバシ保護型分散オンライン学習フレームワークを提案する。
提案するdomklは,マルチプライヤのオンライン交互方向(oadmm)と分散ヘッジアルゴリズムの原理を活用して考案された。
理論上,t 時間スロット上の domkl が最適部分線形後悔を達成できることを証明し,学習関数は,最先端の集中型オンライン学習法と同様に,後見において最良関数のパフォーマンスを達成することを示唆する。
さらに、隣接する学習者の学習関数がTが大きくなるにつれて無視できる差があること、すなわち、いわゆるコンセンサス制約が成立することを保証する。
各種実データを用いた実験により,提案したDOMKLが回帰および時系列予測タスクに与える影響を検証した。
関連論文リスト
- Online Control-Informed Learning [4.907545537403502]
本稿では,リアルタイムに学習・制御タスクの幅広いクラスを解決するためのオンライン制御情報学習フレームワークを提案する。
任意のロボットを調整可能な最適制御系として考慮し,拡張カルマンフィルタ(EKF)に基づくオンラインパラメータ推定器を提案する。
提案手法は,データ中の雑音を効果的に管理することにより,学習の堅牢性も向上する。
論文 参考訳(メタデータ) (2024-10-04T21:03:16Z) - Effective Intrusion Detection in Heterogeneous Internet-of-Things Networks via Ensemble Knowledge Distillation-based Federated Learning [52.6706505729803]
我々は、分散化された侵入検知システムの共有モデル(IDS)を協調訓練するために、フェデレートラーニング(FL)を導入する。
FLEKDは従来のモデル融合法よりも柔軟な凝集法を実現する。
実験の結果,提案手法は,速度と性能の両面で,局所訓練と従来のFLよりも優れていた。
論文 参考訳(メタデータ) (2024-01-22T14:16:37Z) - Empowering Private Tutoring by Chaining Large Language Models [87.76985829144834]
本研究は,最先端の大規模言語モデル(LLM)を活用した,本格的な知的チューリングシステムの開発を探求する。
このシステムは、相互に接続された3つのコアプロセス(相互作用、反射、反応)に分けられる。
各プロセスは LLM ベースのツールと動的に更新されたメモリモジュールによって実装される。
論文 参考訳(メタデータ) (2023-09-15T02:42:03Z) - Model-Based Reinforcement Learning with Multi-Task Offline Pretraining [59.82457030180094]
本稿では,オフラインデータから新しいタスクへ,潜在的に有用なダイナミックスや動作デモを伝達するモデルベースRL法を提案する。
主な考え方は、世界モデルを行動学習のシミュレーターとしてだけでなく、タスクの関連性を測定するツールとして使うことである。
本稿では,Meta-WorldとDeepMind Control Suiteの最先端手法と比較して,我々のアプローチの利点を実証する。
論文 参考訳(メタデータ) (2023-06-06T02:24:41Z) - Online Continual Learning with Natural Distribution Shifts: An Empirical
Study with Visual Data [101.6195176510611]
オンライン」連続学習は、情報保持とオンライン学習の有効性の両方を評価することができる。
オンライン連続学習では、入力される各小さなデータをまずテストに使用し、次にトレーニングセットに追加し、真にオンラインにします。
本稿では,大規模かつ自然な分布変化を示すオンライン連続視覚学習のための新しいベンチマークを提案する。
論文 参考訳(メタデータ) (2021-08-20T06:17:20Z) - Distributed Online Learning with Multiple Kernels [15.102346715690755]
我々は、学習者のネットワーク上の非線形関数を完全に分散的に学習する問題を検討する。
オンライン学習は、すべての学習者がローカルで連続的なストリーミングデータを受け取ると仮定されます。
本稿では,複数のカーネルを持つ新しい学習フレームワーク DOMKL を提案する。
論文 参考訳(メタデータ) (2021-02-25T08:58:49Z) - PsiPhi-Learning: Reinforcement Learning with Demonstrations using
Successor Features and Inverse Temporal Difference Learning [102.36450942613091]
時間差学習(ITD)と呼ばれる逆強化学習アルゴリズムを提案する。
Psi Phi$-learningと呼ばれるデモで強化学習のための新しいアルゴリズムに到達し、オンライン環境の相互作用から学習とITDをシームレスに統合する方法を示します。
論文 参考訳(メタデータ) (2021-02-24T21:12:09Z) - RL Unplugged: A Suite of Benchmarks for Offline Reinforcement Learning [108.9599280270704]
オフラインのRL手法を評価・比較するためのRL Unpluggedというベンチマークを提案する。
RL Unpluggedにはゲームやシミュレートされたモーター制御問題を含むさまざまな領域のデータが含まれている。
本論文で提示した全タスクのデータと,全アルゴリズムをオープンソースとして公開する。
論文 参考訳(メタデータ) (2020-06-24T17:14:51Z) - Plasticity-Enhanced Domain-Wall MTJ Neural Networks for Energy-Efficient
Online Learning [9.481629586734497]
有望な不揮発性メモリデバイスである磁壁磁気トンネル接合(DW-MTJ)によって実現された多段階学習システムについて示す。
この装置の物理的特性と神経科学に触発された可塑性学習ルールの最適実装の相互作用を実証する。
私たちのエネルギー分析は、一般的に機械学習で使用される大きなタスクであっても、学習予算が20ドル以下であることから、このアプローチの価値を確認します。
論文 参考訳(メタデータ) (2020-03-04T22:45:59Z) - Performance Analysis and Comparison of Machine and Deep Learning
Algorithms for IoT Data Classification [0.0]
本稿では,6つのIoT関連データセットを用いた分類タスクにおいて,11の一般的な機械学習アルゴリズムとディープラーニングアルゴリズムの性能評価を行う。
すべてのパフォーマンス指標を考慮すると、Random Forestsは他の機械学習モデルよりも優れており、ディープラーニングモデルのうち、ANNとCNNはより興味深い結果を得た。
論文 参考訳(メタデータ) (2020-01-27T09:14:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。