論文の概要: Distributed Online Learning with Multiple Kernels
- arxiv url: http://arxiv.org/abs/2011.08930v1
- Date: Tue, 17 Nov 2020 20:29:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-24 16:13:08.555840
- Title: Distributed Online Learning with Multiple Kernels
- Title(参考訳): 複数のカーネルによる分散オンライン学習
- Authors: Jeongmin Chae, Songnam Hong
- Abstract要約: マルチカーネル(DOMKL)を用いたプライバシ保護型分散オンライン学習フレームワークを提案する。
理論的には、T時間スロット上でのDOMKLは最適なサブ線形後悔を実現することができる。
提案するDOMKLの回帰および時系列予測タスクにおける有効性を検証する。
- 参考スコア(独自算出の注目度): 10.203602318836444
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the Internet-of-Things (IoT) systems, there are plenty of informative data
provided by a massive number of IoT devices (e.g., sensors). Learning a
function from such data is of great interest in machine learning tasks for IoT
systems. Focusing on streaming (or sequential) data, we present a
privacy-preserving distributed online learning framework with multiplekernels
(named DOMKL). The proposed DOMKL is devised by leveraging the principles of an
online alternating direction of multipliers (OADMM) and a distributed Hedge
algorithm. We theoretically prove that DOMKL over T time slots can achieve an
optimal sublinear regret, implying that every learned function achieves the
performance of the best function in hindsight as in the state-of-the-art
centralized online learning method. Moreover, it is ensured that the learned
functions of any two neighboring learners have a negligible difference as T
grows, i.e., the so-called consensus constraints hold. Via experimental tests
with various real datasets, we verify the effectiveness of the proposed DOMKL
on regression and time-series prediction tasks.
- Abstract(参考訳): IoT(Internet-of-Things)システムでは、大量のIoTデバイス(センサなど)によって提供される情報的なデータが多数存在する。
このようなデータから関数を学ぶことは、IoTシステムの機械学習タスクに非常に関心がある。
ストリーミング(あるいはシーケンシャル)データに着目し,複数カーネル(DOMKL)を備えたプライバシ保護型分散オンライン学習フレームワークを提案する。
提案するdomklは,マルチプライヤのオンライン交互方向(oadmm)と分散ヘッジアルゴリズムの原理を活用して考案された。
理論上,t 時間スロット上の domkl が最適部分線形後悔を達成できることを証明し,学習関数は,最先端の集中型オンライン学習法と同様に,後見において最良関数のパフォーマンスを達成することを示唆する。
さらに、隣接する学習者の学習関数がTが大きくなるにつれて無視できる差があること、すなわち、いわゆるコンセンサス制約が成立することを保証する。
各種実データを用いた実験により,提案したDOMKLが回帰および時系列予測タスクに与える影響を検証した。
関連論文リスト
- LESEN: Label-Efficient deep learning for Multi-parametric MRI-based
Visual Pathway Segmentation [5.726588626363204]
ラベル効率のよい自己認識型深層学習法(LESEN)を提案する。
LESENは教師なしと教師なしの損失を取り入れ、生徒と教師のモデルが相互に学習できるようにする。
ヒトコネクトームプロジェクト(HCP)のデータセットを用いた実験により,本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2024-01-03T10:22:13Z) - Robot Fine-Tuning Made Easy: Pre-Training Rewards and Policies for
Autonomous Real-World Reinforcement Learning [58.3994826169858]
ロボット強化学習のためのリセット不要な微調整システムであるRoboFuMEを紹介する。
我々の洞察は、オフラインの強化学習技術を利用して、事前訓練されたポリシーの効率的なオンライン微調整を確保することである。
提案手法では,既存のロボットデータセットからのデータを組み込んで,目標タスクを3時間以内の自律現実体験で改善することができる。
論文 参考訳(メタデータ) (2023-10-23T17:50:08Z) - Reinforcement Learning Based Multi-modal Feature Fusion Network for
Novel Class Discovery [47.28191501836041]
本稿では,人間の認知過程をシミュレートするために強化学習フレームワークを用いる。
また,マルチモーダル情報から特徴を抽出・融合するマルチエージェントフレームワークをデプロイした。
我々は、OS-MN40、OS-MN40-Miss、Cifar10データセットを用いて、3Dドメインと2Dドメインの両方でのアプローチの性能を示す。
論文 参考訳(メタデータ) (2023-08-26T07:55:32Z) - Pre-Training for Robots: Offline RL Enables Learning New Tasks from a
Handful of Trials [97.95400776235736]
新しいタスクを効果的に学習しようとするオフラインRLに基づくフレームワークを提案する。
既存のロボットデータセットの事前トレーニングと、新しいタスクの迅速な微調整と、最大10のデモを組み合わせたものだ。
我々の知る限り、PTRは本物のWidowXロボットで新しいドメインで新しいタスクを学習する最初のRL手法である。
論文 参考訳(メタデータ) (2022-10-11T06:30:53Z) - RvS: What is Essential for Offline RL via Supervised Learning? [77.91045677562802]
近年の研究では、時間差(TD)のない教師あり学習だけでオフラインRLに極めて効果的であることが示されている。
あらゆる環境スイートにおいて、2層フィードフォワードによる可能性の最大化は競争力がある。
彼らはまた、ランダムデータに対して比較的弱い既存のRvS法の限界を探索する。
論文 参考訳(メタデータ) (2021-12-20T18:55:16Z) - Online Continual Learning with Natural Distribution Shifts: An Empirical
Study with Visual Data [101.6195176510611]
オンライン」連続学習は、情報保持とオンライン学習の有効性の両方を評価することができる。
オンライン連続学習では、入力される各小さなデータをまずテストに使用し、次にトレーニングセットに追加し、真にオンラインにします。
本稿では,大規模かつ自然な分布変化を示すオンライン連続視覚学習のための新しいベンチマークを提案する。
論文 参考訳(メタデータ) (2021-08-20T06:17:20Z) - Distributed Online Learning with Multiple Kernels [15.102346715690755]
我々は、学習者のネットワーク上の非線形関数を完全に分散的に学習する問題を検討する。
オンライン学習は、すべての学習者がローカルで連続的なストリーミングデータを受け取ると仮定されます。
本稿では,複数のカーネルを持つ新しい学習フレームワーク DOMKL を提案する。
論文 参考訳(メタデータ) (2021-02-25T08:58:49Z) - PsiPhi-Learning: Reinforcement Learning with Demonstrations using
Successor Features and Inverse Temporal Difference Learning [102.36450942613091]
時間差学習(ITD)と呼ばれる逆強化学習アルゴリズムを提案する。
Psi Phi$-learningと呼ばれるデモで強化学習のための新しいアルゴリズムに到達し、オンライン環境の相互作用から学習とITDをシームレスに統合する方法を示します。
論文 参考訳(メタデータ) (2021-02-24T21:12:09Z) - RL Unplugged: A Suite of Benchmarks for Offline Reinforcement Learning [108.9599280270704]
オフラインのRL手法を評価・比較するためのRL Unpluggedというベンチマークを提案する。
RL Unpluggedにはゲームやシミュレートされたモーター制御問題を含むさまざまな領域のデータが含まれている。
本論文で提示した全タスクのデータと,全アルゴリズムをオープンソースとして公開する。
論文 参考訳(メタデータ) (2020-06-24T17:14:51Z) - Plasticity-Enhanced Domain-Wall MTJ Neural Networks for Energy-Efficient
Online Learning [9.481629586734497]
有望な不揮発性メモリデバイスである磁壁磁気トンネル接合(DW-MTJ)によって実現された多段階学習システムについて示す。
この装置の物理的特性と神経科学に触発された可塑性学習ルールの最適実装の相互作用を実証する。
私たちのエネルギー分析は、一般的に機械学習で使用される大きなタスクであっても、学習予算が20ドル以下であることから、このアプローチの価値を確認します。
論文 参考訳(メタデータ) (2020-03-04T22:45:59Z) - Performance Analysis and Comparison of Machine and Deep Learning
Algorithms for IoT Data Classification [0.0]
本稿では,6つのIoT関連データセットを用いた分類タスクにおいて,11の一般的な機械学習アルゴリズムとディープラーニングアルゴリズムの性能評価を行う。
すべてのパフォーマンス指標を考慮すると、Random Forestsは他の機械学習モデルよりも優れており、ディープラーニングモデルのうち、ANNとCNNはより興味深い結果を得た。
論文 参考訳(メタデータ) (2020-01-27T09:14:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。