論文の概要: Intelligent and Reconfigurable Architecture for KL Divergence Based
Online Machine Learning Algorithm
- arxiv url: http://arxiv.org/abs/2002.07713v1
- Date: Tue, 18 Feb 2020 16:39:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-30 20:45:27.503436
- Title: Intelligent and Reconfigurable Architecture for KL Divergence Based
Online Machine Learning Algorithm
- Title(参考訳): KLダイバージェンスに基づくオンライン機械学習アルゴリズムのためのインテリジェントで再構成可能なアーキテクチャ
- Authors: S. V. Sai Santosh and Sumit J. Darak
- Abstract要約: オンライン機械学習(OML)アルゴリズムは、トレーニングフェーズを一切必要とせず、未知の環境に直接デプロイすることができる。
オンライン機械学習(OML)アルゴリズムは、トレーニングフェーズを一切必要とせず、未知の環境に直接デプロイすることができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online machine learning (OML) algorithms do not need any training phase and
can be deployed directly in an unknown environment. OML includes multi-armed
bandit (MAB) algorithms that can identify the best arm among several arms by
achieving a balance between exploration of all arms and exploitation of optimal
arm. The Kullback-Leibler divergence based upper confidence bound (KLUCB) is
the state-of-the-art MAB algorithm that optimizes exploration-exploitation
trade-off but it is complex due to underlining optimization routine. This
limits its usefulness for robotics and radio applications which demand
integration of KLUCB with the PHY on the system on chip (SoC). In this paper,
we efficiently map the KLUCB algorithm on SoC by realizing optimization routine
via alternative synthesizable computation without compromising on the
performance. The proposed architecture is dynamically reconfigurable such that
the number of arms, as well as type of algorithm, can be changed on-the-fly.
Specifically, after initial learning, on-the-fly switch to light-weight UCB
offers around 10-factor improvement in latency and throughput. Since learning
duration depends on the unknown arm statistics, we offer intelligence embedded
in architecture to decide the switching instant. We validate the functional
correctness and usefulness of the proposed architecture via a realistic
wireless application and detailed complexity analysis demonstrates its
feasibility in realizing intelligent radios.
- Abstract(参考訳): オンライン機械学習(OML)アルゴリズムは、トレーニングフェーズを一切必要とせず、未知の環境に直接デプロイすることができる。
OMLにはマルチアーム・バンディット(MAB)アルゴリズムが含まれており、全てのアームの探索と最適なアームの活用のバランスをとることで、複数のアームの中で最高のアームを識別できる。
Kullback-Leibler divergence based upper confidence bound (KLUCB) は探索・探索トレードオフを最適化する最先端のMABアルゴリズムである。
これにより、KLUCBとPHYの統合をチップ上のシステム(SoC)で要求するロボティクスや無線アプリケーションの有用性が制限される。
本稿では,代用合成可能計算による最適化ルーチンを,性能を損なうことなく実現し,KLUCBアルゴリズムをSoC上に効率的にマッピングする。
提案したアーキテクチャは動的に再構成可能であり、アームの数やアルゴリズムの種類をオンザフライで変更することができる。
特に、最初の学習の後、オンザフライで軽量な UCB に切り替えると、レイテンシとスループットが約10倍改善される。
学習期間は未知のアーム統計に依存するため、アーキテクチャに埋め込まれたインテリジェンスを提供し、スイッチング瞬間を決定する。
本研究は,現実的無線アプリケーションを用いて,提案アーキテクチャの機能的正確性と有用性を検証し,知的無線の実現可能性を示す。
関連論文リスト
- Curriculum reinforcement learning for quantum architecture search under
hardware errors [1.583327010995414]
本研究は、VQAデプロイメントにおける課題に対処するために設計されたカリキュラムベースの強化学習QAS(CRLQAS)を導入する。
このアルゴリズムは、(i)環境力学の3Dアーキテクチャを符号化し、回路の探索空間を効率的に探索する。
研究を容易にするため,雑音量子回路の計算効率を大幅に向上させる最適化シミュレータを開発した。
論文 参考訳(メタデータ) (2024-02-05T20:33:00Z) - Stabilizing Q-learning with Linear Architectures for Provably Efficient
Learning [53.17258888552998]
本研究では,線形関数近似を用いた基本的な$Q$-learningプロトコルの探索変種を提案する。
このアルゴリズムの性能は,新しい近似誤差というより寛容な概念の下で,非常に優雅に低下することを示す。
論文 参考訳(メタデータ) (2022-06-01T23:26:51Z) - Differentially Private Federated Learning via Reconfigurable Intelligent
Surface [27.004823731436765]
フェデレートラーニング(FL)は、分散化されたローカルデータセットを共有せずに、グローバルモデルの協調トレーニングを可能にする。
本稿では,学習精度とプライバシのジレンマを軽減するために,再構成可能インテリジェントサーフェス (RIS) を用いたオーバー・ザ・エア FLシステムを提案する。
論文 参考訳(メタデータ) (2022-03-31T13:45:02Z) - Multi-armed Bandit Algorithms on System-on-Chip: Go Frequentist or
Bayesian? [0.0]
Multi-armed Bandit (MAB)アルゴリズムは、複数の腕の中で最高の腕を識別する。
再構成可能でインテリジェントなMAB(RI-MAB)フレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-05T10:07:31Z) - Reconfigurable Intelligent Surface Assisted Mobile Edge Computing with
Heterogeneous Learning Tasks [53.1636151439562]
モバイルエッジコンピューティング(MEC)は、AIアプリケーションに自然なプラットフォームを提供します。
再構成可能なインテリジェントサーフェス(RIS)の助けを借りて、MECで機械学習タスクを実行するインフラストラクチャを提示します。
具体的には,モバイルユーザの送信パワー,基地局のビームフォーミングベクトル,risの位相シフト行列を共同で最適化することにより,参加ユーザの学習誤差を最小化する。
論文 参考訳(メタデータ) (2020-12-25T07:08:50Z) - Path Design and Resource Management for NOMA enhanced Indoor Intelligent
Robots [58.980293789967575]
通信可能な屋内知的ロボット(IR)サービスフレームワークを提案する。
室内レイアウトとチャネル状態を決定論的に記述できるレゴモデリング手法が提案されている。
調査対象の無線マップは、強化学習エージェントを訓練するための仮想環境として呼び出される。
論文 参考訳(メタデータ) (2020-11-23T21:45:01Z) - Federated Learning via Intelligent Reflecting Surface [30.935389187215474]
オーバー・ザ・エア・コンピューティング・アルゴリズム(FL)は,複数のアクセスチャネルの波形重畳特性を利用して高速なモデルアグリゲーションを実現することができる。
本稿では,AirCompベースのFLのための高速かつ信頼性の高いモデルアグリゲーションを実現するための2段階最適化フレームワークを提案する。
シミュレーションの結果,提案するフレームワークとIRSの展開により,ベースラインアルゴリズムよりもトレーニング損失が低く,FL予測精度も高いことがわかった。
論文 参考訳(メタデータ) (2020-11-10T11:29:57Z) - Deep Multi-Task Learning for Cooperative NOMA: System Design and
Principles [52.79089414630366]
我々は,近年のディープラーニング(DL)の進歩を反映した,新しいディープ・コラボレーティブなNOMAスキームを開発する。
我々は,システム全体を包括的に最適化できるように,新しいハイブリッドカスケードディープニューラルネットワーク(DNN)アーキテクチャを開発した。
論文 参考訳(メタデータ) (2020-07-27T12:38:37Z) - Predictive Coding Approximates Backprop along Arbitrary Computation
Graphs [68.8204255655161]
我々は、コア機械学習アーキテクチャを予測的符号化に翻訳する戦略を開発する。
私たちのモデルは、挑戦的な機械学習ベンチマークのバックプロップと同等に機能します。
本手法は,ニューラルネットワークに標準機械学習アルゴリズムを直接実装できる可能性を高める。
論文 参考訳(メタデータ) (2020-06-07T15:35:47Z) - Optimization-driven Deep Reinforcement Learning for Robust Beamforming
in IRS-assisted Wireless Communications [54.610318402371185]
Intelligent Reflecting Surface (IRS)は、マルチアンテナアクセスポイント(AP)から受信機へのダウンリンク情報伝達を支援する有望な技術である。
我々は、APのアクティブビームフォーミングとIRSのパッシブビームフォーミングを共同最適化することで、APの送信電力を最小化する。
過去の経験からビームフォーミング戦略に適応できる深層強化学習(DRL)手法を提案する。
論文 参考訳(メタデータ) (2020-05-25T01:42:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。