論文の概要: A Novel Update Mechanism for Q-Networks Based On Extreme Learning
Machines
- arxiv url: http://arxiv.org/abs/2006.02986v1
- Date: Thu, 4 Jun 2020 16:16:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-25 09:06:46.821655
- Title: A Novel Update Mechanism for Q-Networks Based On Extreme Learning
Machines
- Title(参考訳): エクストリーム学習マシンに基づくQ-Networksの新しい更新メカニズム
- Authors: Callum Wilson, Annalisa Riccardi, Edmondo Minisci
- Abstract要約: EQLM(Extreme Q-Learning Machine)は、勾配に基づく更新と同じ方法で強化学習問題に適用される。
我々はその性能を、カートポールタスクにおける典型的なQ-Networkと比較する。
EQLMはQ-Networkと同様の長期学習性能を持つことを示す。
- 参考スコア(独自算出の注目度): 0.6445605125467573
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reinforcement learning is a popular machine learning paradigm which can find
near optimal solutions to complex problems. Most often, these procedures
involve function approximation using neural networks with gradient based
updates to optimise weights for the problem being considered. While this common
approach generally works well, there are other update mechanisms which are
largely unexplored in reinforcement learning. One such mechanism is Extreme
Learning Machines. These were initially proposed to drastically improve the
training speed of neural networks and have since seen many applications. Here
we attempt to apply extreme learning machines to a reinforcement learning
problem in the same manner as gradient based updates. This new algorithm is
called Extreme Q-Learning Machine (EQLM). We compare its performance to a
typical Q-Network on the cart-pole task - a benchmark reinforcement learning
problem - and show EQLM has similar long-term learning performance to a
Q-Network.
- Abstract(参考訳): 強化学習は、複雑な問題に対する最適な解決策を見つけることができる一般的な機械学習パラダイムである。
多くの場合、これらの手順は、検討中の問題の重み付けを最適化するために勾配に基づく更新を伴うニューラルネットワークを用いた関数近似を伴う。
この一般的なアプローチは一般的にうまく機能するが、強化学習ではほとんど探索されていない他の更新メカニズムがある。
そのようなメカニズムのひとつがExtreme Learning Machinesである。
これらは当初、ニューラルネットワークのトレーニング速度を大幅に改善するために提案され、その後多くの応用が見られた。
ここでは、勾配に基づく更新と同じ方法で強化学習問題に極端な学習機械を適用しようとする。
このアルゴリズムはExtreme Q-Learning Machine (EQLM)と呼ばれる。
その性能をカートポールタスク(ベンチマーク強化学習問題)の典型的なqネットワークと比較し、eqlmがqネットワークと同様の長期学習性能を示す。
関連論文リスト
- A Unified Framework for Neural Computation and Learning Over Time [56.44910327178975]
Hamiltonian Learningはニューラルネットワークを"時間とともに"学習するための新しい統合フレームワーク
i)外部ソフトウェアソルバを必要とせずに統合できる、(ii)フィードフォワードおよびリカレントネットワークにおける勾配に基づく学習の概念を一般化する、(iii)新しい視点で開放する、という微分方程式に基づいている。
論文 参考訳(メタデータ) (2024-09-18T14:57:13Z) - Centered Self-Attention Layers [89.21791761168032]
変圧器の自己保持機構とグラフニューラルネットワークのメッセージ通過機構を繰り返し適用する。
我々は、このアプリケーションが必然的に、より深い層での同様の表現に過剰なスムーシングをもたらすことを示す。
これらの機構の集約演算子に補正項を提示する。
論文 参考訳(メタデータ) (2023-06-02T15:19:08Z) - Deep learning applied to computational mechanics: A comprehensive
review, state of the art, and the classics [77.34726150561087]
人工知能,特に深層学習(DL)の最近の進歩を概観する。
ハイブリッドおよび純粋機械学習(ML)の手法について論じる。
AIの歴史と限界は、特に古典の誤解や誤解を指摘し、議論され、議論される。
論文 参考訳(メタデータ) (2022-12-18T02:03:00Z) - Online Target Q-learning with Reverse Experience Replay: Efficiently
finding the Optimal Policy for Linear MDPs [50.75812033462294]
我々は,Q-ラーニングの実践的成功と悲観的理論的結果とのギャップを埋める。
本稿では,新しいQ-Rex法とQ-RexDaReを提案する。
Q-Rex は線形 MDP の最適ポリシを効率的に見つけることができる。
論文 参考訳(メタデータ) (2021-10-16T01:47:41Z) - Improving the sample-efficiency of neural architecture search with
reinforcement learning [0.0]
この作業では、Automated Machine Learning(AutoML)の領域にコントリビュートしたいと思っています。
我々の焦点は、最も有望な研究方向の一つ、強化学習である。
児童ネットワークの検証精度は、コントローラを訓練するための報奨信号として機能する。
我々は、これをより現代的で複雑なアルゴリズムであるPPOに修正することを提案する。
論文 参考訳(メタデータ) (2021-10-13T14:30:09Z) - Analytically Tractable Bayesian Deep Q-Learning [0.0]
我々は時間差Q-ラーニングフレームワークを適応させ、抽出可能な近似ガウス推論(TAGI)と互換性を持たせる。
我々は,TAGIがバックプロパゲーション学習ネットワークに匹敵する性能に到達できることを実証した。
論文 参考訳(メタデータ) (2021-06-21T13:11:52Z) - Neural Network-based Quantization for Network Automation [0.7034976835586089]
k-Meansアルゴリズムの修正であるBounding Sphere Quantization (BSQ)アルゴリズムを導入し、特定のネットワーク管理ユースケースの量子化を改善することを示した。
BSQは、ニューラルネットワークベースの実装で克服できる課題であるk-Meansよりもトレーニングにかなり長い時間を要しました。
本稿では,最先端のディープラーニングツールを用いて,競争力のあるトレーニング速度を実現するBSQの実装を提案する。
論文 参考訳(メタデータ) (2021-03-04T11:41:19Z) - Superiorities of Deep Extreme Learning Machines against Convolutional
Neural Networks [3.04585143845864]
deep learning (dl)は、入力データを詳細に分析する人工知能のための機械学習手順である。
DLはグラフィカル処理ユニット機能の一般的な改善で人気がある。
Deep Extreme Learning Machine(Deep ELM)は、迅速な分類問題を解決するための最速かつ効果的な方法の1つです。
論文 参考訳(メタデータ) (2021-01-21T08:22:18Z) - AutoML-Zero: Evolving Machine Learning Algorithms From Scratch [76.83052807776276]
基本数学的操作をビルディングブロックとして使うだけで,完全な機械学習アルゴリズムを自動的に発見できることが示される。
汎用的な検索空間を通じて人間のバイアスを大幅に低減する新しいフレームワークを導入することでこれを実証する。
機械学習アルゴリズムをゼロから発見する上で、これらの予備的な成功は、この分野における有望な新しい方向性を示していると信じている。
論文 参考訳(メタデータ) (2020-03-06T19:00:04Z) - Deep Learning for Ultra-Reliable and Low-Latency Communications in 6G
Networks [84.2155885234293]
まず,データ駆動型教師付き深層学習と深部強化学習をURLLCに適用する方法を概説する。
このようなオープンな問題に対処するために、デバイスインテリジェンス、エッジインテリジェンス、およびURLLCのためのクラウドインテリジェンスを可能にするマルチレベルアーキテクチャを開発した。
論文 参考訳(メタデータ) (2020-02-22T14:38:11Z) - Memristor Hardware-Friendly Reinforcement Learning [14.853739554366351]
そこで我々は,強化学習におけるアクター・クリティック・アルゴリズムのための経験的ニューロモルフィック・ハードウェアの実装を提案する。
RLと制御理論の両方において古典的な問題である逆振り子のバランスをとることを考える。
本研究は,メムリスタをベースとしたハードウェアニューラルネットワークを用いて複雑なタスクをその場での強化学習によって処理する可能性を示唆している。
論文 参考訳(メタデータ) (2020-01-20T01:08:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。