論文の概要: XCS Classifier System with Experience Replay
- arxiv url: http://arxiv.org/abs/2002.05628v1
- Date: Thu, 13 Feb 2020 16:55:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-01 09:35:26.252693
- Title: XCS Classifier System with Experience Replay
- Title(参考訳): 経験リプレイによるXCS分類システム
- Authors: Anthony Stein, Roland Maier, Lukas Rosenbauer, J\"org H\"ahner
- Abstract要約: Experience Replay (ER)は、Deep-Q-Networkの成功の重要な要因の1つである。
本稿では,XCSをERで拡張する利点について検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: XCS constitutes the most deeply investigated classifier system today. It
bears strong potentials and comes with inherent capabilities for mastering a
variety of different learning tasks. Besides outstanding successes in various
classification and regression tasks, XCS also proved very effective in certain
multi-step environments from the domain of reinforcement learning. Especially
in the latter domain, recent advances have been mainly driven by algorithms
which model their policies based on deep neural networks -- among which the
Deep-Q-Network (DQN) is a prominent representative. Experience Replay (ER)
constitutes one of the crucial factors for the DQN's successes, since it
facilitates stabilized training of the neural network-based Q-function
approximators. Surprisingly, XCS barely takes advantage of similar mechanisms
that leverage stored raw experiences encountered so far. To bridge this gap,
this paper investigates the benefits of extending XCS with ER. On the one hand,
we demonstrate that for single-step tasks ER bears massive potential for
improvements in terms of sample efficiency. On the shady side, however, we
reveal that the use of ER might further aggravate well-studied issues not yet
solved for XCS when applied to sequential decision problems demanding for
long-action-chains.
- Abstract(参考訳): XCSは現在最も深く研究されている分類器システムである。
強力なポテンシャルを持ち、さまざまな学習タスクをマスターする固有の能力を備えている。
様々な分類や回帰タスクで顕著な成功に加えて、xcsは強化学習の領域から特定の多段階環境において非常に効果的であることが証明された。
特に後者の領域では、最近の進歩は、ディープニューラルネットワークに基づいたポリシーをモデル化するアルゴリズムによって主に推進されている。
Experience Replay(ER)は、ニューラルネットワークベースのQ関数近似器の安定的なトレーニングを促進するため、DQNの成功の重要な要因の1つである。
驚くべきことに、XCSは、これまで遭遇した記憶された生の体験を活用する類似のメカニズムをほとんど利用していない。
本稿では,このギャップを埋めるために,ERによるXCS拡張の利点について検討する。
一方, 単段階作業においては, ERがサンプル効率の面で大きな改善をもたらすことが実証された。
しかし, シェーディ側では, ER の使用により, XCS の長鎖要求の逐次決定問題に適用した場合, 未解決の問題がさらに増大する可能性が示唆された。
関連論文リスト
- UniChest: Conquer-and-Divide Pre-training for Multi-Source Chest X-Ray
Classification [39.149526285927664]
UniChestはConquer-and-Divide事前トレーニングフレームワークで、複数のCXRソースのコラボレーション利益をフル活用することを目的としている。
我々は、ChestX-ray14、CheXpert、Vindr-CXR、深セン、Open-I、SIIM-ACR Pneumothoraxなどの多くのベンチマークで徹底的な実験を行った。
論文 参考訳(メタデータ) (2023-12-18T09:16:48Z) - Problem-Dependent Power of Quantum Neural Networks on Multi-Class
Classification [83.20479832949069]
量子ニューラルネットワーク(QNN)は物理世界を理解する上で重要なツールとなっているが、その利点と限界は完全には理解されていない。
本稿では,多クラス分類タスクにおけるQCの問題依存力について検討する。
我々の研究はQNNの課題依存力に光を当て、その潜在的なメリットを評価するための実践的なツールを提供する。
論文 参考訳(メタデータ) (2022-12-29T10:46:40Z) - Tighter Abstract Queries in Neural Network Verification [0.0]
CEGARETTEは,システムとプロパティを同時に抽象化し,洗練する新しい検証機構である。
私たちの結果は有望であり、複数のベンチマークよりもパフォーマンスが大幅に向上したことを証明しています。
論文 参考訳(メタデータ) (2022-10-23T22:18:35Z) - Learning Bayesian Sparse Networks with Full Experience Replay for
Continual Learning [54.7584721943286]
継続学習(CL)手法は、機械学習モデルが、以前にマスターされたタスクを壊滅的に忘れることなく、新しいタスクを学習できるようにすることを目的としている。
既存のCLアプローチは、しばしば、事前に確認されたサンプルのバッファを保持し、知識蒸留を行い、あるいはこの目標に向けて正規化技術を使用する。
我々は,現在および過去のタスクを任意の段階で学習するために,スパースニューロンのみを活性化し,選択することを提案する。
論文 参考訳(メタデータ) (2022-02-21T13:25:03Z) - Deep Reinforcement Learning with Spiking Q-learning [56.13654667729119]
スパイクニューラルネットワーク(SNN)は、少ないエネルギー消費で人工知能(AI)を実現することが期待されている。
SNNと深部強化学習(RL)を組み合わせることで、現実的な制御タスクに有望なエネルギー効率の方法を提供する。
論文 参考訳(メタデータ) (2022-01-21T16:42:11Z) - Phase Retrieval using Expectation Consistent Signal Recovery Algorithm
based on Hypernetwork [73.94896986868146]
位相検索は現代の計算イメージングシステムにおいて重要な要素である。
近年のディープラーニングの進歩は、堅牢で高速なPRの新たな可能性を開いた。
我々は、既存の制限を克服するために、深層展開のための新しいフレームワークを開発する。
論文 参考訳(メタデータ) (2021-01-12T08:36:23Z) - Triage of Potential COVID-19 Patients from Chest X-ray Images using
Hierarchical Convolutional Networks [5.7179132552879395]
新型コロナウイルス(COVID-19)のパンデミックは、逆転写-ポリメラーゼ連鎖反応(RT-PCR)の代替として人工知能技術を使うことを研究者に動機付けている。
胸部X線(CXR)は早期診断のための代替手段の1つであるが、大規模な注釈付きデータの有効性は、機械学習による新型コロナウイルス検出の臨床的実装を困難にしている。
本稿では,階層型畳み込みネットワーク(HCN)アーキテクチャを用いて,データを自然に拡張する手法を提案する。
論文 参考訳(メタデータ) (2020-11-01T20:01:22Z) - SUNRISE: A Simple Unified Framework for Ensemble Learning in Deep
Reinforcement Learning [102.78958681141577]
SUNRISEは単純な統一アンサンブル法であり、様々な非政治的な深層強化学習アルゴリズムと互換性がある。
SUNRISEは, (a) アンサンブルに基づく重み付きベルマンバックアップと, (b) 最上位の自信境界を用いて行動を選択する推論手法を統合し, 効率的な探索を行う。
論文 参考訳(メタデータ) (2020-07-09T17:08:44Z) - Online Kernel based Generative Adversarial Networks [0.45880283710344055]
オンラインカーネルベースのジェネレーティブ・アドバイザリアル・ネットワーク(OKGAN)は,モード崩壊やサイクリングなど,多くのトレーニング問題を緩和する。
OKGANは、合成データ上の他のGANの定式化よりも、逆KL偏差に対して、劇的に優れた性能を発揮する。
論文 参考訳(メタデータ) (2020-06-19T22:54:01Z) - How to Train Your Super-Net: An Analysis of Training Heuristics in
Weight-Sharing NAS [64.50415611717057]
我々は,スーパーネットトレーニングにおける一般的なベースラインが,スーパーネットとスタンドアローンのパフォーマンスの相関に負の影響を及ぼすことを示した。
私たちのコードと実験は、将来の作業が構築できる、強く再現可能なベースラインを設定しました。
論文 参考訳(メタデータ) (2020-03-09T17:34:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。