Fugu-MT 論文翻訳(概要): XCS Classifier System with Experience Replay

論文の概要: XCS Classifier System with Experience Replay

arxiv url: http://arxiv.org/abs/2002.05628v1
Date: Thu, 13 Feb 2020 16:55:08 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-01 09:35:26.252693
Title: XCS Classifier System with Experience Replay
Title（参考訳）: 経験リプレイによるXCS分類システム
Authors: Anthony Stein, Roland Maier, Lukas Rosenbauer, J\"org H\"ahner
Abstract要約: Experience Replay (ER)は、Deep-Q-Networkの成功の重要な要因の1つである。本稿では,XCSをERで拡張する利点について検討する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: XCS constitutes the most deeply investigated classifier system today. It bears strong potentials and comes with inherent capabilities for mastering a variety of different learning tasks. Besides outstanding successes in various classification and regression tasks, XCS also proved very effective in certain multi-step environments from the domain of reinforcement learning. Especially in the latter domain, recent advances have been mainly driven by algorithms which model their policies based on deep neural networks -- among which the Deep-Q-Network (DQN) is a prominent representative. Experience Replay (ER) constitutes one of the crucial factors for the DQN's successes, since it facilitates stabilized training of the neural network-based Q-function approximators. Surprisingly, XCS barely takes advantage of similar mechanisms that leverage stored raw experiences encountered so far. To bridge this gap, this paper investigates the benefits of extending XCS with ER. On the one hand, we demonstrate that for single-step tasks ER bears massive potential for improvements in terms of sample efficiency. On the shady side, however, we reveal that the use of ER might further aggravate well-studied issues not yet solved for XCS when applied to sequential decision problems demanding for long-action-chains.
Abstract（参考訳）: XCSは現在最も深く研究されている分類器システムである。強力なポテンシャルを持ち、さまざまな学習タスクをマスターする固有の能力を備えている。様々な分類や回帰タスクで顕著な成功に加えて、xcsは強化学習の領域から特定の多段階環境において非常に効果的であることが証明された。特に後者の領域では、最近の進歩は、ディープニューラルネットワークに基づいたポリシーをモデル化するアルゴリズムによって主に推進されている。 Experience Replay(ER)は、ニューラルネットワークベースのQ関数近似器の安定的なトレーニングを促進するため、DQNの成功の重要な要因の1つである。驚くべきことに、XCSは、これまで遭遇した記憶された生の体験を活用する類似のメカニズムをほとんど利用していない。本稿では,このギャップを埋めるために,ERによるXCS拡張の利点について検討する。一方, 単段階作業においては, ERがサンプル効率の面で大きな改善をもたらすことが実証された。しかし, シェーディ側では, ER の使用により, XCS の長鎖要求の逐次決定問題に適用した場合, 未解決の問題がさらに増大する可能性が示唆された。

関連論文リスト

Coarse-to-fine Q-Network with Action Sequence for Data-Efficient Robot Learning [62.3886343725955]
本稿では,行動列上のQ値を出力する批判ネットワークを学習する,新しい値に基づく強化学習アルゴリズムを提案する。実験により、CQN-ASは、様々なスパース逆ヒューマノイド制御およびテーブルトップ操作タスクにおいて、いくつかのベースラインより優れていることが示された。
論文参考訳（メタデータ） (2024-11-19T01:23:52Z)
Hyperspectral Image Classification Based on Faster Residual Multi-branch Spiking Neural Network [6.166929138912052]
本稿では,HSI分類タスクのための漏洩統合火災ニューロンモデルに基づくスパイキングニューラルネットワーク(SNN)を構築する。 SNN-SWMRでは、タイムステップの約84%、トレーニング時間、テストタイムの約63%と70%を同じ精度で削減する必要がある。
論文参考訳（メタデータ） (2024-09-18T00:51:01Z)
Towards Scalable and Versatile Weight Space Learning [51.78426981947659]
本稿では,重み空間学習におけるSANEアプローチを紹介する。ニューラルネットワーク重みのサブセットの逐次処理に向けて,超表現の概念を拡張した。
論文参考訳（メタデータ） (2024-06-14T13:12:07Z)
UniChest: Conquer-and-Divide Pre-training for Multi-Source Chest X-Ray Classification [36.94690613164942]
UniChestはConquer-and-Divide事前トレーニングフレームワークで、複数のCXRソースのコラボレーション利益をフル活用することを目的としている。我々は、ChestX-ray14、CheXpert、Vindr-CXR、深セン、Open-I、SIIM-ACR Pneumothoraxなどの多くのベンチマークで徹底的な実験を行った。
論文参考訳（メタデータ） (2023-12-18T09:16:48Z)
Problem-Dependent Power of Quantum Neural Networks on Multi-Class Classification [83.20479832949069]
量子ニューラルネットワーク(QNN)は物理世界を理解する上で重要なツールとなっているが、その利点と限界は完全には理解されていない。本稿では,多クラス分類タスクにおけるQCの問題依存力について検討する。我々の研究はQNNの課題依存力に光を当て、その潜在的なメリットを評価するための実践的なツールを提供する。
論文参考訳（メタデータ） (2022-12-29T10:46:40Z)
Tighter Abstract Queries in Neural Network Verification [0.0]
CEGARETTEは,システムとプロパティを同時に抽象化し,洗練する新しい検証機構である。私たちの結果は有望であり、複数のベンチマークよりもパフォーマンスが大幅に向上したことを証明しています。
論文参考訳（メタデータ） (2022-10-23T22:18:35Z)
Deep Reinforcement Learning with Spiking Q-learning [51.386945803485084]
スパイクニューラルネットワーク(SNN)は、少ないエネルギー消費で人工知能(AI)を実現することが期待されている。 SNNと深部強化学習(RL)を組み合わせることで、現実的な制御タスクに有望なエネルギー効率の方法を提供する。
論文参考訳（メタデータ） (2022-01-21T16:42:11Z)
Phase Retrieval using Expectation Consistent Signal Recovery Algorithm based on Hypernetwork [73.94896986868146]
位相検索は現代の計算イメージングシステムにおいて重要な要素である。近年のディープラーニングの進歩は、堅牢で高速なPRの新たな可能性を開いた。我々は、既存の制限を克服するために、深層展開のための新しいフレームワークを開発する。
論文参考訳（メタデータ） (2021-01-12T08:36:23Z)
SUNRISE: A Simple Unified Framework for Ensemble Learning in Deep Reinforcement Learning [102.78958681141577]
SUNRISEは単純な統一アンサンブル法であり、様々な非政治的な深層強化学習アルゴリズムと互換性がある。 SUNRISEは, (a) アンサンブルに基づく重み付きベルマンバックアップと, (b) 最上位の自信境界を用いて行動を選択する推論手法を統合し, 効率的な探索を行う。
論文参考訳（メタデータ） (2020-07-09T17:08:44Z)
Online Kernel based Generative Adversarial Networks [0.45880283710344055]
オンラインカーネルベースのジェネレーティブ・アドバイザリアル・ネットワーク(OKGAN)は,モード崩壊やサイクリングなど,多くのトレーニング問題を緩和する。 OKGANは、合成データ上の他のGANの定式化よりも、逆KL偏差に対して、劇的に優れた性能を発揮する。
論文参考訳（メタデータ） (2020-06-19T22:54:01Z)
How to Train Your Super-Net: An Analysis of Training Heuristics in Weight-Sharing NAS [64.50415611717057]
我々は,スーパーネットトレーニングにおける一般的なベースラインが,スーパーネットとスタンドアローンのパフォーマンスの相関に負の影響を及ぼすことを示した。私たちのコードと実験は、将来の作業が構築できる、強く再現可能なベースラインを設定しました。
論文参考訳（メタデータ） (2020-03-09T17:34:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。