論文の概要: Some Insights into Lifelong Reinforcement Learning Systems
- arxiv url: http://arxiv.org/abs/2001.09608v1
- Date: Mon, 27 Jan 2020 07:26:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-06 07:30:23.116983
- Title: Some Insights into Lifelong Reinforcement Learning Systems
- Title(参考訳): 生涯強化学習システムに関する一考察
- Authors: Changjian Li
- Abstract要約: 生涯強化学習システムは、生涯にわたって環境との追従的相互作用を通じて学習する能力を持つ学習システムである。
生涯強化学習に関するいくつかの知見と、簡易な生涯強化学習システムを提供する。
- 参考スコア(独自算出の注目度): 6.819322942771288
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A lifelong reinforcement learning system is a learning system that has the
ability to learn through trail-and-error interaction with the environment over
its lifetime. In this paper, I give some arguments to show that the traditional
reinforcement learning paradigm fails to model this type of learning system.
Some insights into lifelong reinforcement learning are provided, along with a
simplistic prototype lifelong reinforcement learning system.
- Abstract(参考訳): 生涯強化学習システムは、生涯にわたって環境との追従的相互作用を通じて学習する能力を持つ学習システムである。
本稿では,従来の強化学習パラダイムが,このような学習システムをモデル化できないことを示すために,いくつかの議論を行う。
生涯強化学習に関するいくつかの知見と、簡易な生涯強化学習システムを提供する。
関連論文リスト
- A Definition of Continual Reinforcement Learning [69.56273766737527]
強化学習問題の標準的な見方では、エージェントの目標は、長期的な報酬を最大化するポリシーを効率的に識別することである。
継続的強化学習とは、最高のエージェントが決して学習をやめない状態を指す。
エージェントの分析とカタログ化のための新しい数学的言語を通じて「学習をやめることはない」エージェントの概念を定式化する。
論文 参考訳(メタデータ) (2023-07-20T17:28:01Z) - Towards Scalable Adaptive Learning with Graph Neural Networks and
Reinforcement Learning [0.0]
学習経路のパーソナライズに関する問題に対して,フレキシブルでスケーラブルなアプローチを導入する。
我々のモデルはグラフニューラルネットワークに基づく逐次レコメンデーションシステムである。
以上の結果から,小規模データ体制における適切なレコメンデーションを学習できることが示唆された。
論文 参考訳(メタデータ) (2023-05-10T18:16:04Z) - A Domain-Agnostic Approach for Characterization of Lifelong Learning
Systems [128.63953314853327]
「生涯学習」システムには,1)継続的学習,2)伝達と適応,3)拡張性があります。
この一連のメトリクスは、様々な複雑な生涯学習システムの開発に役立てることができることを示す。
論文 参考訳(メタデータ) (2023-01-18T21:58:54Z) - Activation Learning by Local Competitions [4.441866681085516]
我々は,神経細胞間の局所的な競合によって特徴を見出す,生物学に着想を得た学習ルールを開発した。
この局所学習規則によって学習された教師なし特徴が事前学習モデルとして機能することが実証された。
論文 参考訳(メタデータ) (2022-09-26T10:43:29Z) - Active Reinforcement Learning -- A Roadmap Towards Curious Classifier
Systems for Self-Adaptation [0.456877715768796]
知的システムにおける「能動的強化学習」についての研究課題を策定することを目的とする。
従来のアプローチでは、学習問題を分離し、さまざまな分野の機械学習からテクニックを分離的に利用している。
論文 参考訳(メタデータ) (2022-01-11T13:50:26Z) - Learning Task-aware Robust Deep Learning Systems [6.532642348343193]
ディープラーニングシステムは、ディープラーニングタスクとディープラーニングモデルという2つの部分から構成される。
本稿では、分類タスクを再定義するために、バイナリおよびインターバルラベル符号化方式を採用する。
本手法は,学習課題と深層モデルの両方から,ディープラーニングシステムの堅牢性を向上させるものとみなすことができる。
論文 参考訳(メタデータ) (2020-10-11T01:06:49Z) - Rethinking Supervised Learning and Reinforcement Learning in
Task-Oriented Dialogue Systems [58.724629408229205]
本稿では、従来の教師あり学習とシミュレータなしの逆学習法を用いて、最先端のRL法に匹敵する性能を実現する方法を示す。
我々の主な目的は、教師あり学習で強化学習に勝ることではなく、タスク指向対話システムの最適化における強化学習と教師あり学習の役割を再考する価値を示すことである。
論文 参考訳(メタデータ) (2020-09-21T12:04:18Z) - Transfer Learning in Deep Reinforcement Learning: A Survey [64.36174156782333]
強化学習は、シーケンシャルな意思決定問題を解決するための学習パラダイムである。
近年、ディープニューラルネットワークの急速な発展により、強化学習の顕著な進歩が見られた。
転校学習は 強化学習が直面する様々な課題に 対処するために生まれました
論文 参考訳(メタデータ) (2020-09-16T18:38:54Z) - Interaction-limited Inverse Reinforcement Learning [50.201765937436654]
本稿では,教師の視点をカバーしたカリキュラム逆強化学習(CIRL)と,学習者の視点に着目した自己適用逆強化学習(SPIRL)の2つの訓練戦略を提案する。
シミュレーション実験と実ロボットを用いた実験により,CIRLの無作為教師やSPIRLのバッチ学習者よりも高速な学習が可能であることを示す。
論文 参考訳(メタデータ) (2020-07-01T12:31:52Z) - Learning Stable Deep Dynamics Models [91.90131512825504]
状態空間全体にわたって安定することが保証される力学系を学習するためのアプローチを提案する。
このような学習システムは、単純な力学系をモデル化することができ、複雑な力学を学習するために追加の深層生成モデルと組み合わせることができることを示す。
論文 参考訳(メタデータ) (2020-01-17T00:04:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。