論文の概要: A Review of Uncertainty for Deep Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2208.09052v1
- Date: Thu, 18 Aug 2022 20:42:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-22 17:25:38.811342
- Title: A Review of Uncertainty for Deep Reinforcement Learning
- Title(参考訳): 深層強化学習における不確実性の検討
- Authors: Owen Lockwood, Mei Si
- Abstract要約: 不確実性はゲームにおいて、エージェントがゲームをプレイしたり、ゲーム自体で頻繁に発生する。
この研究は、不確実性を意識した深層強化学習において、既存のテクニックを動機づけ、提示する概要を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Uncertainty is ubiquitous in games, both in the agents playing games and
often in the games themselves. Working with uncertainty is therefore an
important component of successful deep reinforcement learning agents. While
there has been substantial effort and progress in understanding and working
with uncertainty for supervised learning, the body of literature for
uncertainty aware deep reinforcement learning is less developed. While many of
the same problems regarding uncertainty in neural networks for supervised
learning remain for reinforcement learning, there are additional sources of
uncertainty due to the nature of an interactable environment. In this work, we
provide an overview motivating and presenting existing techniques in
uncertainty aware deep reinforcement learning. These works show empirical
benefits on a variety of reinforcement learning tasks. This work serves to help
to centralize the disparate results and promote future research in this area.
- Abstract(参考訳): 不確実性はゲームにおいて、エージェントがゲームをプレイしたり、ゲーム自体で頻繁に発生する。
したがって、不確実性を扱うことは、深層強化学習エージェントの成功の重要な要素である。
教師付き学習のための不確実性の理解と作業には、かなりの努力と進歩があったが、深層強化学習を意識した不確実性に関する文学の体系は、開発が進んでいない。
教師付き学習のためのニューラルネットワークの不確実性に関する同じ問題の多くは強化学習に残されているが、相互作用可能な環境の性質による不確実性の原因は他にもある。
本研究では,不確実性を意識した深層強化学習における既存の手法の概要と提案を行う。
これらの作品は、様々な強化学習タスクに経験的な利点を示す。
この研究は、異なる結果の集中化と、この分野における今後の研究の促進に役立つ。
関連論文リスト
- A Definition of Continual Reinforcement Learning [69.56273766737527]
強化学習問題の標準的な見方では、エージェントの目標は、長期的な報酬を最大化するポリシーを効率的に識別することである。
継続的強化学習とは、最高のエージェントが決して学習をやめない状態を指す。
エージェントの分析とカタログ化のための新しい数学的言語を通じて「学習をやめることはない」エージェントの概念を定式化する。
論文 参考訳(メタデータ) (2023-07-20T17:28:01Z) - Causal Reinforcement Learning: A Survey [57.368108154871]
強化学習は、不確実性の下でのシーケンシャルな決定問題の解決に不可欠なパラダイムである。
主な障害の1つは、強化学習エージェントが世界に対する根本的な理解を欠いていることである。
因果性は、体系的な方法で知識を形式化できるという点で顕著な利点がある。
論文 参考訳(メタデータ) (2023-07-04T03:00:43Z) - Review of Metrics to Measure the Stability, Robustness and Resilience of
Reinforcement Learning [0.5917654223291071]
近年、強化学習は、主に深層強化学習の成功により、大きな関心を集めている。
我々は、ロバスト性、安定性、弾力性を示すまたは測定するために使用される量的および理論的アプローチを分類する。
これは、強化学習に特化した安定性、堅牢性、レジリエンスに関する、初めての包括的なレビューであると考えています。
論文 参考訳(メタデータ) (2022-03-22T21:15:01Z) - Rethinking Learning Dynamics in RL using Adversarial Networks [79.56118674435844]
本稿では,スキル埋め込み空間を通じてパラメータ化された,密接に関連するスキルの強化学習のための学習機構を提案する。
本研究の主な貢献は、エントロピー規則化政策勾配定式化の助けを借りて、強化学習のための敵の訓練体制を定式化することである。
論文 参考訳(メタデータ) (2022-01-27T19:51:09Z) - Optimism in the Face of Adversity: Understanding and Improving Deep
Learning through Adversarial Robustness [63.627760598441796]
深層学習における対角的強靭性の分野を詳細に検討する。
直感的な対向例と深層ニューラルネットワークの幾何学的関係を強調した。
セキュリティを超えた敵の堅牢性の主な応用について概説する。
論文 参考訳(メタデータ) (2020-10-19T16:03:46Z) - Transfer Learning in Deep Reinforcement Learning: A Survey [64.36174156782333]
強化学習は、シーケンシャルな意思決定問題を解決するための学習パラダイムである。
近年、ディープニューラルネットワークの急速な発展により、強化学習の顕著な進歩が見られた。
転校学習は 強化学習が直面する様々な課題に 対処するために生まれました
論文 参考訳(メタデータ) (2020-09-16T18:38:54Z) - Understanding the Role of Training Regimes in Continual Learning [51.32945003239048]
破滅的な忘れは、ニューラルネットワークのトレーニングに影響を与え、複数のタスクを逐次学習する能力を制限する。
本研究では,タスクの局所的なミニマを拡大するトレーニング体制の形成に及ぼすドロップアウト,学習速度の低下,バッチサイズの影響について検討した。
論文 参考訳(メタデータ) (2020-06-12T06:00:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。