論文の概要: An information-theoretic perspective on intrinsic motivation in
reinforcement learning: a survey
- arxiv url: http://arxiv.org/abs/2209.08890v1
- Date: Mon, 19 Sep 2022 09:47:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-20 19:03:12.870889
- Title: An information-theoretic perspective on intrinsic motivation in
reinforcement learning: a survey
- Title(参考訳): 強化学習における本質的動機づけに関する情報理論的視点
- Authors: Arthur Aubret, Laetitia Matignon, Salima Hassas
- Abstract要約: 本稿では,これらの研究成果を情報理論に基づく新たな分類法を用いて調査することを提案する。
我々は、サプライズ、ノベルティ、スキル学習の概念を計算的に再考する。
我々の分析は、新規性とサプライズがトランスファー可能なスキルの階層を構築するのに役立つことを示唆している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The reinforcement learning (RL) research area is very active, with an
important number of new contributions; especially considering the emergent
field of deep RL (DRL). However a number of scientific and technical challenges
still need to be resolved, amongst which we can mention the ability to abstract
actions or the difficulty to explore the environment in sparse-reward settings
which can be addressed by intrinsic motivation (IM). We propose to survey these
research works through a new taxonomy based on information theory: we
computationally revisit the notions of surprise, novelty and skill learning.
This allows us to identify advantages and disadvantages of methods and exhibit
current outlooks of research. Our analysis suggests that novelty and surprise
can assist the building of a hierarchy of transferable skills that further
abstracts the environment and makes the exploration process more robust.
- Abstract(参考訳): 強化学習(RL)研究領域は非常に活発であり、特に深層RL(DRL)の創発的な分野を考えると、多くの新しい貢献がなされている。
しかし、多くの科学的・技術的な課題が解決される必要があり、その中では、本質的なモチベーション(IM)によって対処できるスパース・リワード環境での行動の抽象化や環境探索の難しさについて言及することができる。
我々は,これらの研究成果を,情報理論に基づく新たな分類学を通じて調査することを提案する。
これにより、方法の利点と欠点を特定し、研究の現在の展望を示すことができます。
我々の分析は、新規性とサプライズが、環境をさらに抽象化し、探索プロセスをより堅牢にするトランスファー可能なスキル階層の構築を支援することを示唆している。
関連論文リスト
- Fostering Intrinsic Motivation in Reinforcement Learning with Pretrained Foundation Models [8.255197802529118]
CLIPのような最近の基盤モデルの台頭は、事前訓練されたセマンティックにリッチな埋め込みを活用する機会を提供する。
導入モジュールは、完全な状態情報を有効に活用することができ、サンプル効率を大幅に向上させることができる。
基礎モデルによって提供される埋め込みは、トレーニング中にエージェントが構築したものよりも、時として優れていることを示す。
論文 参考訳(メタデータ) (2024-10-09T20:05:45Z) - Navigate through Enigmatic Labyrinth A Survey of Chain of Thought Reasoning: Advances, Frontiers and Future [38.1992191907012]
思考の連鎖はLLMの推論能力を大幅に向上させる。
本稿では,高度な手法を要約し,関連研究を体系的に研究する。
また、現在のフロンティアを掘り下げて、課題と今後の方向性を述べています。
論文 参考訳(メタデータ) (2023-09-27T04:53:10Z) - A Comprehensive Survey of Forgetting in Deep Learning Beyond Continual
Learning [76.47138162283714]
蓄積とは、以前取得した情報や知識の喪失または劣化を指す。
フォッテッティングは、深層学習における様々な研究領域でよく見られる現象である。
調査では、忘れることは二重刃の剣であり、ある場合には有益で望ましいと論じている。
論文 参考訳(メタデータ) (2023-07-16T16:27:58Z) - A Diachronic Analysis of Paradigm Shifts in NLP Research: When, How, and
Why? [84.46288849132634]
本稿では、因果発見と推論技術を用いて、科学分野における研究トピックの進化を分析するための体系的な枠組みを提案する。
我々は3つの変数を定義し、NLPにおける研究トピックの進化の多様な側面を包含する。
我々は因果探索アルゴリズムを用いてこれらの変数間の因果関係を明らかにする。
論文 参考訳(メタデータ) (2023-05-22T11:08:00Z) - Knowledge-enhanced Neural Machine Reasoning: A Review [67.51157900655207]
既存の知識強化手法を2つの主要なカテゴリと4つのサブカテゴリに分類する新しい分類法を導入する。
我々は、現在のアプリケーションドメインを解明し、将来的な研究の展望について洞察を提供する。
論文 参考訳(メタデータ) (2023-02-04T04:54:30Z) - From Psychological Curiosity to Artificial Curiosity: Curiosity-Driven
Learning in Artificial Intelligence Tasks [56.20123080771364]
心理学的好奇心は、探索と情報取得を通じて学習を強化するために、人間の知性において重要な役割を果たす。
人工知能(AI)コミュニティでは、人工好奇心は効率的な学習に自然な本質的な動機を与える。
CDLはますます人気を博し、エージェントは新たな知識を学習するために自己動機付けされている。
論文 参考訳(メタデータ) (2022-01-20T17:07:03Z) - Explainability in Deep Reinforcement Learning [68.8204255655161]
説明可能な強化学習(XRL)の実現に向けての最近の成果を概観する。
エージェントの振る舞いを正当化し、説明することが不可欠である重要な状況において、RLモデルのより良い説明可能性と解釈性は、まだブラックボックスと見なされているものの内部動作に関する科学的洞察を得るのに役立つ。
論文 参考訳(メタデータ) (2020-08-15T10:11:42Z) - Deep Reinforcement Learning and its Neuroscientific Implications [19.478332877763417]
強力な人工知能の出現は、神経科学の新しい研究方向を定義している。
深層強化学習(Deep RL)は、学習、表現、意思決定の間の相互作用を研究するための枠組みを提供する。
Deep RLは、新しい研究ツールセットと、幅広い新しい仮説を提供する。
論文 参考訳(メタデータ) (2020-07-07T19:27:54Z) - Deep Learning for Sensor-based Human Activity Recognition: Overview,
Challenges and Opportunities [52.59080024266596]
本稿では,センサを用いた人間の活動認識のための最先端のディープラーニング手法について調査する。
まず、官能データのマルチモーダリティを導入し、公開データセットに情報を提供する。
次に、課題によって深層メソッドを構築するための新しい分類法を提案する。
論文 参考訳(メタデータ) (2020-01-21T09:55:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。