Fugu-MT 論文翻訳(概要): A Definition of Continual Reinforcement Learning

関連論文リスト

Truly Self-Improving Agents Require Intrinsic Metacognitive Learning [59.60803539959191]
自己改善エージェントは、最小限の監督で継続的に新しい能力を取得することを目的としている。現在のアプローチは2つの重要な制限に直面している。自己改善プロセスは、しばしば厳格であり、タスクドメイン全体にわたって一般化できない。我々は、効果的な自己改善は、エージェントの本質的な能力として定義された固有のメタ認知学習を必要とし、自身の学習プロセスを積極的に評価し、反映し、適応させる。
論文参考訳（メタデータ） (2025-06-05T14:53:35Z)
Rethinking the Foundations for Continual Reinforcement Learning [25.069601930142305]
まず,従来の強化学習の基礎が連続的な強化学習パラダイムに適しているかを検討する。継続学習の目標に反する従来の強化学習基盤の4つの重要な柱を同定する。
論文参考訳（メタデータ） (2025-04-10T23:05:56Z)
A Definition of Open-Ended Learning Problems for Goal-Conditioned Agents [18.2920082469313]
オープンエンドラーニングは、一般的に、多様な性質の集合を含む複合概念として考えられている。我々は、エージェントがゴール駆動スキルのレパートリーを増大させることが可能な、オープンエンドの目標条件強化学習問題のサブセットに焦点を当てる。
論文参考訳（メタデータ） (2023-11-01T07:37:27Z)
Causal Reinforcement Learning: A Survey [57.368108154871]
強化学習は、不確実性の下でのシーケンシャルな決定問題の解決に不可欠なパラダイムである。主な障害の1つは、強化学習エージェントが世界に対する根本的な理解を欠いていることである。因果性は、体系的な方法で知識を形式化できるという点で顕著な利点がある。
論文参考訳（メタデータ） (2023-07-04T03:00:43Z)
A Comprehensive Survey of Continual Learning: Theory, Method and Application [64.23253420555989]
本稿では,基礎的設定,理論的基礎,代表的方法,実践的応用を橋渡しする継続的学習に関する包括的調査を行う。連続学習の一般的な目的は、資源効率の文脈において、適切な安定性と塑性のトレードオフと適切なタスク内/タスク内一般化性を保証することであると要約する。
論文参考訳（メタデータ） (2023-01-31T11:34:56Z)
Unveiling the Tapestry: the Interplay of Generalization and Forgetting in Continual Learning [18.61040106667249]
AIでは、一般化とは、与えられたタスクに関連するアウト・オブ・ディストリビューション・データに対して、トレーニングされたデータ以外にうまく機能するモデルの能力を指す。継続的な学習方法は、しばしば破滅的な忘れを軽減し、以前のタスクからの知識を確実に保持するメカニズムを含んでいる。本稿では, 形状テクスチュア整合性規則化(STCR)と呼ばれる, 連続的な学習を支援する簡易かつ効果的な手法を提案する。
論文参考訳（メタデータ） (2022-11-21T04:36:24Z)
A Review of Uncertainty for Deep Reinforcement Learning [0.0]
不確実性はゲームにおいて、エージェントがゲームをプレイしたり、ゲーム自体で頻繁に発生する。この研究は、不確実性を意識した深層強化学習において、既存のテクニックを動機づけ、提示する概要を提供する。
論文参考訳（メタデータ） (2022-08-18T20:42:19Z)
Rethinking Learning Dynamics in RL using Adversarial Networks [79.56118674435844]
本稿では,スキル埋め込み空間を通じてパラメータ化された,密接に関連するスキルの強化学習のための学習機構を提案する。本研究の主な貢献は、エントロピー規則化政策勾配定式化の助けを借りて、強化学習のための敵の訓練体制を定式化することである。
論文参考訳（メタデータ） (2022-01-27T19:51:09Z)
Towards a theory of out-of-distribution learning [23.878004729029644]
本稿では,PAC学習フレームワークを用いて,異なる学習課題を定義するための時系列的アプローチを提案する。まずは流通学習から始め、最近提案された生涯学習や継続学習へと進む。この研究によって、さまざまなタイプの学習を定量化する、普遍的に合意されたアプローチがもたらされることを期待しています。
論文参考訳（メタデータ） (2021-09-29T15:35:16Z)
Importance Weighted Policy Learning and Adaptation [89.46467771037054]
政治外学習の最近の進歩の上に構築された,概念的にシンプルで,汎用的で,モジュール的な補完的アプローチについて検討する。このフレームワークは確率論的推論文学のアイデアにインスパイアされ、堅牢な非政治学習と事前の行動を組み合わせる。提案手法は,メタ強化学習ベースラインと比較して,ホールドアウトタスクにおける競合適応性能を実現し,複雑なスパース・リワードシナリオにスケールすることができる。
論文参考訳（メタデータ） (2020-09-10T14:16:58Z)
Online Fast Adaptation and Knowledge Accumulation: a New Approach to Continual Learning [74.07455280246212]
継続的な学習は、新しいタスクに適応しながら、以前のタスクを忘れずにタスクの流れから学ぶエージェントを研究する。この新たなシナリオでは、現在の連続学習、メタ学習、メタ連続学習、および連続メタ学習技術が失敗することを示します。本稿では,このシナリオの強力なベースラインとして,人気のあるMAMLアルゴリズムのオンライン拡張であるContinual-MAMLを提案する。
論文参考訳（メタデータ） (2020-03-12T15:47:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

論文の概要: A Definition of Continual Reinforcement Learning

関連論文リスト