論文の概要: On the Importance of Critical Period in Multi-stage Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2208.04832v1
- Date: Tue, 9 Aug 2022 15:17:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-10 12:06:17.106341
- Title: On the Importance of Critical Period in Multi-stage Reinforcement
Learning
- Title(参考訳): 多段階強化学習における臨界期間の重要性について
- Authors: Junseok Park, Inwoo Hwang, Min Whoo Lee, Hyunseok Oh, Minsu Lee,
Youngki Lee, Byoung-Tak Zhang
- Abstract要約: 近年の研究では、AIエージェントが人間の臨界期に似た学習期間を示した。
適切な刺激を見つけることを強調するため,多段階強化学習を提案する。
- 参考スコア(独自算出の注目度): 18.610737380842494
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The initial years of an infant's life are known as the critical period,
during which the overall development of learning performance is significantly
impacted due to neural plasticity. In recent studies, an AI agent, with a deep
neural network mimicking mechanisms of actual neurons, exhibited a learning
period similar to human's critical period. Especially during this initial
period, the appropriate stimuli play a vital role in developing learning
ability. However, transforming human cognitive bias into an appropriate shaping
reward is quite challenging, and prior works on critical period do not focus on
finding the appropriate stimulus. To take a step further, we propose
multi-stage reinforcement learning to emphasize finding ``appropriate stimulus"
around the critical period. Inspired by humans' early cognitive-developmental
stage, we use multi-stage guidance near the critical period, and demonstrate
the appropriate shaping reward (stage-2 guidance) in terms of the AI agent's
performance, efficiency, and stability.
- Abstract(参考訳): 幼児の人生の初期は臨界期と呼ばれ、その間に学習性能の全体的な発達は神経可塑性によって著しく影響を受ける。
近年の研究では、実際のニューロンのメカニズムを模倣するディープニューラルネットワークを持つAIエージェントが、人間の臨界期に似た学習期間を示した。
特にこの初期の段階では、適切な刺激が学習能力の発達に重要な役割を果たす。
しかし、人間の認知バイアスを適切な形状の報酬に変換することは極めて困難であり、臨界期以前の研究は適切な刺激を見つけることに集中していない。
さらに, 臨界期における「適切な刺激」の発見を重視した多段階強化学習を提案する。
人間の初期認知発達段階にインスパイアされた我々は、臨界期に近い多段階ガイダンスを使用し、AIエージェントの性能、効率、安定性の観点から適切な形状報酬(ステージ2ガイダンス)を実証する。
関連論文リスト
- Beyond Performance Scores: Directed Functional Connectivity as a Brain-Based Biomarker for Motor Skill Learning and Retention [0.0]
手術、ロボット工学、スポーツなどの分野でのモータースキル獲得には、広範なトレーニングを通じて複雑なタスクシーケンスを学習する必要がある。
実行時間やエラー率といった従来のパフォーマンス指標は、スキル学習と保持の基礎となる神経メカニズムを捕捉できないため、限られた洞察を提供する。
本研究は,脳波から誘導される指向性機能接続(dFC)を,運動能力の学習と保持を評価する新しい脳バイオマーカーとして紹介する。
論文 参考訳(メタデータ) (2025-02-20T16:55:08Z) - Early Period of Training Impacts Adaptation for Out-of-Distribution Generalization: An Empirical Study [56.283944756315066]
本稿では,学習力学,分布外一般化,ニューラルネットワークトレーニングの初期段階との関係について検討する。
トレーニングの初期においてトレーニング可能なパラメータの数を変更することで,OODの結果が大幅に改善できることが示唆された。
画像データとテキストデータの両方で実験したところ、訓練の初期段階は、IDとOODのパフォーマンスを最小限の複雑さで改善できる一般的な現象であることがわかった。
論文 参考訳(メタデータ) (2024-03-22T13:52:53Z) - Critical Learning Periods Emerge Even in Deep Linear Networks [102.89011295243334]
クリティカルラーニング期間(Critical Learning periods)は、一時的な感覚障害が行動や学習表現に恒久的な影響を及ぼす発達初期の期間である。
生物学的ネットワークと人工ネットワークの急激な違いにもかかわらず、両方のシステムで臨界学習期間が経験的に観察されている。
論文 参考訳(メタデータ) (2023-08-23T16:01:50Z) - Critical Learning Periods for Multisensory Integration in Deep Networks [112.40005682521638]
ニューラルネットワークが様々な情報源からの情報を統合する能力は、トレーニングの初期段階において、適切な相関した信号に晒されることに批判的になることを示す。
臨界周期は、訓練されたシステムとその学習された表現の最終性能を決定づける、複雑で不安定な初期過渡的ダイナミクスから生じることを示す。
論文 参考訳(メタデータ) (2022-10-06T23:50:38Z) - Toddler-Guidance Learning: Impacts of Critical Period on Multimodal AI
Agents [18.610737380842494]
我々は、AIエージェントの学習に臨界周期の概念を適用し、AIエージェントの仮想環境における臨界周期を調査する。
VECAツールキットを用いて幼児のような環境を構築し,幼児の学習特性を模倣する。
我々は、AIエージェントに対する臨界期間の影響を、ユニモーダル学習とマルチモーダル学習の両方において、どのように、いつ最も指導されるかという2つの視点から評価する。
論文 参考訳(メタデータ) (2022-01-12T10:57:40Z) - Persistent Reinforcement Learning via Subgoal Curricula [114.83989499740193]
VaPRL(Value-accelerated Persistent Reinforcement Learning)は、初期状態のカリキュラムを生成する。
VaPRLは、エピソード強化学習と比較して、3桁の精度で必要な介入を減らす。
論文 参考訳(メタデータ) (2021-07-27T16:39:45Z) - Deep Multi-task Learning for Depression Detection and Prediction in
Longitudinal Data [50.02223091927777]
うつ病は最も多い精神疾患の1つであり、世界中の年齢の何百万人もの人々に影響を与えている。
機械学習技術は、早期介入と治療のためのうつ病の自動検出と予測を可能にしている。
本稿では、この課題に対処するために、2つの補助的タスクでうつ病分類を共同最適化する、新しいディープマルチタスクリカレントニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2020-12-05T05:14:14Z) - Understanding the Role of Training Regimes in Continual Learning [51.32945003239048]
破滅的な忘れは、ニューラルネットワークのトレーニングに影響を与え、複数のタスクを逐次学習する能力を制限する。
本研究では,タスクの局所的なミニマを拡大するトレーニング体制の形成に及ぼすドロップアウト,学習速度の低下,バッチサイズの影響について検討した。
論文 参考訳(メタデータ) (2020-06-12T06:00:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。