論文の概要: On the Importance of Critical Period in Multi-stage Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2208.04832v1
- Date: Tue, 9 Aug 2022 15:17:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-10 12:06:17.106341
- Title: On the Importance of Critical Period in Multi-stage Reinforcement
Learning
- Title(参考訳): 多段階強化学習における臨界期間の重要性について
- Authors: Junseok Park, Inwoo Hwang, Min Whoo Lee, Hyunseok Oh, Minsu Lee,
Youngki Lee, Byoung-Tak Zhang
- Abstract要約: 近年の研究では、AIエージェントが人間の臨界期に似た学習期間を示した。
適切な刺激を見つけることを強調するため,多段階強化学習を提案する。
- 参考スコア(独自算出の注目度): 18.610737380842494
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The initial years of an infant's life are known as the critical period,
during which the overall development of learning performance is significantly
impacted due to neural plasticity. In recent studies, an AI agent, with a deep
neural network mimicking mechanisms of actual neurons, exhibited a learning
period similar to human's critical period. Especially during this initial
period, the appropriate stimuli play a vital role in developing learning
ability. However, transforming human cognitive bias into an appropriate shaping
reward is quite challenging, and prior works on critical period do not focus on
finding the appropriate stimulus. To take a step further, we propose
multi-stage reinforcement learning to emphasize finding ``appropriate stimulus"
around the critical period. Inspired by humans' early cognitive-developmental
stage, we use multi-stage guidance near the critical period, and demonstrate
the appropriate shaping reward (stage-2 guidance) in terms of the AI agent's
performance, efficiency, and stability.
- Abstract(参考訳): 幼児の人生の初期は臨界期と呼ばれ、その間に学習性能の全体的な発達は神経可塑性によって著しく影響を受ける。
近年の研究では、実際のニューロンのメカニズムを模倣するディープニューラルネットワークを持つAIエージェントが、人間の臨界期に似た学習期間を示した。
特にこの初期の段階では、適切な刺激が学習能力の発達に重要な役割を果たす。
しかし、人間の認知バイアスを適切な形状の報酬に変換することは極めて困難であり、臨界期以前の研究は適切な刺激を見つけることに集中していない。
さらに, 臨界期における「適切な刺激」の発見を重視した多段階強化学習を提案する。
人間の初期認知発達段階にインスパイアされた我々は、臨界期に近い多段階ガイダンスを使用し、AIエージェントの性能、効率、安定性の観点から適切な形状報酬(ステージ2ガイダンス)を実証する。
関連論文リスト
- Enhancing Autism Spectrum Disorder Early Detection with the Parent-Child Dyads Block-Play Protocol and an Attention-enhanced GCN-xLSTM Hybrid Deep Learning Framework [6.785167067600156]
本研究は,ASDと発達幼児を区別する行動パターンを識別するための,親子ダイズブロックプレイ(PCB)プロトコルを提案する。
40人のASDと89人のTD幼児が親とのブロックプレイに従事している。
このデータセットは、参加者の規模と個々のセッションの長さの両方に関する以前の取り組みを上回る。
論文 参考訳(メタデータ) (2024-08-29T21:53:01Z) - Critical Learning Periods Emerge Even in Deep Linear Networks [102.89011295243334]
クリティカルラーニング期間(Critical Learning periods)は、一時的な感覚障害が行動や学習表現に恒久的な影響を及ぼす発達初期の期間である。
生物学的ネットワークと人工ネットワークの急激な違いにもかかわらず、両方のシステムで臨界学習期間が経験的に観察されている。
論文 参考訳(メタデータ) (2023-08-23T16:01:50Z) - Critical Learning Periods for Multisensory Integration in Deep Networks [112.40005682521638]
ニューラルネットワークが様々な情報源からの情報を統合する能力は、トレーニングの初期段階において、適切な相関した信号に晒されることに批判的になることを示す。
臨界周期は、訓練されたシステムとその学習された表現の最終性能を決定づける、複雑で不安定な初期過渡的ダイナミクスから生じることを示す。
論文 参考訳(メタデータ) (2022-10-06T23:50:38Z) - From Psychological Curiosity to Artificial Curiosity: Curiosity-Driven
Learning in Artificial Intelligence Tasks [56.20123080771364]
心理学的好奇心は、探索と情報取得を通じて学習を強化するために、人間の知性において重要な役割を果たす。
人工知能(AI)コミュニティでは、人工好奇心は効率的な学習に自然な本質的な動機を与える。
CDLはますます人気を博し、エージェントは新たな知識を学習するために自己動機付けされている。
論文 参考訳(メタデータ) (2022-01-20T17:07:03Z) - Toddler-Guidance Learning: Impacts of Critical Period on Multimodal AI
Agents [18.610737380842494]
我々は、AIエージェントの学習に臨界周期の概念を適用し、AIエージェントの仮想環境における臨界周期を調査する。
VECAツールキットを用いて幼児のような環境を構築し,幼児の学習特性を模倣する。
我々は、AIエージェントに対する臨界期間の影響を、ユニモーダル学習とマルチモーダル学習の両方において、どのように、いつ最も指導されるかという2つの視点から評価する。
論文 参考訳(メタデータ) (2022-01-12T10:57:40Z) - Persistent Reinforcement Learning via Subgoal Curricula [114.83989499740193]
VaPRL(Value-accelerated Persistent Reinforcement Learning)は、初期状態のカリキュラムを生成する。
VaPRLは、エピソード強化学習と比較して、3桁の精度で必要な介入を減らす。
論文 参考訳(メタデータ) (2021-07-27T16:39:45Z) - Deep Multi-task Learning for Depression Detection and Prediction in
Longitudinal Data [50.02223091927777]
うつ病は最も多い精神疾患の1つであり、世界中の年齢の何百万人もの人々に影響を与えている。
機械学習技術は、早期介入と治療のためのうつ病の自動検出と予測を可能にしている。
本稿では、この課題に対処するために、2つの補助的タスクでうつ病分類を共同最適化する、新しいディープマルチタスクリカレントニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2020-12-05T05:14:14Z) - Understanding the Role of Training Regimes in Continual Learning [51.32945003239048]
破滅的な忘れは、ニューラルネットワークのトレーニングに影響を与え、複数のタスクを逐次学習する能力を制限する。
本研究では,タスクの局所的なミニマを拡大するトレーニング体制の形成に及ぼすドロップアウト,学習速度の低下,バッチサイズの影響について検討した。
論文 参考訳(メタデータ) (2020-06-12T06:00:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。