論文の概要: On the Importance of Critical Period in Multi-stage Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2208.04832v1
- Date: Tue, 9 Aug 2022 15:17:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-08-10 12:06:17.106341
- Title: On the Importance of Critical Period in Multi-stage Reinforcement
Learning
- Title(参考訳): 多段階強化学習における臨界期間の重要性について
- Authors: Junseok Park, Inwoo Hwang, Min Whoo Lee, Hyunseok Oh, Minsu Lee,
Youngki Lee, Byoung-Tak Zhang
- Abstract要約: 近年の研究では、AIエージェントが人間の臨界期に似た学習期間を示した。
適切な刺激を見つけることを強調するため,多段階強化学習を提案する。
- 参考スコア(独自算出の注目度): 18.610737380842494
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The initial years of an infant's life are known as the critical period,
during which the overall development of learning performance is significantly
impacted due to neural plasticity. In recent studies, an AI agent, with a deep
neural network mimicking mechanisms of actual neurons, exhibited a learning
period similar to human's critical period. Especially during this initial
period, the appropriate stimuli play a vital role in developing learning
ability. However, transforming human cognitive bias into an appropriate shaping
reward is quite challenging, and prior works on critical period do not focus on
finding the appropriate stimulus. To take a step further, we propose
multi-stage reinforcement learning to emphasize finding ``appropriate stimulus"
around the critical period. Inspired by humans' early cognitive-developmental
stage, we use multi-stage guidance near the critical period, and demonstrate
the appropriate shaping reward (stage-2 guidance) in terms of the AI agent's
performance, efficiency, and stability.
- Abstract(参考訳): 幼児の人生の初期は臨界期と呼ばれ、その間に学習性能の全体的な発達は神経可塑性によって著しく影響を受ける。
近年の研究では、実際のニューロンのメカニズムを模倣するディープニューラルネットワークを持つAIエージェントが、人間の臨界期に似た学習期間を示した。
特にこの初期の段階では、適切な刺激が学習能力の発達に重要な役割を果たす。
しかし、人間の認知バイアスを適切な形状の報酬に変換することは極めて困難であり、臨界期以前の研究は適切な刺激を見つけることに集中していない。
さらに, 臨界期における「適切な刺激」の発見を重視した多段階強化学習を提案する。
人間の初期認知発達段階にインスパイアされた我々は、臨界期に近い多段階ガイダンスを使用し、AIエージェントの性能、効率、安定性の観点から適切な形状報酬(ステージ2ガイダンス)を実証する。
関連論文リスト
- Early Detection of Cognitive Impairment in Elderly using a Passive FPVS-EEG BCI and Machine Learning -- Extended Version [1.3499500088995462]
初期の認知症診断には、構造的および機能的脳の変化の両方に敏感なバイオマーカーが必要である。
現在の認知評価は、しばしば行動反応に依存しており、努力、実践効果、教育的背景といった要因に影響を受けやすい。
この研究は、脳波(EEG)データから直接認知障害レベルを推測するために、軽量畳み込みニューラルネットワーク(CNN)を活用する、新しいアプローチを導入している。
論文 参考訳(メタデータ) (2025-04-15T08:34:13Z) - On the Cone Effect in the Learning Dynamics [57.02319387815831]
実世界の環境でのニューラルネットワークの学習力学を実証的に研究する。
第一相ではeNTKが著しく進化し、第二相ではeNTKが、第二相ではeNTKは進化し続けるが、狭い空間では制約される。
論文 参考訳(メタデータ) (2025-03-20T16:38:25Z) - Beyond Performance Scores: Directed Functional Connectivity as a Brain-Based Biomarker for Motor Skill Learning and Retention [0.0]
手術、ロボット工学、スポーツなどの分野でのモータースキル獲得には、広範なトレーニングを通じて複雑なタスクシーケンスを学習する必要がある。
実行時間やエラー率といった従来のパフォーマンス指標は、スキル学習と保持の基礎となる神経メカニズムを捕捉できないため、限られた洞察を提供する。
本研究は,脳波から誘導される指向性機能接続(dFC)を,運動能力の学習と保持を評価する新しい脳バイオマーカーとして紹介する。
論文 参考訳(メタデータ) (2025-02-20T16:55:08Z) - Enhancing Autism Spectrum Disorder Early Detection with the Parent-Child Dyads Block-Play Protocol and an Attention-enhanced GCN-xLSTM Hybrid Deep Learning Framework [6.785167067600156]
本研究は,ASDと発達幼児を区別する行動パターンを識別するための,親子ダイズブロックプレイ(PCB)プロトコルを提案する。
40人のASDと89人のTD幼児が親とのブロックプレイに従事している。
このデータセットは、参加者の規模と個々のセッションの長さの両方に関する以前の取り組みを上回る。
論文 参考訳(メタデータ) (2024-08-29T21:53:01Z) - Early Period of Training Impacts Adaptation for Out-of-Distribution Generalization: An Empirical Study [56.283944756315066]
本稿では,学習力学,分布外一般化,ニューラルネットワークトレーニングの初期段階との関係について検討する。
トレーニングの初期においてトレーニング可能なパラメータの数を変更することで,OODの結果が大幅に改善できることが示唆された。
画像データとテキストデータの両方で実験したところ、訓練の初期段階は、IDとOODのパフォーマンスを最小限の複雑さで改善できる一般的な現象であることがわかった。
論文 参考訳(メタデータ) (2024-03-22T13:52:53Z) - Critical Learning Periods Emerge Even in Deep Linear Networks [102.89011295243334]
クリティカルラーニング期間(Critical Learning periods)は、一時的な感覚障害が行動や学習表現に恒久的な影響を及ぼす発達初期の期間である。
生物学的ネットワークと人工ネットワークの急激な違いにもかかわらず、両方のシステムで臨界学習期間が経験的に観察されている。
論文 参考訳(メタデータ) (2023-08-23T16:01:50Z) - Critical Learning Periods for Multisensory Integration in Deep Networks [112.40005682521638]
ニューラルネットワークが様々な情報源からの情報を統合する能力は、トレーニングの初期段階において、適切な相関した信号に晒されることに批判的になることを示す。
臨界周期は、訓練されたシステムとその学習された表現の最終性能を決定づける、複雑で不安定な初期過渡的ダイナミクスから生じることを示す。
論文 参考訳(メタデータ) (2022-10-06T23:50:38Z) - From Psychological Curiosity to Artificial Curiosity: Curiosity-Driven
Learning in Artificial Intelligence Tasks [56.20123080771364]
心理学的好奇心は、探索と情報取得を通じて学習を強化するために、人間の知性において重要な役割を果たす。
人工知能(AI)コミュニティでは、人工好奇心は効率的な学習に自然な本質的な動機を与える。
CDLはますます人気を博し、エージェントは新たな知識を学習するために自己動機付けされている。
論文 参考訳(メタデータ) (2022-01-20T17:07:03Z) - Toddler-Guidance Learning: Impacts of Critical Period on Multimodal AI
Agents [18.610737380842494]
我々は、AIエージェントの学習に臨界周期の概念を適用し、AIエージェントの仮想環境における臨界周期を調査する。
VECAツールキットを用いて幼児のような環境を構築し,幼児の学習特性を模倣する。
我々は、AIエージェントに対する臨界期間の影響を、ユニモーダル学習とマルチモーダル学習の両方において、どのように、いつ最も指導されるかという2つの視点から評価する。
論文 参考訳(メタデータ) (2022-01-12T10:57:40Z) - Persistent Reinforcement Learning via Subgoal Curricula [114.83989499740193]
VaPRL(Value-accelerated Persistent Reinforcement Learning)は、初期状態のカリキュラムを生成する。
VaPRLは、エピソード強化学習と比較して、3桁の精度で必要な介入を減らす。
論文 参考訳(メタデータ) (2021-07-27T16:39:45Z) - Deep Multi-task Learning for Depression Detection and Prediction in
Longitudinal Data [50.02223091927777]
うつ病は最も多い精神疾患の1つであり、世界中の年齢の何百万人もの人々に影響を与えている。
機械学習技術は、早期介入と治療のためのうつ病の自動検出と予測を可能にしている。
本稿では、この課題に対処するために、2つの補助的タスクでうつ病分類を共同最適化する、新しいディープマルチタスクリカレントニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2020-12-05T05:14:14Z) - Understanding the Role of Training Regimes in Continual Learning [51.32945003239048]
破滅的な忘れは、ニューラルネットワークのトレーニングに影響を与え、複数のタスクを逐次学習する能力を制限する。
本研究では,タスクの局所的なミニマを拡大するトレーニング体制の形成に及ぼすドロップアウト,学習速度の低下,バッチサイズの影響について検討した。
論文 参考訳(メタデータ) (2020-06-12T06:00:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。