論文の概要: Infant Spontaneous Movement Noise Improves Exploration in Deep RL
- arxiv url: http://arxiv.org/abs/2606.16590v2
- Date: Tue, 16 Jun 2026 02:50:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 15:01:46.829787
- Title: Infant Spontaneous Movement Noise Improves Exploration in Deep RL
- Title(参考訳): 乳児の自然運動騒音は深部RLの探索を改善する
- Authors: Francisco M. López, Markus R. Ernst, Francisco Cruz, Matej Hoffmann, and Jochen Triesch,
- Abstract要約: 乳児の自然運動に触発された行動雑音が深部RLの探索を改善するか否かを検討した。
本稿では,RL訓練中の探査騒音の時間的自己相関を徐々に高めるメカニズムを提案する。
以上の結果から,ヒトの運動・認知発達は,人工エージェントの学習機構設計に有用であることが示唆された。
- 参考スコア(独自算出の注目度): 4.91183223855466
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Exploration in deep reinforcement learning (RL) is commonly implemented as temporally uncorrelated white noise. However, recent works show that temporally correlated colored noise can improve exploration efficiency by producing smooth trajectories with better coverage of the state space. We inquire whether action noise inspired by infant spontaneous movements can also improve exploration in deep RL. We find that the power spectral densities of babies' end-effector velocities follow a colored noise process where the spectral exponent increases with age. Inspired by this developmental pattern, we introduce a mechanism that progressively increases the temporal auto-correlation of exploration noise during RL training, matching the infant statistics. Experiments across several RL environments show that infant-inspired noise produces structured exploratory behavior and can improve learning efficiency compared to conventional exploration strategies. These findings suggest that human motor and cognitive development can provide useful guidance for designing learning mechanisms in artificial agents. Our code is available at https://github.com/trieschlab/baby-noise-rl.
- Abstract(参考訳): 深部強化学習(RL)の探索は、時間的に非相関な白色雑音として一般的に実施されている。
しかし、近年の研究では、時間的に相関した色のノイズが、状態空間をよりよくカバーした滑らかな軌跡を発生させることで、探索効率を向上させることが示されている。
乳児の自然運動に触発された行動雑音が深部RLの探索を改善できるかどうかを問う。
乳児の終末エフェクター速度のパワースペクトル密度は、スペクトル指数が年齢とともに増加する色付きノイズ過程に従うことが判明した。
この発達パターンに着想を得て,幼児の統計値に適合して,RL訓練中の探索音の時間的自己相関を徐々に高めるメカニズムを導入する。
いくつかのRL環境における実験により、幼児にインスパイアされたノイズは、構造化された探索行動をもたらし、従来の探索戦略と比較して学習効率を向上させることが示されている。
これらの結果から,ヒトの運動・認知発達が,人工エージェントの学習機構設計に有用であることが示唆された。
私たちのコードはhttps://github.com/trieschlab/baby-noise-rl.comで利用可能です。
関連論文リスト
- Variable-Agnostic Causal Exploration for Reinforcement Learning [56.52768265734155]
強化学習のための新しいフレームワークVACERL(Variable-Agnostic Causal Exploration for Reinforcement Learning)を導入する。
本手法は,注目機構を用いて,重要変数に関連する重要な観測行動ステップを自動的に同定する。
これらのステップを接続する因果グラフを構築し、エージェントをタスク完了に対する因果的影響の大きい観察-作用ペアへと導く。
論文 参考訳(メタデータ) (2024-07-17T09:45:27Z) - Chaos-based reinforcement learning with TD3 [1.376408511310322]
カオスに基づく強化学習(CBRL)は、エージェントの内部カオス力学が探索を促進する方法である。
この研究は、最先端の深層強化学習アルゴリズムの一つであるTD3(Twin Delayed Deep Deterministic Policy Gradients)を導入した。
論文 参考訳(メタデータ) (2024-05-15T04:47:31Z) - Noisy Spiking Actor Network for Exploration [56.13654667729119]
スパイキングニューラルネットワーク(SNN)はノイズに対して強い堅牢性を持ち、局所的な障害による効率的な探索を実現することは困難である。
本稿では,充電・送信中の時間関連ノイズを発生させるノイズの多いスパイクアクタネットワーク(ノイズSAN)を提案する。
本手法は,OpenAI体育館の多種多様な連続制御タスクにおいて,最先端の性能を向上する。
論文 参考訳(メタデータ) (2024-03-07T02:47:08Z) - Butterfly Effects of SGD Noise: Error Amplification in Behavior Cloning
and Autoregression [70.78523583702209]
深層ニューラルネットワークを用いた行動クローニングの訓練不安定性について検討した。
トレーニング中のSGD更新の最小化は,長期的報奨の急激な振動をもたらすことが観察された。
論文 参考訳(メタデータ) (2023-10-17T17:39:40Z) - Latent Exploration for Reinforcement Learning [87.42776741119653]
強化学習では、エージェントは環境を探索し、相互作用することでポリシーを学ぶ。
LATent TIme-Correlated Exploration (Lattice)を提案する。
論文 参考訳(メタデータ) (2023-05-31T17:40:43Z) - On the Theoretical Properties of Noise Correlation in Stochastic
Optimization [6.970991851511823]
PGDとアンチPGDに比較して,fPGDは探索能力を有することを示す。
これらの結果は、機械学習モデルにノイズを利用する新しい方法へとフィールドを開放する。
論文 参考訳(メタデータ) (2022-09-19T16:32:22Z) - Learning Causal Overhypotheses through Exploration in Children and
Computational Models [4.957184316605402]
制御可能な因果構造を持つ新しい強化学習環境を提案する。
本研究では, 因果環境における情報ゲイン最適RL探索と, 同一環境における子どもの探索との間に有意な差異があることを実証した。
論文 参考訳(メタデータ) (2022-02-21T18:43:58Z) - Exploration With a Finite Brain [0.0]
人間は探検と搾取のトレードオフを懸命に管理しているようだ。
本稿では,メタラーニング強化学習アルゴリズムを用いて,短い記述長で性能を犠牲にする仮説について検討する。
さらに、記述長の変化が意図した効果をもたらすことを実証する。記述長の減少は、脳卒中患者の振る舞いを捉えながら、青年期の認知発達を反映する。
論文 参考訳(メタデータ) (2022-01-27T21:49:52Z) - Noisy Agents: Self-supervised Exploration by Predicting Auditory Events [127.82594819117753]
本稿では, エージェントが行動の因果的影響を理解することを奨励する, 強化学習(Reinforcement Learning, RL)の本質的なモチベーションを提案する。
ニューラルネットワークを用いて聴覚事象を予測し、予測誤差を本質的な報奨として利用し、RL探索を誘導する。
Atariゲームの実験結果から、我々の新しい本質的な動機は、最先端のベースラインを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2020-07-27T17:59:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。