Fugu-MT 論文翻訳(概要): Learning Dynamics of RNNs in Closed-Loop Environments

論文の概要: Learning Dynamics of RNNs in Closed-Loop Environments

arxiv url: http://arxiv.org/abs/2505.13567v1
Date: Mon, 19 May 2025 11:00:23 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-21 14:49:52.44746
Title: Learning Dynamics of RNNs in Closed-Loop Environments
Title（参考訳）: 閉ループ環境におけるRNNの学習ダイナミクス
Authors: Yoav Ger, Omri Barak,
Abstract要約: 神経科学にインスパイアされたタスクで訓練されたリカレントニューラルネットワーク(RNN)は、脳計算の強力なモデルを提供する。閉ループ文脈で学習した線形RNNの学習力学を記述する数学的理論を開発する。閉ループRNNの学習力学は,短期的政策改善とエージェント環境相互作用の長期的安定性の相互作用によって制御されることを示す。
参考スコア（独自算出の注目度）: 3.6218162133579703
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Recurrent neural networks (RNNs) trained on neuroscience-inspired tasks offer powerful models of brain computation. However, typical training paradigms rely on open-loop, supervised settings, whereas real-world learning unfolds in closed-loop environments. Here, we develop a mathematical theory describing the learning dynamics of linear RNNs trained in closed-loop contexts. We first demonstrate that two otherwise identical RNNs, trained in either closed- or open-loop modes, follow markedly different learning trajectories. To probe this divergence, we analytically characterize the closed-loop case, revealing distinct stages aligned with the evolution of the training loss. Specifically, we show that the learning dynamics of closed-loop RNNs, in contrast to open-loop ones, are governed by an interplay between two competing objectives: short-term policy improvement and long-term stability of the agent-environment interaction. Finally, we apply our framework to a realistic motor control task, highlighting its broader applicability. Taken together, our results underscore the importance of modeling closed-loop dynamics in a biologically plausible setting.
Abstract（参考訳）: 神経科学にインスパイアされたタスクで訓練されたリカレントニューラルネットワーク(RNN)は、脳計算の強力なモデルを提供する。しかし、典型的なトレーニングパラダイムは、クローズドループ環境において実際の学習が展開されるのに対して、オープンループ、教師付き設定に依存している。そこで我々は,閉ループ文脈で学習した線形RNNの学習力学を記述する数学的理論を開発した。まず、閉ループモードまたは開ループモードで訓練された2つの全く同じRNNが、明らかに異なる学習軌跡に従うことを実証した。このばらつきを解明するために,我々は閉ループのケースを解析的に特徴付け,トレーニング損失の進化に合わせた異なる段階を明らかにした。具体的には、閉ループRNNの学習力学は、オープンループとは対照的に、短期的政策改善とエージェント環境相互作用の長期的安定性という2つの競合する目的の相互作用によって支配されていることを示す。最後に、我々のフレームワークを現実的なモータ制御タスクに適用し、その適用性を強調します。本研究の結果は, 生物学的に妥当な環境下での閉ループ力学のモデル化の重要性を浮き彫りにしたものである。

関連論文リスト

Context Gating in Spiking Neural Networks: Achieving Lifelong Learning through Integration of Local and Global Plasticity [20.589970453110208]
ヒトは前頭前皮質(PFC)の文脈ゲーティング機構を通じて、最小の相互干渉で連続して複数のタスクを学習する本研究では,生涯学習のための局所可塑性規則(CG-SNN)によって訓練された文脈ゲーティングを用いたSNNを提案する。実験により,提案モデルは過去の学習経験を維持する上で有効であり,生涯学習における他の方法よりも優れたタスク選択性を有することが示された。
論文参考訳（メタデータ） (2024-06-04T01:35:35Z)
How Graph Neural Networks Learn: Lessons from Training Dynamics [80.41778059014393]
グラフニューラルネットワーク(GNN)の関数空間におけるトレーニングダイナミクスについて検討する。 GNNの勾配勾配勾配最適化は暗黙的にグラフ構造を利用して学習関数を更新する。この発見は、学習したGNN関数が一般化した時期と理由に関する新たな解釈可能な洞察を提供する。
論文参考訳（メタデータ） (2023-10-08T10:19:56Z)
Identifying Equivalent Training Dynamics [3.793387630509845]
共役および非共役のトレーニングダイナミクスを識別するフレームワークを開発する。クープマン作用素理論の進歩を利用して、クープマン固有値を比較することで、オンラインミラー降下とオンライン勾配降下の既知同値を正しく同定できることを実証する。 a)浅層ニューラルネットワークと広層ニューラルネットワークの間の非共役トレーニングダイナミクスの同定、(b)畳み込みニューラルネットワークにおけるトレーニングダイナミクスの初期段階の特徴付け、(c)グルーキングを行わないトランスフォーマーにおける非共役トレーニングダイナミクスの発見。
論文参考訳（メタデータ） (2023-02-17T22:15:20Z)
ConCerNet: A Contrastive Learning Based Framework for Automated Conservation Law Discovery and Trustworthy Dynamical System Prediction [82.81767856234956]
本稿では,DNNに基づく動的モデリングの信頼性を向上させるために,ConCerNetという新しい学習フレームワークを提案する。本手法は, 座標誤差と保存量の両方において, ベースラインニューラルネットワークよりも一貫して優れていることを示す。
論文参考訳（メタデータ） (2023-02-11T21:07:30Z)
Learning Dynamics and Generalization in Reinforcement Learning [59.530058000689884]
時間差学習は, エージェントが訓練の初期段階において, 値関数の非平滑成分を適合させるのに役立つことを理論的に示す。本研究では,高密度報酬タスクの時間差アルゴリズムを用いて学習したニューラルネットワークが,ランダムなネットワークや政策手法で学習した勾配ネットワークよりも,状態間の一般化が弱いことを示す。
論文参考訳（メタデータ） (2022-06-05T08:49:16Z)
The Three Stages of Learning Dynamics in High-Dimensional Kernel Methods [14.294357100033954]
我々は、SGDトレーニングニューラルネットワークの制限力学である、最小二乗目的のフローのトレーニング力学を考察する。 SGDはより複雑な関数を徐々に学習し、「深い勾配」現象が存在することを示す。
論文参考訳（メタデータ） (2021-11-13T18:29:36Z)
Do What Nature Did To Us: Evolving Plastic Recurrent Neural Networks For Task Generalization [38.83701855637824]
進化的プラスチックリカレントニューラルネットワーク(EPRNN)というフレームワークを提案する。 EPRNNは、進化戦略、塑性規則、再帰に基づく学習を1つのメタ学習フレームワークで構成し、異なるタスクに一般化する。 EPRNNの内ループでは,再帰学習機構を用いて塑性を鍛造することにより,長期記憶と短期記憶の両方を効果的に実現している。
論文参考訳（メタデータ） (2021-09-08T11:34:14Z)
A self consistent theory of Gaussian Processes captures feature learning effects in finite CNNs [2.28438857884398]
無限幅/チャネル制限のディープニューラルネットワーク(DNN)が最近注目を集めている。理論上の魅力にもかかわらず、この視点は有限DNNにおいて深層学習の重要な要素を欠いている。ここでは,大きなトレーニングセット上で雑音勾配勾配で訓練されたDNNを考察し,強い有限DNNと特徴学習効果を考慮した自己一貫したガウス過程理論を導出する。
論文参考訳（メタデータ） (2021-06-08T05:20:00Z)
Reinforcement Learning with External Knowledge by using Logical Neural Networks [67.46162586940905]
論理ニューラルネットワーク(LNN)と呼ばれる最近のニューラルシンボリックフレームワークは、ニューラルネットワークとシンボリックロジックの両方のキープロパティを同時に提供することができる。外部知識ソースからのモデルフリー強化学習を可能にする統合手法を提案する。
論文参考訳（メタデータ） (2021-03-03T12:34:59Z)
Learning to Continuously Optimize Wireless Resource In Episodically Dynamic Environment [55.91291559442884]
この研究は、データ駆動型手法が動的環境で継続的に学習し、最適化できる方法論を開発する。本稿では,無線システム学習のモデリングプロセスに連続学習の概念を構築することを提案する。我々の設計は、異なるデータサンプル間で「一定の公正性を保証する」新しいmin-maxの定式化に基づいている。
論文参考訳（メタデータ） (2020-11-16T08:24:34Z)
An Ode to an ODE [78.97367880223254]
我々は、O(d) 群上の行列フローに応じて主フローの時間依存パラメータが進化する ODEtoODE と呼ばれるニューラルODE アルゴリズムの新しいパラダイムを提案する。この2つの流れのネストされたシステムは、訓練の安定性と有効性を提供し、勾配の消滅・爆発問題を確実に解決する。
論文参考訳（メタデータ） (2020-06-19T22:05:19Z)
Recurrent Neural Network Learning of Performance and Intrinsic Population Dynamics from Sparse Neural Data [77.92736596690297]
本稿では,RNNの入出力動作だけでなく,内部ネットワークのダイナミクスも学習できる新しいトレーニング戦略を提案する。提案手法は、RNNを訓練し、生理学的にインスパイアされた神経モデルの内部ダイナミクスと出力信号を同時に再現する。注目すべきは、トレーニングアルゴリズムがニューロンの小さなサブセットの活性に依存する場合であっても、内部動力学の再現が成功することである。
論文参考訳（メタデータ） (2020-05-05T14:16:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。