Fugu-MT 論文翻訳(概要): Fast and Slow Learning of Recurrent Independent Mechanisms

論文の概要: Fast and Slow Learning of Recurrent Independent Mechanisms

arxiv url: http://arxiv.org/abs/2105.08710v1
Date: Tue, 18 May 2021 17:50:32 GMT
ステータス: 翻訳完了
システム内更新日: 2021-05-19 14:14:13.186101
Title: Fast and Slow Learning of Recurrent Independent Mechanisms
Title（参考訳）: 逐次独立メカニズムの高速・低速学習
Authors: Kanika Madan, Rosemary Nan Ke, Anirudh Goyal, Bernhard Bernhard Sch\"olkopf, Yoshua Bengio
Abstract要約: 本稿では,エージェントが必要とする知識の断片と報酬関数が定常的であり,タスク間で再利用可能なトレーニングフレームワークを提案する。注意メカニズムは、現在のタスクに適応できるモジュールを動的に選択します。提案するシステムのモジュール構造をメタ学習することで,強化学習環境における適応の高速化が期待できる。
参考スコア（独自算出の注目度）: 76.18301213803902
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Decomposing knowledge into interchangeable pieces promises a generalization advantage when there are changes in distribution. A learning agent interacting with its environment is likely to be faced with situations requiring novel combinations of existing pieces of knowledge. We hypothesize that such a decomposition of knowledge is particularly relevant for being able to generalize in a systematic manner to out-of-distribution changes. To study these ideas, we propose a particular training framework in which we assume that the pieces of knowledge an agent needs and its reward function are stationary and can be re-used across tasks. An attention mechanism dynamically selects which modules can be adapted to the current task, and the parameters of the selected modules are allowed to change quickly as the learner is confronted with variations in what it experiences, while the parameters of the attention mechanisms act as stable, slowly changing, meta-parameters. We focus on pieces of knowledge captured by an ensemble of modules sparsely communicating with each other via a bottleneck of attention. We find that meta-learning the modular aspects of the proposed system greatly helps in achieving faster adaptation in a reinforcement learning setup involving navigation in a partially observed grid world with image-level input. We also find that reversing the role of parameters and meta-parameters does not work nearly as well, suggesting a particular role for fast adaptation of the dynamically selected modules.
Abstract（参考訳）: 知識を交換可能な部品に分解することは、分布の変化がある場合に一般化の利点を約束する。環境と相互作用する学習エージェントは、既存の知識の新たな組み合わせを必要とする状況に直面しやすい。このような知識の分解は、分布外変化を体系的に一般化できる上で特に重要であると仮定する。そこで本研究では,エージェントが必要とする知識の一部と報酬関数が定常的であり,タスク間で再利用可能な,特定のトレーニングフレームワークを提案する。注意機構は、どのモジュールを現在のタスクに適応できるかを動的に選択し、選択したモジュールのパラメータは、学習者が経験する変化に直面すると迅速に変更でき、一方で注意機構のパラメータは安定してゆっくりと変化するメタパラメータとして動作する。我々は,注意のボトルネックを通じて相互に疎通するモジュール群が捉えた知識の断片に着目した。画像レベルの入力を伴う部分的に観測されたグリッドの世界におけるナビゲーションを含む強化学習装置において,提案方式のモジュール的側面をメタラーニングすることで,より高速な適応を実現することができる。また,パラメータとメタパラメータの役割を逆転させることは,動的に選択されたモジュールを高速に適応するための特別な役割を示唆する。

関連論文リスト

HyRet-Change: A hybrid retentive network for remote sensing change detection [14.46707519278272]
コンボリューションと保持機構の利点をシームレスに統合する,HyRet-Changeと呼ばれるシームズベースのフレームワークを提案する。具体的には,畳み込みとマルチヘッド保持機構の両面を利用した特徴差モジュールを提案する。 3つの挑戦的なCDデータセットの実験を行い、既存の手法と比較して最先端のパフォーマンスを実現した。
論文参考訳（メタデータ） (2025-06-15T13:14:55Z)
Adaptive Orchestration of Modular Generative Information Access Systems [59.102816309859584]
将来のモジュラー生成情報アクセスシステムのアーキテクチャは、単に強力なコンポーネントを組み立てるだけでなく、自己組織化システムを実現するだろう、と我々は主張する。この観点は、IRコミュニティに適応的で自己最適化的で将来的なアーキテクチャを開発するためのモジュラーシステム設計を再考するよう促す。
論文参考訳（メタデータ） (2025-04-24T11:35:43Z)
Automation and Feature Selection Enhancement with Reinforcement Learning (RL) [0.0]
決定木と統合された強化学習は、特徴知識、状態表現、選択効率を向上させる。モンテカルロをベースとした単エージェント特徴選択法である強化特徴選択(MCRFS)は計算負担を軽減する。機能とインスタンスをまとめて選択し、それら間のインタラクションをキャプチャする、デュアルエージェントのRLフレームワークも導入された。
論文参考訳（メタデータ） (2025-03-15T04:30:55Z)
MergeNet: Knowledge Migration across Heterogeneous Models, Tasks, and Modalities [72.68829963458408]
異種モデルのパラメータ空間のギャップを埋めることを学ぶMergeNetを提案する。 MergeNetの中核となるメカニズムはパラメータアダプタにあり、ソースモデルの低ランクパラメータをクエリすることで動作する。 MergeNetは両方のモデルと共に学習され、我々のフレームワークは、現在のステージに関する知識を動的に転送し、適応することができます。
論文参考訳（メタデータ） (2024-04-20T08:34:39Z)
Interactive Continual Learning: Fast and Slow Thinking [19.253164551254734]
本稿では,対話型連続学習フレームワークを提案する。 System1におけるメモリ検索を改善するために,von Mises-Fisher(vMF)分布に基づくCL-vMF機構を導入する。提案したICLの包括的評価は,既存の手法と比較して,忘れられ,優れた性能を示す。
論文参考訳（メタデータ） (2024-03-05T03:37:28Z)
What the Weight?! A Unified Framework for Zero-Shot Knowledge Composition [20.742004197901576]
ゼロショットモジュール合成のための新しいフレームワークを提案し,パラメータモジュールの選択,重み付け,結合のための,既存およびいくつかの新しいバリエーションを包含する。各種ゼロショット知識合成戦略の総合的なベンチマーク研究を行う。本研究の結果は,アンサンブルの有効性を浮き彫りにしただけでなく,単純な重み付け手法の威力を示唆するものである。
論文参考訳（メタデータ） (2024-01-23T13:35:47Z)
MetaModulation: Learning Variational Feature Hierarchies for Few-Shot Learning with Fewer Tasks [63.016244188951696]
本稿では,タスクを減らした少数ショット学習手法を提案する。メタトレーニングタスクを増やすために、さまざまなバッチレベルでパラメータを変更します。また,変分法を取り入れた学習的変分特徴階層も導入する。
論文参考訳（メタデータ） (2023-05-17T15:47:47Z)
Modular Deep Learning [120.36599591042908]
トランスファーラーニングは近年、機械学習の主要なパラダイムとなっている。負の干渉を伴わずに複数のタスクを専門とするモデルを開発する方法はまだ不明である。これらの課題に対する有望な解決策として、モジュール型ディープラーニングが登場した。
論文参考訳（メタデータ） (2023-02-22T18:11:25Z)
Learning an Explicit Hyperparameter Prediction Function Conditioned on Tasks [62.63852372239708]
メタ学習は、観察されたタスクから機械学習の学習方法論を学び、新しいクエリタスクに一般化することを目的としている。我々は、これらの学習手法を、全てのトレーニングタスクで共有される明示的なハイパーパラメータ予測関数の学習として解釈する。このような設定は、メタ学習方法論が多様なクエリタスクに柔軟に適合できることを保証する。
論文参考訳（メタデータ） (2021-07-06T04:05:08Z)
Behavior Priors for Efficient Reinforcement Learning [97.81587970962232]
本稿では,情報とアーキテクチャの制約を,確率論的モデリング文献のアイデアと組み合わせて行動の事前学習を行う方法について考察する。このような潜伏変数の定式化が階層的強化学習(HRL)と相互情報と好奇心に基づく目的との関係について論じる。シミュレーションされた連続制御領域に適用することで,フレームワークの有効性を実証する。
論文参考訳（メタデータ） (2020-10-27T13:17:18Z)
A Combinatorial Perspective on Transfer Learning [27.7848044115664]
モジュラーソリューションの学習によって、目に見えない分散データと潜在的に異なる分散データの両方を効果的に一般化することができるかを検討する。タスクセグメンテーション,モジュール型学習,メモリベースアンサンブルの組み合わせによって,指数関数的に増加する多くの未確認タスクの一般化がもたらされる。
論文参考訳（メタデータ） (2020-10-23T09:53:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。