論文の概要: Mastering Rate based Curriculum Learning
- arxiv url: http://arxiv.org/abs/2008.06456v1
- Date: Fri, 14 Aug 2020 16:34:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-30 16:53:11.309950
- Title: Mastering Rate based Curriculum Learning
- Title(参考訳): 指導率に基づくカリキュラム学習
- Authors: Lucas Willems, Salem Lahlou, Yoshua Bengio
- Abstract要約: 学習の進行という概念には、学習者のサンプル効率の低下につながるいくつかの欠点があると主張する。
本稿では,習得率の概念に基づく新しいアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 78.45222238426246
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent automatic curriculum learning algorithms, and in particular
Teacher-Student algorithms, rely on the notion of learning progress, making the
assumption that the good next tasks are the ones on which the learner is making
the fastest progress or digress. In this work, we first propose a simpler and
improved version of these algorithms. We then argue that the notion of learning
progress itself has several shortcomings that lead to a low sample efficiency
for the learner. We finally propose a new algorithm, based on the notion of
mastering rate, that significantly outperforms learning progress-based
algorithms.
- Abstract(参考訳): 最近の自動カリキュラム学習アルゴリズム、特にTeacher-Studentアルゴリズムは、学習の進行という概念に依存しており、次の良いタスクは学習者が最速の進歩または進歩を成し遂げるものであると仮定している。
そこで本研究では,まずこれらのアルゴリズムの簡易化と改良版を提案する。
次に,学習の進行という概念には,学習者のサンプル効率の低下につながるいくつかの欠点があることを論じる。
そこで我々は,学習進歩に基づくアルゴリズムを著しく上回る,マスタリング率の概念に基づく新しいアルゴリズムを提案する。
関連論文リスト
- Dual Algorithmic Reasoning [9.701208207491879]
本稿では,基礎となるアルゴリズム問題の双対性を利用してアルゴリズムを学習することを提案する。
アルゴリズム学習における最適化問題の2つの定義を同時に学習することで、より良い学習が可能になることを実証する。
次に、難易度の高い脳血管分類タスクにデプロイすることで、二元アルゴリズム推論の現実的な実用性を検証する。
論文 参考訳(メタデータ) (2023-02-09T08:46:23Z) - A Generalist Neural Algorithmic Learner [18.425083543441776]
我々は、幅広いアルゴリズムを実行することを学習できる単一のグラフニューラルネットワークプロセッサを構築している。
マルチタスク方式でアルゴリズムを効果的に学習できることを示す。
論文 参考訳(メタデータ) (2022-09-22T16:41:33Z) - Tree-Based Adaptive Model Learning [62.997667081978825]
我々はKearns-Vazirani学習アルゴリズムを拡張し、時間とともに変化するシステムを扱う。
本稿では,学習前の動作を再利用し,更新し,LearnerLibライブラリに実装し,大規模な実例で評価する学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-31T21:24:22Z) - Learning the Quality of Machine Permutations in Job Shop Scheduling [9.972171952370287]
機械の順列の質を予測することを目的とした新しい教師付き学習タスクを提案する。
そして、我々は、正確な逐次深層学習モデルを作成することができるような、この品質を推定する独自の方法論を設計する。
論文 参考訳(メタデータ) (2022-07-07T11:53:10Z) - Selective Credit Assignment [57.41789233550586]
選択的クレジット代入のための時間差アルゴリズムについて統一的な視点を述べる。
価値に基づく学習と計画アルゴリズムへの重み付けの適用に関する洞察を提供する。
論文 参考訳(メタデータ) (2022-02-20T00:07:57Z) - How to transfer algorithmic reasoning knowledge to learn new algorithms? [23.335939830754747]
我々は,実行トレースにアクセス可能なアルゴリズムを用いて,そうでない同様のタスクを解く方法について検討する。
9つのアルゴリズムと3つの異なるグラフタイプを含むデータセットを作成します。
我々はこれを実証的に検証し、その代わりにマルチタスク学習を用いてアルゴリズム推論知識の伝達を実現する方法を示す。
論文 参考訳(メタデータ) (2021-10-26T22:14:47Z) - The Information Geometry of Unsupervised Reinforcement Learning [133.20816939521941]
教師なしスキル発見(英語: Unsupervised skill discovery)とは、報酬関数にアクセスせずに一連のポリシーを学ぶアルゴリズムのクラスである。
教師なしのスキル発見アルゴリズムは、あらゆる報酬関数に最適なスキルを学習しないことを示す。
論文 参考訳(メタデータ) (2021-10-06T13:08:36Z) - Evolving Reinforcement Learning Algorithms [186.62294652057062]
メタラーニング強化学習アルゴリズムの手法を提案する。
学習アルゴリズムはドメインに依存しないため、トレーニング中に見えない新しい環境に一般化することができる。
従来の制御タスク、gridworld型タスク、atariゲームよりも優れた一般化性能を得る2つの学習アルゴリズムに注目した。
論文 参考訳(メタデータ) (2021-01-08T18:55:07Z) - Meta-learning with Stochastic Linear Bandits [120.43000970418939]
我々は、よく知られたOFULアルゴリズムの正規化バージョンを実装するバンディットアルゴリズムのクラスを考える。
我々は,タスク数の増加とタスク分散の分散が小さくなると,タスクを個別に学習する上で,我々の戦略が大きな優位性を持つことを理論的および実験的に示す。
論文 参考訳(メタデータ) (2020-05-18T08:41:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。