論文の概要: Skillearn: Machine Learning Inspired by Humans' Learning Skills
- arxiv url: http://arxiv.org/abs/2012.04863v2
- Date: Fri, 12 Mar 2021 06:38:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-16 12:40:17.140691
- Title: Skillearn: Machine Learning Inspired by Humans' Learning Skills
- Title(参考訳): Skillearn: 人間の学習スキルに触発された機械学習
- Authors: Pengtao Xie, Xuefeng Du, Hao Ban
- Abstract要約: 私たちは、機械の学習を助けるために人間の学習スキルを借りることができるかどうかを調べることに興味があります。
具体的には、これらのスキルを形式化し、より良い機械学習(ML)モデルのトレーニングに活用することを目指しています。
この目標を達成するために、人間の学習スキルを数学的に表現する原則的な方法を提供する一般的なフレームワークであるSkillearnを開発した。
2つのケーススタディでは、Skillearnを使用して人間の2つの学習スキルを形式化します。テストをパスして学習をインターリーブし、形式化されたスキルを使用して神経アーキテクチャ検索を改善します。
- 参考スコア(独自算出の注目度): 15.125072827275766
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Humans, as the most powerful learners on the planet, have accumulated a lot
of learning skills, such as learning through tests, interleaving learning,
self-explanation, active recalling, to name a few. These learning skills and
methodologies enable humans to learn new topics more effectively and
efficiently. We are interested in investigating whether humans' learning skills
can be borrowed to help machines to learn better. Specifically, we aim to
formalize these skills and leverage them to train better machine learning (ML)
models. To achieve this goal, we develop a general framework -- Skillearn,
which provides a principled way to represent humans' learning skills
mathematically and use the formally-represented skills to improve the training
of ML models. In two case studies, we apply Skillearn to formalize two learning
skills of humans: learning by passing tests and interleaving learning, and use
the formalized skills to improve neural architecture search. Experiments on
various datasets show that trained using the skills formalized by Skillearn, ML
models achieve significantly better performance.
- Abstract(参考訳): 人間は、地球上でもっとも強力な学習者として、テストによる学習、インターリーブ学習、自己説明、アクティブリコールなど、多くの学習スキルを蓄積しています。
これらの学習スキルと方法論により、人間は新しいトピックをより効率的に学習することができる。
私たちは、機械の学習を支援するために人間の学習スキルを借用できるかどうか調査することに興味を持っています。
具体的には、これらのスキルを形式化し、機械学習(ML)モデルのトレーニングに活用することを目指している。
この目標を達成するために、人間の学習スキルを数学的に表現し、形式的に表現されたスキルを用いてMLモデルのトレーニングを改善するための原則的な方法を提供する一般的なフレームワークであるSkillearnを開発する。
2つのケーススタディにおいて、skillearnを人間の2つの学習スキルの形式化に応用した。
さまざまなデータセットの実験では、Skillearnによって形式化されたスキルを使用してトレーニングされたMLモデルは、はるかに優れたパフォーマンスを実現している。
関連論文リスト
- Dynamic Skill Adaptation for Large Language Models [78.31322532135272]
動的スキル適応(Dynamic Skill Adaptation, DSA)は, 言語モデル(LLM)に新しい複雑なスキルを適応させる適応的かつ動的フレームワークである。
各スキルに対して,学習前スキルの詳細な記述を含む教科書的データと,学習前スキルの具体的活用を目標とした演習的データの両方を生成する。
LLAMA や Mistral のような大規模言語モデルを用いた実験は,提案手法が数学推論スキルや社会学習スキルに適応する上で有効であることを示す。
論文 参考訳(メタデータ) (2024-12-26T22:04:23Z) - MaestroMotif: Skill Design from Artificial Intelligence Feedback [67.17724089381056]
MaestroMotifはAI支援スキルデザインの手法であり、高性能で適応可能なエージェントを生成する。
本稿では,AIを活用したスキルデザイン手法であるMaestroMotifについて述べる。
論文 参考訳(メタデータ) (2024-12-11T16:59:31Z) - Unsupervised Skill Discovery for Robotic Manipulation through Automatic Task Generation [17.222197596599685]
本稿では,多数の自律的タスクを解くことで構成可能な振る舞いを発見するスキル学習手法を提案する。
本手法は,ロボットが環境内の物体と連続的かつ堅牢に対話することを可能にするスキルを学習する。
学習したスキルは、シミュレーションだけでなく、本物のロボットプラットフォーム上でも、目に見えない操作タスクのセットを解決するために使用できる。
論文 参考訳(メタデータ) (2024-10-07T09:19:13Z) - Skill Reinforcement Learning and Planning for Open-World Long-Horizon
Tasks [31.084848672383185]
オープンワールド環境におけるマルチタスクエージェントの構築について検討する。
我々は,マルチタスク学習問題を基礎的スキルの学習や,そのスキルの計画に転換する。
提案手法は40種類のMinecraftタスクをこなし,10以上のスキルを順次実行するタスクが多数存在する。
論文 参考訳(メタデータ) (2023-03-29T09:45:50Z) - Choreographer: Learning and Adapting Skills in Imagination [60.09911483010824]
我々は、その世界モデルを利用して想像力のスキルを学び、適応するモデルベースのエージェントであるChoreographerを紹介する。
提案手法は探索とスキル学習のプロセスを切り離し,モデルの潜在状態空間におけるスキルの発見を可能にする。
Choreographerはオフラインデータからスキルを学ぶことができ、探索ポリシーと同時にデータを集めることができる。
論文 参考訳(メタデータ) (2022-11-23T23:31:14Z) - Discovering Generalizable Skills via Automated Generation of Diverse
Tasks [82.16392072211337]
本稿では,多種多様なタスクの自動生成による一般化可能なスキルの発見手法を提案する。
教師なしスキル発見の先行研究とは対照的に,本手法では各スキルをトレーニング可能なタスクジェネレータが生成するユニークなタスクとペアリングする。
生成したタスクにおけるロボットの動作に定義されたタスク判別器を共同で訓練し、多様性目標の低いエビデンスを推定する。
学習スキルは階層的な強化学習アルゴリズムで構成され、目に見えない目標タスクを解決する。
論文 参考訳(メタデータ) (2021-06-26T03:41:51Z) - Actionable Models: Unsupervised Offline Reinforcement Learning of
Robotic Skills [93.12417203541948]
与えられたデータセットの任意の目標状態に到達するために学習することによって、環境の機能的な理解を学ぶ目的を提案する。
提案手法は,高次元カメラ画像上で動作し,これまで見つからなかったシーンやオブジェクトに一般化した実ロボットの様々なスキルを学習することができる。
論文 参考訳(メタデータ) (2021-04-15T20:10:11Z) - Active Hierarchical Imitation and Reinforcement Learning [0.0]
本研究では,我々が開発した階層的模倣強化学習フレームワークを用いて,様々な模倣学習アルゴリズムを探索し,アクティブ学習アルゴリズムを設計した。
実験の結果,daggerと報酬ベースのアクティブラーニング手法は,トレーニング過程において身体的および精神的により多くの努力を省きながら,よりよいパフォーマンスを達成できることがわかった。
論文 参考訳(メタデータ) (2020-12-14T08:27:27Z) - Accelerating Reinforcement Learning with Learned Skill Priors [20.268358783821487]
現代の強化学習アプローチは、すべてのタスクをゼロから学習する。
事前知識を活用する1つのアプローチは、事前タスクで学んだスキルを新しいタスクに移すことである。
学習したスキル事前は、リッチデータセットからの効果的なスキル伝達に不可欠であることを示す。
論文 参考訳(メタデータ) (2020-10-22T17:59:51Z) - Emergent Real-World Robotic Skills via Unsupervised Off-Policy
Reinforcement Learning [81.12201426668894]
報奨関数を使わずに多様なスキルを習得し,これらのスキルを下流のタスクに再利用する効率的な強化学習手法を開発した。
提案アルゴリズムは学習効率を大幅に向上させ,報酬のない実世界のトレーニングを実現する。
また,学習スキルは,目標指向ナビゲーションのためのモデル予測制御を用いて,追加のトレーニングを伴わずに構成可能であることも実証した。
論文 参考訳(メタデータ) (2020-04-27T17:38:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。