Fugu-MT 論文翻訳(概要): Skillearn: Machine Learning Inspired by Humans' Learning Skills

論文の概要: Skillearn: Machine Learning Inspired by Humans' Learning Skills

arxiv url: http://arxiv.org/abs/2012.04863v2
Date: Fri, 12 Mar 2021 06:38:40 GMT
ステータス: 翻訳完了
システム内更新日: 2021-05-16 12:40:17.140691
Title: Skillearn: Machine Learning Inspired by Humans' Learning Skills
Title（参考訳）: Skillearn: 人間の学習スキルに触発された機械学習
Authors: Pengtao Xie, Xuefeng Du, Hao Ban
Abstract要約: 私たちは、機械の学習を助けるために人間の学習スキルを借りることができるかどうかを調べることに興味があります。具体的には、これらのスキルを形式化し、より良い機械学習(ML)モデルのトレーニングに活用することを目指しています。この目標を達成するために、人間の学習スキルを数学的に表現する原則的な方法を提供する一般的なフレームワークであるSkillearnを開発した。 2つのケーススタディでは、Skillearnを使用して人間の2つの学習スキルを形式化します。テストをパスして学習をインターリーブし、形式化されたスキルを使用して神経アーキテクチャ検索を改善します。
参考スコア（独自算出の注目度）: 15.125072827275766
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Humans, as the most powerful learners on the planet, have accumulated a lot of learning skills, such as learning through tests, interleaving learning, self-explanation, active recalling, to name a few. These learning skills and methodologies enable humans to learn new topics more effectively and efficiently. We are interested in investigating whether humans' learning skills can be borrowed to help machines to learn better. Specifically, we aim to formalize these skills and leverage them to train better machine learning (ML) models. To achieve this goal, we develop a general framework -- Skillearn, which provides a principled way to represent humans' learning skills mathematically and use the formally-represented skills to improve the training of ML models. In two case studies, we apply Skillearn to formalize two learning skills of humans: learning by passing tests and interleaving learning, and use the formalized skills to improve neural architecture search. Experiments on various datasets show that trained using the skills formalized by Skillearn, ML models achieve significantly better performance.
Abstract（参考訳）: 人間は、地球上でもっとも強力な学習者として、テストによる学習、インターリーブ学習、自己説明、アクティブリコールなど、多くの学習スキルを蓄積しています。これらの学習スキルと方法論により、人間は新しいトピックをより効率的に学習することができる。私たちは、機械の学習を支援するために人間の学習スキルを借用できるかどうか調査することに興味を持っています。具体的には、これらのスキルを形式化し、機械学習(ML)モデルのトレーニングに活用することを目指している。この目標を達成するために、人間の学習スキルを数学的に表現し、形式的に表現されたスキルを用いてMLモデルのトレーニングを改善するための原則的な方法を提供する一般的なフレームワークであるSkillearnを開発する。 2つのケーススタディにおいて、skillearnを人間の2つの学習スキルの形式化に応用した。さまざまなデータセットの実験では、Skillearnによって形式化されたスキルを使用してトレーニングされたMLモデルは、はるかに優れたパフォーマンスを実現している。

関連論文リスト

Lifelong Language-Conditioned Robotic Manipulation Learning [19.640584848758625]
従来の言語条件の操作エージェントは、新しい操作スキルに逐次適応することで、破滅的な古いスキルを忘れてしまう。 SkillsCrafterは、複数のスキルを継続的に学習するように設計された、新しいロボット操作フレームワークである。
論文参考訳（メタデータ） (2026-03-05T13:30:33Z)
Energy Weighted Learning Progress Guided Interleaved Multi-Task Learning [1.5749416770494706]
機械学習における「連続学習」は、獲得した知識を保存しながら新しい情報を学ぶことを目的としている。本稿では,その「学習の進歩」とエネルギー消費に基づいてタスクをインターリーブする手法を提案する。機械学習の観点から、我々のアプローチはマルチタスク学習システムと見なすことができる。
論文参考訳（メタデータ） (2025-04-01T12:15:27Z)
Pretrained Bayesian Non-parametric Knowledge Prior in Robotic Long-Horizon Reinforcement Learning [10.598207472087578]
強化学習(Reinforcement Learning, RL)の手法は通常、新しいタスクをゼロから学習する。この研究は、潜在的な原始的なスキルモーションを未知の特徴を持つ非パラメトリックな特性を持つものとしてモデル化する手法を導入する。非パラメトリックモデル、特にDirichlet Process Mixturesは、出生とマージによって強化され、スキルの多様な性質を効果的に捉えるための事前トレーニングに使用される。
論文参考訳（メタデータ） (2025-03-27T20:43:36Z)
Learning Adaptive Dexterous Grasping from Single Demonstrations [27.806856958659054]
この作業は、2つの重要な課題に対処する。人間による限られたデモンストレーションから、効率的なスキル獲得と、コンテキスト駆動のスキル選択だ。 AdaDexGraspは、スキルごとに1人の人間のデモからスキルを把握できるライブラリを学び、視覚言語モデル(VLM)を使用して最も適切なものを選択する。我々はAdaDexGraspをシミュレーションと実世界の両方の環境で評価し、RLの効率を大幅に改善し、さまざまなオブジェクト構成をまたいだ人間的な把握戦略の学習を可能にした。
論文参考訳（メタデータ） (2025-03-26T04:05:50Z)
Dynamic Skill Adaptation for Large Language Models [78.31322532135272]
動的スキル適応(Dynamic Skill Adaptation, DSA)は, 言語モデル(LLM)に新しい複雑なスキルを適応させる適応的かつ動的フレームワークである。各スキルに対して,学習前スキルの詳細な記述を含む教科書的データと,学習前スキルの具体的活用を目標とした演習的データの両方を生成する。 LLAMA や Mistral のような大規模言語モデルを用いた実験は,提案手法が数学推論スキルや社会学習スキルに適応する上で有効であることを示す。
論文参考訳（メタデータ） (2024-12-26T22:04:23Z)
MaestroMotif: Skill Design from Artificial Intelligence Feedback [67.17724089381056]
MaestroMotifはAI支援スキルデザインの手法であり、高性能で適応可能なエージェントを生成する。本稿では,AIを活用したスキルデザイン手法であるMaestroMotifについて述べる。
論文参考訳（メタデータ） (2024-12-11T16:59:31Z)
SPIRE: Synergistic Planning, Imitation, and Reinforcement Learning for Long-Horizon Manipulation [58.14969377419633]
タスクをより小さな学習サブプロブレムに分解し、第2に模倣と強化学習を組み合わせてその強みを最大化するシステムであるspireを提案する。我々は、模倣学習、強化学習、計画を統合する従来の手法よりも平均タスク性能が35%から50%向上していることを発見した。
論文参考訳（メタデータ） (2024-10-23T17:42:07Z)
Unsupervised Skill Discovery for Robotic Manipulation through Automatic Task Generation [17.222197596599685]
本稿では,多数の自律的タスクを解くことで構成可能な振る舞いを発見するスキル学習手法を提案する。本手法は,ロボットが環境内の物体と連続的かつ堅牢に対話することを可能にするスキルを学習する。学習したスキルは、シミュレーションだけでなく、本物のロボットプラットフォーム上でも、目に見えない操作タスクのセットを解決するために使用できる。
論文参考訳（メタデータ） (2024-10-07T09:19:13Z)
Skill Reinforcement Learning and Planning for Open-World Long-Horizon Tasks [31.084848672383185]
オープンワールド環境におけるマルチタスクエージェントの構築について検討する。我々は,マルチタスク学習問題を基礎的スキルの学習や,そのスキルの計画に転換する。提案手法は40種類のMinecraftタスクをこなし,10以上のスキルを順次実行するタスクが多数存在する。
論文参考訳（メタデータ） (2023-03-29T09:45:50Z)
Choreographer: Learning and Adapting Skills in Imagination [60.09911483010824]
我々は、その世界モデルを利用して想像力のスキルを学び、適応するモデルベースのエージェントであるChoreographerを紹介する。提案手法は探索とスキル学習のプロセスを切り離し,モデルの潜在状態空間におけるスキルの発見を可能にする。 Choreographerはオフラインデータからスキルを学ぶことができ、探索ポリシーと同時にデータを集めることができる。
論文参考訳（メタデータ） (2022-11-23T23:31:14Z)
Learning and Retrieval from Prior Data for Skill-based Imitation Learning [47.59794569496233]
従来のデータから時間的に拡張された感触者スキルを抽出する,スキルベースの模倣学習フレームワークを開発した。新規タスクの性能を著しく向上させる重要な設計選択をいくつか挙げる。
論文参考訳（メタデータ） (2022-10-20T17:34:59Z)
Discovering Generalizable Skills via Automated Generation of Diverse Tasks [82.16392072211337]
本稿では,多種多様なタスクの自動生成による一般化可能なスキルの発見手法を提案する。教師なしスキル発見の先行研究とは対照的に,本手法では各スキルをトレーニング可能なタスクジェネレータが生成するユニークなタスクとペアリングする。生成したタスクにおけるロボットの動作に定義されたタスク判別器を共同で訓練し、多様性目標の低いエビデンスを推定する。学習スキルは階層的な強化学習アルゴリズムで構成され、目に見えない目標タスクを解決する。
論文参考訳（メタデータ） (2021-06-26T03:41:51Z)
Actionable Models: Unsupervised Offline Reinforcement Learning of Robotic Skills [93.12417203541948]
与えられたデータセットの任意の目標状態に到達するために学習することによって、環境の機能的な理解を学ぶ目的を提案する。提案手法は,高次元カメラ画像上で動作し,これまで見つからなかったシーンやオブジェクトに一般化した実ロボットの様々なスキルを学習することができる。
論文参考訳（メタデータ） (2021-04-15T20:10:11Z)
Active Hierarchical Imitation and Reinforcement Learning [0.0]
本研究では,我々が開発した階層的模倣強化学習フレームワークを用いて,様々な模倣学習アルゴリズムを探索し,アクティブ学習アルゴリズムを設計した。実験の結果,daggerと報酬ベースのアクティブラーニング手法は,トレーニング過程において身体的および精神的により多くの努力を省きながら,よりよいパフォーマンスを達成できることがわかった。
論文参考訳（メタデータ） (2020-12-14T08:27:27Z)
Accelerating Reinforcement Learning with Learned Skill Priors [20.268358783821487]
現代の強化学習アプローチは、すべてのタスクをゼロから学習する。事前知識を活用する1つのアプローチは、事前タスクで学んだスキルを新しいタスクに移すことである。学習したスキル事前は、リッチデータセットからの効果的なスキル伝達に不可欠であることを示す。
論文参考訳（メタデータ） (2020-10-22T17:59:51Z)
Emergent Real-World Robotic Skills via Unsupervised Off-Policy Reinforcement Learning [81.12201426668894]
報奨関数を使わずに多様なスキルを習得し,これらのスキルを下流のタスクに再利用する効率的な強化学習手法を開発した。提案アルゴリズムは学習効率を大幅に向上させ,報酬のない実世界のトレーニングを実現する。また,学習スキルは,目標指向ナビゲーションのためのモデル予測制御を用いて,追加のトレーニングを伴わずに構成可能であることも実証した。
論文参考訳（メタデータ） (2020-04-27T17:38:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。