論文の概要: Teaching to Learn: Sequential Teaching of Agents with Inner States
- arxiv url: http://arxiv.org/abs/2009.06227v1
- Date: Mon, 14 Sep 2020 07:03:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 11:57:44.299471
- Title: Teaching to Learn: Sequential Teaching of Agents with Inner States
- Title(参考訳): 学習の指導--内的状態を持つエージェントのシーケンシャルな指導
- Authors: Mustafa Mert Celikok, Pierre-Alexandre Murena, Samuel Kaski
- Abstract要約: 学習者の内的状態が授業の相互作用によって変化するようなマルチエージェントの定式化を導入する。
このような学習者を指導するために,学習者の今後のパフォーマンスを考慮に入れた最適制御手法を提案する。
- 参考スコア(独自算出の注目度): 20.556373950863247
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In sequential machine teaching, a teacher's objective is to provide the
optimal sequence of inputs to sequential learners in order to guide them
towards the best model. In this paper we extend this setting from current
static one-data-set analyses to learners which change their learning algorithm
or latent state to improve during learning, and to generalize to new datasets.
We introduce a multi-agent formulation in which learners' inner state may
change with the teaching interaction, which affects the learning performance in
future tasks. In order to teach such learners, we propose an optimal control
approach that takes the future performance of the learner after teaching into
account. This provides tools for modelling learners having inner states, and
machine teaching of meta-learning algorithms. Furthermore, we distinguish
manipulative teaching, which can be done by effectively hiding data and also
used for indoctrination, from more general education which aims to help the
learner become better at generalization and learning in new datasets in the
absence of a teacher.
- Abstract(参考訳): シーケンシャルな機械教育において,教師の目的は,学習者に対して最適な入力シーケンスを提供することであり,それらを最良のモデルに導くことである。
本稿では、この設定を、現在の静的1データセット分析から学習アルゴリズムや潜在状態を変更する学習者へ拡張し、学習中に改善し、新しいデータセットに一般化する。
本稿では,学習者の内的状態が授業操作によって変化する可能性があるマルチエージェントの定式化について紹介する。
このような学習者を指導するために,学習者の今後のパフォーマンスを考慮に入れた最適制御手法を提案する。
これは、内部状態を持つ学習者のモデリングツールと、メタ学習アルゴリズムの機械教育を提供する。
さらに,教師のいない新しいデータセットにおいて,学習者の一般化と学習をより良くすることを目的とした,より一般的な教育と,効果的にデータを隠蔽し指導にも利用できるマニピュレーション的指導とを区別する。
関連論文リスト
- When Babies Teach Babies: Can student knowledge sharing outperform Teacher-Guided Distillation on small datasets? [0.0]
我々は,データ効率のよい言語モデル事前学習の限界を推し進めることを目的として,BabyLMチャレンジに提案する。
重み付き相互学習を二段階最適化問題として定式化することにより、生徒の平等な待遇の限界に対処する。
評価の結果、教師なしの手法は教師が指導する手法と一致したり、超えたりできることがわかった。
論文 参考訳(メタデータ) (2024-11-25T15:25:31Z) - A General Model for Detecting Learner Engagement: Implementation and Evaluation [0.0]
本稿では,学習者のエンゲージメントレベルを検出するための特徴の選択と処理のための,汎用的で軽量なモデルを提案する。
本研究では,DAiSEEデータセットの映像を分析し,学習者のエンゲージメントのダイナミックな意義を捉えた。
提案モデルは,特定の実装において68.57%の精度を達成し,学習者のエンゲージメントレベルを検出する最先端モデルより優れている。
論文 参考訳(メタデータ) (2024-05-07T12:11:15Z) - YODA: Teacher-Student Progressive Learning for Language Models [82.0172215948963]
本稿では,教師が指導するプログレッシブ・ラーニング・フレームワークであるYodaを紹介する。
モデルファインチューニングの有効性を向上させるために,教師の教育過程をエミュレートする。
実験の結果, YODAのデータによるLLaMA2のトレーニングにより, SFTは大幅に向上した。
論文 参考訳(メタデータ) (2024-01-28T14:32:15Z) - Revealing Networks: Understanding Effective Teacher Practices in
AI-Supported Classrooms using Transmodal Ordered Network Analysis [0.9187505256430948]
本研究は,AI教師と連携した数学教室において,システム内学習の伝統的な指標に関連する効果的な教員の実践を理解するために,トランスモーダル順序ネットワーク分析を用いた。
教師の実践を学生の学習率で比較すると,低学率の生徒はモニタリング後,より有意な使用感を示した。
学習率の低い生徒は、高学率の学生と同様の学習行動を示し、教師の正しい試みを繰り返した。
論文 参考訳(メタデータ) (2023-12-17T21:50:02Z) - Reinforcement Teaching [43.80089037901853]
本稿では,教師の学習過程を制御するためのメタ学習の枠組みである強化指導を提案する。
学生の学習過程はマルコフ報酬プロセスとしてモデル化され、教師は行動空間でマルコフ決定プロセスと相互作用する。
多くの学習過程において、学習可能なパラメータがマルコフ状態を形成することを示し、教師がパラメータから直接学習することを避けるために、入力・出力動作から生徒の状態の表現を学習する埋め込み器を提案する。
論文 参考訳(メタデータ) (2022-04-25T18:04:17Z) - Iterative Teacher-Aware Learning [136.05341445369265]
人間の教育において、教師と学生はコミュニケーション効率を最大化するために適応的に交流することができる。
本稿では,教師の協調意図を可能性関数に組み込むことができる,勾配最適化に基づく教師認識学習者を提案する。
論文 参考訳(メタデータ) (2021-10-01T00:27:47Z) - Distribution Matching for Machine Teaching [64.39292542263286]
機械学習の逆問題である機械学習は、学習者の目標仮説に向けて学習者を操ることを目的としている。
機械教育に関するこれまでの研究は、それらの最良の指導例を見つけるための教育のリスクとコストのバランスに重点を置いていた。
本稿では,分布マッチングに基づく機械教育戦略を提案する。
論文 参考訳(メタデータ) (2021-05-06T09:32:57Z) - Teaching with Commentaries [108.62722733649542]
コメントとメタ情報を用いたフレキシブルな教育フレームワークを提案する。
解説はトレーニングのスピードと/またはパフォーマンスを改善することができる。
パフォーマンスのメリットを得るために、新しいモデルをトレーニングするときに、コメンタリを再利用できる。
論文 参考訳(メタデータ) (2020-11-05T18:52:46Z) - Learning to Reweight with Deep Interactions [104.68509759134878]
本稿では,教師モデルに内部状態を提供する改良型データ再重み付けアルゴリズムを提案する。
クリーン/ノイズラベルとニューラルマシン翻訳を用いた画像分類実験は、我々のアルゴリズムが従来の手法よりも大幅に改善されていることを実証的に実証した。
論文 参考訳(メタデータ) (2020-07-09T09:06:31Z) - Revisiting Meta-Learning as Supervised Learning [69.2067288158133]
メタラーニングと従来の教師付き学習の関連性を再考し,強化することで,原則的,統一的なフレームワークの提供を目指す。
タスク固有のデータセットとターゲットモデルを(機能、ラベル)サンプルとして扱うことで、多くのメタ学習アルゴリズムを教師付き学習のインスタンスに還元することができる。
この視点は、メタラーニングを直感的で実践的なフレームワークに統一するだけでなく、教師付き学習から直接洞察を伝達してメタラーニングを改善することができる。
論文 参考訳(メタデータ) (2020-02-03T06:13:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。