論文の概要: Know Thy Student: Interactive Learning with Gaussian Processes
- arxiv url: http://arxiv.org/abs/2204.12072v1
- Date: Tue, 26 Apr 2022 04:43:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-27 22:17:09.663327
- Title: Know Thy Student: Interactive Learning with Gaussian Processes
- Title(参考訳): know thy student: ガウス過程を用いた対話型学習
- Authors: Rose E. Wang, Mike Wu, Noah Goodman
- Abstract要約: そこで本研究では,ガウス過程を用いた簡単な診断アルゴリズムを提案する。
本研究は,教師が生徒に実演を行い,余分な軌跡の送出を避けるためのオフライン強化学習環境である。
本実験は,対話型教師の助けを借りて,学生がより効率的に学習できる方法を示す。
- 参考スコア(独自算出の注目度): 11.641731210416102
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning often involves interaction between multiple agents. Human
teacher-student settings best illustrate how interactions result in efficient
knowledge passing where the teacher constructs a curriculum based on their
students' abilities. Prior work in machine teaching studies how the teacher
should construct optimal teaching datasets assuming the teacher knows
everything about the student. However, in the real world, the teacher doesn't
have complete information about the student. The teacher must interact and
diagnose the student, before teaching. Our work proposes a simple diagnosis
algorithm which uses Gaussian processes for inferring student-related
information, before constructing a teaching dataset. We apply this to two
settings. One is where the student learns from scratch and the teacher must
figure out the student's learning algorithm parameters, eg. the regularization
parameters in ridge regression or support vector machines. Two is where the
student has partially explored the environment and the teacher must figure out
the important areas the student has not explored; we study this in the offline
reinforcement learning setting where the teacher must provide demonstrations to
the student and avoid sending redundant trajectories. Our experiments highlight
the importance of diagosing before teaching and demonstrate how students can
learn more efficiently with the help of an interactive teacher. We conclude by
outlining where diagnosing combined with teaching would be more desirable than
passive learning.
- Abstract(参考訳): 学習はしばしば複数のエージェント間の相互作用を伴う。
人間の教師と学生は、教師が生徒の能力に基づいてカリキュラムを構築できる効率的な知識パスを、どのように相互作用が生み出すかを最もよく示している。
機械教育研究における事前の仕事は、教師が生徒についてすべてを知っていると仮定して、教師が最適な指導データセットを構築する方法である。
しかし、現実の世界では、先生は生徒の完全な情報を持っていません。
先生は教える前に生徒と対話し、診断しなければならない。
本研究は,授業データセットを構築する前に,ガウス過程を用いて学生関連情報を推測する簡易診断アルゴリズムを提案する。
これを2つの設定に適用する。
一つは、生徒がスクラッチから学び、教師が生徒の学習アルゴリズムパラメータを把握しなければならないところである。
リッジ回帰またはサポートベクトルマシンにおける正規化パラメータ。
2つは,教師が環境を部分的に探究し,教師が探究していない重要な領域を把握しなければならない場所であり,教師が生徒に実演を行い,余分な軌跡の送出を避けるためのオフライン強化学習環境でこれを研究する。
本実験では,対話型教師の助けを借りて,学生がより効率的に学習できることを示す。
最後に,受動的学習よりも診断と指導の併用が望ましい点を概説する。
関連論文リスト
- Representational Alignment Supports Effective Machine Teaching [81.19197059407121]
GRADEは、教育と表現的アライメントを研究するための新しい制御された実験環境である。
学生との表現的整合性が向上し,生徒の学習成果が向上することがわかった。
しかし、この効果は、教えられているクラスのサイズと表現の多様性によって中和される。
論文 参考訳(メタデータ) (2024-06-06T17:48:24Z) - Learn to Teach: Improve Sample Efficiency in Teacher-student Learning
for Sim-to-Real Transfer [5.731477362725785]
本稿では,教師が収集した学習体験をリサイクルする学習学習フレームワークであるLearning to Teach (L2T)を提案する。
単ループアルゴリズムは、強化学習と逆強化学習の両方の文脈で教師と学生のエージェントを訓練できることを示す。
論文 参考訳(メタデータ) (2024-02-09T21:16:43Z) - YODA: Teacher-Student Progressive Learning for Language Models [82.0172215948963]
本稿では,教師が指導するプログレッシブ・ラーニング・フレームワークであるYodaを紹介する。
モデルファインチューニングの有効性を向上させるために,教師の教育過程をエミュレートする。
実験の結果, YODAのデータによるLLaMA2のトレーニングにより, SFTは大幅に向上した。
論文 参考訳(メタデータ) (2024-01-28T14:32:15Z) - Can Language Models Teach Weaker Agents? Teacher Explanations Improve
Students via Personalization [84.86241161706911]
教師のLLMは、実際に生徒の推論に介入し、パフォーマンスを向上させることができることを示す。
また,マルチターンインタラクションでは,教師による説明が一般化され,説明データから学習されることを示す。
教師のミスアライメントが学生の成績をランダムな確率に低下させることを、意図的に誤解させることで検証する。
論文 参考訳(メタデータ) (2023-06-15T17:27:20Z) - Iterative Teacher-Aware Learning [136.05341445369265]
人間の教育において、教師と学生はコミュニケーション効率を最大化するために適応的に交流することができる。
本稿では,教師の協調意図を可能性関数に組み込むことができる,勾配最適化に基づく教師認識学習者を提案する。
論文 参考訳(メタデータ) (2021-10-01T00:27:47Z) - Interactive Knowledge Distillation [79.12866404907506]
本稿では,効率的な知識蒸留のための対話型指導戦略を活用するために,対話型知識蒸留方式を提案する。
蒸留工程では,教師と学生のネットワーク間の相互作用を交換操作により行う。
教員ネットワークの典型的な設定による実験により,IAKDで訓練された学生ネットワークは,従来の知識蒸留法で訓練された学生ネットワークよりも優れた性能を示した。
論文 参考訳(メタデータ) (2020-07-03T03:22:04Z) - Neural Multi-Task Learning for Teacher Question Detection in Online
Classrooms [50.19997675066203]
教師の音声記録から質問を自動的に検出するエンドツーエンドのニューラルネットワークフレームワークを構築している。
マルチタスク学習手法を取り入れることで,質問の種類によって意味的関係の理解を深めることが可能となる。
論文 参考訳(メタデータ) (2020-05-16T02:17:04Z) - Understanding the Power and Limitations of Teaching with Imperfect
Knowledge [30.588367257209388]
本研究では,教師が学習者に対して特定の課題を学習するための学習例を選択する際に,教師と学生/学生の相互作用について検討する。
教育における機械教育の現実的な応用に着想を得て,教師の知識が限られ,騒々しい環境を考える。
最適学習セットを構築する際に,不完全な知識が対応する機械教育問題に対する教師の解決にどう影響するかを示す。
論文 参考訳(メタデータ) (2020-03-21T17:53:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。