論文の概要: Coaching a Teachable Student
- arxiv url: http://arxiv.org/abs/2306.10014v1
- Date: Fri, 16 Jun 2023 17:59:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-19 12:34:55.324174
- Title: Coaching a Teachable Student
- Title(参考訳): 教師可能な学生のコーチング
- Authors: Jimuyang Zhang, Zanming Huang, Eshed Ohn-Bar
- Abstract要約: 本稿では,官能教師の指導から学生エージェントに指導する知識蒸留フレームワークを提案する。
鍵となる洞察は、入力機能を教師の特権的なバードアイビュー(BEV)空間に合わせることを学ぶ学生を設計することである。
難解な感覚運動学習課題を足場として,様々な補助的指導を施した指導機構を用いて,学生モデルを最適化する。
- 参考スコア(独自算出の注目度): 10.81020059614133
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a novel knowledge distillation framework for effectively teaching
a sensorimotor student agent to drive from the supervision of a privileged
teacher agent. Current distillation for sensorimotor agents methods tend to
result in suboptimal learned driving behavior by the student, which we
hypothesize is due to inherent differences between the input, modeling
capacity, and optimization processes of the two agents. We develop a novel
distillation scheme that can address these limitations and close the gap
between the sensorimotor agent and its privileged teacher. Our key insight is
to design a student which learns to align their input features with the
teacher's privileged Bird's Eye View (BEV) space. The student then can benefit
from direct supervision by the teacher over the internal representation
learning. To scaffold the difficult sensorimotor learning task, the student
model is optimized via a student-paced coaching mechanism with various
auxiliary supervision. We further propose a high-capacity imitation learned
privileged agent that surpasses prior privileged agents in CARLA and ensures
the student learns safe driving behavior. Our proposed sensorimotor agent
results in a robust image-based behavior cloning agent in CARLA, improving over
current models by over 20.6% in driving score without requiring LiDAR,
historical observations, ensemble of models, on-policy data aggregation or
reinforcement learning.
- Abstract(参考訳): そこで本研究では,教師の指導からセンサモブターの学生エージェントに効果的に運転を指導するための知識蒸留フレームワークを提案する。
現在, センサモレータエージェントの蒸留は, 学生が学習した運転行動に準ずる傾向があり, 両者の入力, モデル化能力, 最適化プロセスの相違が原因と考えられる。
そこで我々は,これらの制限に対処し,感覚運動エージェントとその特権教師とのギャップを埋める新しい蒸留スキームを開発した。
我々の重要な洞察は、入力機能を教師の特権的なBird's Eye View (BEV)空間に合わせることを学ぶ学生を設計することである。
生徒は、内部表現学習よりも教師の直接監督の恩恵を受けることができる。
難解な感覚運動学習タスクの足場として,様々な補助監督を行う学生ペースコーチング機構を用いて,学習モデル最適化を行う。
さらに,CARLAにおける先行特権エージェントを超越し,学生が安全な運転行動を学ぶための,高能力模倣学習エージェントを提案する。
提案するsensorimotorエージェントは,carlaにおける頑健なイメージベース行動クローニングエージェントとなり,lidar,歴史的な観察,モデルのアンサンブル,オンポリシーデータ集約,強化学習を必要とせずに,現在のモデルよりも20.6%以上向上した。
関連論文リスト
- Classroom-Inspired Multi-Mentor Distillation with Adaptive Learning Strategies [11.225067563482169]
ClassroomKDは、教室環境にインスパイアされた新しい多面的知識蒸留フレームワークである。
このフレームワークは、各データサンプルの有効性に基づいて、多様なメンターの指導戦略を動的に選択し、適応する。
その結果,メンターの選択と指導に対する動的かつ適応的なアプローチは,より効果的な知識伝達につながることがわかった。
論文 参考訳(メタデータ) (2024-09-30T12:20:07Z) - Adaptive Teaching in Heterogeneous Agents: Balancing Surprise in Sparse Reward Scenarios [3.638198517970729]
実証から学ぶことは、類似エージェントでシステムを訓練する効果的な方法である。
しかし、生徒の能力の限界から外れたデモを自然に複製することは、効率的な学習を制限することができる。
本稿では,教師と学生エージェントの異質性の課題に対処するために,教員-学生学習フレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-23T05:52:42Z) - TSCM: A Teacher-Student Model for Vision Place Recognition Using Cross-Metric Knowledge Distillation [6.856317526681759]
視覚的位置認識は、移動ロボットの自律的な探索とナビゲーションにおいて重要な役割を果たす。
既存の手法では、強力だが大規模なネットワークを利用することでこれを克服している。
本稿では,TSCMと呼ばれる高性能な教師と軽量な学生蒸留フレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-02T02:29:41Z) - A Cognitive-Based Trajectory Prediction Approach for Autonomous Driving [21.130543517747995]
本稿では,教師による知識蒸留の枠組みを取り入れたHuman-Like Trajectory Prediction (H)モデルを提案する。
教師」モデルは人間の脳、特に後頭葉と側頭葉の機能の視覚的処理を模倣する。
学生」モデルはリアルタイムのインタラクションと意思決定に焦点を合わせ、正確な予測のために重要な知覚的手がかりを捉えます。
論文 参考訳(メタデータ) (2024-02-29T15:22:26Z) - DriveAdapter: Breaking the Coupling Barrier of Perception and Planning
in End-to-End Autonomous Driving [64.57963116462757]
最先端の手法は通常、教師-学生のパラダイムに従う。
学生モデルは、生のセンサーデータのみにアクセスし、教師モデルによって収集されたデータに基づいて行動クローニングを行う。
本稿では,学生(知覚)と教師(計画)モジュール間の機能アライメント目的関数を持つアダプタを用いたDriveAdapterを提案する。
論文 参考訳(メタデータ) (2023-08-01T09:21:53Z) - Distantly-Supervised Named Entity Recognition with Adaptive Teacher
Learning and Fine-grained Student Ensemble [56.705249154629264]
NERモデルの堅牢性を改善するために,自己学習型教員学生フレームワークを提案する。
本稿では,2つの教員ネットワークからなる適応型教員学習を提案する。
微粒な学生アンサンブルは、教師モデルの各フラグメントを、生徒の対応するフラグメントの時間移動平均で更新し、各モデルフラグメントのノイズに対する一貫した予測を強化する。
論文 参考訳(メタデータ) (2022-12-13T12:14:09Z) - Better Teacher Better Student: Dynamic Prior Knowledge for Knowledge
Distillation [70.92135839545314]
本研究では,教師の持つ特徴の一部を,特徴蒸留前の先行知識として統合した動的事前知識(DPK)を提案する。
DPKは,教員モデルと生徒モデルのパフォーマンスを正に相関させ,より大きな教員を適用することで生徒の精度をさらに高めることができる。
論文 参考訳(メタデータ) (2022-06-13T11:52:13Z) - Faculty Distillation with Optimal Transport [53.69235109551099]
本稿では,教師の課題と生徒の課題を最適な輸送手段で結びつけることを提案する。
ラベル空間間の意味的関係に基づき、出力分布間の支持ギャップを埋めることができる。
各種条件下での実験は,提案手法の簡潔さと汎用性を示すものである。
論文 参考訳(メタデータ) (2022-04-25T09:34:37Z) - Learning to Teach with Student Feedback [67.41261090761834]
対話的知識蒸留 (Interactive Knowledge Distillation, IKD) は、教師が生徒のフィードバックから教えることを学ぶことを可能にする。
IKDは教師モデルを訓練し、特定の学生のトレーニングステップごとに特定のソフトターゲットを生成する。
教師と生徒の協調的な最適化は2つの反復的なステップによって達成される。
論文 参考訳(メタデータ) (2021-09-10T03:01:01Z) - Dual Policy Distillation [58.43610940026261]
教員政策を学生政策に転換する政策蒸留は、深層強化学習の課題において大きな成功を収めた。
本研究では,2人の学習者が同じ環境下で活動し,環境の異なる視点を探索する,学生学生による二重政策蒸留(DPD)を導入する。
この二重学習フレームワークを開発する上で重要な課題は、同時代の学習に基づく強化学習アルゴリズムにおいて、ピア学習者から有益な知識を特定することである。
論文 参考訳(メタデータ) (2020-06-07T06:49:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。