論文の概要: DriveAdapter: Breaking the Coupling Barrier of Perception and Planning
in End-to-End Autonomous Driving
- arxiv url: http://arxiv.org/abs/2308.00398v2
- Date: Sat, 26 Aug 2023 03:47:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-29 21:05:27.027330
- Title: DriveAdapter: Breaking the Coupling Barrier of Perception and Planning
in End-to-End Autonomous Driving
- Title(参考訳): driveadapter:エンドツーエンド自動運転における知覚と計画の結合障壁を破る
- Authors: Xiaosong Jia, Yulu Gao, Li Chen, Junchi Yan, Patrick Langechuan Liu,
Hongyang Li
- Abstract要約: 最先端の手法は通常、教師-学生のパラダイムに従う。
学生モデルは、生のセンサーデータのみにアクセスし、教師モデルによって収集されたデータに基づいて行動クローニングを行う。
本稿では,学生(知覚)と教師(計画)モジュール間の機能アライメント目的関数を持つアダプタを用いたDriveAdapterを提案する。
- 参考スコア(独自算出の注目度): 64.57963116462757
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: End-to-end autonomous driving aims to build a fully differentiable system
that takes raw sensor data as inputs and directly outputs the planned
trajectory or control signals of the ego vehicle. State-of-the-art methods
usually follow the `Teacher-Student' paradigm. The Teacher model uses
privileged information (ground-truth states of surrounding agents and map
elements) to learn the driving strategy. The student model only has access to
raw sensor data and conducts behavior cloning on the data collected by the
teacher model. By eliminating the noise of the perception part during planning
learning, state-of-the-art works could achieve better performance with
significantly less data compared to those coupled ones.
However, under the current Teacher-Student paradigm, the student model still
needs to learn a planning head from scratch, which could be challenging due to
the redundant and noisy nature of raw sensor inputs and the casual confusion
issue of behavior cloning. In this work, we aim to explore the possibility of
directly adopting the strong teacher model to conduct planning while letting
the student model focus more on the perception part. We find that even equipped
with a SOTA perception model, directly letting the student model learn the
required inputs of the teacher model leads to poor driving performance, which
comes from the large distribution gap between predicted privileged inputs and
the ground-truth.
To this end, we propose DriveAdapter, which employs adapters with the feature
alignment objective function between the student (perception) and teacher
(planning) modules. Additionally, since the pure learning-based teacher model
itself is imperfect and occasionally breaks safety rules, we propose a method
of action-guided feature learning with a mask for those imperfect teacher
features to further inject the priors of hand-crafted rules into the learning
process.
- Abstract(参考訳): エンドツーエンドの自動運転は、生のセンサーデータを入力として、ego車両の予定軌道や制御信号を直接出力する、完全に微分可能なシステムを構築することを目的としている。
最先端のメソッドは通常 'Teacher-Student' パラダイムに従う。
教師モデルは、運転戦略を学ぶために特権情報(周囲のエージェントとマップ要素の基底状態)を使用する。
学習モデルでは,生のセンサデータのみにアクセスでき,教師モデルが収集したデータに対して行動クローニングを行う。
学習計画において知覚部分のノイズを除去することにより、最先端の作業は、結合した作業よりもはるかに少ないデータでより良いパフォーマンスを達成することができる。
しかし,現在の教師・教師パラダイムでは,生センサ入力の冗長でノイズの多い性質と,行動のクローン化のカジュアルな混乱の問題から,学生モデルでは計画ヘッドをスクラッチから学習する必要がある。
本研究は,教師の強いモデルを直接採用して計画を行い,生徒モデルが認知的部分に集中する可能性について検討することを目的とする。
また,SOTA認識モデルを用いた場合であっても,教師モデルの必要な入力を直接学習させることで,予測された特権入力と接地トラストとの間の大きな分配ギャップから生じる運転性能が低下することが判明した。
この目的のために,DriveAdapterを提案する。DriveAdapterは,学生(知覚)と教師(計画)モジュール間の機能アライメント目的機能を備えたアダプタである。
また、純粋学習型教師モデル自体が不完全であり、時折安全ルールを破るので、不完全教師機能のためのマスクを用いた行動誘導型特徴学習法を提案し、手作りルールの先行を学習プロセスに注入する。
関連論文リスト
- Exploring and Enhancing the Transfer of Distribution in Knowledge Distillation for Autoregressive Language Models [62.5501109475725]
知識蒸留(KD)は、より小さな学生モデルを模倣するように訓練することで、大きな教師モデルを圧縮する技術である。
本稿では、教師ネットワークが小さなオンラインモジュールを統合し、学生モデルと同時学習するオンライン知識蒸留(OKD)について紹介する。
OKDは、様々なモデルアーキテクチャやサイズにおけるリードメソッドのパフォーマンスを達成または超え、トレーニング時間を最大4倍に短縮する。
論文 参考訳(メタデータ) (2024-09-19T07:05:26Z) - A Cognitive-Based Trajectory Prediction Approach for Autonomous Driving [21.130543517747995]
本稿では,教師による知識蒸留の枠組みを取り入れたHuman-Like Trajectory Prediction (H)モデルを提案する。
教師」モデルは人間の脳、特に後頭葉と側頭葉の機能の視覚的処理を模倣する。
学生」モデルはリアルタイムのインタラクションと意思決定に焦点を合わせ、正確な予測のために重要な知覚的手がかりを捉えます。
論文 参考訳(メタデータ) (2024-02-29T15:22:26Z) - L2T-DLN: Learning to Teach with Dynamic Loss Network [4.243592852049963]
既存の研究では、教師の反復モデル(1)は、学生モデルの現在の状態に基づいて損失関数を単に決定するだけである。
本稿では,まず,記憶単位を持つ教師モデルを設計し,時間的タスクとして損失調整を定式化する。
そして、ダイナミックな損失ネットワークにより、損失の状態を利用して、教師と生徒モデルとの相互作用を強化する教師の学習を支援する。
論文 参考訳(メタデータ) (2023-10-30T07:21:40Z) - Coaching a Teachable Student [10.81020059614133]
本稿では,官能教師の指導から学生エージェントに指導する知識蒸留フレームワークを提案する。
鍵となる洞察は、入力機能を教師の特権的なバードアイビュー(BEV)空間に合わせることを学ぶ学生を設計することである。
難解な感覚運動学習課題を足場として,様々な補助的指導を施した指導機構を用いて,学生モデルを最適化する。
論文 参考訳(メタデータ) (2023-06-16T17:59:38Z) - Distantly-Supervised Named Entity Recognition with Adaptive Teacher
Learning and Fine-grained Student Ensemble [56.705249154629264]
NERモデルの堅牢性を改善するために,自己学習型教員学生フレームワークを提案する。
本稿では,2つの教員ネットワークからなる適応型教員学習を提案する。
微粒な学生アンサンブルは、教師モデルの各フラグメントを、生徒の対応するフラグメントの時間移動平均で更新し、各モデルフラグメントのノイズに対する一貫した予測を強化する。
論文 参考訳(メタデータ) (2022-12-13T12:14:09Z) - Self-Distillation for Further Pre-training of Transformers [83.84227016847096]
我々は、さらなる事前学習段階の正則化として自己蒸留を提案する。
画像およびテキスト分類タスクのための様々なベンチマークデータセットにおける自己蒸留の有効性を実証的に検証する。
論文 参考訳(メタデータ) (2022-09-30T02:25:12Z) - Oracle Teacher: Leveraging Target Information for Better Knowledge
Distillation of CTC Models [10.941519846908697]
我々は、コネクショニスト時間分類(CTC)に基づくシーケンスモデル、すなわち、Oracle Teacherのための新しいタイプの教師モデルを導入する。
Oracle Teacherは、ターゲット情報を参照することによって、より正確なCTCアライメントを学ぶため、より最適なガイダンスを提供することができる。
CTCアルゴリズムの多対一マッピング特性に基づいて、自明な解を効果的に防止できるトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2021-11-05T14:14:05Z) - Decentralized Federated Learning Preserves Model and Data Privacy [77.454688257702]
我々は、訓練されたモデル間で知識を共有することができる、完全に分散化されたアプローチを提案する。
生徒は、合成された入力データを通じて教師の出力を訓練する。
その結果,教師が学習した未学習学生モデルが,教師と同等のF1スコアに達することがわかった。
論文 参考訳(メタデータ) (2021-02-01T14:38:54Z) - Action-Based Representation Learning for Autonomous Driving [8.296684637620551]
本稿では,行動に基づく運転データを学習表現に用いることを提案する。
提案手法を用いて事前学習した空き時間に基づく運転モデルでは,比較的少量の弱注釈画像が有効であることを示す。
論文 参考訳(メタデータ) (2020-08-21T10:49:13Z) - Goal-Aware Prediction: Learning to Model What Matters [105.43098326577434]
学習した前進力学モデルを使用する際の根本的な課題の1つは、学習したモデルの目的と下流のプランナーやポリシーの目標とのミスマッチである。
本稿では,タスク関連情報への直接的予測を提案し,そのモデルが現在のタスクを認識し,状態空間の関連量のみをモデル化することを奨励する。
提案手法は,目標条件付きシーンの関連部分を効果的にモデル化し,その結果,標準タスク非依存のダイナミックスモデルやモデルレス強化学習より優れていることがわかった。
論文 参考訳(メタデータ) (2020-07-14T16:42:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。