論文の概要: Enhance Sample Efficiency and Robustness of End-to-end Urban Autonomous
Driving via Semantic Masked World Model
- arxiv url: http://arxiv.org/abs/2210.04017v1
- Date: Sat, 8 Oct 2022 13:00:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-11 18:33:01.024341
- Title: Enhance Sample Efficiency and Robustness of End-to-end Urban Autonomous
Driving via Semantic Masked World Model
- Title(参考訳): セマンティックマスク世界モデルによるエンドツーエンドの都市自律走行のサンプル効率とロバスト性
- Authors: Zeyu Gao, Yao Mu, Ruoyan Shen, Chen Chen, Yangang Ren, Jianyu Chen,
Shengbo Eben Li, Ping Luo, Yanfeng Lu
- Abstract要約: 本稿では,重要なタスク関連特徴を抽出し,フィルタされた特徴を通して意味マスクを再構成する潜時フィルタを導入したセマンティックマスク再帰世界モデル(SEM2)を提案する。
提案手法は, サンプル効率と入力順列に対するロバスト性の観点から, 最先端の手法よりも優れている。
- 参考スコア(独自算出の注目度): 20.26487890713432
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: End-to-end autonomous driving provides a feasible way to automatically
maximize overall driving system performance by directly mapping the raw pixels
from a front-facing camera to control signals. Recent advanced methods
construct a latent world model to map the high dimensional observations into
compact latent space. However, the latent states embedded by the world model
proposed in previous works may contain a large amount of task-irrelevant
information, resulting in low sampling efficiency and poor robustness to input
perturbations. Meanwhile, the training data distribution is usually unbalanced,
and the learned policy is hard to cope with the corner cases during the driving
process. To solve the above challenges, we present a semantic masked recurrent
world model (SEM2), which introduces a latent filter to extract key
task-relevant features and reconstruct a semantic mask via the filtered
features, and is trained with a multi-source data sampler, which aggregates
common data and multiple corner case data in a single batch, to balance the
data distribution. Extensive experiments on CARLA show that our method
outperforms the state-of-the-art approaches in terms of sample efficiency and
robustness to input permutations.
- Abstract(参考訳): エンドツーエンドの自動運転は、前面カメラからの生のピクセルを制御信号に直接マッピングすることで、運転システム全体の性能を最大化することができる。
最近の高度な手法は、高次元の観測をコンパクトな潜在空間にマッピングする潜在世界モデルを構築している。
しかし、従来の研究で提案された世界モデルに埋め込まれた潜伏状態には、大量のタスク関連情報が含まれており、サンプリング効率が低く、入力摂動に対する堅牢性が低い。
一方、トレーニングデータ分布は、通常不均衡であり、学習されたポリシーは、運転中のコーナーケースに対処するのは難しい。
上記の課題を解決するために,有意なタスク関連特徴を抽出し,フィルタ機能を介して意味マスクを再構築する潜時フィルタを導入したセマンティックマスク再帰世界モデル(SEM2)を提案し,共通データと複数のコーナーケースデータを単一のバッチで集約し,データ分散のバランスをとるマルチソースデータサンプリング器を用いて訓練を行った。
CARLAの広範囲な実験により,本手法はサンプル効率と入力順列に対する堅牢性の観点から,最先端の手法よりも優れていることが示された。
関連論文リスト
- End-to-End Predictive Planner for Autonomous Driving with Consistency Models [5.966385886363771]
軌道予測と計画は、自動運転車が動的環境において安全かつ効率的に航行するための基本的な要素である。
伝統的に、これらのコンポーネントは、しばしば別々のモジュールとして扱われ、インタラクティブな計画を実行する能力を制限する。
単一の一貫性モデルで予測と計画を統合する,統一的でデータ駆動のフレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-12T00:26:01Z) - SUDS: A Strategy for Unsupervised Drift Sampling [0.5437605013181142]
監視された機械学習は、データ分散が時間とともに変化するコンセプトドリフトに遭遇し、パフォーマンスが低下する。
本稿では,既存のドリフト検出アルゴリズムを用いて,同種サンプルを選択する新しい手法であるドリフトサンプリング戦略(SUDS)を提案する。
本研究は, 動的環境におけるラベル付きデータ利用の最適化におけるSUDSの有効性を示すものである。
論文 参考訳(メタデータ) (2024-11-05T10:55:29Z) - MITA: Bridging the Gap between Model and Data for Test-time Adaptation [68.62509948690698]
テスト時間適応(TTA)は、モデルの一般化性を高めるための有望なパラダイムとして登場した。
本稿では,Met-In-The-MiddleをベースとしたMITAを提案する。
論文 参考訳(メタデータ) (2024-10-12T07:02:33Z) - Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models [60.87795376541144]
World Model(ワールドモデル)は、エージェントの次の状態を予測できるニューラルネットワークである。
エンド・ツー・エンドのトレーニングでは、人間のデモで観察された状態と整合してエラーから回復する方法を学ぶ。
クローズドループ試験における先行技術に有意な改善がみられた定性的,定量的な結果を示す。
論文 参考訳(メタデータ) (2024-09-25T06:48:25Z) - FPMT: Enhanced Semi-Supervised Model for Traffic Incident Detection [0.0]
本論文では、MixTextのフレームワーク内でFPMTと呼ばれる半教師付き学習モデルを提案する。
データ拡張モジュールには、データセットのバランスと拡張のためのGenerative Adversarial Networksが導入されている。
トレーニング戦略では、すべてのデータに対して教師なしのトレーニングを開始し、その後ラベル付きデータのサブセットを教師付き微調整し、最終的にはセミ教師付きトレーニングの目標を達成します。
論文 参考訳(メタデータ) (2024-09-12T08:38:42Z) - AIDE: An Automatic Data Engine for Object Detection in Autonomous Driving [68.73885845181242]
本稿では,問題を自動的に識別し,データを効率よくキュレートし,自動ラベル付けによりモデルを改善する自動データエンジン(AIDE)を提案する。
さらに,AVデータセットのオープンワールド検出のためのベンチマークを構築し,様々な学習パラダイムを包括的に評価し,提案手法の優れた性能を低コストで実証する。
論文 参考訳(メタデータ) (2024-03-26T04:27:56Z) - Layout Sequence Prediction From Noisy Mobile Modality [53.49649231056857]
軌道予測は、自律運転やロボット工学などの応用における歩行者運動を理解する上で重要な役割を担っている。
現在の軌道予測モデルは、視覚的モダリティからの長い、完全な、正確に観察されたシーケンスに依存する。
本稿では,物体の障害物や視界外を,完全に視認できる軌跡を持つものと同等に扱う新しいアプローチであるLTrajDiffを提案する。
論文 参考訳(メタデータ) (2023-10-09T20:32:49Z) - Fusing Pseudo Labels with Weak Supervision for Dynamic Traffic Scenarios [0.0]
我々は、異種データセットで訓練されたオブジェクト検出モデルから擬似ラベルをアマルガメートする弱い教師付きラベル統一パイプラインを導入する。
我々のパイプラインは、異なるデータセットからのラベルの集約、バイアスの修正、一般化の強化を通じて、統一されたラベル空間をエンゲージする。
我々は,統合ラベル空間を用いた単独物体検出モデルを再学習し,動的交通シナリオに精通した弾力性のあるモデルを構築した。
論文 参考訳(メタデータ) (2023-08-30T11:33:07Z) - SHIFT: A Synthetic Driving Dataset for Continuous Multi-Task Domain
Adaptation [152.60469768559878]
ShiFTは、自動運転のための最大規模のマルチタスク合成データセットである。
曇り、雨と霧の強さ、昼の時間、車と歩行者の密度を個別に連続的に変化させる。
私たちのデータセットとベンチマークツールキットはwww.vis.xyz/shift.comで公開されています。
論文 参考訳(メタデータ) (2022-06-16T17:59:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。