Fugu-MT 論文翻訳(概要): Enhance Sample Efficiency and Robustness of End-to-end Urban Autonomous Driving via Semantic Masked World Model

論文の概要: Enhance Sample Efficiency and Robustness of End-to-end Urban Autonomous Driving via Semantic Masked World Model

arxiv url: http://arxiv.org/abs/2210.04017v1
Date: Sat, 8 Oct 2022 13:00:08 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-11 18:33:01.024341
Title: Enhance Sample Efficiency and Robustness of End-to-end Urban Autonomous Driving via Semantic Masked World Model
Title（参考訳）: セマンティックマスク世界モデルによるエンドツーエンドの都市自律走行のサンプル効率とロバスト性
Authors: Zeyu Gao, Yao Mu, Ruoyan Shen, Chen Chen, Yangang Ren, Jianyu Chen, Shengbo Eben Li, Ping Luo, Yanfeng Lu
Abstract要約: 本稿では,重要なタスク関連特徴を抽出し,フィルタされた特徴を通して意味マスクを再構成する潜時フィルタを導入したセマンティックマスク再帰世界モデル(SEM2)を提案する。提案手法は, サンプル効率と入力順列に対するロバスト性の観点から, 最先端の手法よりも優れている。
参考スコア（独自算出の注目度）: 20.26487890713432
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: End-to-end autonomous driving provides a feasible way to automatically maximize overall driving system performance by directly mapping the raw pixels from a front-facing camera to control signals. Recent advanced methods construct a latent world model to map the high dimensional observations into compact latent space. However, the latent states embedded by the world model proposed in previous works may contain a large amount of task-irrelevant information, resulting in low sampling efficiency and poor robustness to input perturbations. Meanwhile, the training data distribution is usually unbalanced, and the learned policy is hard to cope with the corner cases during the driving process. To solve the above challenges, we present a semantic masked recurrent world model (SEM2), which introduces a latent filter to extract key task-relevant features and reconstruct a semantic mask via the filtered features, and is trained with a multi-source data sampler, which aggregates common data and multiple corner case data in a single batch, to balance the data distribution. Extensive experiments on CARLA show that our method outperforms the state-of-the-art approaches in terms of sample efficiency and robustness to input permutations.
Abstract（参考訳）: エンドツーエンドの自動運転は、前面カメラからの生のピクセルを制御信号に直接マッピングすることで、運転システム全体の性能を最大化することができる。最近の高度な手法は、高次元の観測をコンパクトな潜在空間にマッピングする潜在世界モデルを構築している。しかし、従来の研究で提案された世界モデルに埋め込まれた潜伏状態には、大量のタスク関連情報が含まれており、サンプリング効率が低く、入力摂動に対する堅牢性が低い。一方、トレーニングデータ分布は、通常不均衡であり、学習されたポリシーは、運転中のコーナーケースに対処するのは難しい。上記の課題を解決するために,有意なタスク関連特徴を抽出し,フィルタ機能を介して意味マスクを再構築する潜時フィルタを導入したセマンティックマスク再帰世界モデル(SEM2)を提案し,共通データと複数のコーナーケースデータを単一のバッチで集約し,データ分散のバランスをとるマルチソースデータサンプリング器を用いて訓練を行った。 CARLAの広範囲な実験により,本手法はサンプル効率と入力順列に対する堅牢性の観点から,最先端の手法よりも優れていることが示された。

関連論文リスト

Align-Then-stEer: Adapting the Vision-Language Action Models through Unified Latent Guidance [63.33213516925946]
textbfAlign-Then-stEer(textttATE)は,新しいデータ効率,プラグアンドプレイ適応フレームワークである。我々の研究は、新しいロボットプラットフォームやタスクにVLAモデルをデプロイする実用性を大幅に向上させる、汎用的で軽量なソリューションを提供する。
論文参考訳（メタデータ） (2025-09-02T07:51:59Z)
Heterogeneous Self-Supervised Acoustic Pre-Training with Local Constraints [64.15709757611369]
異種データを扱うための自己教師付き事前学習手法を提案する。提案手法は、下流の教師付き微調整タスクに対する自己教師付き事前訓練モデルの適応性を大幅に向上させることができる。
論文参考訳（メタデータ） (2025-08-27T15:48:50Z)
Data Shift of Object Detection in Autonomous Driving [0.40792653193642503]
自律走行物体検出タスクにおけるデータシフト問題について検討する。我々は、データセットの分類とバランスをとるためにシフト検出分析技術を採用している。このアプローチを検証するために,CycleGANベースのデータ拡張技術とYOLOv5フレームワークを統合することにより,モデルを最適化する。
論文参考訳（メタデータ） (2025-08-16T01:52:31Z)
Bayesian Multiobject Tracking With Neural-Enhanced Motion and Measurement Models [4.7752948351582605]
マルチオブジェクトトラッキング(MOT)は、自律走行、海洋科学、航空宇宙監視などのアプリケーションにおいて重要なタスクである。従来のMOT法はモデルベースであり、連続ベイズ推定とデータアソシエーションとオブジェクト生成モデルを組み合わせたものである。最近の手法は完全なデータ駆動であり、ニューラルネットワークのトレーニングに依存している。
論文参考訳（メタデータ） (2025-06-22T18:15:08Z)
End-to-End Predictive Planner for Autonomous Driving with Consistency Models [5.966385886363771]
軌道予測と計画は、自動運転車が動的環境において安全かつ効率的に航行するための基本的な要素である。伝統的に、これらのコンポーネントは、しばしば別々のモジュールとして扱われ、インタラクティブな計画を実行する能力を制限する。単一の一貫性モデルで予測と計画を統合する,統一的でデータ駆動のフレームワークを提案する。
論文参考訳（メタデータ） (2025-02-12T00:26:01Z)
SUDS: A Strategy for Unsupervised Drift Sampling [0.5437605013181142]
監視された機械学習は、データ分散が時間とともに変化するコンセプトドリフトに遭遇し、パフォーマンスが低下する。本稿では,既存のドリフト検出アルゴリズムを用いて,同種サンプルを選択する新しい手法であるドリフトサンプリング戦略(SUDS)を提案する。本研究は, 動的環境におけるラベル付きデータ利用の最適化におけるSUDSの有効性を示すものである。
論文参考訳（メタデータ） (2024-11-05T10:55:29Z)
MITA: Bridging the Gap between Model and Data for Test-time Adaptation [68.62509948690698]
テスト時間適応(TTA)は、モデルの一般化性を高めるための有望なパラダイムとして登場した。本稿では,Met-In-The-MiddleをベースとしたMITAを提案する。
論文参考訳（メタデータ） (2024-10-12T07:02:33Z)
Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models [60.87795376541144]
World Model(ワールドモデル)は、エージェントの次の状態を予測できるニューラルネットワークである。エンド・ツー・エンドのトレーニングでは、人間のデモで観察された状態と整合してエラーから回復する方法を学ぶ。クローズドループ試験における先行技術に有意な改善がみられた定性的,定量的な結果を示す。
論文参考訳（メタデータ） (2024-09-25T06:48:25Z)
FPMT: Enhanced Semi-Supervised Model for Traffic Incident Detection [0.0]
本論文では、MixTextのフレームワーク内でFPMTと呼ばれる半教師付き学習モデルを提案する。データ拡張モジュールには、データセットのバランスと拡張のためのGenerative Adversarial Networksが導入されている。トレーニング戦略では、すべてのデータに対して教師なしのトレーニングを開始し、その後ラベル付きデータのサブセットを教師付き微調整し、最終的にはセミ教師付きトレーニングの目標を達成します。
論文参考訳（メタデータ） (2024-09-12T08:38:42Z)
AIDE: An Automatic Data Engine for Object Detection in Autonomous Driving [68.73885845181242]
本稿では,問題を自動的に識別し,データを効率よくキュレートし,自動ラベル付けによりモデルを改善する自動データエンジン(AIDE)を提案する。さらに,AVデータセットのオープンワールド検出のためのベンチマークを構築し,様々な学習パラダイムを包括的に評価し,提案手法の優れた性能を低コストで実証する。
論文参考訳（メタデータ） (2024-03-26T04:27:56Z)
Leveraging Driver Field-of-View for Multimodal Ego-Trajectory Prediction [69.29802752614677]
RouteFormerは、GPSデータ、環境コンテキスト、運転者の視野を組み合わせた新しいエゴ軌道予測ネットワークである。データ不足に対処し、多様性を高めるために、同期運転場と視線データに富んだ都市運転シナリオのデータセットであるGEMを導入する。
論文参考訳（メタデータ） (2023-12-13T23:06:30Z)
Layout Sequence Prediction From Noisy Mobile Modality [53.49649231056857]
軌道予測は、自律運転やロボット工学などの応用における歩行者運動を理解する上で重要な役割を担っている。現在の軌道予測モデルは、視覚的モダリティからの長い、完全な、正確に観察されたシーケンスに依存する。本稿では,物体の障害物や視界外を,完全に視認できる軌跡を持つものと同等に扱う新しいアプローチであるLTrajDiffを提案する。
論文参考訳（メタデータ） (2023-10-09T20:32:49Z)
Fusing Pseudo Labels with Weak Supervision for Dynamic Traffic Scenarios [0.0]
我々は、異種データセットで訓練されたオブジェクト検出モデルから擬似ラベルをアマルガメートする弱い教師付きラベル統一パイプラインを導入する。我々のパイプラインは、異なるデータセットからのラベルの集約、バイアスの修正、一般化の強化を通じて、統一されたラベル空間をエンゲージする。我々は,統合ラベル空間を用いた単独物体検出モデルを再学習し,動的交通シナリオに精通した弾力性のあるモデルを構築した。
論文参考訳（メタデータ） (2023-08-30T11:33:07Z)
SHIFT: A Synthetic Driving Dataset for Continuous Multi-Task Domain Adaptation [152.60469768559878]
ShiFTは、自動運転のための最大規模のマルチタスク合成データセットである。曇り、雨と霧の強さ、昼の時間、車と歩行者の密度を個別に連続的に変化させる。私たちのデータセットとベンチマークツールキットはwww.vis.xyz/shift.comで公開されています。
論文参考訳（メタデータ） (2022-06-16T17:59:52Z)
Large Scale Autonomous Driving Scenarios Clustering with Self-supervised Feature Extraction [6.804209932400134]
本稿では,自動車運転データの大規模集合に対する包括的データクラスタリングフレームワークを提案する。提案手法では,トラヒック内エージェントオブジェクトとマップ情報の両方を含むトラフィック要素を網羅的に検討する。新たに設計されたデータクラスタリング評価メトリクスは、データ拡張に基づくものであるため、精度評価には人間のラベル付きデータセットは必要ない。
論文参考訳（メタデータ） (2021-03-30T06:22:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。