論文の概要: Enhance Sample Efficiency and Robustness of End-to-end Urban Autonomous
Driving via Semantic Masked World Model
- arxiv url: http://arxiv.org/abs/2210.04017v1
- Date: Sat, 8 Oct 2022 13:00:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-11 18:33:01.024341
- Title: Enhance Sample Efficiency and Robustness of End-to-end Urban Autonomous
Driving via Semantic Masked World Model
- Title(参考訳): セマンティックマスク世界モデルによるエンドツーエンドの都市自律走行のサンプル効率とロバスト性
- Authors: Zeyu Gao, Yao Mu, Ruoyan Shen, Chen Chen, Yangang Ren, Jianyu Chen,
Shengbo Eben Li, Ping Luo, Yanfeng Lu
- Abstract要約: 本稿では,重要なタスク関連特徴を抽出し,フィルタされた特徴を通して意味マスクを再構成する潜時フィルタを導入したセマンティックマスク再帰世界モデル(SEM2)を提案する。
提案手法は, サンプル効率と入力順列に対するロバスト性の観点から, 最先端の手法よりも優れている。
- 参考スコア(独自算出の注目度): 20.26487890713432
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: End-to-end autonomous driving provides a feasible way to automatically
maximize overall driving system performance by directly mapping the raw pixels
from a front-facing camera to control signals. Recent advanced methods
construct a latent world model to map the high dimensional observations into
compact latent space. However, the latent states embedded by the world model
proposed in previous works may contain a large amount of task-irrelevant
information, resulting in low sampling efficiency and poor robustness to input
perturbations. Meanwhile, the training data distribution is usually unbalanced,
and the learned policy is hard to cope with the corner cases during the driving
process. To solve the above challenges, we present a semantic masked recurrent
world model (SEM2), which introduces a latent filter to extract key
task-relevant features and reconstruct a semantic mask via the filtered
features, and is trained with a multi-source data sampler, which aggregates
common data and multiple corner case data in a single batch, to balance the
data distribution. Extensive experiments on CARLA show that our method
outperforms the state-of-the-art approaches in terms of sample efficiency and
robustness to input permutations.
- Abstract(参考訳): エンドツーエンドの自動運転は、前面カメラからの生のピクセルを制御信号に直接マッピングすることで、運転システム全体の性能を最大化することができる。
最近の高度な手法は、高次元の観測をコンパクトな潜在空間にマッピングする潜在世界モデルを構築している。
しかし、従来の研究で提案された世界モデルに埋め込まれた潜伏状態には、大量のタスク関連情報が含まれており、サンプリング効率が低く、入力摂動に対する堅牢性が低い。
一方、トレーニングデータ分布は、通常不均衡であり、学習されたポリシーは、運転中のコーナーケースに対処するのは難しい。
上記の課題を解決するために,有意なタスク関連特徴を抽出し,フィルタ機能を介して意味マスクを再構築する潜時フィルタを導入したセマンティックマスク再帰世界モデル(SEM2)を提案し,共通データと複数のコーナーケースデータを単一のバッチで集約し,データ分散のバランスをとるマルチソースデータサンプリング器を用いて訓練を行った。
CARLAの広範囲な実験により,本手法はサンプル効率と入力順列に対する堅牢性の観点から,最先端の手法よりも優れていることが示された。
関連論文リスト
- Self-Supervised Dataset Distillation for Transfer Learning [82.09002658558529]
ラベルなしデータセットを、効率的な自己教師付き学習(SSL)のための小さな合成サンプル群に蒸留する新しい問題を提案する。
両レベル最適化におけるSSL目標に対する合成サンプルの勾配は、データ拡張やマスキングから生じるランダム性から、テキストバイアスを受けていることを最初に証明する。
転送学習を含む様々な応用における本手法の有効性を実証的に検証する。
論文 参考訳(メタデータ) (2023-10-10T10:48:52Z) - Layout Sequence Prediction From Noisy Mobile Modality [53.49649231056857]
軌道予測は、自律運転やロボット工学などの応用における歩行者運動を理解する上で重要な役割を担っている。
現在の軌道予測モデルは、視覚的モダリティからの長い、完全な、正確に観察されたシーケンスに依存する。
本稿では,物体の障害物や視界外を,完全に視認できる軌跡を持つものと同等に扱う新しいアプローチであるLTrajDiffを提案する。
論文 参考訳(メタデータ) (2023-10-09T20:32:49Z) - Fusing Pseudo Labels with Weak Supervision for Dynamic Traffic Scenarios [0.0]
我々は、異種データセットで訓練されたオブジェクト検出モデルから擬似ラベルをアマルガメートする弱い教師付きラベル統一パイプラインを導入する。
我々のパイプラインは、異なるデータセットからのラベルの集約、バイアスの修正、一般化の強化を通じて、統一されたラベル空間をエンゲージする。
我々は,統合ラベル空間を用いた単独物体検出モデルを再学習し,動的交通シナリオに精通した弾力性のあるモデルを構築した。
論文 参考訳(メタデータ) (2023-08-30T11:33:07Z) - Value function estimation using conditional diffusion models for control [62.27184818047923]
拡散値関数(DVF)と呼ばれる単純なアルゴリズムを提案する。
拡散モデルを用いて環境-ロボット相互作用の連成多段階モデルを学ぶ。
本稿では,DVFを用いて複数のコントローラの状態を効率よく把握する方法を示す。
論文 参考訳(メタデータ) (2023-06-09T18:40:55Z) - Learning Sampling Distributions for Model Predictive Control [36.82905770866734]
モデル予測制御(MPC)に対するサンプリングに基づくアプローチは、MPCに対する現代のアプローチの基盤となっている。
我々は、学習された分布を最大限に活用できるように、潜在空間における全ての操作を実行することを提案する。
具体的には、学習問題を双方向の最適化として捉え、バックプロパゲーションスルータイムでコントローラをトレーニングする方法を示す。
論文 参考訳(メタデータ) (2022-12-05T20:35:36Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Dynamic Prototype Mask for Occluded Person Re-Identification [88.7782299372656]
既存の手法では、目に見える部分を識別するために、余分なネットワークによって提供される身体の手がかりを利用することで、この問題に対処している。
2つの自己明快な事前知識に基づく新しい動的プロトタイプマスク(DPM)を提案する。
この条件下では、隠蔽された表現は、選択された部分空間において自然にうまく整列することができる。
論文 参考訳(メタデータ) (2022-07-19T03:31:13Z) - SHIFT: A Synthetic Driving Dataset for Continuous Multi-Task Domain
Adaptation [152.60469768559878]
ShiFTは、自動運転のための最大規模のマルチタスク合成データセットである。
曇り、雨と霧の強さ、昼の時間、車と歩行者の密度を個別に連続的に変化させる。
私たちのデータセットとベンチマークツールキットはwww.vis.xyz/shift.comで公開されています。
論文 参考訳(メタデータ) (2022-06-16T17:59:52Z) - Dream to Explore: Adaptive Simulations for Autonomous Systems [3.0664963196464448]
ベイズ的非パラメトリック法を適用し,力学系制御の学習に挑戦する。
ガウス過程を用いて潜在世界力学を探索することにより、強化学習で観測される一般的なデータ効率の問題を緩和する。
本アルゴリズムは,ログの変動的下界を最適化することにより,世界モデルと政策を共同で学習する。
論文 参考訳(メタデータ) (2021-10-27T04:27:28Z) - Large Scale Autonomous Driving Scenarios Clustering with Self-supervised
Feature Extraction [6.804209932400134]
本稿では,自動車運転データの大規模集合に対する包括的データクラスタリングフレームワークを提案する。
提案手法では,トラヒック内エージェントオブジェクトとマップ情報の両方を含むトラフィック要素を網羅的に検討する。
新たに設計されたデータクラスタリング評価メトリクスは、データ拡張に基づくものであるため、精度評価には人間のラベル付きデータセットは必要ない。
論文 参考訳(メタデータ) (2021-03-30T06:22:40Z) - Input-Output Balanced Framework for Long-tailed LiDAR Semantic
Segmentation [12.639524717464509]
本稿では,ロングテール分布の問題を扱うための入出力バランスフレームワークを提案する。
入力空間に対して、メッシュモデルからこれらのテールインスタンスを合成し、LiDARスキャンの位置と密度分布をうまくシミュレートする。
出力空間に対して, 形状と実例量に基づいて, 異なるカテゴリをグループ化するマルチヘッドブロックを提案する。
論文 参考訳(メタデータ) (2021-03-26T05:42:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。