論文の概要: Multi-task UNet architecture for end-to-end autonomous driving
- arxiv url: http://arxiv.org/abs/2112.08967v2
- Date: Fri, 8 Sep 2023 07:19:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-11 19:02:54.651664
- Title: Multi-task UNet architecture for end-to-end autonomous driving
- Title(参考訳): エンドツーエンド自動運転のためのマルチタスクunetアーキテクチャ
- Authors: Der-Hau Lee and Jinn-Liang Liu
- Abstract要約: 本稿では,MTUNetアーキテクチャと制御アルゴリズムを統合したエンドツーエンド駆動モデルを提案する。
エンド・ツー・エンド駆動システムの総合的、動的、リアルタイムな性能を評価するための定量的尺度を提供し、MTUNetの安全性と解釈性を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose an end-to-end driving model that integrates a multi-task UNet
(MTUNet) architecture and control algorithms in a pipeline of data flow from a
front camera through this model to driving decisions. It provides quantitative
measures to evaluate the holistic, dynamic, and real-time performance of
end-to-end driving systems and thus the safety and interpretability of MTUNet.
The architecture consists of one segmentation, one regression, and two
classification tasks for lane segmentation, path prediction, and vehicle
controls. We present three variants of the architecture having different
complexities, compare them on different tasks in four static measures for both
single and multiple tasks, and then identify the best one by two additional
dynamic measures in real-time simulation. Our results show that the performance
of the proposed supervised learning model is comparable to that of a
reinforcement learning model on curvy roads for the same task, which is not
end-to-end but multi-module.
- Abstract(参考訳): 本稿では,マルチタスク unet (mtunet) アーキテクチャと制御アルゴリズムを統合したエンド・ツー・エンド駆動モデルを提案する。
エンド・ツー・エンド駆動システムの総合的、動的、リアルタイムな性能を評価するための定量的尺度を提供し、MTUNetの安全性と解釈性を提供する。
このアーキテクチャは1つのセグメンテーションと1つの回帰、レーンセグメンテーション、経路予測、車両制御のための2つの分類タスクで構成されている。
複雑度が異なるアーキテクチャの3つの変種を1つのタスクと複数タスクの両方に対して4つの静的測度で比較し、さらに2つの動的測度を実時間シミュレーションで同定する。
その結果,提案する教師付き学習モデルの性能は,エンド・ツー・エンドではなくマルチモジュールである同じタスクに対して,カービブ・ロード上で強化学習モデルと同等であることが判明した。
関連論文リスト
- StreamMOTP: Streaming and Unified Framework for Joint 3D Multi-Object Tracking and Trajectory Prediction [22.29257945966914]
我々は3次元多目的追跡・軌道予測(StreamMOTP)のためのストリーミング統合フレームワークを提案する。
ストリーミング方式でモデルを構築し、メモリバンクを利用して、追跡対象の長期潜伏機能をより効果的に保存し、活用する。
また,予測トラジェクタの品質と一貫性を2ストリーム予測器で改善する。
論文 参考訳(メタデータ) (2024-06-28T11:35:35Z) - MS-Net: A Multi-Path Sparse Model for Motion Prediction in Multi-Scenes [1.4451387915783602]
マルチシーンネットワーク(Multi-Scenes Network、別名MS-Net)は、進化過程によって訓練されたマルチパススパースモデルである。
MS-Netは、推論段階でパラメータのサブセットを選択的に活性化し、各シーンの予測結果を生成する。
実験の結果,MS-Netは既存の歩行者行動予測データセットの最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2024-03-01T08:32:12Z) - Trajeglish: Traffic Modeling as Next-Token Prediction [67.28197954427638]
自動運転開発における長年の課題は、記録された運転ログからシードされた動的運転シナリオをシミュレートすることだ。
車両、歩行者、サイクリストが運転シナリオでどのように相互作用するかをモデル化するために、離散シーケンスモデリングのツールを適用します。
我々のモデルはSim Agents Benchmarkを上回り、リアリズムメタメトリックの先行作業の3.3%、インタラクションメトリックの9.9%を上回ります。
論文 参考訳(メタデータ) (2023-12-07T18:53:27Z) - An Empirical Study of Multimodal Model Merging [148.48412442848795]
モデルマージは、異なるタスクでトレーニングされた複数のモデルを融合してマルチタスクソリューションを生成するテクニックである。
我々は、モダリティ固有のアーキテクチャのビジョン、言語、およびクロスモーダルトランスフォーマーをマージできる新しい目標に向けて研究を行っている。
本稿では,重み間の距離を推定し,マージ結果の指標となる2つの指標を提案する。
論文 参考訳(メタデータ) (2023-04-28T15:43:21Z) - Visual Exemplar Driven Task-Prompting for Unified Perception in
Autonomous Driving [100.3848723827869]
本稿では,タスク固有のプロンプトを通じて視覚的見本を提示する,効果的なマルチタスクフレームワークVE-Promptを提案する。
具体的には、境界ボックスと色に基づくマーカーに基づいて視覚的な例を生成し、ターゲットカテゴリの正確な視覚的外観を提供する。
我々は変圧器をベースとしたエンコーダと畳み込み層を橋渡しし、自律運転における効率的かつ正確な統合認識を実現する。
論文 参考訳(メタデータ) (2023-03-03T08:54:06Z) - Controllable Dynamic Multi-Task Architectures [92.74372912009127]
本稿では,そのアーキテクチャと重みを動的に調整し,所望のタスク選択とリソース制約に適合させる制御可能なマルチタスクネットワークを提案する。
本稿では,タスク親和性と分岐正規化損失を利用した2つのハイパーネットの非交互トレーニングを提案し,入力の嗜好を取り入れ,適応重み付き木構造モデルを予測する。
論文 参考訳(メタデータ) (2022-03-28T17:56:40Z) - Short-term passenger flow prediction for multi-traffic modes: A residual
network and Transformer based multi-task learning method [21.13073816634534]
Res-Transformerは、複数交通モードの短期的乗客フロー予測のための学習モデルである。
モデルは北京の2つの大規模な実世界のデータセットで評価される。
本稿では,複数交通モードにおける短時間の乗客フロー予測について,重要な洞察を与えることができる。
論文 参考訳(メタデータ) (2022-02-27T01:09:19Z) - Multi-path Neural Networks for On-device Multi-domain Visual
Classification [55.281139434736254]
本稿では,モバイルデバイス上でのマルチドメイン視覚分類のためのマルチパスネットワークの自動学習手法を提案する。
提案するマルチパスネットワークは,各ドメインに1つの強化学習コントローラを適用して,MobileNetV3のような検索空間から生成されたスーパーネットワークの最適経路を選択することにより,ニューラルネットワーク検索から学習する。
決定されたマルチパスモデルは、個々のドメインパス内の非共有ノード内にドメイン固有のパラメータを保持しながら、共有ノード内のドメイン間でパラメータを選択的に共有する。
論文 参考訳(メタデータ) (2020-10-10T05:13:49Z) - A Unified Object Motion and Affinity Model for Online Multi-Object
Tracking [127.5229859255719]
オブジェクトの動きと親和性モデルを単一のネットワークに統一する新しいMOTフレームワークUMAを提案する。
UMAは、単一物体追跡とメートル法学習をマルチタスク学習により統合された三重項ネットワークに統合する。
我々は,タスク認識機能学習を促進するために,タスク固有のアテンションモジュールを装備する。
論文 参考訳(メタデータ) (2020-03-25T09:36:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。