論文の概要: End-to-End Multi-Task Deep Learning and Model Based Control Algorithm
for Autonomous Driving
- arxiv url: http://arxiv.org/abs/2112.08967v1
- Date: Thu, 16 Dec 2021 15:35:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-17 16:22:36.827068
- Title: End-to-End Multi-Task Deep Learning and Model Based Control Algorithm
for Autonomous Driving
- Title(参考訳): エンド・ツー・エンドマルチタスク深層学習とモデルベース自動走行制御アルゴリズム
- Authors: Der-Hau Lee and Jinn-Liang Liu
- Abstract要約: 本稿では,マルチタスクディープラーニングニューラルネットワーク,経路予測,制御モデルを統合したエンドツーエンド駆動アルゴリズムを提案する。
エンド・ツー・エンド駆動システムの総合的、動的、リアルタイムな性能を評価するための定量的指標を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: End-to-end driving with a deep learning neural network (DNN) has become a
rapidly growing paradigm of autonomous driving in industry and academia. Yet
safety measures and interpretability still pose challenges to this paradigm. We
propose an end-to-end driving algorithm that integrates multi-task DNN, path
prediction, and control models in a pipeline of data flow from sensory devices
through these models to driving decisions. It provides quantitative measures to
evaluate the holistic, dynamic, and real-time performance of end-to-end driving
systems, and thus allows to quantify their safety and interpretability. The DNN
is a modified UNet, a well known encoder-decoder neural network of semantic
segmentation. It consists of one segmentation, one regression, and two
classification tasks for lane segmentation, path prediction, and vehicle
controls. We present three variants of the modified UNet architecture having
different complexities, compare them on different tasks in four static measures
for both single and multi-task (MT) architectures, and then identify the best
one by two additional dynamic measures in real-time simulation. We also propose
a learning- and model-based longitudinal controller using model predictive
control method. With the Stanley lateral controller, our results show that
MTUNet outperforms an earlier modified UNet in terms of curvature and lateral
offset estimation on curvy roads at normal speed, which has been tested in a
real car driving on real roads.
- Abstract(参考訳): ディープラーニングニューラルネットワーク(dnn)を用いたエンドツーエンド運転は、産業や学界における自動運転の急速に成長するパラダイムになりつつある。
しかし、安全対策と解釈性は依然としてこのパラダイムに課題をもたらしている。
本研究では,複数タスクのdnn,経路予測,制御モデルを統合したエンド・ツー・エンド駆動アルゴリズムを提案する。
エンド・ツー・エンドの運転システムの総合的、動的、リアルタイム性能を評価する定量的な尺度を提供し、その安全性と解釈可能性の定量化を可能にする。
DNNは、セマンティックセグメンテーションのよく知られたエンコーダデコーダニューラルネットワークであるUNetの修正版である。
1つのセグメンテーション、1つの回帰、レーンセグメンテーション、パス予測、車両制御の2つの分類タスクで構成される。
修正UNetアーキテクチャの3つの変種を異なる複雑度で比較し, 単一およびマルチタスク(MT)アーキテクチャの4つの静的測度で比較し, 実時間シミュレーションにおいて2つの動的測度で最良の測度を同定する。
また,モデル予測制御を用いた学習およびモデルベース縦方向制御を提案する。
その結果,mtunetは,実際の道路で走行する実車において,通常の速度で曲がりくねった道路の曲率と横オフセット推定の点で,前回修正したunetを上回っていることがわかった。
関連論文リスト
- StreamMOTP: Streaming and Unified Framework for Joint 3D Multi-Object Tracking and Trajectory Prediction [22.29257945966914]
我々は3次元多目的追跡・軌道予測(StreamMOTP)のためのストリーミング統合フレームワークを提案する。
ストリーミング方式でモデルを構築し、メモリバンクを利用して、追跡対象の長期潜伏機能をより効果的に保存し、活用する。
また,予測トラジェクタの品質と一貫性を2ストリーム予測器で改善する。
論文 参考訳(メタデータ) (2024-06-28T11:35:35Z) - MS-Net: A Multi-Path Sparse Model for Motion Prediction in Multi-Scenes [1.4451387915783602]
マルチシーンネットワーク(Multi-Scenes Network、別名MS-Net)は、進化過程によって訓練されたマルチパススパースモデルである。
MS-Netは、推論段階でパラメータのサブセットを選択的に活性化し、各シーンの予測結果を生成する。
実験の結果,MS-Netは既存の歩行者行動予測データセットの最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2024-03-01T08:32:12Z) - Trajeglish: Traffic Modeling as Next-Token Prediction [67.28197954427638]
自動運転開発における長年の課題は、記録された運転ログからシードされた動的運転シナリオをシミュレートすることだ。
車両、歩行者、サイクリストが運転シナリオでどのように相互作用するかをモデル化するために、離散シーケンスモデリングのツールを適用します。
我々のモデルはSim Agents Benchmarkを上回り、リアリズムメタメトリックの先行作業の3.3%、インタラクションメトリックの9.9%を上回ります。
論文 参考訳(メタデータ) (2023-12-07T18:53:27Z) - An Empirical Study of Multimodal Model Merging [148.48412442848795]
モデルマージは、異なるタスクでトレーニングされた複数のモデルを融合してマルチタスクソリューションを生成するテクニックである。
我々は、モダリティ固有のアーキテクチャのビジョン、言語、およびクロスモーダルトランスフォーマーをマージできる新しい目標に向けて研究を行っている。
本稿では,重み間の距離を推定し,マージ結果の指標となる2つの指標を提案する。
論文 参考訳(メタデータ) (2023-04-28T15:43:21Z) - Visual Exemplar Driven Task-Prompting for Unified Perception in
Autonomous Driving [100.3848723827869]
本稿では,タスク固有のプロンプトを通じて視覚的見本を提示する,効果的なマルチタスクフレームワークVE-Promptを提案する。
具体的には、境界ボックスと色に基づくマーカーに基づいて視覚的な例を生成し、ターゲットカテゴリの正確な視覚的外観を提供する。
我々は変圧器をベースとしたエンコーダと畳み込み層を橋渡しし、自律運転における効率的かつ正確な統合認識を実現する。
論文 参考訳(メタデータ) (2023-03-03T08:54:06Z) - Controllable Dynamic Multi-Task Architectures [92.74372912009127]
本稿では,そのアーキテクチャと重みを動的に調整し,所望のタスク選択とリソース制約に適合させる制御可能なマルチタスクネットワークを提案する。
本稿では,タスク親和性と分岐正規化損失を利用した2つのハイパーネットの非交互トレーニングを提案し,入力の嗜好を取り入れ,適応重み付き木構造モデルを予測する。
論文 参考訳(メタデータ) (2022-03-28T17:56:40Z) - Short-term passenger flow prediction for multi-traffic modes: A residual
network and Transformer based multi-task learning method [21.13073816634534]
Res-Transformerは、複数交通モードの短期的乗客フロー予測のための学習モデルである。
モデルは北京の2つの大規模な実世界のデータセットで評価される。
本稿では,複数交通モードにおける短時間の乗客フロー予測について,重要な洞察を与えることができる。
論文 参考訳(メタデータ) (2022-02-27T01:09:19Z) - Multi-path Neural Networks for On-device Multi-domain Visual
Classification [55.281139434736254]
本稿では,モバイルデバイス上でのマルチドメイン視覚分類のためのマルチパスネットワークの自動学習手法を提案する。
提案するマルチパスネットワークは,各ドメインに1つの強化学習コントローラを適用して,MobileNetV3のような検索空間から生成されたスーパーネットワークの最適経路を選択することにより,ニューラルネットワーク検索から学習する。
決定されたマルチパスモデルは、個々のドメインパス内の非共有ノード内にドメイン固有のパラメータを保持しながら、共有ノード内のドメイン間でパラメータを選択的に共有する。
論文 参考訳(メタデータ) (2020-10-10T05:13:49Z) - A Unified Object Motion and Affinity Model for Online Multi-Object
Tracking [127.5229859255719]
オブジェクトの動きと親和性モデルを単一のネットワークに統一する新しいMOTフレームワークUMAを提案する。
UMAは、単一物体追跡とメートル法学習をマルチタスク学習により統合された三重項ネットワークに統合する。
我々は,タスク認識機能学習を促進するために,タスク固有のアテンションモジュールを装備する。
論文 参考訳(メタデータ) (2020-03-25T09:36:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。